Schichtenübergreifende Fehlertoleranz in On-Chip Verbindungsnetzwerken

Konferenz: Zuverlässigkeit und Entwurf - 7. ITG/GI/GMM-Fachtagung
24.09.2013 - 26.09.2013 in Dresden, Deutschland

Tagungsband: Zuverlässigkeit und Entwurf

Seiten: 8Sprache: DeutschTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Schley, Gert; Batzolis, Nikolaos; Radetzki, Martin (Institut für Technische Informatik, Universität Stuttgart, Deutschland)

Inhalt:
Der zuverlässige Datenaustausch zwischen Prozessorelementen eines On-Chip Netzwerks (NoC) ist von großer Bedeutung für das korrekte Systemverhalten. Beeinträchtigt wird der Austausch durch das Auftreten von transienten und permanenten Fehlern innerhalb der Kommunikationsstruktur des Netzwerks. Fehler in Links oder Switches führen zur Verfälschung oder dem Verlust von Daten. Dies kann zu einer Verschlechterung der Performanz oder sogar zum Ausfall des gesamten Systems führen. Eine gängige Maßnahme zur Behandlung verfälschter Daten durch transiente Fehler ist, diese erneut zu senden (Retransmission). Hierfür kommen sogenannte Datenflusssteuerungsprotokolle zum Einsatz. Das erneute Senden von Daten stellt im Fall von permanenten Fehlern jedoch keine Lösung dar. Solange nicht diagnostiziert, wirkt sich ein permanenter Fehler nachteilig auf die Datenkommunikation im Netzwerk aus, sodass selbst erneut gesendete Daten wieder verfälscht werden können. In dem vorliegenden Beitrag wird ein fehlertolerantes Ende-zu-Ende Protokoll vorgestellt, welches eine zuverlässige Kommunikation von Daten in der Gegenwart von transienten und permanenten Fehlern sicherstellt. Mit Hilfe seiner Diagnose-Eigenschaft ist das Protokoll in der Lage, permanente Fehler während des Systembetriebs ohne zusätzliche Hardware innerhalb beliebiger Topologien zu lokalisieren.