Degradierbare Switches für fehlertolerante Networks-on-Chip

Conference: Zuverlässigkeit und Entwurf - 3. GMM/GI/ITG-Fachtagung
09/21/2009 - 09/23/2009 at Stuttgart, Germany

Proceedings: Zuverlässigkeit und Entwurf

Pages: 8Language: germanTyp: PDF

Personal VDE Members are entitled to a 10% discount on this title

Authors:
Kohler, Adan; Radetzki, Martin (Institut für Technische Informatik der Universität Stuttgart, Deutschland)

Abstract:
Networks-on-Chip (NoCs) weisen inhärente strukturelle Redundanz im Sinne von Pfaddiversität auf, die durch geeignete Routingverfahren genutzt werden kann. Dies ermöglicht es, Konnektivität sicherzustellen, selbst wenn einige NoC-Komponenten fehlerbehaftet sind, womit in zukünftigen Chip-Generationen verstärkt zu rechnen ist. Wir stellen ein fein aufgelöstes funktionales Fehlermodell vor, das es zusammen mit fehlererkennenden Maßnahmen sowie einer verteilt implementierten Fehlerdiagnose erlaubt, den Fehlerzustand individueller NoC-Switches sowie der angeschlossenen Kommunikationsverbindungen zu ermitteln. Während Vorarbeiten zur Fehlertoleranz auf Netzwerkebene davon ausgehen, dass Switches entweder verfügbar oder vollständig ausgefallen sind, nutzen wir die Restfunktionalität teildefekter Switches durch einen modifizierten Routingalgorithmus, der zudem für Lastausgleich der Kommunikation sorgt. Dadurch kann ein akzeptables Maß an Kommunikationsdurchsatz selbst bei hohen Fehlerraten aufrechterhalten werden (Graceful Degradation).