Inhalt: | Unter fehlertoleranten Systemen versteht man
Hard- und Softwaresysteme, die trotz des Auftretens von bestimmten
Klassen von Fehlern und Ausfällen zuverlässig
funktionieren. Neben sicherheitskritischen Bereichen (Flugzeuge,
Medizintechnik) bekommt die Fehlertoleranz zunehmend Bedeutung in
Systemen, deren Ausfall enorme wirtschaftliche Folgen hat
(z.B. Telefonvermittlungssysteme).
In der Vorlesung werden allgemeine Verfahren vorgestellt, mit denen
sich fehlertolerante Systeme realisieren lassen. Einen
Schwerpunkt bilden Verfahren, die sich in verteilten Systemen
einsetzen lassen. Behandelt werden unter anderem zuverlässige,
atomare und kausale Broadcasts, Checkpointing von kommunizierenden
Prozessen, Replikation und Virtual Synchrony. |
Literatur: |
- P. Jalote: Fault Tolerance in Distributed Systems,
Prentice Hall, 1994
- M.R. Lyu: Handbook of Software Reliability Engineering,
Mc.Graw Hill, 1995
- S.J. Mullender: Distributed Systems, Addison Wesley, 1993
- F. Mattern: Verteilte Basisalgorithmen, Informatik-Fachberichte
Band 226, Springer Verlag, 1989
- K.P. Birman: Building Secure and Reliable Network Applications,
Prentice Hall, 1996
|