Hasso-Plattner-Institut Potsdam Operating Systems and Middleware Group at HPI University of Potsdam, Germany
Operating Systems and Middleware Group at HPI

Seminar  

Fehlertolerante Systeme

Sommersemester 2008

Prof. Dr. habil. Andreas Polze

Dipl. Inf. Andreas Rasche

Hasso-Plattner-Institut

polze@hpi.uni-potsdam.de

andreas.rasche@hpi.uni-potsdam.de  

 

Im Sommersemester 2008 findet ein Seminar zum Thema Fehlertolerante Systeme statt. Das Seminar richtet sich an Studierende des Master-Studienganges IT Systems Engineering und Software Systems Engineering und wird einem der Themenkomplexe Softwaresystemtechnische Vertiefungsthemen oder Freie Informatikvertiefungsthemen bzw. einem Vertiefungsgebiet Software Engineering, Systems Architecture oder Mobile & Embedded Computing zugerechnet. Voraussetzung für das Seminar ist Standardwissen zur Architektur von Betriebssystemen (VL Prof. Polze) und zur Rechnerkommunikation (VL Prof. Zorn).

Das Seminar konzentriert sich auf die Arbeit mit wissenschaftlichen Publikationen und Buchartikeln. Dabei sollen wichtige, grundlegende Erkenntnisse aus ausgewählten Veröffentlichungen auf dem Gebiet der fehlertoleranten Systeme erarbeitet und referiert werden. Die Teilnehmer sollen insbesondere Techniken der wissenschaftlichen Recherche erlernen und praktizieren. 

Von den Teilnehmern wird ein 45-50 minütiger Vortrag mit anschließender Diskussion und Auswertung (25-30 Minuten) erwartet. Zwei Wochen vor dem Vortragstermin sollten in einer Vorbesprechung die Vortragsunterlagen (Folien oder Tafelbild) bei einem Betreuer vorgestellt werden. Zum Seminar werden wöchentliche Konsultationen angeboten.

 

Termin:  Mittwoch, 11:00 Uhr - 12:30 Uhr, Raum A 1.2                                  

Themenvergabe:  23.04.2008      

 

Liste der Seminarvorträge:

Termin Vortragende(r) Betreuer Thema
23.04 Prof. Polze Themeneinführung
4.6 Alexander Schmidt, Andreas Rasche
Grundlagen und Begriffe für zuverlässige Systeme (Reliability, Dependability, Availability ...)
Reliability-Modelle, Failure-Modelle, Fehler-Bäume
"Dependability: Basic Concepts and Terminologie", J.C. Laprie
"Understanding Fault-Tolerant Distributed Systems", F. Christian
"Fault-Tolerance in the advance automation system", F. Christian et. al. 
11.6 Janek Schumann Alexander Schmidt Uhrensynchronisation
"Time, Clocks and the Ordering of Events in a Distributed System", L. Lamport
"On the possibility and impossibility of achieving clock synchronization", D.Dolev et. al.
Gruppenkommunikation und Reliable Multicast am Beispiel von ISIS
"Reliable communication in the presence of failures", K.Birman, T. Joseph
"Time, Clocks and the Ordering of Events in a Distributed System", L. Lamport
18.6 Johannes Nicolai Andreas Rasche Software-Fehlertoleranz ( Recovery Blocks, Acceptance Tests, Checkpointing) und Linux-Cluster
"A Program Structure For Error Detection And Recovery", J.J. Horning et.al.
"Software Fault Tolerance: A Tutorial", W.Torres-Pomales

N-Version Programming
"The Methodology of N-Version Programming", A.Avizienis
25.6 Frank Feinbube Andreas Rasche Fault-Tolerant CORBA
"Introduction to Fault-tolerant CORBA", Rob Martin and  Steve Totten
"Fault-tolerant CORBA standard", OMG
2.7 Daniel Richter Andreas Rasche The Simplex Approach
"Using Simplicity to Control Complexity", L.Sha
"Dependable System Upgrade", L. Sha
Boeing 777 Flight Controller
"Triple-Triple Redundant 777 Primary Flight Computer", Y.C. Yeh
erstellt von Andreas Rasche