Hasso-Plattner-Institut Potsdam Operating Systems and Middleware Group at HPI University of Potsdam, Germany
Operating Systems and Middleware Group at HPI

Seminar  

Fehlertolerante Systeme

Sommersemester 2005

Prof. Dr. habil. Andreas Polze

Dipl. Inf. Andreas Rasche
Dipl.-Inf Peter Tröger

Hasso-Plattner-Institut

polze@hpi.uni-potsdam.de

andreas.rasche@hpi.uni-potsdam.de  
peter.troeger@hpi.uni-potsdam.de

 

Im Sommersemester 2005 findet ein Seminar zum Thema Fehlertolerante Systeme statt. Das Seminar richtet sich an Studierende des Master-Studienganges Softwaresystemtechnik und wird einem der Themengebiete Softwaresystemtechnische Vertiefungsthemen oder Freie Informatikvertiefungsthemen zugerechnet. Voraussetzung für das Seminar ist Standardwissen zur Architektur von Betriebssystemen (VL Prof. Polze) und zur Rechnerkommunikation (VL Prof. Zorn).

Das Seminar konzentriert sich auf die Arbeit mit wissenschaftlichen Publikationen und Buchartikeln. Dabei sollen wichtige, grundlegende Erkenntnisse aus ausgewählten Veröffentlichungen auf dem Gebiet der fehlertoleranten Systeme erarbeitet und referiert werden. Die Teilnehmer sollen insbesondere Techniken der wissenschaftlichen Recherche erlernen und praktizieren. 

Von den Teilnehmern wird ein 45-50 minütiger Vortrag mit anschließender Diskussion und Auswertung (25-30 Minuten) erwartet. Zwei Wochen vor dem Vortragstermin sollten in einer Vorbesprechung die Vortragsunterlagen (Folien oder Tafelbild) bei einem Betreuer vorgestellt werden. Zum Seminar werden wöchentliche Konsultationen angeboten. Das Seminar ist unbenotet und wird mit 3 Belegungspunkten angerechnet. 

 

Termin:  Mittwoch, 11:00 Uhr - 12:30 Uhr, Raum A 1.1                                  

Themenvergabe:  13.4.2005      

 

Liste der Seminarvorträge:

TerminVortragende(r)BetreuerThema
13.4Prof. PolzeThemeneinführung, Grundlagen wissenschaftlicher Recherche
4.5.Dominik Tornow
(Vortrag)
A.RascheGrundlagen und Begriffe für zuverlässige Systeme (Reliability, Dependability, Availability ...)
Reliability-Modelle, Failure-Modelle, Fehler-Bäume
"Dependability: Basic Concepts and Terminologie", J.C. Laprie
"Understanding Fault-Tolerant Distributed Systems", F. Christian
"Fault-Tolerance in the advance automation system", F. Christian et. al. 
11.5Alexey RaskatovP.TrögerReplikation (Gossip)
"Providing Availability using Lazy Replication", R. Ladin
18.5Johannes Scheerer
(Vortrag)
P.TrögerUhrensynchronisation
"Time, Clocks and the Ordering of Events in a Distributed System", L. Lamport
"On the possibility and impossibility of achieving clock synchronization", D.Dolev et. al.
25.5Mario Oschwald
(Vortrag)
P.TrögerGruppenkommunikation und Reliable Multicast
"Reliable communication in the presence of failures", K.Birman, T. Joseph
"Time, Clocks and the Ordering of Events in a Distributed System", L. Lamport
1.6Matthias Wiemann
(Vortrag)
P.TrögerDie byzantinischen Generäle
"Byzantine Generals Problem", L. Lamport et.al.
"Authenticated algorithms for byzantine agreement", D. Dolev et.al.
8.6Jan-Henry Ohlert
(Vortrag)
A.RascheSoftware-Fehlertoleranz ( Recovery Blocks, Acceptance Tests, Checkpointing)
"A Program Structure For Error Detection And Recovery", J.J. Horning et.al.
"Software Fault Tolerance: A Tutorial", W.Torres-Pomales
15.6A.RascheN-Version Programming
"The Methodology of N-Version Programming", A.Avizienis
22.6P.TrögerFault Injection 
"Fault-Injection-Based Testing of Fault-Tolerant Algorithms in Message-Passing Parallel Computers", D.M. Blough et.al.
Failure Detectors
"Unreliable failure detectors for reliable distributed systems", T.Chandra  and S. Toueg 
15.6.Georg Köster
(Vortrag)
A.RascheThe Simplex Approach
"Using Simplicity to Control Complexity", L.Sha
"Dependable System Upgrade", L. Sha
22.6.Alexander Renneberg
(Vortrag)
A.RascheBoeing 777 Flight Controller
"Triple-Triple Redundant 777 Primary Flight Computer", Y.C. Yeh
erstellt von Peter Tröger und Andreas Rasche