Wie ernst zu nehmen sind die jährlich von verschiedenen Anbietern herausgegebenen Sicherheits-Rankings von Fluggesellschaften, die regelmäßig ein großes mediales Echo erzeugen? Wir haben einen Statistiker mit Luftverkehrsbezug befragt, welche Schlüsse man aus den wenigen Unfällen im zivilen Luftverkehr ziehen kann und welche nicht. Ein Interview aus dem Januar 2021 mit Prof. Dr. Andreas Thams über Randwahrscheinlichkeiten, Monte-Carlo-Simulationen und das Gesetz der großen Zahlen in Bezug auf Luftverkehrssicherheit.

Geschenkt! Eigentlich ist das ein Plus-Artikel Mit airliners+ erkennen Sie Zusammenhänge besser. © Adobe Stock Wertvolle Hintergründe und Einordnungen machen airliners+ für Abonnenten unverzichtbar. Mit diesem Artikel bieten wir Einblicke hinter unsere Paywall. Wollen auch Sie Zusammenhänge besser verstehen? Dann werden Sie jetzt airliners+ Abonnent. Mit ihrer Firma/Abteilung oder privat. Jetzt einen Monat für 1,00€ testen.

Professor Thams, mit etwas Fantasie kann man Zusammenhänge erkennen, die nicht unbedingt stimmen müssen. So ist die Wahrscheinlichkeit, bei einem Flugunfall zu sterben, im vergangenen Jahr um über 400 Prozent angestiegen, während gleichzeitig ein großer Anteil der Geschäftsreisenden angibt, zukünftig verstärkt auf Videokonferenzen zu setzen. Ein dramatischer Vertrauensverlust für die Luftfahrt, oder?

Prof. Andreas Thams: (Lacht) Nein, das kann ja nicht sein. Erst einmal muss man sich hüten, statistische Erkenntnisse in einen Zusammenhang zu setzen, die zwar im Ergebnis korrelieren, aber inhaltlich nicht zusammengehören. Dass Videokonferenzen während der Corona-Homeoffice-Zeit gefragt sind und einige das zum Teil auch beibehalten wollen, hat ja nichts mit der unterstellten Verschlechterung der Luftsicherheit zu tun.

Aber da kommen wir zum zweiten Fehler in der Auslegung. Auch hier kommt Corona zum Tragen, was dazu führt, dass die Anzahl der operierten Flüge und die der Sitzplatzkilometer deutlich gesunken sind, was Einzug in diese Statistik hält. Verglichen damit gab es bedauerlicherweise verhältnismäßig mehr Todesopfer bei Flugunfällen, verglichen mit dem Jahr davor.

Über den Interview-Partner Andreas Thams. © Andreas Thams Prof. Dr. Andreas Thams ist Statistiker und lehrt Airline- und Tourismusmanagement an der IUBH Bad Honnef sowie an der Hochschule Worms. Er ist Partner der auf die Travel Industry spezialisierten Unternehmensberatung UNEX Consulting und verfügt über langjährige Management-Erfahrung in der Reise- und Tourismusindustrie.

Aber hätte man statistisch betrachtet nicht von weit weniger Unfalltoten ausgehen müssen - oder andersrum gefragt: Gibt es generell so wenige Unfälle in der Luftfahrt, dass solche Zahlen ohnehin nur zufällig ausfallen?

Nunja, das hat zunächst einmal damit zu tun, dass in der Bewertung meist eine komplett vergangenheitsorientierte Sicht stattfindet. Das ist ja nichts Gegenwartorientiertes und damit haben Sie diese rein kalkulatorischen 400 Prozent, wenn die denn überhaupt stimmen, was ich nicht nachgeprüft habe, weil die Zahl als solches schlichtweg keinen Sinn macht. Sie ist das Ergebnis eines rein rechnerischen Effekts. Fliegen an sich ist aber deswegen nicht unsicherer geworden. Nehmen wir den Absturz eines Widebodys. Das passiert ja zum Glück nur extrem selten. Aber dann ist der Luftverkehr insgesamt in diesem Jahr ja nicht unsicherer geworden. Statistisch gesehen schlägt hier das Gesetz der großen Zahlen zu, mit dem Ergebnis, dass es in unserem Beispiel einmalig zu einem Ereignis mit einer erhöhten Zahl von Todesopfern gekommen ist. Womit wir es hier also statistisch zu tun haben, sind sogenannte Randwahrscheinlichkeiten.

Haben Sie vielleicht ein Beispiel abseits der Luftfahrt zu Randwahrscheinlichkeiten?

Randwahrscheinlichkeiten sind im Grunde genau das, was Banken bei der Kreditvergabe betrachten, auch wenn man für oder gegen eine Kreditzusage von den menschlichen Auswirkungen natürlich nicht mit Flugunfällen vergleichen kann. Aber auch bei der Frage, ob jemand seinen Kredit zurückbezahlen kann, geht es ja nicht vor allem darum, was der Antragsteller in den vergangenen 30 Jahren gemacht hat, sondern im Wesentlichen um die finanziellen Kennziffern, die die aktuelle Situation des Kreditnehmers beschreiben.

Also sollte man für Sicherheits-Rankings von Fluggesellschaften nicht die Vergangenheit betrachten?

Wissen Sie, wenn man Fluggesellschaft A und B vergleicht und betrachtet, dass A mehr geflogen ist als B, dann heißt das ja nicht, dass A sicherer wäre als B. Auch ein Unfall vor fünf Jahren sagt nicht zwangsläufig etwas darüber aus, wie groß das aktuelle Risiko ist, dass es bei einer der beiden Airlines zu einem weiteren Extremfall kommt. Man kann sich natürlich alle Vorfälle der letzten Jahrzehnte anschauen und einen Mittelwert dazu bilden. Aber dadurch, dass sich die Wahrscheinlichkeiten für Unfälle in der Luftfahrt statistisch betrachtet in den Rändern befinden, sagt das natürlich nichts darüber aus, wie sich die Risiken in diesen Randwahrscheinlichkeiten für die einzelne Fluggesellschaft entwickeln.

Einzelne Fluggesellschaften sind nur Teile des Ganzen.

Einzelne Fluggesellschaften sind nur Teile des Ganzen. Natürlich kann man sehen, dass die Luftfahrt insgesamt heute durchschnittlich viel sicherer ist als im Durchschnitt vor 30 oder 40 Jahren. Aber dieser Durchschnitt ist nur eine Sache. Um in den statistischen Rändern Wahrscheinlichkeiten auf der Ebene einzelner Airlines modellieren zu können, müsste man viel tiefer in die operativen Prozesse der jeweiligen Fluggesellschaften einsteigen. Das wird sogar gemacht. Dazu gibt es Audits wie beispielsweise das Iata-Sicherheitsaudit Iosa.

Kann man aber Fluggesellschaften, die kein Iata-Mitglied sind, weil sie es für ihr Geschäftsmodell ohne Umsteiger einfach nicht benötigen, eine schlechtere Sicherheitskultur unterstellen?

Iosa-Zertifikate haben Sinn, weil sie eine objektive Bewertung darstellen, was die Qualität von Prozessen und Safety-Management bei einer Airline angeht und zwar kontinuierlich. Es hilft einer Airline immer, die eigenen internen Prozesse von einem unabhängigen Gremium überprüfen und objektiv bewerten zu lassen. Zudem ist ein Iosa-Zertifikat eine öffentlich zugängliche Information, die man natürlich als Variable nutzen kann, um statistische Ableitungen zu ziehen.

Ich bin mir aber sicher, dass beispielsweise die großen europäischen Billigflieger, die keine Iata-Mitglieder sind, überwiegend problemlos ein Iosa-Zertifikat bekommen würden, denn die wenigen Zwischenfälle bei der Größe dieser Airlines zeigen, dass hier belastbare Flugbetriebe bestehen. In diesen Fällen aus dem statistischen Effekt des fehlenden Zertifikats abzuleiten, dass diese Fluggesellschaften unsicherer sind als andere, halte ich für eine verfälschte Aussage.

Nur wie kann man dann valide statistische Aussagen treffen?

In der Statistik geht es ja auch darum, Aussagen in Bezug auf die Zukunft treffen zu können. Auf Basis rein deskriptiver Ereignisse ist das aber viel zu kurz gegriffen. Moderne Statistik dreht sich stattdessen darum, Wahrscheinlichkeitsverteilungen zu bilden. Wie viel Wahrscheinlichkeit gibt es am Rande der Verteilung? Darum geht es hier. Dabei sind die deskriptiven Variablen sicher interessant. Aber darüber hinaus müssen noch viele weitere Variablen betrachtet werden. Um eine Reihenfolge abzubilden, also "Airline A ist sicherer als Airline B", müsste man zunächst einmal eine komplette Vergleichbarkeit herstellen. Nur gibt es da immer Inkonsistenzen und Ausreißer.

Das sind Fragestellungen, mit denen sich jeder Statistiker beschäftigen muss. Dabei muss man immer Approximationen treffen und dafür wiederum Hypothesen. Jede dieser Annahmen kann man dann wissenschaftlich hinterfragen und kritisieren. Solche Herausforderungen sehen wir ja auch gerade während Corona. Die Entscheidungen bezüglich Annahmen muss man aber am Ende des Tages treffen, man sollte diese nur gut begründen können und das trifft zu, wenn sie die Realität möglichst gut abbilden und entsprechend belastbar sind.

Bei über 40 Millionen Flügen sind 2019 laut Icao bei fünf Unfällen 239 Menschen gestorben. Wie kann das statistisch relevant sein?

Statistisch relevant ist das schon, es passieren ja Unfälle, es gibt also eine Restwahrscheinlichkeit, dass etwas passiert. Eine eins-zu-eins-Übersetzung mit Wahrscheinlichkeitsvergleichen von einem Jahr auf das andere ist dabei aber grundsätzlich falsch, weil das rein deskriptiv und nicht induktiv betrachtet wäre.

Die Frage ist hier doch: Wie bekomme ich bei einem analytisch nicht oder nur teilweise erfassbaren Problem eine Aussage, die wirklich eine statistische Relevanz und Belastbarkeit hat? Dazu gibt es bestimmte Sampling-Verfahren. Eines ist beispielsweise die sogenannte "Monte Carlo"-Simulation.

Zielführender als ein Ranking einzelner Airlines wäre also beispielsweise eine Einteilung in Risikogruppen.

Dabei kann man am Rechner Tausende, Zehntausende oder annähernd unendlich viele Jahre Luftverkehr durchlaufen lassen. Dabei kann man mit ganz, ganz vielen Ziehungen, in der Statistik Iterationen genannt, simulieren, was da eigentlich approximativ passiert. Also eine Aussage dazu treffen, wie hoch beispielsweise die Wahrscheinlichkeit ist, dass bei einem Flugereignis ein Unfall passiert. Jedes Flugereignis wird dabei in der resultierenden Wahrscheinlichkeitsverteilung abgebildet. Die Kunst ist dabei nun, herauszufinden, ob es in den "Tails" der Verteilung keine falsche Konzentration der Wahrscheinlichkeiten gibt, was für eine erhöhte Unfallwahrscheinlichkeit sprechen würde.

Aber es gibt dabei durchaus Konzentrationen in den Wahrscheinlichkeiten, die statistisch relevant sind?

Nehmen wir den Flughafen Lukla am Mount Everest. Da wäre sicherlich die Hypothese, dass es in den "Tails", also den Flugereignissen, die wir gerade untersuchen, eine höhere Wahrscheinlichkeit für Unfälle gibt als beispielsweise in Frankfurt. Ganz einfach, weil Frankfurt über hervorragende Security-Prozesse und beispielsweise über einen "Cat-III-"Precision-Approach verfügt, falls das Wetter mal schlecht ist. Das ist natürlich an einem Bergflugplatz im Himalaja anders. Da gibt es einen Sichtanflug von nur einer Landerichtung und dann landet man auch noch bergauf. Statistisch kommt es dadurch dazu, dass sich hier größere Wahrscheinlichkeitsmassen für einen Unfall bilden.

Und aus der Masse solcher Betrachtungen könnte man dann die Sicherheit für einzelne Fluggesellschaften ableiten?

Natürlich. Man könnte das anhand von Kennziffern herunterbrechen und Wahrscheinlichkeiten modellieren. Aber man kann das natürlich nicht so statisch präsentieren, wie es in diesen Sicherheits-Rankings getan wird, die immer zum Jahresanfang durch die Publikumspresse geistern. Dabei geht es vor allem um das Stichwort der Datengenauigkeit. Zielführender als ein Ranking einzelner Airlines wäre also beispielsweise eine Einteilung in Risikogruppen.

Wenn man dann am Ende des Tages alle Flugereignisse einer Fluggesellschaft vollumfänglich betrachtet und alle Annahmen modelliert hat, kann man die "Tails" kumulieren und hat dann schlussendlich ein Risikoprofil für eine Fluggesellschaft. Daraus ließe sich dann sicher ableiten, dass eine Airline, die nur nach Lukla fliegt, eine höhere Unfallwahrscheinlichkeit hat als eine, die ausschließlich nach Frankfurt operiert. Nur ist sich natürlich jeder Fluggast, der nach Lukla fliegt, auch so dieser höheren Unfallwahrscheinlichkeit bewusst.

Nun hat sich das Unfallgeschehen in den vergangenen Jahren ganz generell von der Start- und Landephase verschoben. Flugzeuge stürzen vermehrt aus Reiseflughöhe ab. Wie geht man damit statistisch um?

Die Einflüsse für Unfallwahrscheinlichkeiten verändern sich natürlich im Zeitablauf. Unfälle während Take-Off und Landing sind weniger geworden. Nichtdestotrotz sind diese Phasen bei der Flugdurchführung weiterhin von der Ausgangssituation die risikoreichsten eines Fluges. Aber durch aktives Safety und Quality-Management einer Airline werden diese Risiken minimiert und das kann durchaus dazu führen, dass der Einfluss auf die Unfallwahrscheinlichkeit nach unten reduziert - und das durchaus statistisch signifikant. So ist das Flugzeug über die Zeit vom unsichersten zum sichersten Verkehrsmittel geworden.

**Beispiel Malaysia Airlines: Jahrelang keine Unfälle und in den Sicherheitsrankings weit oben. Jetzt ist die Airline nach zwei schier unglaublichen Unfällen fast Schlusslicht. Ist das statistisch zu erklären?

In diesem Fall ist eine Veränderung im Ranking in punkto statistischer Signifikanz und Interferenz sicherlich eine falsche Aussage. Einer der Abstürze ist ja noch gar nicht geklärt und der zweite war ein Abschuss über einem Krisengebiet, das auch von vielen anderen Airlines überflogen wurde. Daraus nun abzuleiten, diese Airline habe in der Zukunft ein erhöhtes Unfallrisiko, ist mit Sicherheit so nicht korrekt. Die wahre Wahrscheinlichkeitsverteilung wird man aber nie herausfinden. Unsere Aufgabe als Statistiker ist es, diese wahre Wahrscheinlichkeit so gut es geht annäherungsweise zu schätzen.

Bei vergleichbaren Airlines geht es ohnehin immer um die statistische Signifikanz. Also die Frage: Ist ein Unfall überhaupt statistisch signifikant für die zukünftige Unfallwahrscheinlichkeit der betroffenen Airline? Da kann man sich im Einzelfall natürlich vortrefflich um die Details streiten. Daher würde es sicher im Einzelfall einer wissenschaftlichen Analyse bedürfen. Oft kommt man dann wohl zum Schluss, dass der betrachtete Unfall, bei all der Dramatik, nichts anderes war als ein Ergebnis des Gesetzes der großen Zahlen. Verkettungen unglücklicher Umstände, Terroranschläge…

Aber das führt uns noch zu einem ganz anderen Effekt, denn egal ob Terroranschlag, Überflüge von Krisengebieten oder auch der Absturz der Germanwings in den französischen Alpen. All diese Ereignisse zeigen, dass in der Luftfahrt nach jedem Vorfall Rückschlüsse gezogen und Maßnahmen ergriffen werden, die sich dann positiv auf die zukünftigen Wahrscheinlichkeiten auswirken, ob ein Vorfall in vergleichbarer Art und Weise noch mal passieren kann.

Ist die Wahrscheinlichkeit, dass ein Terrorist einen Absturz herbeiführt genauso hoch wie vor dem 11. September? Oder die Wahrscheinlichkeit, dass ein Pilot noch mal ein Flugzeug in den Boden steuert? Nein, die Wahrscheinlichkeiten sind geringer als damals, weil man sich Prozesse angeschaut und angepasst hat. Das machen wir in unserer Branche nach jedem Zwischenfall. Hinzu kommen Crew Assessments sowie Crew Coordination und Ressource Management. Genau für diese Verfahren bei der Aufarbeitung von Zwischenfällen ist die Luftfahrt sogar ein Vorbild für viele andere Bereiche. Wir wissen, dass das funktioniert, und zwar weil es eben auch statistisch bewiesen ist.

Ein passender Abschlusssatz! Vielen Dank für das Gespräch.