Close

Vorfallmanagement für High-Velocity-Teams

Was können Vorfallmanagementteams von der Luftfahrtbranche lernen?

Jeder weiß, dass Fliegen die sicherste Art zu reisen ist und dass die Luftfahrtbranche ihr Vorfallmanagement in den letzten Jahrzehnten massiv verbessert hat. Tatsächlich gab es im Jahr 1959 pro eine Million Flüge 40 tödliche Unfälle. Ein Jahrzehnt später war diese Zahl auf zwei Fälle gesunken und liegt heute bei 1.

Oberflächlich betrachtet mag das Risiko in der Luftfahrt höher sein als in der Softwarebranche (die Wahrscheinlichkeit, an einem Zusammenbruch des elektronischen Handels zu sterben, ist wesentlich geringer als bei einem Ausfall der Bordelektronik). Die gängigen Praktiken zur Vermeidung von Vorfällen sind aber gar nicht so unterschiedlich. Beide Branchen müssen Risiken handhaben, Warnmeldungen ausgeben und gegen Alarm-Fatigue ankämpfen. Beide brauchen Zeitpläne, um wichtige alltägliche Anforderungen zu erfüllen. Beide sind von Vorfällen mit unterschiedlichen Schweregraden betroffen. Beide Branchen verfolgen gewissenhaft KPIs nach und beide werden von der Öffentlichkeit und von ihren Kunden zur Verantwortung gezogen.

Aus diesem Grund kann die Technologiebranche vielleicht das ein oder andere von dem kompromisslosen Ansatz der Luftfahrtindustrie lernen, was die Verbesserung des Vorfallmanagements und die Vermeidung von Vorfällen angeht. Hier sind fünf Praktiken aufgeführt, die dein Team von führenden Luftfahrtunternehmen übernehmen kann:

Konstruktion und Einführung unter dem Gesichtspunkt des Vorfallmanagements

In der Luftfahrt- wie in der Technologiebranche kann die Entwicklung unter Berücksichtigung von potenziellen Vorfällen einen großen Einfluss darauf haben, wie teuer diese Vorfälle letztendlich werden.

In der Luftfahrt wurde im Jahr 1988 mit der Einführung von 16G-Sitzen der Schutz vor Kopf- und Brustverletzungen erhöht und die Wahrscheinlichkeit verringert, aufgrund von Sitzverformungen bei einem Crash eingeklemmt zu werden. Weil sie Leben retteten und Verletzungen vermeiden halfen, belief sich der geschätzte wirtschaftliche Nutzen dieser Sitze über 25 Jahre betrachtet auf insgesamt 78,9 Mio. US-Dollar. Und das nur deshalb, weil bei der Konstruktion mögliche Vorfälle berücksichtigt wurden.

In der Technologiebranche sehen wir einen ähnlichen Nutzen durch den aufkommenden You-built-it-you-run-it-Ansatz, bei dem die Zuständigkeiten von Entwicklung und Vorfallmanagement verschmolzen werden. Ein Vorteil dieses Ansatzes ist folgender: Mit der Entwicklung von Technologie beauftragte Teams sind sich des Risikos von Vorfällen stärker bewusst und werden eher etwas unternehmen, um sie zu verhindern und ihre Auswirkungen minimal zu halten.

Nutze Automatisierung, um die Wahrscheinlichkeit menschlicher Fehler zu reduzieren

Als häufigste Ursache für Luftfahrtunglücke wird der Pilotenfehler genannt. Bei Software- und IT-Vorfällen wird häufig auf Einzelpersonen mit dem Finger gezeigt. In beiden Lagern kann Automatisierung helfen, die in mehreren Branchen nachweislich die Fehlerzahl deutlich reduzieren konnte. Da ist es nur logisch, dass die Luftfahrtbranche von Jahr zu Jahr stärker automatisiert. Mittlerweile übernimmt der Autopilot das Fliegen zu etwa 90 % und vollautomatisierte Optionen werden gerade geprüft.

Menschliche Fehler sind gang und gäbe, deshalb stellen wir uns bei Atlassian bei unseren Post-Mortem-Analysen vor allem folgende Frage: Gibt es irgendwelche Vorgänge, die wir automatisieren können, um erneute Vorfälle zu vermeiden? Denn ein Problem lässt sich manchmal mit einem einfachen technischen Trick vermeiden.

Ein gutes Beispiel dafür ereignete sich bei Atlassian vor ein paar Jahren:

"Ein Entwickler machte einen großen Fehler bei der Syntax einer Konfigurationsdatei für ein wichtiges Gerät. Dieser legte das gesamte Unternehmen 45 Minuten lang komplett lahm und alles in allem gingen dabei mehrere Hunderttausend US-Dollar verloren … Menschen machen Fehler, daran kann man nichts ändern. Die Frage ist, wie machen wir es weniger wahrscheinlich, dass menschliches Versagen passiert?

"Am Ende bestand die einfache, permanente Lösung in einer automatisierten Überprüfung der Konfigurationsdatei vor dem Laden, um jegliches menschliche Eingreifen in die Systemkonfiguration überflüssig zu machen. Das Problem, das den Ausfall verursacht hat, wird nun durch eine schnelle technische Lösung verhindert."

Lege klare Prioritäten fest und entwickle Warnmeldungen dafür

Wenn die Luftfahrtindustrie eines besser kann als der Rest, dann ist es die rigorose enge Definition von Prioritäten. Denn auch in einer Notsituation gibt es einige Fälle, die dringender sind als andere. Und wenn ein Flugzeug kurz vor dem Absturz steht, sollte der Pilot ganz genau wissen, in welcher Reihenfolge er sich um welche Notsituation kümmern muss.

Aus diesem Grund erhält der Pilot nur bei 10 % der Flüge überhaupt eine Warnung, obwohl der Computer zu jedem beliebigen Zeitpunkt über 10.000 Datenpunkte in einem Flugzeug nachverfolgt. Muss der Pilot wissen, dass der Scheibenenteiser von der Einstellung "Hoch" zu "Mittel" wechselt? Muss er wissen, dass eine Hydraulikpumpe ausgefallen ist und eine andere ihre Funktion übernommen hat – ohne Auswirkungen auf das Flugzeug oder seine Route? Laut Luftfahrtsachverständigen muss die Antwort in beiden Fällen "Nein" heißen.

Wenn Warnungen erforderlich sind, etwa beim Ausfall eines Triebwerks oder bei Problemen mit dem Kabinendruck, und diese im Cockpit angezeigt werden, sind ihre Prioritätsstufen eindeutig. Sie werden dann nicht nur durch visuelle Signale wie Text und rote Leuchten, sondern auch durch akustische und physische Hinweise angezeigt, zum Beispiel durch eine Warnansage oder eine vibrierende Steuersäule.

Für die höchste Alarmstufe gibt es erwartungsgemäß die meisten Hinweise. Wenn das Flugzeug sich im Sturzflug befindet, erhält der Pilot eine rote Textnachricht, sieht rote Leuchten, hört eine Warnansage und spürt die Steuersäule vibrieren.

Eine Alarmstufe darunter sind die Signale bis auf die vibrierende Steuersäule die gleichen. Bei der nächsten Stufe darunter werden Leuchten und eine Textnachricht in Gelb angezeigt. Noch eine Stufe tiefer wird eine einfache Textnachricht auf dem Bildschirm angezeigt, der Pilot muss hier aber nicht eingreifen. Dank dieser strengen Hierarchie wissen Piloten genau, worauf sie achten müssen.

Lege hohe Schwellenwerte für Warnmeldungen fest

Die Luftfahrtbranche zeigt nicht nur unterschiedliche Warnprioritäten an, sondern versteht es auch ausgezeichnet einzuordnen, in welchem Fall eine Warnung ausgegeben werden muss und wann auf keinen Fall.

Die oberste Prioritätsstufe ist nur den schlimmsten Notfällen vorbehalten – solche, bei denen das Flugzeug abstürzen kann, wenn der Pilot keine sofortigen definitiven und entschiedenen Maßnahmen ergreift.

Warnungen der zweiten Prioritätsstufe erfordern ebenfalls das sofortige Eingreifen des Piloten, das Flugzeug ist in diesem Moment aber nicht absturzgefährdet. Auslöser hierfür sind beispielsweise Druckabfall in der Kabine oder ein Konflikt im Flugverkehr, der eine Kollision nach sich ziehen könnte.

Auf der dritten Prioritätsstufe wird der Pilot auf ein Problem hingewiesen, er muss aber nicht sofort darauf reagieren. Und genau an dieser Stelle macht sich die rigorose Festlegung von Prioritätsstufen sehr deutlich bemerkbar. Denn selbst bei einem Triebwerksbrand oder dem Ausfall eines einzelnen Triebwerks würde höchstens eine Warnung ausgegeben werden.

Mithilfe dieses kompromisslosen Ansatzes für Priorisierung konnte die Luftfahrtbranche die Alarm-Fatigue bekämpfen und ihre Passagiere besser schützen.

Halte Playbooks und Checklisten bereit

Wenn eine Warnung ausgegeben wird, weil die Klimaanlage ausgefallen ist (was zum Abfall des Kabinendrucks führen kann) oder ein Triebwerk kurz vor dem Ausfall steht, verlässt sich die Luftfahrtindustrie nicht darauf, dass der Pilot für die Behebung des Vorfalls ausgebildet ist.

Die Ausbildung des Piloten wird natürlich eine Rolle spielen, aber es ist sicherer (und vor allem schneller), die nächsten Schritte direkt zu kommunizieren. Aus diesem Grund gibt es bei Cockpitwarnungen eine Checkliste mit den nächsten Schritten, die auf die spezifische Warnung zugeschnitten sind. Der Ansatz ist zwar nicht mit Automatisierung gleichzusetzen, hat aber ähnliche Vorteile. Das System verlässt sich in diesem Fall nicht ausschließlich auf die Ausbildung der handelnden Personen, sondern gibt exakte Anweisungen, wie man ein Problem am besten beheben könnte.

Das Engagement in der Luftfahrt, VM-Verfahren immer weiter zu verbessern, lässt sich auch auf andere Bereiche übertragen. So können zum Beispiel in der Technikbranche Incident-Response- und Management-Verfahren optimiert werden.

Erfahre mehr darüber, wie Jira Service Management Teams dabei helfen kann, auf Vorfälle zu reagieren, sie zu lösen und sich immer weiter zu verbessern.