Close

Vorfallmanagement für High-Velocity-Teams

Vor- und Nachteile unterschiedlicher Ansätze für das Bereitschaftsmanagement

Services sind weltweit bedeutender denn je. Ein Ausfall kann Millionen von Menschen betreffen und erhebliche Auswirkungen für sie haben: Sie können beispielsweise ihre Rechnungen nicht bezahlen, Flüge nicht buchen oder keine Videogespräche mit ihren Freunden führen.

Ganz gleich, ob du es mit einem schwerwiegenden Fehler, Kapazitätsproblemen oder einem kompletten Ausfall zu tun hast – Kunden, die auf deine Services angewiesen sind, erwarten eine unmittelbare Reaktion. (Das Gleiche gilt auch für interne Teams.)

Vorfälle können nicht nur aus finanzieller Perspektive bedeutende Auswirkungen haben (allein in Nordamerika kosten sie Unternehmen 700 Mrd. US-Dollar pro Jahr), sondern auch dem Ruf deines Unternehmens, Produkts und Teams schaden.

Da so viel auf dem Spiel steht, sind Teams dazu übergegangen, Bereitschaftsdienst von IT- und Entwicklerteams zu fordern, damit dem Unternehmen bei Vorfällen immer die richtigen Personen zum Lösen eines Problems zur Verfügung stehen, wann auch immer sie auftreten.

In Kombination mit einem Vergütungsplan für den Bereitschaftsdienst kann ein fairer Bereitschaftsplan sogar eine Kultur gemeinsamer Verantwortung fördern und Teams zu umfassenderen Erkenntnissen im Hinblick darauf verhelfen, was für die Entwicklung stabiler Software und Services erforderlich ist. Das wiederum führt zu einem besseren Gesamtprodukt und weniger Ausfällen.

Was ist Bereitschaftsdienst?

Beim Bereitschaftsdienst müssen sich bestimmte Mitarbeiter zu bestimmten Zeiten bereithalten, um im Falle eines dringlichen Serviceproblems helfen zu können, auch wenn sie zu dieser Zeit sonst eigentlich nicht arbeiten.

Der Bereitschaftsdienst ist eine wichtige Verantwortung in vielen IT-, Entwickler-, Support- und Operations-Teams, die Services ausführen, bei denen Kunden eine ununterbrochene Verfügbarkeit erwarten. Teammitglieder wechseln sich beim Bereitschaftsdienst ab und decken damit entweder den gesamten Tag oder nur die Zeiträume außerhalb der normalen Geschäftszeiten ab. Neben dem Techniker, der Bereitschaftsdienst hat, kommen Lösungen für automatisierte Überwachung und Warnmeldungen zum Einsatz, sodass unmittelbar auf Serviceunterbrechungen reagiert werden kann.

Die zunehmende Bedeutung des Bereitschaftsdienstes für IT- und Softwareteams

Der Bereitschaftsdienst gerät zuweilen in Verruf. Manche langjährigen IT-Mitarbeiter können von Horrorgeschichten über die Arbeit in Teams mit zu wenigen Ressourcen und Situationen berichten, in denen sie nicht den nötigen Support erhielten, um angemessen auf Vorfälle zu reagieren.

Viele dieser Sorgen können ausgeräumt werden, wenn der Bereitschaftsdienst richtig gestaltet ist. Mit einem effektiven Bereitschaftsplan kannst du sicherstellen, dass dein Team entsprechend den wachsenden Services skalieren kann, sodass eine konsistente Abdeckung für kritische IT-Funktionen und eine schnelle Incident Response ermöglicht wird.

Ein guter Plan für das Bereitschaftsmanagement bietet aber noch mehr Vorteile als die bloße Bewältigung von Ausfällen. Bei jedem Fehler können Teams sich neue Kompetenzen aneignen, beispielsweise in Form besserer Kenntnisse zu einem kritischen Service, zur Reaktion eines Service auf einen Fehler und zur Entwicklung weniger fehleranfälliger Designs oder zur Verbesserung des Incident-Response-Plans.

Außerdem kann ein gutes Programm für den Bereitschaftsdienst, das auf einer Kultur gemeinsamer Verantwortung basiert, auch den Teamgeist verbessern und Burn-outs reduzieren, was wiederum der Mitarbeiterbindung zugutekommen kann.

Vor- und Nachteile des Bereitschaftsdienstes

In Unternehmen, die auf DevOps setzen, übernehmen Softwareteams einen großen Teil der Verantwortung für die Zuverlässigkeit und Verfügbarkeit der Services, die sie erstellen – eine Aufgabe, die früher ausschließlich den Operations-Teams vorbehalten war. Für viele dieser Teams lautet das neue Motto "you build it, you run it", welches im Grunde besagt, dass sie für den anschließenden Betrieb ihrer eigenen Entwicklungen verantwortlich sind. Da sie den Code am besten kennen, sind Entwickler meist diejenigen, die Probleme am schnellsten beheben können.

Durch diesen Prozess bringen Entwickler bessere Software hervor, die weniger fehleranfällig ist. Diese Verlagerung der Verantwortung veranlasst die Entwickler dazu, ihren Code sorgfältiger zu testen, da sie schlussendlich außerhalb der Geschäftszeiten hinzugezogen werden können, wenn es Probleme mit dem Service gibt.

Das führt zu stabileren Systemen und weniger völlig erschöpften Mitarbeitern, da mehr Personen verfügbar sind und sich um Vorfälle kümmern können.

Ohne ein gutes Programm für den Bereitschaftsdienst können Unternehmen sich nicht alle kulturellen Vorteile von DevOps zunutze machen oder die Anforderungen in Zusammenhang mit einer skalierbaren Infrastruktur nicht erfüllen. Wenn ein Team sich mehr um die Vorfallreaktion kümmern muss als ein anderes, ist es nicht in der Lage, seine eigentliche Arbeit gut zu machen. Entwickler kommen dann nicht dazu, das Feedback aus Vorfällen zu implementieren, und Vorfallbearbeiter haben nicht die nötige Kapazität, um ihre Systeme zu stärken.

Bei einer ungleichmäßigen Verteilung der Verantwortung können die für den Bereitschaftsplan vorgesehenen Mitarbeiter nie wirklich abschalten und leicht vom Burn-out in die Knie gezwungen werden.

Ein Plan, der die wahren Abdeckungsanforderungen der Organisation berücksichtigt, die Zeit auf Entwickler- und IT-Betriebsteams aufteilt und Daten zur kontinuierlichen Verbesserung einbezieht, kann aber zu umfassenden Vorteilen führen. Nicht nur der Service für Kunden kann dadurch verbessert werden, auch die Mitarbeiter können Verbesserungen mit Blick auf ihre Kompetenzen und Produkte erzielen, sodass sie sich schlussendlich vielleicht sogar auf den Bereitschaftsdienst freuen werden.

So erzielst du Verbesserungen für Entwicklerrollen im Bereitschaftsdienst

"Ich kann es kaum erwarten, meinen Abend mit der Überwachung dieses Deployments und der Behebung möglicher Ausfälle zu verbringen!" — das hat wohl noch nie ein Techniker gesagt.

Da mehr Entwickler in ihrer Rolle auch die Pflege der von ihnen erstellten Services übernehmen, ist es wichtig, sicherzustellen, dass sie für ihre Verantwortlichkeiten im Bereitschaftsdienst vorbereitet sind. Der beste Zeitpunkt, um dies zu beurteilen, ist während des Einstellungsprozesses.

Es ist kein Geheimnis, dass Top-Talente aus Technik und Softwareentwicklung hoch im Kurs stehen. Und da Geld allein nicht alle Menschen motiviert, ist ein höheres Gehalt für Entwickler, die nach Feierabend arbeiten müssen, womöglich nicht die Lösung (mehr zur Vergütung für den Bereitschaftsdienst folgt später). Softwareentwickler werden während des Vorstellungsgesprächs natürlich fragen, wie oft sie dem Bereitschaftsdienst ihre Freizeit opfern müssen.

Ein dokumentierter Bereitschaftsplan mit gerechter Aufteilung der Verantwortung auf ein kompetentes Team aus Entwicklern und SRE-Mitarbeitern kann viel dazu beitragen, neue Mitarbeiter davon zu überzeugen, dass dein Unternehmen das Bereitschaftsmanagement unter Kontrolle hat. Ein dokumentierter Plan ermöglicht dir komplette Transparenz im Vorstellungsgespräch und du kannst sicherstellen, dass die Bewerber bereit sind, die nötige Bereitschaftsarbeit zu leisten.

Fünf einfache Tipps, wie du den Bereitschaftsdienst entwicklerfreundlicher gestaltest

  1. Definiere klar die Verantwortlichkeiten im Bereitschaftsdienst.
    Die Verantwortlichkeiten im Bereitschaftsdienst sollten klar definiert sein. Das verhindert Burn-out, Irritationen und Frustration. Wir empfehlen dir, deinen Incident-Response-Prozess und deine Erwartungen in Zusammenhang mit dem Bereitschaftsdienst zu dokumentieren.
  2. Stelle sicher, dass Warnmeldungen der richtigen Person zugewiesen werden.
    Die korrekte Einrichtung von Warnmeldungstools sollte nicht außer Acht gelassen werden. Durch einen klaren Bearbeitungs-Workflow mit den richtigen Benachrichtigungen und Aufhebungen lassen sich viele Probleme vermeiden.
  3. Lege primäre und sekundäre Bearbeiter fest.
    Die Welt steht nicht still, nur weil jemand Bereitschaftsdienst hat. Ein unerwarteter persönlicher Notfall kann einen Entwickler während seiner regulären Arbeitszeiten für Stunden handlungsunfähig machen und genau das kann auch im Bereitschaftsdienst passieren. Mit einem Plan B kannst du den aufgrund einer solchen Unterbrechung möglichen Schaden in Grenzen halten.
  4. Optimiere die Pläne.
    Teams sind nicht statisch und dein Bereitschaftsplan sollte es auch nicht sein. Wir empfehlen eine Kultur der ständigen Überprüfung, Anpassung und Verbesserung deiner Verfahren in Zusammenhang mit dem Bereitschaftsdienst.
  5. Stelle sicher, dass Mitarbeiter Zugang zu allen relevanten Diagnosetools haben und damit vertraut sind.
    Jedes Team nutzt andere Tools zum Nachverfolgen des Betriebszustands, der Anwendungsleistung, der Ressourcenauslastung usw. Vergewissere dich, dass deine Techniker im Bereitschaftsdienst mit den verwendeten Tools vertraut sind und Zugriff darauf haben.

So verbesserst du den Bereitschaftsdienst für Rollen im IT-Support und -Service

Es sind nicht nur die Entwickler, die dem Bereitschaftsdienst mehr Zeit widmen müssen. Auch bei den IT-Support- und IT-Service-Teams wird Support rund um die Uhr immer wichtiger, um das Unternehmen auf Kurs zu halten.

Diese Teams sind im Bereitschaftsdienst mit vielen Herausforderungen konfrontiert, die auch die Entwickler kennen: Stress, Burn-out, unklare Rollen und Verantwortlichkeiten, Zugang zu Tools.

Bei IT-Teams gibt es oft den zusätzlichen Stressfaktor, dass sie sich im gleichen Gebäude wie ihre Kunden befinden. Diese können die Dinge durch eine Vielzahl von Unterbrechungen (E-Mail, Slack oder sogar persönliches Vorbeikommen) in Zusammenhang mit dem Vorfall verlangsamen.

Hier ein paar Tipps, damit IT-Vorfälle kontrollierbar bleiben:

  • Sofortige und transparente Kommunikation: Eine proaktive Kommunikation rund um IT-Vorfälle zeigt, dass du dich kümmerst und die Dinge unter Kontrolle hast.
  • Überblick über alle wichtigen Punkte: Die meisten IT-Service-Teams nutzen eine Art Servicedesk-Software. Es ist wichtig, nicht einfach nur Felder zum Eingeben von Freiformdaten zu verwenden, um die Details der einzelnen Tickets zu erfassen.
  • Implementierung eines Überwachungssystems: Früher mussten viele IT-Operations-Teams Leistungs-Dashboards persönlich überwachen, um nach Ausfällen Ausschau zu halten. Indem du das durch Überwachungs- und Warnmeldungstools erledigen lässt, kannst du dem Team einen großen Gefallen tun.

Vergütung für den Bereitschaftsdienst

Mit einem guten Vergütungsplan für den Bereitschaftsdienst werden Mitarbeiter für ihr Know-how und für die Zeit entlohnt, die sie für die Arbeit nach Geschäftsschluss aufwenden. Wenn Mitarbeiter sich gut behandelt fühlen, werden sie sich bemühen, zum Erfolg des Unternehmens beizutragen.

Gemäß dem US-amerikanischen Fair Labor Standard Act (FLSA), einem Bundesgesetz, das Mindestlohn-, Überstunden- und Mindestaltersanforderungen für Arbeitgeber und Arbeitnehmer festlegt, gilt: Wenn ein Arbeitnehmer Bereitschaftsdienst hat, aber mit seiner Zeit tun kann, was er möchte, "wartet er auf seinen Einsatz" und arbeitet daher nicht.

Wenn die Freizeit einer Person eingeschränkt ist und sie in ihrer Freizeit nicht tun kann, was sie möchte, kann diese Bereitschaftsdienstzeit laut FLSA als "geleistete Arbeitsstunden" betrachtet werden und der Mitarbeiter kann Anspruch auf entsprechende Vergütung haben.

Deine lokalen Gesetze können abweichen. Daher solltest du unbedingt einen Experten zurate ziehen. Anschließend gilt es, an einem Vergütungsplan für den Bereitschaftsdienst zu arbeiten, der konkurrenzfähig und fair ist und eine Kultur der gemeinsamen Verantwortung unterstützt.

Verschiedene Vergütungsmodelle für den Bereitschaftsdienst

1. Anreize für Bereitschaftsdienst

Ein Vergütungsplan mit Anreizen für den Bereitschaftsdienst belohnt Mitarbeiter, die sich im Gegenzug für zusätzliche freie Tage, flexible Arbeitszeiten, höhere Grundgehälter oder eine Kombination dieser Dinge für Bereitschaftsarbeit melden.

Der Vorteil bei diesem Ansatz für die Bereitschaftsdienstvergütung ist ein ausgeprägteres Verantwortungsgefühl im Hinblick auf die Services, was zu robusteren Systemen führen kann.

Genügend Freizeit und eine konkurrenzfähige Bezahlung zu erhalten, zeigt Mitarbeitern auch, dass ihre Arbeit geschätzt und gewürdigt wird. So lassen sich Burn-outs vermeiden und die Fluktuation reduzieren.

2. Bezahlter Bereitschaftsdienst für geplante Überstunden

Beim bezahlten Bereitschaftsdienst werden Mitarbeiter für die Zeit bezahlt, die sie auf Abruf bereitstehen oder zum Arbeiten eingeteilt sind, auch wenn es während ihrer Schicht keine Probleme gibt.

Der offensichtliche Vorteil dieses Vergütungsmodells für den Bereitschaftsdienst ist der konkrete Anreiz. Wenn Mitarbeiter wissen, dass sie dafür bezahlt werden, einen Pager (oder eher einen Laptop und ein Mobiltelefon) dabeizuhaben, finden sie sich leichter damit ab, dass sie auf Abruf bereitstehen müssen, auch wenn keine Probleme auftreten.

3. Bezahlter Bereitschaftsdienst für die zur Behebung von Problemen aufgewendete Zeit

Ein anderer Vergütungsansatz für den Bereitschaftsdienst besteht darin, Mitarbeiter nur für die zur Bearbeitung eines Vorfalls aufgewendete Zeit zu bezahlen. Hier einige Kalkulationsoptionen:

  • Zahlung eines Gesamtbetrags für den Bereitschaftsdienst
  • Stundensatz für die zur Bearbeitung von Warnmeldungen/Problemen aufgewendete Zeit
  • Anteilige Bezahlung für die Anzahl der bearbeiteten Warnmeldungen und Probleme

Der Vorteil dieses Modells besteht darin, dass Mitarbeiter für die zusätzliche Arbeit bezahlt werden, die sie außerhalb der normalen Geschäftszeiten leisten. Ein möglicher Nachteil ist, dass es aus finanzieller Sicht unattraktiv ist, für weniger Warnmeldungen und Probleme zu sorgen, und das könnte wiederum die Integrität des Systems insgesamt beeinträchtigen.

4. Bezahlter Bereitschaftsdienst für geplante Überstunden und die für Probleme aufgewendete Zeit

Dies ist eine Kombination der beiden zuvor beschriebenen Modelle. Manche Unternehmen bezahlen Mitarbeiter für die Einteilung im Bereitschaftsplan und bieten ihnen eine zusätzliche Summe für die erhaltenen Warnmeldungen und bearbeiteten Probleme. Der Vorteil dieses Vergütungsmodells für den Bereitschaftsdienst ist, dass die Mitarbeiter das Gefühl haben, dass der vom Unternehmen zusätzlich geforderte Zeit- und Arbeitsaufwand hinreichend vergütet wird. Zudem erhalten die Mitarbeiter mit diesem Modell eine finanzielle Entschädigung, wenn sie aufgrund eines besonders schwierigen Problems ihre Freizeit opfern müssen. Doch auch hier solltest du wieder abwägen, ob es für die Kultur in deinem Unternehmen sinnvoll ist, eine indirekte Entlohnung für Fehler in der Software einzuführen.

Ebenfalls zu beachten

Dies sind die typischen Vergütungsmodelle für den Bereitschaftsdienst. Du solltest jedoch noch einige weitere Aspekte berücksichtigen (sofern zutreffend):

  • Anzahl der während der Geschäftszeiten und nach Geschäftsschluss eingegangenen Warnmeldungen

Diese Zahl ist wichtig, um zu bestimmen, ob du einen Bereitschaftsplan für die Zeit nach Geschäftsschluss oder ein spezielles Bereitschaftsteam während der regulären Geschäftszeiten benötigst.

  • Für die Bearbeitung der Vorfälle aufgewendete Zeit

Die Komplexität und Bedeutung der Vorfälle deines Unternehmens kann variieren. Ein Techniker im Bereitschaftsdienst braucht zur Lösung eines Problems vielleicht nur wenige Minuten, es ist aber auch möglich, dass er den ganzen Abend mit der Bewältigung eines Vorfalls verbringen muss. Der Zeit- und Arbeitsaufwand während einer normalen Bereitschaftsschicht sollte berücksichtigt werden. Für eine faire Vergütung ist hier eine Messung erforderlich.

  • Durchschnittliche Zeit bis zur Bestätigung oder Lösung

Die Zeit bis zur Bestätigung sollte in Eskalationsrichtlinien zwingend vorgegeben sein und ist für eine schnelle Lösung entscheidend. Die Messung der durchschnittlichen Zeit bis zur Bestätigung und Lösung über einen bestimmten Zeitraum hilft Managern, über zusätzliche Anreize zu entscheiden.

Fazit

Die richtigen Tools erleichtern dir den Umgang mit Bereitschaftsrichtlinien. Verbesserte Lösungen für das Vorfallmanagement helfen dir dabei, Bereitschaftspläne und Überwachungsmeldungen zu verwalten und dafür zu sorgen, dass deine Mitarbeiter zufrieden und gesund bleiben. Die Warnmeldungsfunktionen von Jira Service Management ermöglichen es Teams, Alarme für alle Überwachungs-, Protokollierungs- und CI/CD-Tools zu zentralisieren und zu filtern, um schnell reagieren zu können und Alarm-Fatigue zu vermeiden.