Close

Der Weg zu einem besseren Vorfallmanagement beginnt hier

Tipps zur Auswahl eines Tools für das Vorfallmanagement

Kategorien, wichtige Funktionen und worauf du achten solltest

Es gibt kein für alle Teams geeignetes Universaltool für das Vorfallmanagement.

Die erfolgreichsten Incident Response-Teams nutzen eine Kombination aus für sie passenden Tools, Praktiken und Fachleuten.

Einige dieser Tools sind konkret auf das Vorfallmanagement zugeschnitten, andere sind allgemeiner und werden von den Teams auch für andere Aufgaben verwendet. Vielleicht entwickelt dein Team sogar ganz eigene Tools mit verschiedenen Integrationen und Anpassungen.

Unabhängig vom Verwendungszweck haben gute Tools für das Vorfallmanagement einige Gemeinsamkeiten: Sie sind alle offen, zuverlässig und anpassbar.

Offen: Bei einem Vorfall stehen alle Beteiligten unter Druck. Daher ist entscheidend, dass die richtigen Personen sofort Zugriff auf die richtigen Tools und Informationen haben. Dies gilt nicht nur für die Reaktionsverantwortlichen, sondern auch für Stakeholder aus dem Unternehmen, die Einblick in die Abläufe bei der Reaktion benötigen.

Zuverlässig: Der Worst Case bei der Incident Response tritt ein, wenn auch noch die für die Reaktion benötigten Tools ausfallen. Mit Cloud-Tools wie Slack und Opsgenie minimierst du das Risiko, dass sich ein Ausfall deiner Infrastruktur auch auf deine Reaktionstools auswirkt.

Anpassbar: Faktoren wie Integrationsmöglichkeiten, Workflows, Add-ons, Anpassbarkeit und APIs eröffnen dir über das Produkt hinaus neue Möglichkeiten. Für den Anfang genügt vielleicht eine vorgefertigte Konfiguration, aber wenn deine Praktiken und Prozesse reifen, sollten die Tools flexibel genug sein, um sich an deine wechselnden Anforderungen anzupassen.

Abbildung: Vorfallmanagementzyklus

Vor dem Vorfall

Überwachung

Mit Überwachungssystemen können DevOps- und IT-Ops-Teams Daten aus mehreren Tausend verschiedenen Services in Echtzeit sammeln, aggregieren und zum Auslösen von Warnmeldungen nutzen. Diese sind entscheidend für einen vollständigen Einblick in den Zustand deiner Services und lösen bei einem Vorfall häufig den ersten Alarm aus.

Vorteile

Mit Überwachungstools hat dein Team ständig Einblick in den Zustand der Infrastruktur. Moderne Überwachungstools lösen außerdem bei unerwarteten Aktivitäten proaktiv Warnmeldungen aus.

Funktionen

 

Funktionen

Zu stellende Fragen

 

Funktionen

Abdeckung und Analysen rund um die Uhr

Zu stellende Fragen

Hat das Tool Einblick in alle meine Server und Infrastrukturen?

Kann mein Team Echtzeitanalysen und Dashboards anzeigen und Warnschwellenwerte festlegen?

 

Funktionen

Integration mit Benachrichtigungstools möglich

Zu stellende Fragen

Lässt sich das Produkt in mein Benachrichtigungs- und Bereitschaftstool integrieren?

Servicedesk

Servicedesk-Software bietet Kunden und Mitarbeitern eine Anlaufstelle, um potenzielle und offensichtliche Vorfälle zu melden.

Vorteile

Neben ihren vielen anderen Anwendungsgebieten (Serviceanfragen, IT-Helpdesk) ermöglichen Servicedesks es deinem Team, schnell über Vorfälle informiert zu werden – und zwar von den Personen, die am wichtigsten sind: euren Benutzern und Kunden.

Funktionen

 

Funktionen

Zu stellende Fragen

 

Funktionen

Self-Service aktivieren

Zu stellende Fragen

Können Kunden Tickets schnell über ein Serviceportal erstellen?

Stehen automatisierte, wissensbasierte Vorschläge zur Verfügung, damit Kunden schnell das Gesuchte finden?

Unsere Empfehlung: Jira Service Management

Warnmeldungen und Bereitschaft

Sofortige und zuverlässige Warnmeldungen sind ein wichtiger Bestandteil der Incident Response. Auf diese Weise können Teams sichergehen, dass bei einem Vorfall die richtigen Personen benachrichtigt werden.

Vorteile

Warntools benachrichtigen die für die Reaktion zuständigen Mitarbeiter im Rahmen einer ausgefeilten Kombination aus Zeitplänen, Eskalationspfaden und Benachrichtigungen.

Funktionen

 

Funktionen

Zu stellende Fragen

 

Funktionen

Weltweite Verfügbarkeit

Zu stellende Fragen

Kann ich Benachrichtigungen (SMS, Sprachnachricht, E-Mail) an nahezu alle Standorte weltweit senden?

 

Funktionen

Verschiedene Benachrichtigungsmethoden

Zu stellende Fragen

Kann ich Benachrichtigungen mit verschiedenen Methoden wie E-Mail, SMS, Telefon oder Push-Benachrichtigung in einer mobilen App senden und sie mehrmals testen?

Unsere Empfehlung: Opsgenie

Während des Vorfalls

Schnellere Lösung mit einer Configuration Management Database (CMDB)

Nur wenn du die Abhängigkeiten innerhalb deiner Infrastruktur kennst, kannst du die Auswirkungen eines Vorfalls genau ermitteln und die Problembehebung beschleunigen.

Vorteile

Eine CMDB hilft dir, die Beziehungen und Abhängigkeiten innerhalb deiner IT-Infrastruktur nachzuvollziehen. Wenn etwas schiefgeht, kannst du so Folgendes schneller ermitteln:

  • Mögliche Ursachen für den Vorfall. Du kannst beispielsweise mit nur einem Mausklick feststellen, auf welchem Host ein Service ausgeführt wird.
  • Nachgelagerte Auswirkungen des Vorfalls. Vielleicht stellt sich heraus, dass andere Services auf demselben fehlerbehafteten Host ausgeführt werden.

Auf diese Weise kannst du alle Aspekte des Vorfalls schnell untersuchen und kommunizieren.

 

Funktionen

Zu stellende Fragen

 

Funktionen

Mehrere Kanäle

Zu stellende Fragen

Wie flexibel ist die CMDB? Kann ich jede Art von CI/Asset speichern?

Kann ich meine Infrastruktur grafisch darstellen?

 

Funktionen

Integrationen

Zu stellende Fragen

Kann ich CIs/Assets mit meinen Servicedesk-Vorgängen verknüpfen?

Kann ich CIs/Assets mit Änderungsanfragen verknüpfen?

Logo: Insight

Schnellere Reaktion auf Vorfälle

In Jira kannst du deine Infrastruktur und die entsprechenden Abhängigkeiten nativ zuordnen. So findest du die Ursache schneller und kannst sie früher beheben, was die Verfügbarkeit erhöht.

Teamkommunikation

Eine klare und zuverlässige Kommunikation ist beim Vorfallmanagement unverzichtbar.

Vorteile

Eine solide Kommunikationsplattform hilft Teams bei der Kommunikation und beim Austausch von Beobachtungen, Links und Screenshots. Dabei werden alle Interaktionen mit einem Zeitstempel versehen und aufbewahrt. So kommen bei einem Vorfall die richtigen Informationen und Personen zusammen, und es entsteht ein umfassender Datensatz, aus dem das Team nach dem Vorfall Erkenntnisse ziehen kann.

Funktionen

 

Funktionen

Zu stellende Fragen

 

Funktionen

Mehrere Kanäle

Zu stellende Fragen

Kann mein Incident Response-Team schnell einen dedizierten Kanal für einen Vorfall einrichten?

 

Funktionen

Integrationen

Zu stellende Fragen

Können andere Tools aus meiner Vorfall-Toolchain Beiträge im Kommunikationskanal meines Teams veröffentlichen?

Unsere Empfehlung: Slack (Text), Zoom (Video)

Kommunikation mit Kunden

Tools für die Kundenkommunikation tragen dazu bei, Kunden während eines Vorfalls auf dem Laufenden zu halten.

Vorteile

Es lässt sich nicht leugnen: In aller Regel sind Vorfälle eine negative Erfahrung für Kunden. Wer die Kunden durchgehend informiert, stärkt das Vertrauen und beschleunigt die Reaktion. Durch die Kommunikation mit Kunden wissen diese, dass ihr über den Vorfall Bescheid wisst und an einer Lösung arbeitet.

Funktionen

 

Funktionen

Zu stellende Fragen

 

Funktionen

Unabhängig von meiner Infrastruktur

Zu stellende Fragen

Ist mein Kommunikationstool auch dann noch verfügbar, wenn meine interne Infrastruktur ausfällt?

 

Funktionen

Abonnenten und Benachrichtigungen

Zu stellende Fragen

Können Kunden auswählen, ob sie benachrichtigt werden möchten, wenn ich Mitteilungen zu einem Vorfall veröffentliche?

Unsere Empfehlung: Statuspage

Incident Command Center

Das Incident Command Center befindet sich dort, wo die Aufzeichnungen und die wichtigsten Details zum Vorfall aufbewahrt werden. Dies könnte ein Vorfallmanagementtool wie Opsgenie oder ein Tool zur Vorgangsverfolgung wie Jira sein.

Vorteile

Ein Command Center-Tool ist eine zentrale Anlaufstelle, bei der sich während und nach einem Vorfall alle auf den neuesten Stand bringen können. Dort werden wichtige Details wie der Vorfallstatus, die zugehörigen Warnmeldungen und Mitteilungen aufgeführt. Es liefert auch eine Aufzeichnung des Vorfalls und der damit verbundenen Reaktionsmaßnahmen im zeitlichen Verlauf.

Funktionen

 

Funktionen

Zu stellende Fragen

 

Funktionen

Zentrale Informationsquelle

Zu stellende Fragen

Können sich Teammitglieder und Stakeholder schnell über den Vorfall auf den neuesten Stand bringen?

Finden Teammitglieder und Stakeholder in diesen Aufzeichnungen auch alle weiteren Details zum Vorfall und zur Reaktion darauf?

 

Funktionen

Zeitleiste

Zu stellende Fragen

Stellt das Tool eine chronologische Zeitleiste wichtiger Ereignisse zusammen?

Unsere Empfehlung: Opsgenie

Nach dem Vorfall

Post-Mortem-Analyse

Post-Mortem-Analysen sind eine schriftliche Aufzeichnung dessen, was während eines Vorfalls passiert ist und welche Maßnahmen danach ergriffen wurden, um ein erneutes Auftreten zu verhindern.

Vorteile

Auch nachdem ein Vorfall gelöst ist, kennen die Teams oft noch nicht die Ursachen. So besteht die Gefahr, dass sich der Vorfall wiederholt. Post-Mortem-Analysen mindern dieses Risiko, weil das Team nach dem Vorfall eine gründliche Analyse durchführt.

Funktionen

 

Funktionen

Zu stellende Fragen

 

Funktionen

Vorlagen

Zu stellende Fragen

Kann mein Team Vorlagen für Post-Mortem-Analysen nutzen?

 

Funktionen

Planung der nächsten Schritte

Zu stellende Fragen

Kann mein Team bei der Post-Mortem-Analyse die nächsten Schritte und Behebungsmaßnahmen planen?

Unsere Empfehlung: Opsgenie

Vorgangsverfolgung

Ein Tool zur Vorgangsverfolgung hilft dem Team beim Planen künftig nötiger Korrekturmaßnahmen.

Vorteile

Oft sorgt eine Problembehebung dafür, dass der Service wieder verfügbar ist, ohne jedoch die Ursachen zu beseitigen. In der Regel müssen weitere technische Arbeiten durchgeführt werden, um die Ursachen zu beheben und sicherzustellen, dass sich der Vorfall nicht wiederholt. Mit Tools zur Vorgangs- und Aufgabenverfolgung – die dein Team hoffentlich bereits für andere Entwicklungsarbeiten verwendet – kannst du sicherstellen, dass diese Arbeit priorisiert und nicht vergessen wird.

Funktionen

 

Funktionen

Zu stellende Fragen

 

Funktionen

Gemeinsame Workflow-Pipeline

Zu stellende Fragen

Kann mein Team Behebungsmaßnahmen bei Vorfällen parallel zu seinen anderen Aufgaben und Prioritäten planen?

 

Funktionen

Integrationen

Zu stellende Fragen

Kann mein Team Daten und Inhalte aus anderen Vorfallmanagementtools einbinden?

Unsere Empfehlung: Jira Software

Weiter geht's
KPIs