ITSM für High-Velocity-Teams
Was ist Problemmanagement?
Problemmanagement ist der Prozess der Identifizierung und Verwaltung der Ursachen von Incidents bei einem IT Service. Es stellt eine Kernkomponente von ITSM-Frameworks dar.
Von echten Experten für Incidents hört man eher selten die Frage: "Welche Ursache hat der Incident?" Von Führungskräften, Kunden und der Presse wird sie natürlich ständig gestellt. Die Experten wissen es aber besser.
Die Antwort auf die Frage nach der Ursache des Incidents ist nämlich oft wenig aussagekräftig und hilfreich: eine geänderte Konfigurationsdatei, ein beschädigter Datenbankeintrag etc.
Welche Ursachen haben aber im Hintergrund zum Incident beigetragen? Welche Faktoren haben zum Incident geführt? Wie kann es sein, dass eine Konfigurationsdatei geändert wurde? Welche Bedingungen führen zu einem beschädigten Datenbankeintrag? Dies sind die Fragen, die Experten stellen. Und sie stehen im Mittelpunkt des Problemmanagements.
Beim Problemmanagement geht es nicht nur darum, Incidents zu finden und zu beheben, sondern auch darum, die zugrundeliegenden Ursachen eines Incidents zu identifizieren, zu verstehen und die beste Methode zu finden, um diese Ursache zu beseitigen. Außerdem bringt es dem Unternehmen nichts, wenn die Ursachenermittlung ein isolierter Prozess ist, der von einem isolierten Team durchgeführt wird. Daher sollte Problemmanagement kontinuierlich und von mehreren Teams betrieben werden, einschließlich IT, Sicherheit und Softwareentwicklung. Ein Incident mag ausgestanden sein, wenn der Service wieder in Betrieb ist, doch solange die Ursachen und begünstigenden Faktoren nicht beseitigt werden, bleibt das Problem bestehen.
Welche Vorteile hat Problemmanagement?
Richtig angewandtes Problemmanagement bringt viele Vorteile für das Unternehmen.
Kürzere Problemlösungszeit
Teams, die die Probleme hinter dem heutigen Incident aufdecken, sind besser für den Umgang mit künftigen Incidents gewappnet. Durch die Formulierung von Best Practices für die Problemanalyse können die Teams bei der nächsten Serviceunterbrechung schneller reagieren und Maßnahmen ergreifen.
Kostspielige Incidents vermeiden
Die Vermeidung von Incidents spart Zeit, Geld und Ärger. Laut Gartner kosten Ausfälle Unternehmen über 300.000 USD pro Stunde. Bei einigen webbasierten Services liegt diese Zahl unter Umständen noch deutlich höher.
Produktivitätssteigerung
Du musst nicht mehr so häufig auf Incidents reagieren und Teams, die neuen Mehrwert für Kunden schaffen könnten, gewinnen Zeit und Ressourcen.
Dem Team die Möglichkeit bieten, Ursachen zu finden und aus ihnen zu lernen
Wenn Unternehmen effektives Problemmanagement betreiben, untersuchen Teams kontinuierlich Incidents, lernen aus ihnen und liefern Verbesserungen. Leider arbeitet das Problemmanagement-Team in vielen Unternehmen isoliert, sodass es zu weit vom Tagesgeschäft entfernt ist, um die dringendsten Probleme zu lösen.
Kontinuierliche Serviceverbesserungen fördern
Durch Problemmanagement werden Incidents verhindert und gleichzeitig wird ein Mehrwert geschaffen. Durch die Behebung eines Incidents, der die Leistung beeinträchtigt, wird beispielsweise auch die Servicequalität verbessert.
Die Kundenzufriedenheit verbessern
Besseres Problemmanagement führt zu weniger Incidents und zufriedeneren Kunden. Wenn Kunden dagegen feststellen, dass der gleiche Incident mehrmals auftritt, haben sie wenig Verständnis dafür. Wenn die gleichen Incidents seltener auftreten, steigt das Kundenvertrauen.
Der Problemmanagement-Prozess
Wir bei Atlassian plädieren dafür, die Prozesse des Problem- und Incident Managements stärker zu integrieren.
Wenn das Problemmanagement ein schwerfälliger, isolierter und separater Prozess ist, besteht die Gefahr für Unternehmen, dass sich Probleme hier lediglich ansammeln. In diesem Backlog gehen Probleme in manchen Teams unter. Am besten werden Probleme an Teams übergeben, die wertvolle Untersuchungen durchführen können.
Trotzdem ist es hilfreich, die wichtigsten Schritte des Problemmanagement-Prozesses zu verstehen. Diese sind:
- Problemerkennung: Probleme in Eigeninitiative ermitteln, damit sie behoben werden können, oder Workarounds identifizieren, bevor zukünftige Incidents auftreten
- Kategorisierung und Priorisierung: Bekannte Probleme nachverfolgen und bewerten, damit Teams systematisch vorgehen und an den wichtigsten und werthaltigsten Problemen arbeiten können
- Untersuchung und Diagnose: Die grundlegenden Ursachen des Problems und die beste Vorgehensweise zur Behebung identifizieren
- Bekannte Fehler aufzeichnen: In ITIL wird unter einem bekannten Fehler ein Problem verstanden, "für das es eine dokumentierte Ursache und einen Workaround gibt". Die Aufzeichnung dieser Informationen führt zu kürzeren Ausfallzeiten, wenn durch das Problem ein Incident ausgelöst wird. Diese Angaben werden normalerweise in einem Dokument erfasst, das als Datenbank bekannter Fehler (Known Error Database) bezeichnet wird.
- Bei Bedarf einen Workaround erstellen: Ein Workaround ist eine temporäre Lösung, um die Auswirkungen von Problemen zu reduzieren und zu verhindern, dass sie zu Incidents werden. Das ist zwar nicht optimal, kann aber geschäftliche Auswirkungen verringern und einen Incident mit Auswirkungen auf den Kunden verhindern, wenn sich das Problem nicht leicht identifizieren und beheben lässt.
- Das Problem lösen und schließen: Wird ein Problem geschlossen, wurde es beseitigt und es kann nicht mehr zu einem weiteren Incident führen.
Möchtest du mehr über das Problemmanagement in Jira Service Management erfahren?
Atlassian-Leitfaden zu agilen Arbeitsweisen mit ITIL 4
ITIL 4 ist da – und agiler als je zuvor Hier erhältst du Tipps, wie du mit Atlassian Agilität und Zusammenarbeit in ITSM einbeziehen kannst.
White Paper lesenDie Weiterentwicklung des IT-Änderungsmanagements
Das IT-Änderungsmanagement minimiert Risiken, während Änderungen an Systemen und Services vorgenommen werden. Erfahre mehr über den Änderungsmanagementprozess, dessen Bedeutung und die Best Practices.
Artikel lesen