Incidentmanagement voor razendsnelle teams
Het belang van een postmortemproces bij incidenten
Incidenten gebeuren.
Dat is nu eenmaal zo. Naarmate onze systemen groter en complexer worden, zijn storingen onvermijdelijk.
Incidenten zijn ook een leermogelijkheid.
Een kans om kwetsbaarheden in je systeem te ontdekken. Een kans om herhaalde incidenten te beperken en de tijd tot oplossing te verkorten. Een tijd om je teams bij elkaar te brengen en te plannen hoe ze de volgende keer nog beter kunnen handelen.
De beste manier om door te nemen wat er tijdens een incident is gebeurd en alle geleerde lessen vast te leggen, is door een incidentpostmortem uit te voeren, ook wel bekend als een beoordeling na een incident.
Een post-mortem van een incident brengt mensen samen om de details van het incident te bespreken: waarom het is gebeurd, de impact, welke acties er zijn ondernomen om het op te lossen en wat er gedaan kan worden om te voorkomen dat het opnieuw gebeurt.
Dankzij tools zoals versiebeheer, functievlaggen en continue levering kunnen veel incidenten snel 'ongedaan worden gemaakt'. Veel incidenten worden veroorzaakt door een bug in een verandering die naar productie wordt gepusht. Als die wijziging wordt teruggedraaid, kan de app weer operationeel worden. Dit is echt voordelig voor iedereen. Het zorgt ervoor dat de service snel weer werkt. Maar het helpt je vaak niet te begrijpen wat er is mislukt en waarom. Postmortems bieden dan uitkomst.
Een incidentpostmortem is een framework om van incidenten te leren en problemen om te zetten in vooruitgang. Het proces bouwt ook vertrouwen op bij klanten, collega's en eindgebruikers (in feite de mensen die door het incident zijn getroffen) en laat hen weten dat je team eraan werkt om toekomstige incidenten en impact te minimaliseren.
Een postmortem is een belangrijke stap in de levenscyclus van een service die altijd beschikbaar is. De bevindingen van je postmortem moeten direct terugvloeien in je planningsproces. Dit zorgt ervoor dat de kritieke herstelwerkzaamheden die in de postmortem zijn geïdentificeerd, een plek krijgen in aanstaande werkzaamheden en in evenwicht zijn met andere aanstaande werkzaamheden en prioriteiten.
Een op afroep-rooster opstellen met Opsgenie
In deze tutorial leer je hoe je een op afroep-rooster instelt, overschrijfregels toepast, op afroep-meldingen configureert en meer, allemaal binnen Opsgenie.
Lees deze tutorialSjabloon voor incident-postmortems
Duidelijke documentatie is essentieel voor effectieve incident-postmortems. Gebruik deze postmortemsjabloon om alle belangrijke details over een incident vast te leggen.
Lees dit artikel