Close

Catégories

Modèle de post-mortem d'incident

par Opsgenie

Apprenez de vos performances et soutenez votre équipe d'ingénierie

Utiliser le modèle
Modèle de post-mortem d'incident

Les problèmes se multiplient quand on avance vite. Des incidents sont inévitables lorsque votre entreprise fait rapidement évoluer son équipe d'ingénierie et développe de nouveaux systèmes. Après la résolution d'un problème et la restauration des services, collaborez avec votre équipe d'ingénierie pour remplir le modèle de post-mortem d'incident. Notre modèle aidera votre équipe à découvrir pourquoi un incident s'est produit et comment elle peut éviter qu'il ne se reproduise.

Comment utiliser le modèle Post-mortem d'incident ?

Étape 1 : Résumez le post-mortem d'incident

Commencez votre analyse post-mortem par un résumé général de la durée, des causes et des effets de l'incident. Veillez à mettre en évidence les services et les clients qui ont été touchés. Cela aide votre équipe à comprendre comment l'incident a affecté le système et fournit un contexte pour la préparation d'une analyse approfondie.

Étape 2 : Effectuez une analyse de l'incident sans blâme

Maintenant que vous avez fourni un résumé de l'incident, vous êtes prêt à vous plonger dans les détails. Les incidents sont l'occasion pour votre équipe d'ingénierie de tirer les leçons des erreurs passées. Notre modèle est conçu pour que votre équipe puisse identifier la cause profonde d'un incident sans rejeter la faute sur un membre en particulier. En menant votre analyse d'incident de manière constructive et collaborative, votre équipe peut se concentrer sur la recherche de solutions.

Étape 2 : Effectuez une analyse de l'incident sans blâme

Étape 3 : Créez un plan post-mortem

Pendant que votre équipe collabore pour analyser l'incident, utilisez le modèle pour noter ses idées et les questions en suspens. Donnez suite à l'analyse de votre équipe en utilisant ses recommandations pour éviter que l'incident ne se reproduise. Une fois que vous avez établi un plan post-mortem pour l'incident, suivez votre avancement en créant et en mettant à jour des tickets Jira.


Optimisé par Atlassian, Opsgenie fournit des solutions de gestion des alertes et des incidents pour aider les entreprises à résoudre des tickets critiques avant qu'ils n'impactent les clients.

  • Diagramme d'architecture AWS

    Lucidchart

    Diagramme d'architecture AWS

    Visualisez votre infrastructure pour mieux identifier ses faiblesses et repérer les points à améliorer.

  • Concevez votre semaine de travail idéale

    Atlassian

    Concevez votre semaine de travail idéale

    Fournissez des instructions pas-à-pas pour réaliser une tâche.

  • Runbook DevOps

    Atlassian

    Runbook DevOps

    Préparez votre équipe opérationnelle à réagir rapidement aux alertes et aux pannes système.