Close

Categorias

Template de análise retrospectiva de incidentes

por Opsgenie

Aprenda com seu desempenho e dê suporte à sua equipe de engenharia

Usar template
Template de análise retrospectiva de incidentes

As coisas dão errado quando você está com pressa. Os incidentes são inevitáveis quando sua empresa escala a equipe de engenharia com rapidez e desenvolve novos sistemas. Depois de um problema ser resolvido e os serviços serem restaurados, colabore com sua equipe de engenharia para preencher o template de análise retrospectiva de incidentes. Nosso template vai ajudar sua equipe a descobrir por que um incidente aconteceu e como eles podem evitar que ele ocorra de novo.

Como usar o template Análise retrospectiva dos incidentes

Etapa 1. Escreva um resumo de análise retrospectiva do incidente

Lance sua análise retrospectiva com um resumo de alto nível da duração do incidente, causas e efeitos. Destaque quais serviços e clientes foram afetados. Isso ajuda sua equipe a entender como o incidente afetou o sistema e oferece contexto à medida que sua equipe se prepara para uma análise completa.

Etapa 2. Faça uma análise simples de incidentes

Agora que ofereceu um resumo do incidente, você está pronto para analisar os detalhes. Os incidentes são uma oportunidade para a equipe de engenharia aprender com os erros passados. Nosso template foi criado para sua equipe identificar a causa de um incidente sem culpar ninguém. Ao conduzir a análise do incidente de uma forma construtiva e colaborativa, sua equipe pode se focar em soluções de brainstorming.

Etapa 2. Faça uma análise simples de incidentes

Etapa 3. Crie um plano de análise retrospectiva

Enquanto sua equipe trabalha para analisar o incidente, use o template para anotar os insights e as perguntas em aberto. Siga a análise de sua equipe usando as recomendações deles para evitar que o incidente aconteça outra vez. Assim que fizer um plano de análise retrospectiva do incidente, acompanhe o progresso criando e atualizando chamados no Jira.


O Opsgenie, da Atlassian, oferece soluções de alerta e gerenciamento de incidentes para ajudar empresas a resolver itens críticos antes que afetem os clientes.

  • AWS architecture diagram template

    Lucidchart

    Diagrama da arquitetura AWS

    Veja a infraestrutura para identificar melhor os pontos fracos e indicar as áreas que precisam de melhoria.

  • DevOps runbook template

    Atlassian

    Runbook do DevOps

    Prepare sua equipe de operações para responder com rapidez às interrupções e aos alertas do sistema.

  • DevOps change management template

    Atlassian

    Gerenciamento de mudanças do DevOps

    Use este template para avaliar o desempenho do gerenciamento de mudanças e reduzir os riscos.