Close

O caminho para um gerenciamento de incidentes melhor começa aqui

Criação de relatórios de análise retrospectiva

Por que coletar e documentar os dados é fundamental para o processo de análise retrospectiva de incidentes

Uma análise retrospectiva de incidente pode ser dividida em dois artefatos distintos: a reunião onde o incidente é discutido e o relatório de análise retrospectiva correspondente criado como um resultado dessa reunião.

Essas duas atividades, a reunião e o relatório, são usadas como intercambiáveis com frequência quando as pessoas se referem a uma “análise retrospectiva”. As pessoas podem estar falando sobre um ou ambos quando usam o termo.

Quer começar a usar um template de análise retrospectiva? Confira os templates de análises retrospectivas.

Contudo, há uma diferença entre a reunião de análise retrospectiva e o relatório escrito de análise retrospectiva.

Na Atlassian, normalmente usamos análise retrospectiva, ou análise retrospectiva de incidente, para descrever todo o processo de análise de um incidente, incluindo:

  • Realizar uma reunião de análise retrospectiva de incidente
  • Capturar ações e informações durante a reunião
  • Obter aprovação sobre ações de acompanhamento e comunicar o resultado da reunião

Leia mais sobre como a Atlassian gerencia análises retrospectivas no manual de gerenciamento de incidentes.

Quais as características de um bom relatório de análise retrospectiva de incidente?

Tópicos claros e consistentes

Um bom relatório deve ser baseado em uma estrutura clara e consistente. Equipes eficazes configuram cada análise retrospectiva em um template, no qual os participantes respondem a um conjunto de perguntas ou solicitações.

Assim, você garante que as principais informações não sejam esquecidas. Também cria consistência entre os incidentes e ajuda a equipe a identificar padrões, tendências e oportunidades de melhoria. A estrutura pode ser iterada e melhorada ao longo do tempo, mas todas as mudanças devem ser intencionais.

Riqueza de informações e dados

Os campos da análise retrospectiva não são lugares para economizar informações e minimizar eventos. É aqui que você quer ser mais específico. Não diga que você viu um pico de tráfego, diga com precisão quanto e qual métrica mudou. Não diga que a equipe estava confusa, mostre uma citação exata do histórico de bate-papo em que alguém expressou confusão.

Linguagem inclusiva, sem apontar dedos

Como muitas equipes, praticamos análises retrospectivas sem apontar culpados aqui na Atlassian. Durante a reunião e na análise do incidente, é importante não apontar o dedo para ninguém. Tome o mesmo cuidado com as palavras escritas no relatório. Evite linguagem que culpe ou destaque as pessoas.

Perguntas importantes a serem feitas durante um relatório de análise retrospectiva

Estes são os prompts incluídos no recurso de análise retrospectiva do Opsgenie:

  • Precedentes
    Descrever as circunstâncias que levaram a este incidente
  • Falha
    Descrever o que falhou em funcionar conforme esperado
  • Detecção
    Descrever como o incidente foi detectado
  • Causas raiz
    Faça uma análise dos 5 porquês para entender as verdadeiras causas do incidente
  • Mitigação e resolução
    Que medidas você tomou para resolver este incidente?
  • Lições aprendidas
    O que correu bem? O que a gente poderia ter feito melhor? O que mais você aprendeu?

Confira o artigo sobre templates de análise retrospectiva para mais exemplos de perguntas a serem incluídas em um relatório de análise retrospectiva.

O que mais incluir em um relatório de análise retrospectiva

  • Capturas de tela
    Anexe capturas de tela relevantes, em especial as que a equipe de resposta fez durante a interrupção. Quais mudanças você viu no produto? Qual comportamento do produto não aconteceu como esperado?
  • Bilhetes
    Link para quaisquer bilhetes relevantes relacionados ao incidente.
  • Feedback dos clientes
    Os clientes enviaram comentários sobre o incidente? Eles podem ser relatados a um help desk, por e-mail ou nas redes sociais. Não se preocupe em incluir tudo.
  • Tabelas e gráficos
    Quais visualizações de dados ajudam a mostrar o impacto do incidente?
  • Dados
    Há algum outro ponto de dados importante sobre o incidente ou seu impacto?
  • Trocas de bate-papo
    Se a equipe usar uma ferramenta de bate-papo como o Slack durante o esforço de resposta, considere incluir mensagens ou trocas importantes do histórico de bate-papo.
  • Linhas do tempo
    Uma linha do tempo clara do incidente é uma excelente ajuda para a análise de incidentes. Quais foram os principais eventos e os carimbos de data/hora durante o incidente.

Relatórios de análise retrospectiva internos vs. externos

Embora seja menos comum, algumas empresas escolhem publicar uma versão pública de uma análise retrospectiva após um incidente. Essa decisão é bem comum para serviços ao consumidor em grande escala que apresentam interrupções que afetam muitos usuários. Eles podem publicar o relatório completo da análise retrospectiva ou (o que é mais provável) uma versão reduzida do relatório interno. Pode ser necessário remover algumas informações confidenciais ou privadas.

a seguir
Meeting