Gerenciamento de incidentes para equipes de alta velocidade
Buscar tópicos
Responder
Resolver
Saiba mais
Mais recursos
O que é gerenciamento de incidentes?
O gerenciamento de incidentes é o processo usado pelas equipes de DevOps e operações de TI para responder a um evento ou interrupção de serviço não planejada e restaurar o serviço ao estado operacional.
Na Atlassian, um incidente é um evento que causa interrupção ou redução na qualidade de um serviço que requer uma resposta de emergência. As equipes que seguem as práticas da ITIL ou do ITSM podem usar o termo incidente grave.

Obtenha o Manual de gerenciamento de incidentes em formato impresso ou PDF
Quantidade limitada de versões impressas do Manual de gerenciamento de incidentes com envio grátis ou baixe a versão em PDF.
Um incidente é resolvido quando o serviço afetado volta a funcionar no estado pretendido. Estão incluídas apenas as tarefas necessárias para atenuar o impacto e restaurar a funcionalidade.
Esses tipos de incidentes podem variar muito em gravidade, de uma falha no serviço web global a um pequeno número de usuários com erros intermitentes.
Tópicos sobre gerenciamento de incidentes
Tutoriais apresentados
Quer ver como a Atlassian lida com incidentes graves? A gente publicou o manual interno de gerenciamento de incidentes. Fique à vontade para aprender com ele, adaptá-lo e usá-lo como quiser.
Configuração de um on-call schedule com o Opsgenie
Neste tutorial, aprenda a configurar um on-call schedule, aplicar regras de substituição, configurar notificações de plantão e muito mais. Tudo no Opsgenie.
Leia este tutorialPrós e contras de diferentes abordagens ao gerenciamento de plantão
As equipes de plantão estão evoluindo com rapidez. Explore os prós e contras de diferentes abordagens ao gerenciamento de plantão.
Leia este artigo