Gestão e resposta a incidentes

O Opsgenie entende como os problemas afetam os serviços corporativos e ajuda a comunicar de forma proativa as interrupções a todas as partes interessadas. Você pode planejar as interrupções de serviço e fazer com que o Opsgenie envie mensagens, crie páginas de status e pontes de conferência logo após a ocorrência dos incidentes. As distrações são minimizadas e as equipes permanecem concentradas em encontrar uma solução.

Lápis e papel com gráficos

Gestão de serviços por equipe


O Opsgenie permite mapear os alertas para os serviços corporativos afetados por eles para que você tenha uma compreensão clara de quais equipes precisam responder e quem precisa ficar informado sobre o progresso da resolução. Equipes diferentes são notificadas ao mesmo tempo e recebem as ferramentas necessárias para colaborar durante a resolução.

Captura de tela do modelo de incidente
Blueprint

Planejamento e cenários


Crie sua resposta a incidentes e configure diferentes fluxos de trabalho para incidentes com prioridades distintas usando os modelos de incidentes do Opsgenie. Para cada tipo de incidente, predefina as equipes de resposta, as partes interessadas e os melhores canais de colaboração necessários para solucionar os problemas com agilidade e ter uma comunicação eficiente.

Captura de tela de incidente de edição

Páginas de status

Reduza o ruído durante os incidentes para que os respondentes possam manter o foco no contexto certo e resolver os problemas rápido. As atualizações de status mostram as últimas atualizações de cada incidente em separado. Você também pode ter uma visão geral da saúde do sistema na página de status do serviço.

Captura de tela do status do serviço
Ícone Megahorn

Comunicação aos interessados


Notifique as partes interessadas de toda a sua organização sobre incidentes de acordo com as especificações organizacionais. As partes interessadas podem se manter informadas sobre o andamento da resolução do incidente e saúde do serviço por meio de notificações automáticas, acessando a página de status ou assinando atualizações da página de status.

Ícone de cluster de nó

Agrupamento de alertas


Agrupe automaticamente os alertas relacionados ao grupo originados de vários sistemas em um único incidente com base nas condições que você especificar. Reduza a complexidade e o ruído para permitir que os responsáveis possam se concentrar no contexto certo e solucionar os problemas com rapidez.


Captura de tela de pós-incidente

Jira Software e Jira Service Desk

Você pode vincular itens do Jira Service Desk a um incidente para monitorar o escopo do incidente e o impacto que ele vai ter para os clientes.Além disso, fique por dentro das tarefas posteriores vinculando ou criando itens do Jira direto nas informações do incidente.

Análise pós-incidente

Entenda como as equipes responderam aos principais incidentes com o relatório detalhado de análise pós-incidente do Opsgenie. O relatório traz insights sobre as medidas tomadas por cada equipe, sua participação na resolução e como as mudanças no status foram comunicadas às partes interessadas. Você consegue identificar na mesma hora o que deu certo e o que pode melhorar.

Captura de tela de pós-incidente
Captura de tela da linha do tempo do incidente

Linha do tempo do incidente

A linha do tempo do incidente é a fonte única de informações no ciclo de vida do incidente. Ela lista as informações principais, como o status do incidente, alertas associados, atividades da Central de Controle de Incidentes (CCI) e mais. Os dados da linha do tempo do incidente são adicionados automaticamente à análise retrospectiva do incidente. Assim, as equipes têm acesso a um registro completo dos eventos durante todo o ciclo de vida do incidente.

Serviços externos

Rastreie incidentes de serviços externos que tenham uma página Statuspage voltada ao público. Os incidentes criados para a página de status do serviço externo correspondente vão disparar um alerta para os usuários e equipes inscritos no serviço no Opsgenie.

Captura de tela dos serviços externos

Confira o gerenciamento de incidentes programado para serviços