Gerenciamento de incidentes para equipes de alta velocidade
Buscar tópicos
Responder
Resolver
Saiba mais
Mais recursos
Prós e contras de diferentes abordagens ao gerenciamento de plantão
O mundo depende de serviços sempre disponíveis mais do que nunca. Uma interrupção pode afetar milhões de pessoas, com impacto real: elas não conseguem pagar contas, reservar voos nem fazer videochamadas com os amigos.
E se você estiver tendo um grande bug, problemas de capacidade ou estiver completamente inativo, os clientes que dependem de seus serviços esperam uma resposta imediata. (Também vale para equipes internas.)
Os incidentes podem ter um impacto real não apenas em termos monetários — eles custam às empresas US$ 700 bilhões por ano só na América do Norte — mas também sobre a reputação de sua empresa, do seu produto e da sua equipe.
Com tanta coisa em jogo, as equipes se dedicaram a colocar as equipes de TI e de desenvolvedores de plantão para garantir que a empresa tenha as pessoas certas disponíveis para resolver um problema durante um incidente, não importa quando ele ocorra.
Um cronograma de plantão justo, combinado com um plano de compensação por plantão, pode até promover uma cultura de responsabilidade compartilhada e ajudar as equipes a aprender mais sobre o que é necessário para criar softwares e serviços resilientes, proporcionando um produto melhor e menos interrupções.
Configuração de um on-call schedule com o Opsgenie
Neste tutorial, aprenda a configurar um on-call schedule, aplicar regras de substituição, configurar notificações de plantão e muito mais. Tudo no Opsgenie.
Leia este tutorialPráticas recomendadas da comunicação de incidentes
A comunicação de incidentes é o processo de alertar os usuários de que algum serviço está passando por algum tipo de interrupção ou teve queda no desempenho.
Leia este artigo