Управление инцидентами для высокоскоростных команд
Просмотр тем
Реагируйте
Решение
Обучение
Дополнительные ресурсы
Плюсы и минусы различных подходов к управлению дежурствами
Современный мир наиболее сильно зависит от сервисов с непрерывной работой. Сбой в их работе может повлиять на миллионы людей и спровоцировать значительные последствия: люди не смогут оплатить счета, забронировать авиабилеты или пообщаться по видеосвязи с друзьями.
Независимо от проблемы — серьезный баг, нехватка ресурсов или полная остановка системы — пользователи ваших сервисов будут ожидать немедленной реакции. То же относится и к внутренним командам.
Инциденты не только провоцируют большие затраты (в Северной Америке они ежегодно обходятся компаниям в 700 млрд долларов США), но и могут серьезно сказаться на репутации компании, продукта и команды.
Учитывая, что на карту поставлено так много, в график дежурств стали включать команды разработчиков и ИТ, чтобы в случае возникновения инцидента у организации всегда были наготове специалисты, способные решить проблему.
Справедливое расписание дежурств в сочетании с планом компенсаций за дежурство способствует формированию культуры совместной ответственности и помогает командам лучше понять, что нужно для создания отказоустойчивого ПО и сервисов. Это позволяет улучшить качество продукта и снизить количество сбоев.
Составление графика дежурств с помощью Opsgenie
С помощью этого руководства вы научитесь настраивать график дежурств, использовать правила переадресации дежурств, настраивать оповещения о начале дежурства, а также изучите другие возможности Opsgenie.
Читать учебное руководствоРекомендации по информированию об инцидентах
Информирование об инцидентах — это процесс оповещения пользователей о том, что сервис испытывает некоторые перебои в работе или снижение производительности.
Читать статью