Управление инцидентами для высокоскоростных команд
Просмотр тем
Реагируйте
Решение
Обучение
Дополнительные ресурсы
Любите DevOps? Вы еще не знаете об SRE!
Возможно, вы слышали об одной компании под названием Google. Она изобретает потрясающие вещи, например беспилотные машины и лифты в открытый космос. А еще она разрабатывает невероятно успешные приложения, среди которых Gmail, Google Документы и Google Карты. Похоже, там что-то смыслят в разработке.
Она также является инициатором набирающего популярность движения под названием Site Reliability Engineering (обеспечение надежности, SRE), которое ставит точку в многолетней войне между командами разработчиков и операционными командами. SRE призывает обеспечивать надежность продукта, принимать личную ответственность и внедрять инновации, но при этом обходиться без коридорных разборок, какие вы привыкли видеть в ИТ-вузах.
Как? Давайте изучим основы.
Составление графика дежурств с помощью Opsgenie
С помощью этого руководства вы научитесь настраивать график дежурств, использовать правила переадресации дежурств, настраивать оповещения о начале дежурства, а также изучите другие возможности Opsgenie.
Читать учебное руководствоШаблоны и примеры информирования об инцидентах
Во время реагирования на инциденты становится ясна ценность шаблонов сообщений. Загрузите шаблоны, которые использует наша команда, и познакомьтесь с другими примерами распространенных инцидентов.
Читать статью