Шаблон разбора инцидента
Автор: Opsgenie
Учитесь на результатах своей работы и поддерживайте техническую команду

Трудно избежать проблем при стремительных изменениях. Когда компания быстро масштабирует техническую команду и разрабатывает новые системы, появление инцидентов неизбежно. После устранения неполадок и восстановления работы сервисов заполните вместе с технической командой этот шаблон разбора инцидента. Он поможет вашей команде выяснить, почему произошел инцидент и как можно предотвратить его повторение.
Как использовать шаблон «Разбор инцидентов»
Шаг 1. Предоставьте краткую информацию об инциденте
Начните анализ инцидента с краткого описания его продолжительности, причин и последствий. Обязательно укажите, какие сервисы и клиенты пострадали. Это поможет вашей команде понять, как инцидент повлиял на систему, и предоставит контекст для глубокого анализа.
Шаг 2. Проведите анализ инцидента без поиска виновных
Описав инцидент вкратце, переходите к подробностям. Инциденты дают вашей технической команде возможность учиться на прошлых ошибках. Этот шаблон поможет определить причину инцидента, не возлагая вину на конкретных участников. Совместный конструктивный анализ инцидента позволит вашей команде сосредоточиться на проведении мозгового штурма по поиску решений.
Шаг 3. Создайте план по итогам разбора инцидента
При проведении совместного анализа инцидента используйте этот шаблон, чтобы записать идеи и нерешенные вопросы. Выполняйте сформулированные в ходе анализа рекомендации, чтобы предотвратить повторение инцидента. Составьте план по итогам разбора инцидента и отслеживайте его выполнение с помощью заявок Jira.
Opsgenie (поддерживается Atlassian) предоставляет решения для отправки уведомлений и управления инцидентами, позволяющие компаниям разрешать критически важные проблемы до того, как клиенты ощутят их последствия.
Коллекции, в которые входит этот шаблон
Больше шаблонов (Разработка программного обеспечения/ИТ) Подробнее
-
Lucidchart
Схема архитектуры AWS
Создайте наглядное представление инфраструктуры, чтобы выявить слабые места и области, требующие улучшений.
-
ATLASSIAN
Составьте план идеальной рабочей недели
Создайте пошаговое руководство для выполнения задания.
-
ATLASSIAN
Перечень задач DevOps
Подготовьте операционную команду к быстрому реагированию на предупреждения системы и перебои в ее работе.