Шаблон плана информирования об инцидентах

Автор: Statuspage

Создайте план действий на случай сбоев в работе, чтобы заслужить доверие пользователей

Использование шаблона
Шаблон плана информирования об инцидентах

Представьте, что ваш сервис неожиданно стал недоступен или перестала работать какая-то функция. Можно принять срочные меры и понадеяться, что проблему удастся решить до того, как ее заметят. Но это рискованно: если вы не успеете, пользователи начнут жаловаться и могут даже распространять негативные отзывы о ваших продуктах. Лучше честно сообщить об инциденте тем, кого он затрагивает, и обозначить примерные сроки устранения. Таким образом вы покажете, что заботитесь о пользователях, и они проникнутся к вам доверием. Этот шаблон поможет составить план действий, определить, что может считаться серьезным инцидентом, кто будет им заниматься и как информировать пользователей о нем.

Как использовать шаблон «Сообщения об инцидентах»

Шаг 1. Определите, что может считаться инцидентом

Не стоит надеяться, что вы сможете сохранять самообладание и действовать уверенно, когда все пойдет кувырком и вы окажетесь в эпицентре проблем. Подготовьтесь заранее. В разделе определения инцидента обозначьте, по каким критериям можно распознать инцидент. Эта информация поможет вам определиться с дальнейшими действиями в непростой ситуации.

Шаг 2. Определите роли и обязанности

В большинстве случаев для устранения сбоев в работе требуется участие многих специалистов. В таблице ролей и обязанностей укажите роли и основные обязанности людей, которые будут помогать вам устранять неполадки. Обязательно @упомяните каждого человека, чтобы они получили уведомление о том, за что отвечают и какие действия должны выполнять.

Шаг 2. Определите роли и обязанности

Шаг 3. Выберите способ информирования

Есть много способов сообщить пользователям об инциденте: по электронной почте, в социальных сетях, через службу поддержки или на странице Statuspage. Но какой из них выбрать, когда все летит под откос? В разделе способов информирования об инциденте перечислите все возможные каналы коммуникации и опишите, как их использовать, чтобы держать пользователей в курсе событий. Укажите, по какому каналу сообщать об инциденте конкретного типа, какие отделы компании должны пользоваться тем или иным каналом и как получать к нему доступ (например, где хранятся учетные данные и нужно ли запрашивать доступ).

Шаг 4. Воспользуйтесь шаблонами, чтобы сэкономить время

Ваша цель — как можно быстрее решить проблему. У вас не будет времени и сил, чтобы продумывать сообщения для пользователей. В разделе шаблонов сообщений создайте образец текста, который вы будете отправлять клиентам на каждом этапе работы: от поиска причин до устранения неполадок. Конечно, вам придется добавлять уточняющие сведения, но общая структура будет у вас под рукой, и это позволит сэкономить массу времени.

Шаг 4. Воспользуйтесь шаблонами, чтобы сэкономить время

Шаг 5. Определите ценности, связанные с инцидентами

Инциденты отнимают много сил и могут быстро вывести вашу команду из равновесия. В таблице ценностей, связанных с инцидентами, нужно указать, какие принципы имеют наибольшее значение при реагировании на инциденты и как им следовать. Информация из этого раздела поможет вашей команде с достоинством выходить даже из самых катастрофических ситуаций.


Statuspage — это инструмент взаимодействия при управлении инцидентами. Statuspage интегрируется с удобными для вас инструментами мониторинга, уведомления, общения в чате и поддержки, что повышает эффективность реагирования на каждый инцидент.

  • AWS architecture diagram template

    Lucidchart

    Схема архитектуры AWS

    Создайте наглядное представление инфраструктуры, чтобы выявить слабые места и области, требующие улучшений.

  • DevOps runbook template

    ATLASSIAN

    Перечень задач DevOps

    Подготовьте операционную команду к быстрому реагированию на предупреждения системы и перебои в ее работе.

  • DevOps change management template

    ATLASSIAN

    Управление изменениями DevOps

    Воспользуйтесь этим шаблоном, чтобы оценить эффективность управления изменениями и определить действия по снижению рисков.