Управление инцидентами для высокоскоростных команд
Управление инцидентами в эпоху DevOps
Применение принципов открытого общения без поиска виноватых в командах по управлению инцидентами
Невозможно переосмыслить создание, развертывание и эксплуатацию программного обеспечения, не переосмыслив свои методы реагирования на инциденты.
В своем знаменательном выступлении «Более 10 развертываний в день: сотрудничество команды по разработке и операционной команды во Flickr» в 2009 году Джон Олспоу и Пол Хаммонд изложили видение мира, где команды разработчиков и ИТ-команды ведут совместную работу и выполняют частую поставку. В течение следующего десятилетия это видение сложилось в движение DevOps.
По своей природе DevOps зависит от новых способов реагирования на инциденты. Неудивительно, что в выступлении Олспоу и Хаммонда управлению инцидентами было уделено столько внимания.
«Важно понимать, что сбой будет, — сказал в своем выступлении Хаммонд. — Вопрос не в том, будет ли, а в том, когда».
В отличие от таких методик, как ITIL, у команд DevOps нет официального документа с рекомендациями. Но в целом можно согласиться, что по сути практика DevOps призвана повысить ценность бизнеса путем преодоления организационной разрозненности, повышения прозрачности и стимулирования открытого общения между командами разработчиков и операционными ИТ-командами».
Та же культура прозрачности, наглядности и быстрого обучения распространяется на управление инцидентами.
Почему? Потому что первые и наиболее важные шаги в управлении инцидентами состоят в том, чтобы понять, что пошло не так, привлечь нужных людей к работе над проблемой и сформировать культуру без поиска виновных.
Управление инцидентами по методике DevOps способствует установлению между разработчиками и ИТ-специалистами культуры открытости, исключающей поиск виновных, а также созданию простых процессов, повышающих надежность ИТ-услуг, уровень удовлетворенности клиентов и коммерческую ценность. Специалист по DevOps может помочь во внедрении культуры и практик DevOps в команде.
С другой стороны, ITIL представляет собой фиксированный набор из 26 процессов, процедур, заданий и списков задач, предназначенных для улучшения конкретных практик управления ИТ-услугами. ITIL фокусируется на качестве и единообразии обслуживания, а также повышении устойчивости систем.
Одним из преимуществ ITIL является то, что организации, которые хотят улучшить ITSM, могут начать с рекомендованных шаблонов, а не с нуля. И хотя некоторые считают, что ITIL лучше всего подходит для крупных предприятий, эта методология достаточно гибкая, чтобы небольшие компании могли выбирать подходящие для их бизнеса процессы и извлекать из этого пользу.
Один из недостатков методологии ITIL (если вы спешите внести изменения в процесс реакции на инциденты) заключается в том, что она может подразумевать формальное управление изменениями и привлечение консультирующего эксперта, что задерживает внедрение улучшений.
Командам, которые хотят начать работу сразу, подход DevOps к управлению инцидентами поможет собраться вместе и мгновенно реализовать преимущества.
Составление графика дежурств с помощью Opsgenie
С помощью этого руководства вы научитесь настраивать график дежурств, использовать правила переадресации дежурств, настраивать оповещения о начале дежурства, а также изучите другие возможности Opsgenie.
Читать учебное руководствоРекомендации по информированию об инцидентах
Информирование об инцидентах — это процесс оповещения пользователей о том, что сервис испытывает некоторые перебои в работе или снижение производительности.
Читать статью