Close

ITSM для высокоскоростных команд

Что такое управление проблемами?

Управление проблемами — это процесс выявления причин инцидентов в ИТ-услугах и управления этими причинами. Это — основа фреймворков ITSM.

Чем ближе вы к настоящим экспертам по инцидентам, тем реже слышите вопрос: «Что вызвало инцидент?» Конечно, его часто задают руководители, клиенты и пресса. Но только не эксперты.

Потому что ответ на вопрос: «Что вызвало инцидент?» часто бывает сухим и бесполезным: «Перезаписанный файл конфигурации» или «Поврежденная запись в базе данных».

Но какие причины способствовали возникновению инцидента? Какие факторы привели к инциденту? Как получилось, что файл конфигурации был перезаписан? При каких условиях была создана поврежденная запись в базе данных? Такие вопросы задают эксперты. И эти вопросы лежат в основе управления проблемами.

Управление проблемами — это не только поиск и устранение инцидентов, но также выявление и изучение причин, способствовавших их возникновению, и поиск наилучшего способа устранения первопричины. Более того, точное определение причины не имеет ценности для организации, если это неструктурированный процесс, выполненный изолированной командой. То есть управление проблемами должно быть постоянным и широко применяться множеством команд, включая команды ИТ, обеспечения безопасности и разработки ПО. Инцидент может закончиться после восстановления работы сервиса, но пока не будут устранены первопричины и способствующие факторы, проблема остается.

Связь между управлением проблемами и другими основными процессами ITIL

Управление проблемами работает в связке с управлением инцидентами и другими практиками ITIL, формируя общую стратегию ITSM.

Управление проблемами и управление инцидентами

ITIL определяет проблему как причину или потенциальную причину одного или нескольких инцидентов. Реакции на события, лежащие в основе эффективного управления инцидентами и эффективного управления проблемами, бывают сходны и частично совпадают, но существуют и ключевые различия. Например, откат к предыдущему развертыванию может привести к восстановлению работы сервиса и окончанию инцидента, но основная проблема остается.

Тем не менее мы считаем, что практики управления проблемами и управления инцидентами все теснее переплетаются. В промежутках между инцидентами ИТ-команды могут сосредоточить свои усилия на исследовании проблем, чтобы внести усовершенствования и повысить качество обслуживания. Такое управление проблемами имеет наибольшую ценность для организации.

Управление проблемами и управление изменениями

Управление изменениями — это процесс планирования, отслеживания и выпуска изменений без перебоев в обслуживании и простоев.

Если изменение приводит к сбою в работе или простою, его анализируют в процессах управления инцидентами и проблемами.

Управление проблемами и управление знаниями

При управлении знаниями создается репозиторий решений и документации по стандартным процедурам и даже способам обхода инцидентов. Когда управление знаниями идет эффективно и с участием всей команды, этот процесс может ускорить устранение инцидентов и сократить их количество.

Управление проблемами и управление запросами на обслуживание

Управление запросами на обслуживание — это практика обработки запросов пользователей на предоставление им чего-либо, например, доступа к приложениям, улучшениям ПО или информации. Запрос на обслуживание иногда бывает трудно отличить от инцидента. На самом деле, до выхода версии ITIL V3 в 2007 г. их не различали и объединяли в одну категорию — «инциденты». Сейчас ITIL определяет инцидент как «незапланированное прекращение предоставления или снижение качества ИТ-услуги». Запрос на обслуживание определяется как «официальный запрос пользователя на предоставление чего-либо: например, запрос информации, совета, сброса пароля или установки рабочей станции для нового пользователя».

Какие преимущества дает управление проблемами?

Управление проблемами при правильном использовании дает много преимуществ бизнесу.

Более быстрое устранение инцидентов

Команды, которые выявляют проблемы, лежащие в основе текущих инцидентов, будут лучше подготовлены к реагированию на инциденты в будущем. Систематизируя рекомендации по анализу проблем, команды смогут более оперативно реагировать и принимать меры при следующих перебоях в обслуживании.

Возможность избежать дорогостоящих инцидентов

Возможность избежать инцидентов экономит время, средства и нервы. По данным компании Gartner, во многих организациях время простоя обходится более чем в 300 000 $ в час. Если же речь идет о веб-сервисах, эта цифра может оказаться гораздо больше.

Повышайте продуктивность

Перестав так часто реагировать на инциденты, вы освободите ресурсы и время в командах, которые теперь смогут уделять больше внимания созданию ценности для клиентов.

Предоставление команде возможности находить и изучать первопричины инцидентов

В организациях, где эффективно управляют проблемами, команды постоянно расследуют инциденты, извлекают из них уроки и поставляют ценные обновления. К сожалению, на многих предприятиях создаются изолированные команды управления проблемами, которые слишком далеки от повседневной работы, чтобы устранить наиболее серьезные проблемы.

Поддержка постоянного улучшения обслуживания 

Управление проблемами предотвращает инциденты и одновременно повышает эффективность. Например, устранение инцидента, вызывающего снижение производительности, приводит к улучшению качества обслуживания.

Повышение удовлетворенности клиентов

Более эффективное управление проблемами сокращает число инцидентов и повышает удовлетворенность клиентов. И наоборот, если один и тот же инцидент возникает снова и снова, терпение клиентов иссякает. Уменьшение числа повторных инцидентов укрепляет доверие клиентов.

Процесс управления проблемами

Компания Atlassian выступает за сближение процессов управления проблемами и инцидентами.

Если процесс управления проблемами громоздкий, изолированный и оторванный от остальных, для компании это может закончиться появлением целого вороха нерешенных проблем. Бэклог — это место, в где проблемы у некоторых команд уходят в небытие. Проблемы лучше всего ставить перед командами, которые могут их решить и способны провести ценные исследования.

При этом важно знать основные этапы процесса управления проблемами. Они перечислены ниже.

  1. Обнаружение проблемы. Занимайтесь поиском проблем заблаговременно, чтобы их можно было решить, или предусматривайте способы обхода инцидентов до того, как они возникнут.
  2. Присвоение категории и назначение приоритета. Отслеживайте и оценивайте известные проблемы, чтобы команды могли организованно работать над решением наиболее насущных и важных проблем.
  3. Изучение и диагностика. Определите первопричины, которые привели к возникновению проблемы, и выберите наилучший способ их устранения.
  4. Создание записи об известной ошибке. В ITIL известная ошибка — это «проблема, имеющая документированную основную причину и способ обхода». Регистрация этих сведений позволит сократить простои, если проблема вызовет инцидент. Обычно эта информация хранится в документе, который называется базой данных известных ошибок.
  5. Создание способа обхода (при необходимости). Способ обхода — это временное решение, которое снижает негативное воздействие проблемы и не позволяет ей перерасти в инцидент. Способы обхода не идеальны, но могут ограничить влияние на бизнес и не позволят клиентам столкнуться с инцидентом, если проблему не удастся быстро обнаружить и устранить.
  6. Решение и закрытие проблемы. Закрытая проблема — это проблема, которая устранена и больше не может вызвать инцидент.

Рекомендации и советы по управлению проблемами

Как уже упоминалось ранее, самые эффективные из известных нам команд объединяют управление проблемами и управление инцидентами.

Если выделять управление проблемами в отдельный процесс, возникают сложности, когда, например, команда по управлению проблемами становится «узким» местом или концентрируется не на тех задачах (например, на проблемах с внешними поставщиками, на которые она не может повлиять). Основные причины зачастую не изучаются до тех пор, пока не возникнет инцидент.

Во многих случаях команда может выиграть от объединения практик управления инцидентами и управления проблемами. Это упреждающий подход, который позволяет понять, что привело к инциденту, в процессе его устранения. Например, чтобы устранить инцидент в ПО, необходимо найти ошибку в коде (причину) и затем создать замещающий код (исправление), чтобы избежать инцидентов в будущем.

Объединение управления проблемами и управления инцидентами означает, что когда команды не находятся в режиме реагирования, они могут заняться проблемами, которые больше всего влияют на качество обслуживания и производительность, и действовать на опережение, чтобы предотвратить инциденты в будущем.

Советы по управлению проблемами

Не полагайтесь на анализ основных причин постфактум

За инцидентом или проблемой редко стоит одна основная причина. Успешные команды рассматривают все потенциальные способствующие факторы в комплексе и применяют анализ без поиска виновных.

Поощряйте открытую среду, в которой можно делиться проблемами

Анализ проблем и инцидентов должен проходить в форме открытого обсуждения, во время которого участники команды могут делиться фактами, не опасаясь наказания или последствий.

Сосредоточьтесь на критически важных услугах

В первую очередь решайте проблемы, которые влияют на услуги, приносящие организации наибольшую прибыль.

Задавайте вопросы и используйте метод пяти «почему»

Многие команды добиваются успеха с помощью метода пяти «почему», автором которого является Тайити Оно, создатель производственной системы Toyota. Подробнее см. в сценарии Atlassian Team Playbook .

Распространяйте знания

Открытые команды делятся знаниями и идеями, на которых могут учиться их коллеги и другие команды.

Станьте обучающейся организацией

Эффективное управление проблемами никогда не заканчивается. Инциденты случаются даже в самых успешных организациях. Команды мирового уровня постоянно повторяют процесс и совершенствуют его, чтобы уменьшить влияние проблем на своих коллег и клиентов.

Отслеживайте последующие действия

Важно разработать четкий и унифицированный способ отслеживания последующих действий. Поскольку управлением проблемами нужно заниматься постоянно, важно использовать ПО для ITSM, с помощью которого команды могут назначать приоритеты задачам, отслеживать прогресс и связывать инциденты с проблемами.

Резюме

Инциденты часто называют незапланированными инвестициями в надежное обслуживание в будущем. Эффективное управление проблемами позволяет повысить качество обслуживания, а также выявлять и устранять причины инцидентов.

Хотите узнать об управлении проблемами в Jira Service Management?

продолжение темы
Template