Gestión de incidentes para equipos de alta velocidad
Poner orden en el caos: la función del responsable de la gestión de incidentes
¿Qué es un responsable de la gestión de incidentes (IC, del inglés, incident commander) y por qué lo necesitas?
No es ningún secreto que los incidentes graves tienen una amplia repercusión en los resultados de una empresa. Es por eso por lo que la gestión de incidentes es un componente esencial y en constante evolución de cualquier práctica de ITSM. Ahora bien, cuando estalla un incidente, ¿quién tiene la responsabilidad de que los sistemas vuelvan a ponerse en marcha?
La respuesta general suele ser que es el equipo de TI o DevOps; pero lo cierto es que da igual cuál sea el departamento o los departamentos encargados de gestionar incidentes graves: la persona al mando de la resolución suele ser el responsable de la gestión de incidentes.
¿Qué es un responsable de la gestión de incidentes?
Un responsable de la gestión de incidentes (también conocido como "gestor de incidentes"), es un miembro del equipo de TI o DevOps que está a cargo de gestionar la respuesta ante incidentes. La prioridad de esta persona es conducir un incidente hacia su resolución con la máxima rapidez e integridad posible, para lo cual gestiona los recursos, el plan y la comunicación implicados en dicha resolución.
Este término también lo utilizan los bomberos y los equipos de respuesta a emergencias de los Estados Unidos y, aunque en estas circunstancias los riesgos suelen ser mayores, su función sigue siendo la misma. El responsable de la gestión de incidentes siempre es la persona de referencia que tiene la última palabra sobre todas las cuestiones relacionadas con el incidente.
¿Por qué los necesitan equipos un responsable de la gestión de incidentes?
El responsable de la gestión de incidentes es el punto de contacto primario y la principal fuente de información fiable sobre tu incidente. Esta persona contempla el panorama general, maneja todas las piezas que hay en movimiento, sabe qué es lo que se ha intentado y qué está todavía en el radar, y planifica y gestiona los pasos sucesivos.
Sin un responsable de la gestión de incidentes, la comunicación y el trabajo en equipo se desmoronan. Es fácil que los equipos dupliquen el trabajo sin saberlo, pasen por alto preocupaciones de carácter general y no consigan comunicarse de forma rápida y precisa con los usuarios del sistema, las partes interesadas internas, el equipo de liderazgo y entre sí. Cuanto mayores y más complejas sean la tecnología o las estructuras de los equipos de una organización, mayor será la importancia de esta función para una práctica saludable de gestión de incidentes.
Los cometidos de un responsable de la gestión de incidentes
Preparación para los incidentes
Los responsables de la gestión de incidentes son responsables de establecer canales de comunicación, invitar a las personas adecuadas a esos canales durante un incidente y capacitar a los miembros del equipo sobre las prácticas recomendadas no solo para la gestión de incidentes, sino también para la comunicación durante un incidente.
Toma de decisiones
Los IC son responsables de evaluar con rapidez un incidente y tomar decisiones sobre qué hacer, qué miembros del equipo son necesarios y qué acciones hay que efectuar a continuación en cada etapa del proceso de resolución. Deben ser personas que sepan escuchar, y experimentadas en reunir, sintetizar y priorizar las recomendaciones de los expertos.
Los mejores responsables de la gestión de incidentes son personas que toman decisiones con confianza y que poseen sólidas dotes de resolución de problemas.
Delegación
Los CI deben delegar tareas en sus equipos y saber cuándo ampliar el equipo incorporando a desarrolladores adicionales, expertos en comunicación, etc.
Supervisión
Mientras los desarrolladores están hasta arriba tratando de averiguar las causas de un incidente y cómo resolverlo en el código, un responsable de la gestión de incidentes debería examinar el panorama general. ¿Qué es lo que ya se ha intentado? ¿Qué funcionó la última vez? ¿Cuál es lo mejor que se puede hacer si la estrategia actual no funciona?
Los responsables de la gestión de incidentes se encargan de supervisar el proceso de principio a fin, de plantear las preguntas adecuadas, de obtener informes periódicos sobre el estado de cada miembro del equipo y de priorizar los pasos sucesivos.
Alineación del equipo
Cuanto mayor sea un incidente, mayor será la probabilidad de que haya varios equipos trabajando en una resolución. Un IC supervisa la comunicación y se cerciora de que todos estén en sintonía. Además, debe procurar que las conversaciones no divaguen y sean breves para minimizar el tiempo de resolución.
Gestión del pánico
Los incidentes son eventos que generan un riesgo y un estrés elevados, y los estudios demuestran que las personas estresadas toman peores decisiones. Es por eso por lo que parte del trabajo del responsable de la gestión de incidentes consiste en mantener la calma y la concentración de los equipos.
El IC debe tener la capacidad y voluntad de apartar del equipo de incidentes a las personas que estén muy estresadas, para alzar su voz por encima de la del resto equipo cuando sea preciso, y para volver a poner el foco de atención siempre sobre la tarea que se tiene entre manos. Siempre que sea posible, también debería aligerar cualquier carga adicional de estrés de las espaldas de sus equipos, para lo cual debe desviar el flujo constante de preguntas y pánico procedente de las partes interesadas internas y externas.
Escalación y gestión de recursos
Cuando es preciso, los responsables de la gestión de incidentes se encargan de escalar las incidencias a desarrolladores más séniores o especializados y/o aportar recursos adicionales para acelerar la resolución.
Planificación
Tanto antes como en el transcurso de un incidente, un IC debe tener los pasos sucesivos y los planes alternativos listos para ponerlos en marcha.
Análisis retrospectivo
Una vez resuelto un incidente, el responsable de la gestión de incidentes se encarga del proceso de análisis retrospectivo, que incluye la creación de documentos en los que los equipos puedan compartir sus ideas, planificar reuniones de análisis retrospectivo y efectuar recomendaciones sobre cómo prevenir o disminuir la repercusión de futuros incidentes.
Cómo llegar a ser responsable de la gestión de incidentes
Las principales responsabilidades de un responsable de la gestión de incidentes son la gestión de recursos, la comunicación y la resolución de problemas. Cualquiera que tenga estas competencias, desde el liderazgo sénior hasta los becarios, puede llegar a ser un excelente responsable de la gestión de incidentes.
Estos son algunos de los requisitos habituales de los responsables de la gestión de incidentes:
- Competencias comunicativas sólidas
- Un alto nivel de conocimiento de los sistemas y las prácticas recomendadas sobre la gestión de incidentes
- Competencias para resolver problemas
- Capacidad para tomar decisiones rápidas y seguras
- Competencias de escucha y síntesis
- Experiencia previa con incidentes graves (ya sea como participante o como observador)
- Competencias de liderazgo: capacidad de tomar el control en una situación de mucho estrés
Para llegar a ser responsable de la gestión de incidentes, la mayoría de las empresas te harán aprender de otros IC. En estos casos, la práctica recomendada es observar en silencio y aprender, y no hacer ninguna pregunta hasta que se resuelva el incidente.
Prácticas recomendadas de los responsables de la gestión de incidentes
Mantente al corriente de las prácticas recomendadas del sector
Dado que los responsables de la gestión de incidentes se encargan de orientar a los equipos hacia el éxito en los incidentes, deben conocer bien las prácticas recomendadas de respuesta ante incidentes y las prácticas recomendadas de comunicación de incidentes. El manual de gestión de incidentes de Atlassian es otro recurso útil.
Planifica el futuro
También resulta fundamental contar con un plan estratégico para los incidentes antes de que se produzcan. Cuanto mejor documentado esté tu proceso antes del incidente, al IC y a los equipos les resultará más fácil seguirlo en el entorno más intenso y estresante que genera un incidente.
Conoce a tus equipos
Conocer la dinámica del equipo y las fortalezas y debilidades de las personas que integran tus equipos hace que delegues mejor y resuelvas antes los incidentes.
Concéntrate en tus tareas
Las llamadas de equipo y las conversaciones de Slack siempre pueden desviarse del tema, incluso durante un incidente grave. El IC debe estar preparado para impedir que la gente se salga por la tangente y reorientar al equipo en la tarea en cuestión.
En algunas ocasiones, basta con un breve recordatorio verbal o por escrito. En otras, todo esto implica apartar a personas del equipo o incorporar a gente nueva. Los mejores IC están dispuestos incluso a sacar al director ejecutivo o a sus jefes de una llamada si esa persona se está convirtiendo en una distracción.
Mantén la calma
Los mejores IC son personas que pueden mantener la serenidad y la concentración en una crisis. Si esto no le surge a un IC de forma natural, es algo que se puede practicar y mejorar.
Prioriza los análisis retrospectivos
Una vez resuelto un incidente, el IC debe llevar a cabo un análisis retrospectivo sin reproches para identificar cómo puede el equipo mejorar la gestión de incidentes y los sistemas globales en el futuro. Los mejores IC no solo guían los incidentes con calma hacia la resolución, sino que también trabajan para ayudar a la empresa a aprender del incidente y hacer mejoras.
Conclusión
Los responsables de la gestión de incidentes pueden sacar provecho de una solución potente de gestión de servicios. Jira Service Management mejora la comunicación, centraliza las alertas e incorpora artículos de la base de conocimientos.
Configuración de un horario de guardias con Opsgenie
En este tutorial aprenderás a configurar un horario de guardias, aplicar reglas de anulación, configurar notificaciones de guardias y mucho más, todo dentro de Opsgenie.
Leer el tutorialVentajas e inconvenientes de los diferentes enfoques de la gestión de las guardias
Los equipos de guardia evolucionan rápidamente. Descubre las ventajas y los inconvenientes de los diferentes enfoques de la gestión de las guardias.
Leer el artículo