Close

El camino hacia una mejor gestión de incidentes empieza aquí

Cómo elegir herramientas de gestión de incidentes

Categorías, funciones clave y en qué conviene centrarse

No existe una herramienta universal para la gestión de incidentes.

Los equipos de incidentes con mejor rendimiento se hacen valer de las herramientas, prácticas y personas adecuadas.

Algunas herramientas son específicas para la gestión de incidentes, mientras que otras son herramientas más generales que el equipo utiliza también para otras tareas. Y algunas herramientas pueden ofrecer una experiencia totalmente personalizada y basada en capas de integraciones y personalización.

Independientemente del caso práctico, las mejores herramientas de gestión de incidentes tienen algunas cosas en común: son abiertas, fiables y adaptables.

Abiertas: en un entorno de mucha presión, como el de un incidente, es fundamental que las personas adecuadas tengan acceso de inmediato a las herramientas y la información necesarias. Esto no solo se aplica a quienes tienen que dar respuesta al incidente, sino también a las partes interesadas de la empresa que necesitan supervisar las tareas de respuesta.

Fiables: hay pocas cosas peores que pueden suceder durante la respuesta ante incidentes que tener las herramientas de respuesta fuera de servicio. El uso de herramientas en la nube, como Slack y Opsgenie, minimiza el riesgo de que se produzca una interrupción del servicio en la infraestructura que ponga las herramientas de respuesta fuera de servicio.

Adaptables: las integraciones, los flujos de trabajo, los complementos, la personalización y las API, entre otras cosas, amplían las posibilidades del producto. Puede que quieras ponerte a trabajar con una configuración predefinida, pero a medida que tus prácticas y procesos evolucionen, querrás que las herramientas sean lo suficientemente flexibles como para dar respuesta a las necesidades cambiantes.

Ilustración del ciclo de gestión de incidentes

Antes del incidente

Supervisión

Los sistemas de supervisión permiten a los equipos de DevOps y operaciones de TI recopilar, agregar y activar alertas de datos procedentes de miles de servicios diferentes en tiempo real. Estos sistemas son fundamentales para proporcionar una visibilidad completa de la salud de tus servicios y, a menudo, activan los primeros avisos de alarma durante un incidente.

Ventajas

Las herramientas de supervisión proporcionan a los equipos una visión constante del estado de salud de la infraestructura. Las más modernas también activan alertas de forma proactiva cuando se detecta actividad inesperada.

Funcionalidad

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Cobertura y analíticas ininterrumpidas

Plantéate esto

¿La herramienta tiene acceso a todos mis servidores e infraestructuras?

¿Mi equipo puede ver analíticas y tableros con información en tiempo real y configurar umbrales de alerta?

 

Conjunto de funciones

Integración con herramientas de alerta

Plantéate esto

¿Se integra el producto con mi herramienta de alertas y guardias?

Incidencias

El software de centro de asistencia ofrece a los clientes y empleados un mecanismo para informar de incidentes e incidentes potenciales.

Ventajas

Junto con sus muchos otros casos prácticos (solicitudes de asistencia, servicio de asistencia informática), los centros de asistencia permiten a los equipos obtener información sobre incidentes de las personas que más importan: los usuarios y los clientes.

Funcionalidad

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Funciones de autoservicio

Plantéate esto

¿Pueden los clientes enviar tickets a través de un portal de servicios?

¿Pueden los clientes encontrar la ayuda que necesitan con sugerencias automatizadas basadas en conocimientos?

Nuestra recomendación: Jira Service Management

Alertas y guardias

Las alertas rápidas y fiables son un componente fundamental de la respuesta ante incidentes. Así es como los equipos se aseguran de que las personas adecuadas sepan que se ha producido un incidente.

Ventajas

Las herramientas de alerta notifican a las personas de guardia designadas a través de una sofisticada combinación de programación, rutas de escalación y notificaciones.

Funcionalidad

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Funciona en todo el mundo

Plantéate esto

¿Puedo enviar notificaciones (a través de SMS, voz, correo electrónico) a cualquier parte del mundo?

 

Conjunto de funciones

Varios métodos de notificación

Plantéate esto

¿Puedo enviar notificaciones a través de varios métodos como el correo electrónico, el SMS, el teléfono, las notificaciones push de aplicaciones, y probarlos varias veces?

Nuestra recomendación: Opsgenie

Durante el incidente

Aprovechar una base de datos de gestión de la configuración (CMDB) para una resolución más rápida

Conocer las interdependencias dentro de tu infraestructura es fundamental para determinar el impacto total del incidente y alcanzar la resolución más rápidamente.

Ventajas

Utilizar una CMDB te ayudará a conocer las relaciones y las dependencias dentro de tu infraestructura de TI. Si algo deja de funcionar, este mapa te permite encontrar lo siguiente de forma rápida:

  • Las posibles causas del incidente; por ejemplo, puedes determinar en qué host se está ejecutando un servicio con solo hacer clic en un botón.
  • Otros efectos relacionados con el incidente; por ejemplo, puedes descubrir que otros servicios están ejecutándose en el mismo host problemático.

De este modo, puedes investigar y comunicar rápidamente todos los aspectos del incidente.

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Varios canales

Plantéate esto

¿Cómo de flexible es la CMDB? ¿Puedo almacenar cualquier CI o recurso?

¿Puedo visualizar mi infraestructura en un gráfico?

 

Conjunto de funciones

Integraciones

Plantéate esto

¿Puedo vincular CI o recursos con incidencias de mi centro de asistencia?

¿Puedo vincular CI o recursos con solicitudes de cambio?

Logotipo de Insight

Resuelve incidentes más rápido

Asocia tu infraestructura y sus dependencias en Jira de forma nativa. Podrás encontrar la causa de los incidentes y resolverlos en menos tiempo.

Comunicación entre equipos

La comunicación clara y fiable es, sin duda, fundamental durante la gestión de incidentes.

Ventajas

Disponer de una plataforma de comunicación fiable permite al equipo comunicarse, compartir observaciones, enlaces y capturas de pantalla con marcas temporales y de forma preservada. De este modo, se reúne la información adecuada y a las personas apropiadas durante un incidente, y se crea un registro detallado del que se puede aprender después del incidente.

Funcionalidad

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Varios canales

Plantéate esto

¿Puede mi equipo de respuesta ante incidentes crear rápidamente un canal específico a un incidente?

 

Conjunto de funciones

Integraciones

Plantéate esto

¿Pueden otras herramientas de respuesta ante incidentes publicar en el canal de comunicación de mi equipo?

Nuestra recomendación: Slack (texto), Zoom (vídeo)

Comunicación con los clientes

Las herramientas de comunicación con los clientes nos ayudan a mantenerlos informados durante un incidente.

Ventajas

No hay duda de que los incidentes suponen una mala experiencia para los clientes. Mantener informados a los clientes genera confianza y acelera los procesos de respuesta. De este modo, sabrán que eres consciente del incidente y que estás buscando una solución.

Funcionalidad

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Comunicación fuera de mi infraestructura

Plantéate esto

¿Seguirá estando mi herramienta de comunicación accesible y operativa aunque mi infraestructura interna no esté operativa?

 

Conjunto de funciones

Suscriptores y notificaciones

Plantéate esto

¿Pueden los clientes optar por recibir notificaciones cuando publique información sobre un incidente?

Nuestra recomendación: Statuspage

Centro de Comando de Incidentes

En un centro de comando de incidentes se guardan los registros canónicos de los incidentes y sus detalles fundamentales. Puede ser una herramienta de gestión de incidentes como Opsgenie o una herramienta de seguimiento de incidencias como Jira.

Ventajas

Un centro de comandos ofrece un solo lugar para que todo el mundo esté al día durante y después de un incidente, ya que pueden consultarse detalles clave como el estado del incidente, las alertas asociadas, las actualizaciones y mucho más. También proporciona un registro histórico del incidente y de los procesos de respuesta asociados.

Funcionalidad

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Fuente de información fiable

Plantéate esto

¿Pueden los miembros del equipo y las partes interesadas ponerse al día rápidamente sobre un incidente?

¿Pueden los miembros del equipo y las partes interesadas utilizar este registro para buscar todos los detalles sobre el incidente y las actividades de respuesta?

 

Conjunto de funciones

Cronograma

Plantéate esto

¿Genera la herramienta un cronograma de los eventos clave?

Nuestra recomendación: Opsgenie

Después del incidente

Análisis retrospectivo

Un análisis retrospectivo es un registro escrito de lo que ha sucedido durante un incidente y de las acciones tomadas después para evitar que vuelva a ocurrir.

Ventajas

Una vez resuelto un incidente, los equipos a menudo no saben cuál fue su origen y corren el riesgo de que se repita. Los análisis retrospectivos ayudan a prevenirlo, ya que reúnen al equipo para hacer un análisis posterior al incidente.

Funcionalidad

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Plantillas

Plantéate esto

¿Puede mi equipo utilizar una plantilla para rellenar un análisis retrospectivo?

 

Conjunto de funciones

Determinar los siguientes pasos

Plantéate esto

¿Puede mi equipo planear los siguientes pasos que deben darse y la solución de problemas durante el análisis retrospectivo?

Nuestra recomendación: Opsgenie

Gestión de Tareas

Las herramientas de seguimiento de incidencias ayudan a los equipos a determinar el trabajo futuro que debe realizarse para solucionar problemas.

Ventajas

En muchos casos, la resolución del incidente corrige el funcionamiento del servicio, pero no aborda el origen del incidente. Por lo general, hay que realizar más trabajo de ingeniería para remediar las causas del incidente y asegurarse de que no se repita. Las herramientas de seguimiento de incidencias y del trabajo —que esperamos que tu equipo ya esté utilizando para otras tareas de desarrollo— ayudan a priorizar ese trabajo para que no caiga en el olvido.

Funcionalidad

 

Conjunto de funciones

Plantéate esto

 

Conjunto de funciones

Canalización de flujos de trabajo compartidos

Plantéate esto

¿Mi equipo puede compaginar procesos de solución de incidentes con las demás tareas y prioridades?

 

Conjunto de funciones

Integraciones

Plantéate esto

¿Mi equipo puede obtener datos y contenido de las otras herramientas de gestión de incidentes que utiliza?

Nuestra recomendación: Jira Software

A continuación
KPIs