Close

¿Todo listo para adoptar la ITSM a alta velocidad?

¿Qué es la gestión de incidentes?

La gestión de incidentes es el proceso para responder a eventos no planificados o interrupciones del servicio, a fin de recuperar el estado operativo. Según ITIL (biblioteca de infraestructura de TI), "el proceso de gestión de incidentes garantiza que el funcionamiento normal del servicio se recupere lo antes posible y se minimice el impacto en el negocio".

Los incidentes son eventos de cualquier tipo que alteran o reducen la calidad del servicio (o amenazan con hacerlo). Una aplicación empresarial que deja de funcionar es un incidente. Un servidor web "agonizante" también puede serlo, porque va lento y eso afecta a la productividad. Y lo que es peor, existe el riesgo aún más grave de que se produzca un fallo completo.

Vamos a presentar algunos términos importantes del tema para que todos partamos de las mismas definiciones:

ITSM (gestión de servicios de TI) es una estrategia habitual para crear, respaldar y gestionar servicios de TI. El concepto básico de ITSM es la idea de que la TI debe prestarse como un servicio. Además, una de las prácticas básicas de ITSM es la gestión de incidentes.

ITIL es un conjunto de prácticas recomendadas para ITSM (vendría a ser como un manual de estrategias).

Un problema es el origen no identificado de uno o varios incidentes. En el incidente anterior, donde la red agoniza y una aplicación empresarial ha dejado de funcionar, el problema subyacente podría ser un router mal configurado.

La importancia de la gestión de incidentes como práctica de ITSM

Teniendo en cuenta todos los servicios de software de los que las organizaciones de servicios de software dependen hoy en día, hay más puntos de error posibles que nunca. También pueden ser enormes las repercusiones en caso de incidente. Hay estudios que indican que los incidentes graves pueden costar 300 000 $ por cada hora que un sistema está caído. En algunos servicios basados en web, esa cifra incluso puede ser considerablemente superior.

Tener un proceso de gestión de incidentes bien definido puede servir para reducir esos costes significativamente. Estas son las ventajas de contar con un proceso bien definido:

  • Resolución de incidentes más rápida
  • Menores costes o pérdidas de ingresos resultantes de incidentes para la organización
  • Mejora de la comunicación (interna y externa) durante los incidentes
  • Mejora y aprendizaje continuos

El proceso de gestión de incidentes

La clave para la gestión de incidentes es tener un buen proceso y ceñirse a él. Aunque parezca bastante complicado, puedes aprender de la experiencia de miles de equipos de servicios de TI.

Uno de los principales errores de las organizaciones de TI en crecimiento y con un volumen alto de actividad es intentar "reinventar la rueda" y crear procesos desde cero. Aprovecha las prácticas recomendadas y no pierdas tiempo creando una herramienta de cosecha propia para el envío de tickets.

A continuación, te ofrecemos un resumen general de los pasos importantes para la gestión de incidentes:

Identifica un incidente y regístralo

Los incidentes pueden venir de cualquier parte. Puede notificarlos un empleado o caer literalmente del techo sobre tu mesa (imagina un centro de red mal instalado y un falso techo en mal estado, aunque no lo decimos por experiencia…).

Sea cual sea el origen del incidente, los dos primeros pasos son sencillos: alguien identifica un incidente y alguien lo registra.

Si el incidente te llega a través del centro de asistencia, estos dos primeros pasos te los ahorras. Si recibes una llamada telefónica o el incidente se notifica por correo electrónico, por SMS o por paloma mensajera, el equipo de centro de asistencia deberá encargarse de registrarlo.

Para registrar incidentes (o, lo que es lo mismo, para crear tickets), lo habitual es tener que hacer todo esto:

  • El nombre de la persona que notifica el incidente
  • La fecha y la hora en las que se notifica el incidente
  • Una descripción del incidente (lo que está inactivo o no funciona correctamente)
  • Un número de identificación único asignado al incidente, para el seguimiento

Categorizar el incidente

Asigna a cada incidente una categoría lógica e intuitiva (y una subcategoría, según sea necesario). Si no lo haces, te será más complicado analizar los datos y buscar tendencias y patrones posteriormente, algo esencial para la gestión eficaz de problemas y la prevención de incidentes futuros. Además, deberás elegir una solución de centro de asistencia de ITSM con la que puedas personalizar fácilmente las categorías de incidentes.

Jerarquizar el incidente por orden de prioridad

Hay que asignar una prioridad a todos los incidentes. Para empezar, evalúa su impacto en el negocio. Ten en cuenta el número de personas que se verán afectadas y las posibles implicaciones financieras, de seguridad y de cumplimiento. Esto te servirá para estimar las repercusiones negativas del incidente y la urgencia con la que debe resolverse.

En este caso, la práctica recomendada es definir los niveles de gravedad y prioridad antes de que el incidente llegue a ocurrir, para que los gestores de incidentes puedan determinar la prioridad fácil y rápidamente.

Siempre que tengas dudas sobre el nivel de prioridad, aplica el más alto. Es mejor pasarse que no llegar y correr el riesgo de que se cuele un problema grave.

Cuando hayas definido prioridades, aborda todos los incidentes abiertos por orden de prioridad. Casi todas las organizaciones establecen acuerdos de servicio claros en torno a cada nivel de prioridad, de modo que los clientes sepan con qué plazo pueden contar para recibir una respuesta y una solución.

Respuesta

"Respuesta ante incidentes" es un término bastante amplio, así que vamos a desglosarlo en los pasos que será más probable que debas dar una vez identifiques, categorices y priorices un incidente.

Diagnóstico inicial

Vendría a ser como el triaje que se hace en los hospitales cuando llega un paciente. El empleado del centro de asistencia hace una primera suposición sobre la causa del error, para empezar a resolverlo o seguir los procedimientos apropiados y reunir los recursos adecuados para ello. En este paso, las bases de conocimiento y los manuales de diagnóstico son herramientas útiles.

Si el primer agente en responder puede resolver el incidente a partir de los diagnósticos iniciales y con los conocimientos y herramientas disponibles, el incidente queda resuelto. Si no es así, tocará escalarlo.

Escalación de incidentes

Tu equipo de asistencia de primera línea debe ser capaz de resolver una gran cantidad de incidentes habituales sin tener que escalarlos. Cuando no pueda ser, el objetivo es recopilar y registrar la información correcta para que se disponga enseguida de toda la información necesaria y que el incidente se pueda resolver lo antes posible.

Investigación y diagnóstico

Para ITIL, este es "su paso". Aunque en realidad es un proceso que se extiende a lo largo del ciclo de vida del incidente.

La primera persona que responde al incidente ya lo está investigando (en cierto grado) en el momento en el que recopila información; de hecho, incluso puede diagnosticarlo correctamente y resolverlo sin necesidad de escalación.Si las cosas suceden así, te saltarás directamente los pasos de resolución, recuperación y cierre de incidentes.

Si no es el caso, la investigación y el diagnóstico están presentes en todos los pasos del proceso, a medida que se escale o requiera recursos externos para ayudar con la resolución.

Resolución y recuperación

Finalmente (y, en el mejor de los casos, dentro de tus acuerdos de nivel de servicio, SLA), llegarás a un diagnóstico y darás los pasos necesarios para resolver el incidente. La recuperación simplemente implica la cantidad de tiempo que las operaciones pueden tardar en recuperarse por completo, ya que algunas correcciones (como parches de error) pueden requerir pruebas e implementación incluso después de determinar la resolución adecuada.

Cierre de incidentes

Si el incidente se había escalado, vuelve al centro de asistencia para que se pueda cerrar. Para mantener la calidad y garantizar un proceso fluido, solo los empleados del centro de asistencia pueden cerrar incidentes. Los propietarios de cada incidente deben consultar con la persona que lo notificó para confirmar que la resolución es satisfactoria y que el incidente puede cerrarse realmente.

Resumen

El proceso de gestión de incidentes puede parecer de un formalismo innecesario, especialmente si tu organización es pequeña. Sin embargo, el ciclo de vida de los incidentes es siempre el mismo, con independencia de la estructura de tu equipo, y las escalaciones son lo más habitual. ¡No te saltes ningún paso!

A veces se producen incidentes. Sin embargo, un proceso sólido de gestión de incidentes permite reducir su impacto y recuperar los servicios rápidamente.