Close

Gestion des incidents pour les équipes haute vélocité

L'adoption de ChatOps par les équipes pour la gestion des incidents

Ce n'est pas un secret, plus votre communication est bonne, meilleure sera votre gestion des incidents.

Les équipes ayant de solides pratiques de communication et de collaboration résolvent les incidents plus rapidement tout en maintenant la satisfaction des membres internes et des utilisateurs externes. Elles sont également mieux armées pour les post-mortems qui permettent d'identifier les problèmes centraux et de prévenir les incidents futurs.

C'est pourquoi il n'est pas surprenant que ChatOps fasse partie intégrante des processus de nombreuses équipes de gestion des incidents.

Pourquoi ChatOps

Comme l'explique Sean Regan, Directeur du marketing produit pour Jira et Bitbucket, ChatOps représente des conversations mises à profit :

« ChatOps est un modèle de collaboration qui rassemble les personnes, les outils, les processus et l'automatisation dans un workflow transparent. Ce workflow centralise les tâches à réaliser, en cours et terminées dans un espace persistant composé de personnes, de robots et d'outils connexes. La transparence renforce la boucle de feedback, améliore le partage d'informations et la collaboration d'équipe. Sans parler de la culture d'équipe et de la formation polyvalente… »

« Le chat représente une nouvelle méthode pour consigner les connaissances collectives d'une équipe et les utiliser afin de favoriser un changement durable dans la manière dont les produits sont livrés et dans la manière de collaborer. Si vous vous contentez d'en parler, vous n'avez pas l'impression qu'un véritable changement est à l'œuvre, mais une fois que vous commencez à travailler de cette manière, vous ne pouvez plus imaginer revenir à l'ancienne méthode. »

Comment ChatOps fonctionne-t-il dans la gestion des incidents ?

Dans le contexte de la gestion des incidents, ChatOps rassemble le workflow des incidents en un seul endroit pour que les équipes restent agiles et en phase.

Il centralise toutes les communications liées aux incidents, aux rapports d'incidents, aux plans et à l'avancement, ce qui permet de tenir tout le monde informé en temps réel. De plus, il fournit aux équipes DevOps, informatiques, de communication, de sécurité, juridiques ainsi qu'à toutes les autres équipes pertinentes, un endroit pour collaborer non seulement sur la résolution d'incidents, mais également sur la prévention d'incidents futurs et l'atténuation des risques.

Décloisonnez les informations durant les incidents

Tout le monde a accès aux mêmes informations

Plus vos conversations sur les incidents sont cloisonnées, plus il est probable que des erreurs de communication fassent dérailler le projet. Inviter tout le monde dans un seul groupe de discussion réduit ce risque.

Les conversations sont en temps réel

Cela signifie que toutes les personnes qui doivent être tenues informées et doivent agir, des développeurs qui résolvent les incidents aux gestionnaires de réseaux sociaux qui rassurent les utilisateurs finaux, sont toujours à jour sans délai.

Moins de changements de contexte

Sans ChatOps, la gestion des incidents se fait généralement entre diverses apps et est communiquée par e-mail, téléphone, ou encore SMS. Cela s'accompagne de nombreux changements de contexte, et le suivi nécessite beaucoup de réflexion.

ChatOps uniformise tout, autant que possible, en un seul et même endroit. Les alertes arrivent dans le chat. Les rapports arrivent dans le chat. Les conversations sont renvoyées vers le chat. Par conséquent, les équipes chargées des incidents n'ont qu'à se rendre à cet endroit unique pour obtenir les dernières informations.

Pas de « téléphone arabe »

Quiconque connaît l'ancien « téléphone arabe » sait qu'il suffit d'un ou deux échanges pour modifier totalement un message. ChatOps élimine ce risque. Si tout le monde a accès aux mêmes conversations initiales, le risque d'erreurs de communication diminue considérablement.

Un rapport écrit intégré pour les post-mortems d'incidents

Que s'est-il passé ? Combien de temps a-t-il fallu pour résoudre l'incident ? Qu'est-ce qui a finalement résolu le problème ? Pourrions-nous automatiser la solution ?

C'est le genre de questions qui feront probablement l'objet d'une enquête lors d'un post-mortem d'incident. Grâce à un enregistrement unique et horodaté de toutes les communications, il sera beaucoup plus facile d'y répondre clairement et correctement.

Bonnes pratiques ChatOps pour la gestion des incidents

Connectez votre système d'alerte à votre chat

Plus vos développeurs sont obligés d'ouvrir et de quitter le chat pour résoudre un incident, plus vous perdez de temps à changer de tâches. Cela signifie qu'au lieu d'envoyer les alertes par e-mails et par SMS lors d'un incident, les envoyer directement dans votre groupe de discussion peut aider à accélérer le processus de résolution d'incident.

Définissez des seuils intelligents pour vos alertes

La fatigue d'alerte est une menace réelle, surtout au beau milieu d'un incident majeur. Donc, lorsque nous vous suggérons de faire passer les alertes directement dans votre chat, nous ne parlons pas de toutes les alertes.

Quelles alertes aideront votre équipe à répondre rapidement et complètement à un incident ? Quelles alertes sont juste des interférences supplémentaires ? Quelles alertes sont des doublons ?

Posez ces questions au préalable et définissez des seuils d'alerte intelligents pour votre chat afin de simplifier les choses et de réduire le risque que les équipes manquent un point important en raison de la fatigue d'alerte. Un outil tel qu'Opsgenie vous permet de configurer les actions envoyées vers un groupe de discussion et de filtrer les alertes en fonction de leurs propriétés.

Configurez un groupe pour chaque incident majeur

Les équipes qui gèrent un incident majeur ne devraient pas se soucier d'être enlisées dans les incidents mineurs, les conversations quotidiennes ou les autres incidents non prioritaires dans leur liste. Assurez-vous que chaque incident majeur dispose de sa propre discussion dédiée.

Intégrez des actions au chat

Grâce à une combinaison comme Slack et Opsgenie, le chat de gestion des incidents peut devenir plus qu'un simple canal de communication. Vous pouvez activer des commandes texte ou des boutons directement dans le chat afin d'exécuter des actions d'incident telles que l'assignation d'alertes, la prise en charge, l'ajout de notes, la désactivation des incidents ou même la création d'alertes.

Invitez plusieurs équipes

Des équipes DevOps aux équipes informatiques en passant par les responsables des communications, les gestionnaires des réseaux sociaux, l'équipe chargée de la sécurité et les équipes juridiques, il y a souvent plusieurs acteurs et rôles qui doivent être informés d'un incident en temps réel. Déterminez à l'avance quelles personnes composent ces équipes et tiennent ces rôles, et conviez-les à votre chat.

Priorisez la sécurité

Assurez-vous que votre chat est sécurisé et que seules les personnes de votre choix peuvent prendre des mesures.

Enregistrez les transcriptions du chat

Une fois votre incident résolu, le moment est venu de passer au post-mortem, et ChatOps simplifie le processus. Si vous avez une discussion unique qui réunit toutes les communications sur les incidents, une fois l'incident terminé, vous disposez d'un enregistrement complet de l'ensemble des conversations, alertes et rapports en un endroit centralisé. Vous pouvez consigner cet enregistrement pour référence ultérieure, l'utiliser pour actualiser vos playbooks sur les incidents, et l'approfondir lors du post-mortem pour apprendre à éviter ou atténuer le risque d'incidents similaires à l'avenir.

Aperçu du document PDF

Six incontournables pour utiliser Slack dans la gestion des incidents

En savoir plus sur ChatOps, six fonctionnalités importantes des intégrations de chat pour les solutions de gestion des incidents et une comparaison des intégrations Slack utilisées par les plus grands acteurs de la gestion des incidents.

Up Next
ITSM