Close
Imagine Learning + Atlassian

Imagine Learning limite les interférences et réduit la fatigue d'alerte grâce à Opsgenie


Logo Imagine Learning
Secteur

EdTech

Site

Provo, Utah

Nombre d'utilisateurs

241

Apps du Marketplace
Partager la page

Imagine Learning est une entreprise d'apprentissage par la technologie fondée en 2004 afin d'aider les étudiants pour lesquels l'enseignement traditionnel n'est pas efficace. L'entreprise conçoit des logiciels pour les élèves de la maternelle au lycée, qui rencontrent des problèmes pour la lecture, l'écriture et les mathématiques. Les écoles achètent ces logiciels pour répondre aux besoins des élèves ayant des difficultés d'apprentissage et les aider à réussir leurs études.

Réaliser les difficultés liées à la fatigue d'alerte

Keith Smith a rejoint Imagine Learning en tant que Principal Site Reliability Engineer après avoir travaillé dans le domaine DevOps pendant des années. Il connaissait bien divers outils de surveillance des incidents, dont Opsgenie. Imagine Learning disposait de nombreux outils, mais l'entreprise manquait de consolidation et d'alertes efficaces.

« [À l'époque,] l'équipe d'astreinte recevait uniquement les messages d'alerte par e-mail. C'était stupide et tellement peu pratique. Je me levais toutes les nuits à 1 heure du matin, je jetais un œil à mon téléphone et je retournais me coucher. Il devait sûrement y avoir une meilleure solution. »

En raison du volume d'alertes, elles n'étaient ni significatives ni exploitables. Le processus était complètement réactif, et les équipes ne disposaient d'aucun moyen efficace de communiquer lors d'incidents.

« Le volume d'appels au support augmentait, ce qui indiquait un problème, puis le représentant du support le faisait remonter. Mais c'était la seule chaîne de communication : le client nous communiquait un problème, puis nous le réglions. »

Élaborer un business case

Keith était conscient qu'il devait implémenter un outil comme Opsgenie, mais devait formuler un business case pour les cadres supérieurs, ce qui s'est avéré plus facile que prévu.

« Deux semaines après avoir commencé, je mettais en place des alertes et je regardais des métriques lorsque je me suis rendu compte que nous rencontrions une panne depuis 24 heures et que nous étions passés à côté ! » Le problème a été résolu assez rapidement, mais une panne de 24 heures était tout à fait évitable.

Il était également devenu essentiellement un point de défaillance unique, ce qui n'était ni évolutif ni viable pour une entreprise de plus de 500 employés répartis aux États-Unis, en Inde et en Argentine.

Dans les trois mois suivant l'adoption d'Opsgenie, nous avons réduit le nombre d'incidents de 900 %.

Keith Smith

Principal Site Reliability Engineer

La consolidation et l'amélioration de la communication ont été essentielles pour gérer l'infrastructure nécessaire à la réussite de l'entreprise.

« Et si je partais en congés ? Qu'en serait-il des alertes pendant deux jours ? Je suis allé voir mon patron et je lui ai dit que ce n'était pas viable, qu'on allait rencontrer des problèmes, preuves [comme la panne de 24 heures] à l'appui ».

Entre un planning d'astreinte pénible et des alertes principalement envoyées par e-mail, une approche réactive des problèmes et des métriques pour confirmer la nécessité d'une plateforme moderne de gestion des incidents, les arguments ne manquaient pas, et Imagine Learning a décidé d'adopter Opsgenie.

Alertes fiables

Les plus de 20 outils et applications pour gérer l'intégration d'Opsgenie à sa stack informatique ont mis tout le monde d'accord.

« Chaque fois que je souhaitais connecter une source à Opsgenie, il y avait une solution… ne serait-ce qu'un webhook. »

Grâce aux intégrations étroites avec Slack et Jira, Imagine Learning dispose désormais d'un processus automatisé. Opsgenie met à jour la page d'état, crée un ticket Jira, envoie une notification Slack et réveille les bonnes personnes au bon moment.

« Maintenant, nous rencontrons un incident majeur chaque année, c'est plus raisonnable. Je peux dormir sur mes deux oreilles et j'ai récupéré du temps pour m'atteler à d'autres projets. »

Keith Smith

Principal Site Reliability Engineer

« Outre une accélération du MTTR, le principal avantage que nous en retirons est l'aspect communication. L'outil informe nos clients de ce qui se passe et prévient les 500 personnes présentes dans nos bureaux à travers le pays [et le monde] dès qu'un incident survient. »

Soulagement après l'adoption d'Opsgenie

Le fait de partager le planning d'astreinte et de n'être réveillé que lorsque cela est nécessaire permet à Keith de diversifier son travail et de réduire le délai de réponse de 24 à 36 heures à une fenêtre de 15 minutes maximum.

Grâce à Opsgenie, Keith a pu créer un processus efficace de gestion des incidents et des astreintes qui a permis de réduire le MTTR et d'améliorer la qualité de vie de son équipe. Pour une entreprise fournissant un produit logiciel, un ticket doit être vite résolu. Dans les trois mois suivant l'adoption d'Opsgenie, le volume d'incidents a diminué de 900 %.

« Maintenant, nous rencontrons un incident majeur chaque année, c'est plus raisonnable. Je peux dormir sur mes deux oreilles et j'ai récupéré du temps pour m'atteler à d'autres projets. »

Démarrez votre essai gratuit Opsgenie de 14 jours sans plus attendre

Logo tecRacer

Adopter une orientation cloud grâce à Opsgenie

Logo EBSCO

Fournir des services permanents grâce à la gestion agile des incidents