L'ITSM pour les équipes haute vélocité
Qu'est-ce que la gestion des problèmes ?
La gestion des problèmes désigne le processus qui consiste à identifier et gérer les causes des incidents dans un service informatique. C'est un composant fondamental des frameworks ITSM.
Plus vous vous rapprochez de vrais experts des incidents, moins vous entendez la question « Qu'est-ce qui a causé l'incident ? » Bien sûr, vous l'entendrez de la part des dirigeants, des clients, et de la presse. Mais les experts s'y connaissent mieux.
Car la réponse à cette question est souvent ennuyeuse et peu utile. Cela peut être un fichier de configuration réécrit, une entrée de base de données corrompue.
Mais quelles sont les causes qui ont contribué à la survenue de l'incident ? Quels sont les facteurs qui ont mené à l'incident ? Comment est-il possible qu'un fichier de configuration puisse être réécrit ? Quelles conditions créent une entrée corrompue dans la base de données ? Ce sont les questions que vous entendez les experts poser. Et elles sont au cœur de la gestion des problèmes.
La gestion des problèmes ne se résume pas à trouver et à corriger les incidents, c'est également identifier et comprendre les causes sous-jacentes d'un incident, ainsi qu'identifier la meilleure méthode afin d'éliminer cette cause profonde. De plus, identifier la cause n'a aucune valeur pour une organisation s'il s'agit d'un processus perturbateur effectué par une équipe cloisonnée. La gestion des problèmes doit donc être constante et largement pratiquée au sein de plusieurs équipes, notamment l'équipe informatique, de sécurité et de développement. Un incident peut se terminer lorsque le service est à nouveau opérationnel, mais tant que les causes sous-jacentes et les facteurs contributifs ne sont pas traités, le problème demeure.
Relation entre la gestion des problèmes et d'autres processus ITIL clés
La gestion des problèmes fonctionne en parallèle de la gestion des incidents et d'autres pratiques ITIL pour former une stratégie ITSM globale.
Gestion des problèmes et gestion des incidents
ITIL définit un problème comme une cause, ou une cause potentielle, d'un ou plusieurs incidents. Les comportements qui sous-tendent une gestion des incidents et une gestion des problèmes efficaces sont souvent similaires et se chevauchent, mais des différences clés subsistent. Par exemple, annuler un déploiement récent peut permettre au service de fonctionner à nouveau et mettre fin à l'incident, mais le problème sous-jacent demeure.
Cela dit, nous pensons que les pratiques de gestion des problèmes et des incidents sont de plus en plus entremêlées. Entre les incidents, les équipes informatiques peuvent concentrer leurs efforts sur les enquêtes sur les problèmes qui engendreront des améliorations et une meilleure qualité de service. C'est ainsi que la gestion des problèmes devient la plus précieuse pour l'organisation.
Gestion des problèmes et gestion des changements
La gestion des changements désigne le processus qui consiste à planifier, suivre et livrer des changements sans perturber le service ou entraîner un temps d'arrêt.
Lorsqu'un changement entraîne une interruption ou un temps d'arrêt, ce dernier est analysé au cours des processus de gestion des incidents et des problèmes.
Gestion des problèmes et gestion des connaissances
La gestion des connaissances crée un dépôt de solutions et de documentation pour les procédures courantes, voire de solutions de contournement pour les incidents. Utilisée conjointement, une pratique de gestion des connaissances saine peut permettre une résolution plus rapide et moins d'incidents.
Gestion des problèmes et gestion des demandes de service
La gestion des demandes de service consiste à traiter une demande d'un utilisateur concernant un service à fournir, comme l'accès aux apps, les améliorations logicielles et les informations. Il peut parfois être difficile de différencier une demande de service d'un incident. En fait, les deux n'étaient pas distingués et étaient regroupés dans la catégorie « incidents » jusqu'à la publication de la version 3 d'ITIL en 2007. ITIL définit maintenant un incident comme « toute interruption non planifiée d'un service informatique ou réduction de la qualité d'un service informatique ». Une demande de service est définie comme « une demande formelle d'un utilisateur pour la fourniture d'un élément. Par exemple, une demande d'information ou de conseil, la réinitialisation d'un mot de passe ou l'installation d'un poste de travail pour un nouvel utilisateur ».
Quels sont les avantages de la gestion des problèmes ?
Si elle est bien utilisée, la gestion des problèmes procure de nombreux avantages à l'entreprise.
Accélérez la résolution
Les équipes qui résolvent les problèmes à l'origine de l'incident d'aujourd'hui seront mieux préparées pour répondre aux incidents à venir. En codifiant les bonnes pratiques en matière d'analyse des problèmes, les équipes pourront répondre et agir plus rapidement lors de la prochaine interruption de service.
Évitez les incidents coûteux
Éviter les incidents permettra de gagner du temps et de l'argent, et d'éviter de nombreux problèmes. Selon Gartner, de nombreuses organisations signalent que les temps d'arrêt coûtent plus de 300 000 dollars par heure. Pour certains services web, ce chiffre peut être encore bien plus élevé.
Améliorez la productivité
Cessez de répondre trop fréquemment aux incidents et restituez des ressources et du temps aux équipes afin de leur permettre d'apporter une nouvelle valeur aux clients.
Donnez à votre équipe les moyens de trouver des causes sous-jacentes et d'en tirer des enseignements
Lorsque les organisations pratiquent efficacement la gestion des problèmes, les équipes enquêtent continuellement, tirent des enseignements des incidents, et livrent des mises à jour précieuses. Malheureusement, de nombreuses entreprises créent une équipe de gestion des problèmes cloisonnée qui est trop éloignée des opérations quotidiennes pour éliminer les problèmes les plus urgents.
Mettez en avant l'amélioration continue du service
La gestion des problèmes évite les incidents et génère également de la valeur. Par exemple, corriger un incident qui entraîne une baisse des performances livre également de précieuses améliorations de la qualité du service.
Augmentez la satisfaction client
Une meilleure gestion des problèmes se traduit par une réduction des incidents, et par des clients satisfaits. Par ailleurs, les clients perdent patience lorsqu'ils remarquent qu'un même incident se produit plusieurs fois. La réduction des incidents répétés renforce la confiance des clients.
Processus de gestion des problèmes
Chez Atlassian, nous préconisons de rapprocher les processus de gestion des problèmes et des incidents.
Lorsque la gestion des problèmes est un processus lourd, cloisonné et séparé, les entreprises peuvent finir par créer un espace dans lequel stocker tous leurs problèmes. C'est dans ce « backlog » que les problèmes tombent aux oubliettes dans certaines équipes. Il est préférable que les problèmes soient consignés à l'endroit même où des équipes peuvent les gérer et effectuer des enquêtes précieuses.
Cela dit, il est bon de comprendre les étapes principales qui contribuent à un processus de gestion des problèmes. Notamment :
- La détection des problèmes : repérez les problèmes de manière proactive afin qu'ils soient corrigés, ou identifiez les solutions avant que des incidents futurs ne surviennent.
- Catégorisation et priorisation : suivez et évaluez les problèmes connus pour que les équipes restent organisées et travaillent sur les problèmes les plus pertinents et à haute valeur.
- Enquête et diagnostic : identifiez les causes sous-jacentes du problème et déterminez la meilleure marche à suivre pour y remédier.
- Créez un enregistrement d'erreurs connues : dans ITIL, une erreur connue est « un problème dont la cause profonde et la solution de contournement sont documentées ». Consigner cette information réduit les temps d'arrêt en cas d'incident. Ces informations sont généralement stockées dans un document appelé base de données des erreurs connues.
- Créez une solution de contournement, si nécessaire : une solution de contournement est une solution provisoire permettant de réduire l'impact des problèmes et de les empêcher de se transformer en incidents. Les solutions de contournement ne sont pas idéales, mais elles peuvent limiter l'impact business et éviter un incident affectant directement les clients si le problème ne peut pas être facilement identifié et éliminé.
- Résolvez et clôturez le problème : un problème clôturé est un problème qui a été éliminé et ne peut plus causer d'autres incidents.
Bonnes pratiques et conseils en matière de gestion des problèmes
Comme nous l'avons mentionné précédemment, les équipes de gestion des problèmes les plus efficaces que nous ayons vues combinent la gestion des problèmes et des incidents.
Lorsque la gestion des problèmes est envisagée comme une pratique distincte, vous faites face à un défi : l'équipe responsable des problèmes devient un goulot d'étranglement ou se concentre sur les mauvaises choses, comme les problèmes de fournisseurs externes sur lesquels elle n'a aucun contrôle. Les causes premières ne font généralement l'objet d'enquêtes que plusieurs mois après la survenue de l'incident.
Dans bien des cas, votre équipe peut tirer parti d'une intégration des pratiques de gestion des incidents et des problèmes. Cette approche proactive vous permet de comprendre ce qui a déclenché l'incident, tout en le résolvant. Par exemple, la résolution d'un incident dans un logiciel nécessite d'identifier le mauvais code (la cause), puis de développer un code de remplacement pour éviter d'autres incidents (la correction).
Associer les problèmes aux incidents signifie que lorsque les équipes ne sont pas en mode réponse, elles peuvent se pencher sur les problèmes qui ont le plus d'impact sur les services et sur la qualité du service et prendre de l'avance afin d'éviter les incidents futurs.
Conseils en matière de gestion des problèmes
Évitez de compter sur une analyse réactive des causes profondes
La cause profonde d'un incident ou d'un problème est rarement unique. Les meilleures équipes prennent en compte de façon holistique tous les facteurs contributifs potentiels et pratiquent une analyse sans reproches.
Encouragez un environnement ouvert où les problèmes sont partagés
L'analyse des problèmes et des incidents devrait prendre la forme d'une discussion ouverte qui encourage les membres de l'équipe à partager les faits sans craindre de punition ou de représailles.
Concentrez-vous sur les services stratégiques
Priorisez la résolution des problèmes affectant les services qui apportent le plus de valeur à l'organisation.
Posez des questions et utilisez la technique des « Cinq pourquoi »
De nombreuses équipes réussissent en utilisant la technique des « Cinq pourquoi » de Taiichi Ohno, l'architecte du système de production Toyota. Consultez le scénario du playbook de l'équipe Atlassian pour en savoir plus.
Diffusez les connaissances
Les équipes ouvertes partagent des connaissances et des informations dont leurs collègues et les équipes adjacentes peuvent tirer des enseignements.
Apprenez de vos erreurs
La gestion des problèmes se doit d'être efficace. Toujours. Même les organisations les plus performantes rencontrent des incidents. Les équipes de classe mondiale sont celles qui itèrent constamment sur leur processus, l'améliorent et réduisent l'impact des problèmes sur leurs collègues et leurs clients.
Assurez le suivi
Il est essentiel de mettre au point une méthode claire et normalisée pour maîtriser les actions de suivi. Vous devriez toujours pratiquer la gestion des problèmes. Il est donc important d'utiliser un logiciel ITSM qui permettra à votre équipe de hiérarchiser les tâches, de suivre l'avancement et d'associer les tickets d'incident aux problèmes.
Résumé
Les incidents sont souvent décrits comme un investissement imprévu dans la fiabilité future de votre service. Une gestion efficace des problèmes apporte de précieuses améliorations de service, tout en identifiant et en éliminant les catalyseurs d'incidents.
Vous souhaitez en savoir plus sur la gestion des problèmes dans Jira Service Management ?
Atlassian's guide to agile ways of working with ITIL 4
ITIL 4 is here—and it’s more agile than ever. Learn tips to bring agility and collaboration into ITSM with Atlassian.
Lire le livre blancL'évolution de la gestion des changements informatiques
La gestion des changements informatiques réduit les risques, tout en modifiant les systèmes et les services. Découvrez-en plus sur le processus, l'importance et les bonnes pratiques en matière de gestion des changements.
Lire cet article