Le funzionalitร  di avviso e di chiamata di Opsgenie sono ora disponibili in Jira Service Management e Compass. Esegui la migrazione dei dati e delle configurazioni di Opsgenie esistenti prima del 5 aprile 2027 utilizzando il nostro strumento di migrazione automatica.

Che cos'รจ la gestione degli imprevisti?

La gestione degli imprevisti รจ un processo usato dai team DevOps che consente di rispondere agli eventi non pianificati o alle interruzioni del servizio allo scopo di ripristinarne il funzionamento.

Noi di Atlassianย definiamo un imprevistoย come un evento che causa un'interruzione o una riduzione della qualitร  di un servizio e che richiede una risposta di emergenza. I team che seguono le prassi ITIL o ITSM potrebbero invece usare il termine imprevisto grave per definire un tale evento.

Scarica il nostro manuale sulla gestione degli imprevisti

Scarica il PDF per scoprire i principi e le pratiche di gestione degli imprevisti e capire come applicare queste lezioni utilizzando Jira Service Management.

Incidents are events of any kind that disrupt or reduce the quality of service (or threaten to do so). A business application going down is an incident. A crawling-but-not-yet-dead web server can be an incident, too. Itโ€™s running slowly and interfering with productivity. Worse yet, it poses the even-greater risk of complete failure. Incidents can vary widely in severity, ranging from an entire global web service crashing to a small number of users having intermittent errors. An incident is resolved when the affected service resumes functioning in its intended state. This includes only those tasks required to mitigate impact and restore functionality.

Usa il modello Report settimanale degli imprevisti gravi ITSM

L'importanza della gestione degli imprevisti

Valori della gestione degli imprevisti di Atlassian

La gestione degli imprevisti รจ uno dei processi piรน importanti di un'organizzazione. Le interruzioni del servizio possono essere costose per l'azienda e i team devono poter contare su un modo efficiente per rispondere ai problemi e risolverli tempestivamente. I team hanno bisogno di un metodo affidabile per definire le prioritร  degli imprevisti, risolverli piรน rapidamente e offrire un servizio migliore agli utenti.

Di fronte a un imprevisto, i team devono disporre di un piano che li aiuti a:

  • Rispondere con efficacia per riprendersi rapidamente.
  • Comunicare in modo chiaro con clienti, stakeholder, responsabili del servizio e altre figure dell'organizzazione.
  • Collaborare in modo efficace per risolvere il problema piรน velocemente come un unico team e rimuovere gli ostacoli che impediscono la risoluzione del problema.
  • Migliorare costantemente per apprendere dalle interruzioni e applicare le lezioni per rafforzare un servizio e perfezionare il processo per il futuro.

Vuoi sapere come Atlassian gestisce gli imprevisti piรน gravi? Abbiamo pubblicato il nostro manuale interno sulla gestione degli imprevisti. Ti invitiamo a leggerlo attentamente, adattandolo alle tue esigenze e usandolo come meglio credi.

Tipi di processi di gestione degli imprevisti

Tipi di azienda diversi tendono a preferire tipi di processi di gestione degli imprevisti diversi. Non esiste un processo perfetto per tutte le aziende, pertanto รจ normale osservare approcci differenti tra aziende diverse.

Molti team si affidano a un processo di gestione degli imprevisti piรน tradizionale, basato sull'IT, come quelli descritti nelle certificazioni ITIL. Altri team propendono per un processo di tipo Site Reliability Engineer (SRE) o DevOps.

Processo di gestione degli imprevisti IT

Un processo di gestione degli imprevisti aiuta i team IT a esaminare, registrare e risolvere le interruzioni del servizio. Ilย flusso di lavoro di gestione degli imprevisti ITILย ha l'obiettivo di ridurre il tempo di inattivitร  e di limitare il piรน possibile l'impatto degli imprevisti sulla produttivitร  dei dipendenti. Grazie all'uso di modelli progettati per gestire gli imprevisti, รจ possibile creare un flusso di lavoro di gestione degli imprevisti ripetibile. Ciรฒ consente ai team di registrare, analizzare e risolvere gli imprevisti, nonchรฉ di conservare un registro delle proprie attivitร .

Il framework ITIL รจ utilizzato principalmente dai team IT che gestiscono servizi all'interno delle aziende. In genere i team prendono ciรฒ di cui hanno bisogno dall'ITIL, che tratta quasi ogni tipo di imprevisto, problema e procedura che i team IT potrebbero dover affrontare, e tralasciano il resto. L'ITIL รจ una soluzione ideale quando i team devono concentrarsi sulla creazione di una cultura di risoluzione dei problemi attiva. I processi prescritti aiutano i team a monitorare in modo coerente gli imprevisti e le azioni, cosรฌ da migliorare le attivitร  di reporting e analisi. Ciรฒ a sua volta consente di perfezionare il servizio e di rafforzare l'efficacia del team.

Fasi del processo di gestione degli imprevisti ITimprevisto

Identificazione e registrazione di un imprevisto

Le cause degli imprevisti possono essere infinite: un dipendente, un cliente, un fornitore o i sistemi di monitoraggio. A prescindere dall'origine, le prime due fasi sono semplici, una persona individua un imprevisto, un'altra ne esegue il log. In genere i log degli imprevisti (ovvero i ticket) includono:

  • Il nome della persona che segnala l'imprevisto
  • La data e l'ora di segnalazione dell'imprevisto
  • Una descrizione dell'imprevisto (che cosa non รจ disponibile o non funziona correttamente)
  • Un numero di identificazione univoco assegnato all'imprevisto, per consentirne il monitoraggio

Categorizzazione

Assegna una categoria logica e intuitiva (e una sottocategoria, se necessario) a ogni imprevisto.Ciรฒ consente di analizzare i dati alla ricerca di tendenze e modelli, ovvero una parte fondamentale per una gestione dei problemi efficace e per prevenire imprevisti futuri.

Definisci le prioritร 

A ogni imprevisto deve essere assegnata una prioritร . Inizia valutando l'impatto che ha sul business, il numero di persone interessate dall'impatto, gli eventuali SLA e le potenziali implicazioni finanziarie, di sicurezza e di conformitร .ย Confronta questo imprevisto con tutti gli altri imprevisti aperti per determinarne la prioritร  relativa. La best practice prevede la definizione dei livelli di gravitร  e prioritร  prima che si verifichi un imprevisto, in modo che i gestori imprevisti possano valutare rapidamente la prioritร .ย 

Rispondi

  • Diagnosi iniziale: idealmente, il team di assistenza in prima linea puรฒ occuparsi di un imprevisto dalla diagnosi alla chiusura. Tuttavia, se non dovesse riuscirci, il passaggio successivo รจ eseguire il log di tutte le informazioni pertinenti e l'escalation al team di livello successivo.
  • Escalation: il team successivo acquisisce i dati registrati e prosegue la procedura di diagnosi. Se nemmeno questo team riesce a diagnosticare l'imprevisto, la palla passa al team ancora successivo.
  • Comunicazione: il team condivide regolarmente gli aggiornamenti con gli stakeholder interni ed esterni.
  • Indagine e diagnosi: il processo continua fino a quando non viene identificata la natura dell'imprevisto. A volte i team si rivolgono a risorse esterne o ad altri membri del dipartimento per chiedere una consulenza e aiuto per la risoluzione.
  • Risoluzione e ripristino: in questa fase, il team arriva a una diagnosi e adotta le misure necessarie per risolvere l'imprevisto. Il ripristino implica semplicemente il tempo necessario per la ripresa completa delle operazioni, perchรฉ alcune correzioni (come patch di bug eccetera) potrebbe richiedere test e distribuzione anche dopo aver individuato la risoluzione corretta.
  • Chiusura: se รจ stata eseguita l'escalation, l'imprevisto viene infine passato al service desk per la chiusura. Per mantenere la qualitร  e garantire un processo fluido, solo i dipendenti del service desk sono autorizzati a chiudere gli imprevisti e il responsabile dell'imprevisto dovrebbe contattare la persona che ha effettuato la segnalazione per verificare se la risoluzione รจ soddisfacente e se l'imprevisto puรฒ effettivamente essere chiuso.

Processo di gestione degli imprevisti DevOps e SRE

Con un approccio DevOps o SRE alla gestione degli imprevisti, il team che crea il servizio si occupa anche di gestirlo e di risolverne i problemi. La diffusione di questo approccio รจ cresciuta di pari passo con l'espansione dei servizi cloud sempre attivi, delle applicazioni web ad accesso globale, dei microservizi e delle soluzioni Software as a Service.

Sempre piรน spesso, il software a cui ti affidi per l'uso personale e professionale non รจ ospitato su un server nella stessa posizione fisica in cui ti trovi. Probabilmente si tratta di un'applicazione accessibile dal web distribuita in un data center per migliaia o milioni di utenti in tutto il mondo. Per i team incaricati di gestire questi servizi, l'agilitร  e la velocitร  sono requisiti cruciali. Ogni tempo di inattivitร  comporta potenziali ricadute su migliaia di organizzazioni, non solo una.

Un vantaggio dell'approccio "chi lo crea, lo gestisce" รจ che offre la flessibilitร  di cui iย team Agileย hanno bisogno, ma d'altro canto puรฒ creare confusione sugli ambiti di responsabilitร . I team DevOps possono sentirsi a loro agio e lavorare con maggiore efficacia adottando processi di sviluppo meno strutturati, ma รจ meglio standardizzare un insieme di processi di base per la gestione degli imprevisti, in modo da non avere dubbi su come rispondere nel caso di un imprevisto e da poter monitorare i ticket e riferire come sono stati risolti.

Tre convinzioni dei team di gestione degli imprevisti DevOps

  • Turni di reperibilitร : anzichรฉ contare sulla reperibilitร  di alcuni membri specializzati, in genere i team DevOps prevedono un programma di reperibilitร  a turni in cui il rischio di doversi svegliare di notte per rispondere a un imprevisto รจ condiviso da tutti i membri.
  • L'ingegnere che ha sviluppato la soluzione รจ il migliore candidato a risolvere il problema: secondo il principio "chi lo crea, lo gestisce", le persone che conoscono piรน a fondo il servizio (i creatori) sono anche le piรน preparate a risolvere un'interruzione.
  • Creazione rapida, senza rinunciare alla responsabilitร : sapendo di essere reperibili durante le interruzioni del servizi, gli sviluppatori e i colleghi del team sono piรน incentivati a garantire che il codice distribuito sia di ottima qualitร .

Questo approccio assicura tempi di risposta veloci e un feedback piรน rapido ai team che devono sapere come realizzare un servizio affidabile.

Un approccio alla gestione degli imprevisti molto orientato al concetto DevOps รจ descritto nelย Manuale degli imprevisti di Atlassian.

Strumenti di gestione degli imprevisti

La gestione degli imprevisti non puรฒ essere affidata a un semplice strumento, ma alla giusta combinazione di strumenti, pratiche e persone. Ecco alcune delle categorie di strumenti piรน diffuse per una gestione degli imprevisti efficace:

  • Monitoraggio degli imprevisti: ogni imprevisto dovrebbe essere monitorato e documentato per individuare tendenze e fare confronti nel corso del tempo.
  • Chat: la comunicazione testuale in tempo reale รจ di cruciale importanza per diagnosticare e risolvere l'imprevisto come un unico team. Inoltre, offre un insieme di dati corposo che in un secondo momento sarร  utile all'analisi della risposta.
  • Chat video: la chat video integra la chat di testo per molti imprevisti. La chat video a livello di team puรฒ aiutare a discutere i risultati e a mappare la strategia di risposta.
  • Sistema di avviso: uno strumento come Jira Service Management si integra con il sistema di monitoraggio e gestisce i turni di reperibilitร  e le escalation.
  • Strumento di documentazione: uno strumento come Confluence puรฒ acquisire i documenti sullo stato dell'imprevisto e le analisi retrospettive.
  • Statuspage: la comunicazione dello stato con gli stakeholder interni e i clienti attraverso Statuspage consente di tenere al corrente tutte le persone coinvolte.

Argomenti relativi alla gestione degli imprevisti

Manuale di gestione degli imprevisti di Atlassian

Questo manuale presenta i reali processi di gestione degli imprevisti che abbiamo messo a punto come azienda globale con migliaia di dipendenti e piรน di 200.000 clienti.

Best practice per la comunicazione degli imprevisti

Tramite il processo di comunicazione degli imprevisti, si avvisano gli utenti dell'interruzione o della riduzione delle prestazioni dei servizi.

Risposta agli imprevisti

Scopri le principali tecniche di risposta agli imprevisti per gestire e risolvere rapidamente i problemi critici nella tua organizzazione.

Reperibilitร 

I team su chiamata si stanno evolvendo rapidamente. Scopri pro e contro dei diversi approcci alla gestione del servizio su chiamata.

Strumenti

Esplora le funzioni principali del software di gestione degli imprevisti. Scopri come scegliere gli strumenti giusti per una risposta agli imprevisti efficace e operazioni senza intoppi.

Analisi retrospettiva

L'analisi retrospettiva degli imprevisti, nota anche come revisione post-imprevisto, รจ il modo migliore per esaminare ciรฒ che รจ avvenuto durante un imprevisto e fissare le lezioni apprese.

DevOps

Per i team che si occupano di DevOps, il processo di gestione degli imprevisti (IM) si concentra sulla trasparenza e sul miglioramento continuo del ciclo di vita degli imprevisti.

Tutorial in primo piano

Tutorial

Comunicazione di imprevisti

In questo tutorial, ti mostreremo come utilizzare i modelli di imprevisti per comunicare in modo efficace durante le interruzioni. Puoi adattarlo a molti tipi di interruzione del servizio.

Tutorial

Programma di reperibilitร 

In questo tutorial imparerai come configurare una On-call Schedule, applicare le regole di sostituzione, configurare le notifiche su chiamata e molto altro, il tutto in Opsgenie.

Vuoi sapere come funziona la gestione degli imprevisti in Jira Service Management?

Consigliata per te

Tutorial

Configurare una On-call Schedule con Opsgenie

In questo tutorial imparerai come configurare una On-call Schedule, applicare le regole di sostituzione, configurare le notifiche su chiamata e molto altro, il tutto in Opsgenie.

Articolo

Pro e contro dei diversi approcci alla gestione del servizio su chiamata

I team su chiamata si stanno evolvendo rapidamente. Scopri pro e contro dei diversi approcci alla gestione del servizio su chiamata.

Articolo

Cos'รจ l'MTTR?

La comprensione dell'MTTR e di altre metriche sugli imprevisti aiuta i team a misurare e migliorare la velocitร  e l'efficacia della risposta agli imprevisti.