Close

Gestione degli imprevisti per i team high velocity

Comprensione dei livelli di gravità degli imprevisti

Identifica gli imprevisti e definiscine le priorità per una risoluzione più rapida

Ci sono tre verità fondamentali sulla gestione degli imprevisti.

La prima è che gli imprevisti sono inevitabili, soprattutto per le aziende che crescono e innovano costantemente.

La seconda è che una solida pratica di gestione degli imprevisti è fondamentale per un'azienda sana (e una debole ha un costo per le aziende sia in termini di tempo e soddisfazione dei dipendenti che di ricavi aziendali).

La terza è che non tutti gli imprevisti sono uguali. Perdere dati da un database non è la stessa cosa che perdere dati da tutti i database. Gestire un'interruzione che ha un impatto sul 20% degli utenti è un obiettivo completamente diverso rispetto a un'interruzione che ha un impatto sul 90% o sul 100%. Gestire un'interruzione del sistema nelle ore di punta è molto più stressante che gestirne una quando la maggior parte dei clienti dorme. Anche due imprevisti che sulla carta sembrano identici, a un esame più approfondito sono unici.

Logo di JSM

Gestione degli imprevisti per i team high velocity

Accelera il flusso di informazioni tra i team operativi e di sviluppo per fornire una risposta adeguata ed eseguire il ripristino dei sistemi in caso di imprevisti con Jira Service Management.

Ecco perché le aziende con solidi programmi di gestione degli imprevisti hanno livelli di gravità degli imprevisti ben definiti e best practice chiare per definire le priorità degli imprevisti non appena si presentano.

Cosa sono i livelli di gravità?

I livelli di gravità degli imprevisti misurano l'impatto di un imprevisto sul business. In genere, quanto più il numero di gravità è basso, tanto maggiore è l'impatto dell'imprevisto.

In Atlassian, ad esempio, un imprevisto di gravità 1 è definito come "un imprevisto critico con un impatto molto elevato". Ciò potrebbe includere la perdita dei dati dei clienti, una violazione della sicurezza o la situazione in cui un servizio rivolto ai clienti è inattivo per tutti i clienti.

Un imprevisto di gravità 2 è un "imprevisto grave con un impatto elevato", ad esempio la situazione in cui un servizio rivolto ai clienti è inattivo per un sottoinsieme di clienti oppure una funzione fondamentale all'interno di un sistema non funziona.

E un imprevisto di gravità 3 è "un imprevisto minore con basso impatto", ad esempio un problema tecnico del sistema che sta causando un disagio minimo ai clienti.

In Atlassian, gli imprevisti di gravità 3 possono essere gestiti durante le ore diurne/lavorative, mentre gli imprevisti di gravità 1 e 2 generano un avviso per i professionisti su chiamata affinché individuino una correzione immediata a prescindere dall'ora del giorno.

Gravità Descrizione Esempi
1 Un imprevisto critico con un impatto molto elevato
  • Un servizio rivolto ai clienti, come Jira Cloud, è inattivo per tutti i clienti
  • La riservatezza o la privacy sono state violate
  • Sì è verificata una perdita di dati dei clienti
2 Un imprevisto grave con un impatto significativo
  • Un servizio rivolto ai clienti non è disponibile per un sottoinsieme di clienti
  • Una funzionalità di base (ad es. git push, issue create) ha subito un impatto significativo
3 Un imprevisto minore a basso impatto
  • Un disagio minimo per i clienti, soluzione alternativa disponibile
  • Un peggioramento delle prestazioni disponibili

I livelli di gravità sono utili per comprendere rapidamente l'impatto e stabilire le priorità per i team IT e i team DevOps.

Quanto più definiti sono i livelli di gravità, tanto maggiore è la probabilità che il tuo team sia sulla stessa pagina e in grado di reagire agli imprevisti in modo rapido e appropriato. In assenza di livelli di gravità adeguatamente definiti, si corre facilmente il rischio di perdere del tempo essenziale per definire e spiegare l'urgenza di un imprevisto invece di risolverlo.

Quando e dove sono utili i livelli di gravità?

Il valore fondamentale dei livelli di gravità risiede nel fatto che fanno risparmiare tempo ai team. Un team con livelli di gravità e una roadmap chiara per affrontare ogni livello è un team che può individuare subito una correzione. È probabile che un team senza livelli di gravità trascorra i primi minuti cruciali di un imprevisto grave per capire quanto sia importante, chi debba gestirlo e come gestirlo.

Più l'imprevisto è critico, più è importante risparmiare la maggiore quantità di tempo possibile pianificando in anticipo non solo mediante la risoluzione degli imprevisti e i piani di comunicazione, ma anche con i livelli di gravità e le priorità.

Quali sono le differenze tra gravità e priorità?

A prima vista, la gravità di un imprevisto sembra equivalere alla sua priorità. Dopotutto, un imprevisto grave con conseguenze disastrose dovrebbe essere affrontato prima di un imprevisto meno grave, giusto?

Ma la verità è che per la maggior parte delle aziende non è così semplice.

La gravità è un indice dell'impatto. Qual è l'impatto di un imprevisto sugli utenti? Mette a repentaglio l'intero sistema? Impedisce di completare un'attività fondamentale? O semplicemente infastidisce gli utenti e rende più complesse le attività?

La priorità, invece, è un indice dell'urgenza. Con quale urgenza dobbiamo risolvere questo problema? Quale problema deve essere risolto per primo?

A volte, gravità e priorità sono perfettamente allineate. Un imprevisto di elevata gravità che colpisce l'intera azienda è probabilmente la massima priorità su cui devono concentrarsi i team DevOps e IT.

Altre volte, invece, non sono allineate. Ad esempio: supponiamo che ci sia un errore di battitura nel titolo della home page del tuo sito Web. Si tratta di un problema di bassa gravità perché in realtà non influisce sul funzionamento del sito Web, gli utenti possono comunque continuare le loro attività e i dipendenti hanno comunque a disposizione tutto ciò di cui hanno bisogno.

Ma l'azienda potrebbe vedere la correzione come priorità assoluta per motivi di standard del marchio o perché causa confusione o semplicemente perché ne compromette l'immagine. Quindi questo imprevisto potrebbe essere di bassa gravità e di alta priorità.

Allo stesso modo, supponiamo che si sia verificato un imprevisto che sta causando l'arresto anomalo della tua app: è di gravità elevata perché impedisce agli utenti di portare avanti le loro attività, ma è anche vero che sta interessando solo lo 0,05% degli utenti. In presenza di altri imprevisti con un impatto maggiore, un problema come questo potrebbe non essere della massima priorità, anche se generalmente frasi come "il sistema si sta bloccando" mettono tutti in allerta.

Entrambi gli indici, priorità e gravità, sono importanti nella gestione degli imprevisti, ma è fondamentale riconoscere quando sono allineati e quando non lo sono. Una gravità elevata non si traduce automaticamente in una priorità assoluta, così come un'alta priorità non equivale a un danno irreparabile.

Poiché la priorità è più perseguibile della gravità, è l'indice principale che utilizziamo. E poiché la gravità è spesso un fattore chiave che determina la priorità, nel nostro manuale degli imprevisti abbiamo fornito definizioni chiare per la nostra prassi di gestione degli imprevisti.

Definizione dei livelli di gravità degli imprevisti per la tua organizzazione

Non tutti gli imprevisti sono uguali e non tutte le organizzazioni li gestiscono allo stesso modo. Nel definire i livelli di gravità, nonché i relativi processi e aspettative, oltre all'impatto di un imprevisto, dovrai tenere conto dei seguenti fattori:

  • Dimensione del team tecnico
  • On-call Schedule
  • Orari della giornata ad alto e basso traffico per il servizio
  • Frequenza degli imprevisti

Questo perché ciascuno di questi fattori potrebbe influire sul modo in cui definisci i livelli di gravità.

Ad esempio, un'app usata nei mercati locali di un unico fuso orario potrebbe essere poco utilizzata nella fascia oraria compresa tra le 2 e le 7 del mattino. Quindi, se l'intero sistema non funziona alle 3 del mattino, il livello di gravità sarebbe uguale a quello di un'interruzione del sistema nelle ore di punta?

Oppure che dire di una start-up con un team di piccole dimensioni e molti imprevisti che potremmo considerare di gravità 3? Dovrebbe utilizzare il livello 3 e lasciare che il team decida quali imprevisti hanno la priorità quando se ne verificano tre contemporaneamente? Oppure dovrebbe suddividerli ulteriormente in livelli di gravità 3, 4 o 5 per distinguere tra una perdita parziale di funzionalità in un sistema rivolto ai clienti, problemi di prestazioni e un problema ancora più piccolo, come un bug che non influisce sull'usabilità del sistema ma alla fine deve essere corretto?

L'aspetto fondamentale è comprendere il tuo business, il tuo team e quali sono le definizioni di livello di gravità e di priorità adatte alle tue esigenze.

Livello 3 Atlassian Livello 4 Livello 5
Grav 1

Un imprevisto critico con un impatto molto elevato.

Ad esempio, un servizio rivolto ai clienti come Jira non è disponibile per tutti i clienti.

Grav 2

Un imprevisto grave con un impatto elevato.

Ad esempio, un servizio rivolto ai clienti non è disponibile per un sottoinsieme di clienti.

Grav 3 Un imprevisto minore a basso impatto.

Ad esempio, un bug di sistema sta creando un inconveniente di lieve entità per i clienti.

Un imprevisto che potrebbe diventare grave qualora non venga affrontato rapidamente.

Ad esempio, una perdita parziale di funzionalità per un piccolo sottoinsieme di clienti.

Gravità 4 Una richiesta di assistenza su un problema che il cliente trova irritante ma che non influisce sul funzionamento generale del sistema.

Un piccolo imprevisto che ha un impatto sull'usabilità del prodotto ma non ne causa l'interruzione.

Ad esempio, tempi di caricamento più lenti della media.

Gravità 5

Bug o problemi di assistenza che non influiscono sull'usabilità del prodotto.

Ad esempio, un logo viene visualizzato nella posizione sbagliata o nasconde parzialmente l'ultima lettera di un titolo.

È essenziale disporre di una soluzione di gestione degli imprevisti per l'escalation degli stessi, in modo che i team di competenza possano immediatamente scremarli e avviarne la risoluzione.

Scopri come tutte le funzionalità di gestione degli imprevisti di Jira Service Management, tra cui avvisi e pianificazione su chiamata, comunicazione collaborativa e solide funzionalità di reporting e analisi, consentono ai team di rispondere, risolvere e imparare dagli imprevisti.