Close

Gestione degli imprevisti per i team high velocity

L'importanza del processo di analisi retrospettiva degli imprevisti

Gli imprevisti accadono.

Non c'è via di scampo. Via via che i sistemi crescono in dimensioni e complessità, gli errori sono inevitabili.

Gli imprevisti sono anche un'opportunità di apprendimento.

Un'opportunità per mitigare gli imprevisti ripetuti e ridurre il tempo necessario per la risoluzione. Un momento per riunire i team e pianificare in che modo agire meglio la volta successiva.

Il modo migliore per analizzare ciò che è successo durante un imprevisto e fissare le lezioni apprese, consiste nel condurre un'analisi retrospettiva dell'imprevisto, nota anche come revisione post-imprevisto.

Grazie alle analisi retrospettive, le persone si riuniscono per discutere i dettagli di un imprevisto: perché si è verificato, il suo impatto, quali azioni sono state intraprese per mitigarlo e risolverlo e cosa fare per impedire che si verifichi nuovamente.

Tramite strumenti come il controllo delle versioni, i flag delle funzioni e la continuous delivery, molti imprevisti possono essere rapidamente "annullati". Tanti imprevisti sono causati da qualche bug in una modifica inviata all'ambiente di produzione e il rollback di tale modifica può consentire di ripristinare il funzionamento dell'app. Questo processo rappresenta un autentico vantaggio per tutti e assicura la rapida riattivazione del servizio. Ma spesso non aiuta a capire cosa è andato storto e perché. È qui che entrano in gioco le analisi retrospettive.

In questo tipo di analisi, è possibile inquadrare l'imprevisto per trarne apprendimento e trasformare i problemi in avanzamenti. Le analisi retrospettive costruiscono inoltre un rapporto di fiducia con clienti, colleghi e utenti finali (in poche parole le persone interessate dall'imprevisto) e trasmettono loro la sicurezza che il tuo team sta lavorando per ridurre al minimo gli futuri imprevisti e il loro impatto.

Illustrazione del ciclo delle analisi retrospettive

L'analisi retrospettiva è un passaggio importante del ciclo di vita di un servizio sempre attivo. I risultati che emergono da tale analisi dovrebbero essere integrati direttamente nel processo di pianificazione per fare in modo che il lavoro di risoluzione critico individuato nell'analisi retrospettiva trovi spazio nel lavoro futuro e sia bilanciato rispetto alle priorità e al lavoro imminenti.

I vantaggi dell'analisi retrospettiva degli imprevisti

Potresti essere tentato di saltare una riunione formale sull'analisi retrospettiva degli imprevisti con la conseguente messa per iscritto dei risultati, soprattutto se conosci la causa dell'imprevisto e sei piuttosto certo di aver risolto il problema.

Tutto questo può essere vero, per te. Ma potrebbero esserci altri membri del team che non hanno interiorizzato gli eventi che hanno portato all'imprevisto e ai quali potrebbe servire ascoltare il tuo punto di vista per migliorare i loro servizi all'interno del team e nei confronti dei clienti.

Se si riuniscono tutti i membri del team per avviare un processo strutturato e collaborativo, ciascuno di essi potrà condividere ciò che ha appreso e si costruiranno fiducia e resilienza all'interno del team. Inoltre, documentare l'imprevisto e il modo in cui il team lo ha risolto è utile per avere un riferimento per la gestione degli imprevisti futuri.

Puoi inoltre decidere di condividere con i clienti o con il resto dell'organizzazione i concetti chiave emersi dall'analisi retrospettiva degli imprevisti. Ciò può essere fondamentale per ricostruire la fiducia nelle persone non troppo coinvolte mentre l'imprevisto era in corso. Altri team dell'organizzazione, specialmente la leadership, potrebbero aver bisogno di vedere i dettagli del problema e conoscere i passaggi di risoluzione intrapresi per evitare di mettere in dubbio le capacità del tuo team in futuro.

Anche i partner, i clienti e gli utenti finali potrebbero voler sapere cosa è successo e quali misure hai adottato per migliorare la loro esperienza. Rendere l'analisi retrospettiva degli imprevisti disponibile sul tuo sito web pubblico potrebbe non essere sempre una scelta appropriata, ma il team di marketing o delle pubbliche relazioni può aiutarti a usare il linguaggio più adatto per comunicare le informazioni in modo pertinente e volto a creare fiducia nei servizi che offri.

Best practice per l'analisi retrospettiva degli imprevisti

L'approccio che scegli di seguire per l'analisi retrospettiva degli imprevisti è importante tanto quanto la checklist dei passaggi che intraprendi. In seguito a un imprevisto la tensione può arrivare alle stelle. La chiave per coinvolgere le persone che prendono parte al processo e per prepararle ad affrontare un problema complicato consiste nel trasmettere loro un senso di sicurezza psicologica.

Stabilisci una cultura che non si focalizza sulla ricerca delle colpe

L'ex CTO di Etsy, John Allspaw, ha scritto un articolo fondamentale sulle "analisi retrospettive non focalizzate sulla ricerca delle colpe". Questo approccio all'analisi degli imprevisti fa in modo che le persone coinvolte nell'imprevisto chiariscano tutte le loro azioni e il loro impatto e ciò di cui sono venute a conoscenza e quando, senza temere punizioni o ritorsioni.

Questo approccio è fondamentale per assicurarsi che i team condividano apertamente le informazioni arrivando alla causa primaria di un imprevisto. Se invece dovessero temere rimproveri, potrebbero non dire tutto o provare a deviare le colpe. Quando ciò accade, le persone perdono la fiducia reciproca. E l'organizzazione perde l'opportunità di costruire resilienza all'interno dei team e dei sistemi. Per evitare queste insidie, molti team, inclusi quelli di Atlassian e Google, hanno adottato i principi chiave delle analisi retrospettive non focalizzate sulla ricerca delle colpe.

Evita di accusare e fai solo critiche costruttive

Nella riunione sull'analisi retrospettiva e durante la conseguente stesura del resoconto sui risultati, evita di usare un linguaggio che prende di mira singole persone come responsabili dell'imprevisto. Al contrario, concentrati sulle azioni, sui risultati e sull'impatto.

Anche se è importante mantenere la conversazione obiettiva e neutra, arrivare alla causa primaria dell'imprevisto è di importanza critica per risolverlo. Durante la riunione, puoi utilizzare la tecnica chiamata "I 5 perché". Inizia assicurandoti che tutti siano d'accordo sulla natura del problema. Quindi, chiedi perché si è verificato e chiedi di nuovo "perché" alle risposte che ricevi per questa domanda. Ripeti questa procedura per almeno cinque volte per fare emergere tutti i fattori profondi che hanno contribuito al problema. Accertati che i membri del team non provino ad allontanarsi da una scomoda verità o che non cerchino di ottenere facili consensi. Ulteriori informazioni sull'approccio de "I 5 perché" sono disponibili nel nostro Playbook sulle strategie qui.

Rivedi ogni singola analisi retrospettiva e implementala nei tuoi processi

Se i report sulle analisi retrospettive degli imprevisti non vengono letti, tanto vale non scriverli. Quando si redige la bozza di un report sull'analisi retrospettiva degli imprevisti, è importante rivederla per chiudere eventuali ticket irrisolti, estrapolare idee da tenere presenti in futuro e completare il report. Si potrebbe addirittura affermare che un imprevisto non è veramente risolto se non è stata effettuata questa revisione.

Come fare? Programma una riunione ricorrente con i tecnici (e con chiunque altro possa essere interessato, ad esempio l'assistenza clienti o gli Account Manager), almeno ogni mese, per rivedere i report sulle analisi retrospettive degli imprevisti. Puoi scegliere di rivedere gli ultimi report o persino quelli meno recenti e condividere le lezioni apprese ancora pertinenti alla situazione attuale.

Un piano di analisi retrospettiva degli imprevisti efficace

Per ottenere analisi retrospettive efficaci, e per costruire una cultura di miglioramento continuo, occorre implementare un processo semplice e ripetibile a cui tutti possano partecipare. L'approccio che scegli per farlo dipende dalla cultura aziendale e dal tuo team. In Atlassian, abbiamo sviluppato un metodo adatto alle nostre esigenze. Puoi trovare ulteriori informazioni in merito nel nostro Manuale degli imprevisti.

Ecco alcuni suggerimenti per iniziare:

Suggerimento 1: Imposta una soglia

Gli imprevisti che si verificano nell'organizzazione devono avere livelli di gravità chiari e misurabili. Tali livelli possono essere utilizzati per attivare il processo di analisi retrospettiva. Ad esempio, gli imprevisti con livello Grav 1 o più elevato attivano il processo di analisi retrospettiva, mentre quest'ultimo può essere facoltativo nel caso di imprevisti meno gravi. Prendi in considerazione la possibilità di dare ai team leader o ai responsabili l'opportunità di richiedere un'analisi retrospettiva per gli imprevisti che non raggiungono la soglia.

Suggerimento 2: Non procrastinare

È importante fare una pausa e riposarsi un po' dopo un imprevisto. Ma non ritardare la stesura dell'analisi retrospettiva dell'imprevisto. Se aspetti troppo, i dettagli importanti potrebbero andare persi o potresti dimenticarli. Idealmente, l'analisi viene redatta subito dopo la riunione di revisione post-imprevisto, che deve essere tenuta entro 24-48 ore dalla risoluzione dell'imprevisto e non oltre i cinque giorni lavorativi.

Suggerimento 3: Assegna ruoli e responsabili

Durante la riunione di revisione post-imprevisto, vengono analizzati i dettagli che verranno registrati nell'analisi retrospettiva dell'imprevisto. È bene delegare la stesura della bozza dell'analisi retrospettiva a una persona specifica, preferibilmente qualcuno che abbia familiarità con l'imprevisto e che sia in possesso del necessario livello di conoscenze tecniche e organizzative per comprendere le cause e le soluzioni.

Suggerimento 4: Basati su un modello

I modelli possono aiutarti a non tralasciare i dettagli chiave. E sono anche un modo fantastico per favorire la coerenza delle analisi retrospettive.

Suggerimento 5: Includi una timeline

Una timeline è un sussidio molto utile nella documentazione dell'imprevisto. Spesso è il primo elemento che salta all'occhio dei lettori quando cercano di valutare rapidamente ciò che è accaduto. Cerca di inserire informazioni il più chiare e specifiche possibile. Ad esempio scrivi "11:14 Ora legale del Pacifico", non "intorno alle 11". Usare timestamp specifici ti consente di ricreare una catena di eventi affidabile e utile per individuare le aree di miglioramento. Ad esempio, potresti giungere alla conclusione che l'intervallo di tempo trascorso tra l'inizio dell'impatto e il momento in cui i clienti ne sono stati informati è stato troppo lungo.

Momenti importanti da includere.

  • Primo avviso o ticket
  • Annuncio della prima comunicazione (interno e/o esterno)
  • Orari degli aggiornamenti della pagina di stato
  • Orario di eventuali tentativi di riparazione (rollback del codice, ecc.)
  • Tempo di risoluzione

Suggerimento 6: Dettagli, dettagli, dettagli

Risparmiare sui dettagli è il modo più veloce per scrivere analisi retrospettive inutili e poco chiare. Aggiungi quanti più dettagli possibili su ciò che è successo e le azioni intraprese durante l'imprevisto. Invece di scrivere "e poi lo abbiamo comunicato pubblicamente", scrivi "Abbiamo annunciato pubblicamente l'imprevisto sulla nostra pagina di stato pubblica e sul nostro account Twitter".

Laddove possibile, includi link e nomi, link a ticket e ad aggiornamenti dello stato e link a documenti sullo stato e a grafici di monitoraggio dell'imprevisto. Non aver paura di aggiungere anche screenshot di elementi grafici o dashboard pertinenti. Un grafico del sistema di monitoraggio che mostra in modo chiaro l'ora di inizio e fine di un imprevisto (ad esempio un calo del tasso di richieste seguito da un ritorno alla normalità) è molto prezioso perché non lascia spazio all'ambiguità. Diventa ancora più potente se unito a grafici che mostrano cosa succedeva dietro le quinte in quel momento, ad esempio connessioni di database, stato dei link di rete o consumo di CPU/memoria/I/O/larghezza di banda nello stesso intervallo di tempo.

Suggerimento 7: Acquisisci le metriche sull'imprevisto

Acquisendo le metriche dell'analisi retrospettiva degli imprevisti, applicherai dati concreti ai problemi e al loro impatto. Avere questi punti dati a disposizione aiuta a determinare se il team si sta muovendo nella direzione giusta e a ridurre il numero di imprevisti, la loro gravità e il tempo di inattività. Grazie alla misurazione di metriche coerenti, puoi fare un passo indietro ed esaminare le tendenze dell'imprevisto nel tempo.

Alcune metriche da considerare nel monitoraggio dell'analisi retrospettiva dell'imprevisto:

  • Il numero di minuti del tempo di inattività, per verificare se questo numero sta aumentando o diminuendo
  • La gravità dell'imprevisto, in modo da poter determinare l'affidabilità relativa dei tuoi sistemi.
  • Il tempo medio di risoluzione (MTTR), che misura il tempo medio necessario per risolvere un imprevisto, da quando è stato inizialmente segnalato.

Il suggerimento più importante? Non saltare nessun passaggio. La chiave per condurre analisi retrospettive degli imprevisti utili per migliorare i team e i sistemi è definire un processo e rispettarlo.

Usa un modello di analisi retrospettiva degli imprevisti per semplificare il processo

Per fare in modo che il team sviluppi una cultura incentrata sulle revisioni delle analisi retrospettive degli imprevisti, semplifica l'acquisizione delle informazioni, la programmazione delle riunioni e la pubblicazione del report finale tramite modelli e checklist riutilizzabili. Un processo ripetibile fornisce coerenza e fa in modo che tutti sappiano cosa aspettarsi per poi contribuire al processo con una mentalità produttiva.

Voci tipiche della checklist per un processo di analisi retrospettiva degli imprevisti:

Riunioni che devono essere condotte:

  • Incontro per la raccolta di informazioni
  • Revisione del report
  • Presentazione del report

Informazioni che devono essere raccolte in anticipo:

  • Scaletta standard per ogni riunione
  • Partecipanti, stakeholder, revisori
  • Standardizza la stesura di report di analisi retrospettiva degli imprevisti con un modello
Up Next
Template