Gestione degli imprevisti per i team high velocity
Risposta a un imprevisto
Le sezioni seguenti descrivono il processo di Atlassian per la risposta agli imprevisti. L'Incident manager (IM) segue questa serie di passaggi per condurre l'imprevisto dal rilevamento alla risoluzione.
Campo Jira | Tipo | Testo guida |
Riepilogo | Testo | Qual è l'emergenza? |
Descrizione | Testo | Qual è l'impatto sui clienti? Includi i tuoi dati di contatto in modo che gli addetti agli imprevisti possano comunicare con te. |
Gravità | Selezione singola | (Collegamento ipertestuale a una pagina Confluence con la nostra scala di gravità) Scegliendo Gravità 2 o 1, ritieni che il problema debba essere risolto immediatamente - le persone verranno contattate. |
Servizio in errore | Selezione singola | Il servizio con il malfunzionamento che sta causando l'imprevisto. Formula l'ipotesi migliore, in caso di incertezza. Seleziona "Sconosciuto", se non noto. |
Prodotti interessati | Checkbox | Quali prodotti sono interessati dall'imprevisto? Seleziona tutti i prodotti pertinenti. |
Una volta creato l'imprevisto, la sua chiave issue è utilizzata in tutte le comunicazioni interne relative all'imprevisto.
I clienti spesso aprono casi di supporto su un imprevisto che li riguarda. Se i nostri team di assistenza clienti stabiliscono che tutti questi casi si riferiscono a un imprevisto, assegnano un'etichetta a quei casi, corrispondente alla chiave issue dell'imprevisto, per monitorare l'impatto sul cliente e poter più facilmente ricontattare i clienti interessati quando l'imprevisto è risolto.
Gravità | Descrizione | Esempi |
1 | Un imprevisto critico con un impatto molto elevato |
|
2 | Un imprevisto grave con un impatto significativo |
|
3 | Un imprevisto minore a basso impatto |
|
Una volta stabilito l'impatto dell'imprevisto, adattare o confermare la gravità della relativa issue e comunicare tale gravità al team. Riteniamo che numerare il livello è molto utile per comunicare chiaramente la gravità.
In Atlassian, gli imprevisti di gravità 3 vengono trasmessi ai team di delivery per la risoluzione in orario di lavoro, mentre i livelli di gravità 1 e 2 esigono il coinvolgimento dei membri del team per una correzione immediata. La differenza di risposta tra le gravità 1 e 2 è più sfumata e dipende dal servizio interessato.
La matrice di gravità deve essere documentata e concordata tra tutti i team per ottenere una risposta coerente agli imprevisti in base all'impatto sui clienti.
Statuspage interna | Statuspage esterna | |
Nome dell'imprevisto | | Stiamo effettuando indagini sui problemi di |
Messaggio | Stiamo analizzando un imprevisto che riguarda il | Stiamo effettuando indagini sui problemi di |
Oltre a creare un imprevisto in Statuspage, inviamo un'e-mail a una lista di distribuzione per le comunicazioni degli imprevisti che include la nostra direzione tecnica, i principali Incident manager e altro personale interessato. Questa e-mail ha lo stesso contenuto dell'imprevisto interno in Statuspage. L'e-mail consente al personale di porre domande e rispondere, mentre Statuspage rappresenta più una comunicazione diffusa a senso unico.
Si noti che includiamo sempre la chiave issue Jira dell'imprevisto su tutte le comunicazioni interne relative all'imprevisto, pertanto lo staff sa in quale chat inserirsi per ulteriori domande.
Configurare una On-call Schedule con Opsgenie
In questo tutorial imparerai come configurare una On-call Schedule, applicare le regole di sostituzione, configurare le notifiche su chiamata e molto altro, il tutto in Opsgenie.
Segui il tutorialCome eseguiamo analisi retrospettive degli imprevisti
Le analisi retrospettive senza biasimi ci aiutano a comprendere e correggere la causa degli imprevisti. Ecco come svolgiamo in Atlassian le analisi retrospettive sugli imprevisti.
Leggi l'articolo