Close

Droga do lepszego zarządzania incydentami zaczyna się tutaj

Jak dobrać narzędzia do zarządzania incydentami?

Kategorie, kluczowe funkcje i istotne elementy

Nie ma jednego, uniwersalnego narzędzia do zarządzania incydentami.

Zespoły zajmujące się incydentami, które osiągają najlepsze wyniki, korzystają ze zbioru właściwych narzędzi, praktyk oraz ludzi.

Niektóre narzędzia są przeznaczone konkretnie do zarządzania incydentami, podczas gdy inne mają charakter uniwersalny i zespół używa ich do wykonywania także innych zadań. Niektóre narzędzia mogą również oferować całkowicie zindywidualizowane środowisko oparte na warstwach integracji i personalizacji.

Bez względu na przypadek użycia, dobre narzędzia do zarządzania incydentami mają kilka cech wspólnych. Najlepsze z nich są otwarte, niezawodne i elastyczne.

Otwartość: W sytuacjach obarczonych dużą presją, takich jak incydent, kluczowe jest zapewnienie odpowiednim ludziom natychmiastowego dostępu do właściwych narzędzi i informacji. Dotyczy to nie tylko osób reagujących na incydenty, ale także interesariuszy w firmie, którzy wymagają wglądu w prace podejmowane w ramach reakcji.

Niezawodność: Jedną z najgorszych rzeczy, jaka może przytrafić się podczas reagowania na incydent, jest awaria kluczowych narzędzi wykorzystywanych do podejmowania reakcji. Stosowanie narzędzi chmurowych, takich jak Slack i Opsgenie, minimalizuje ryzyko utraty dostępu do narzędzi reagowania wskutek awarii własnej infrastruktury.

Elastyczność: Takie elementy, jak integracje, przepływy pracy, dodatki, personalizacje i interfejsy API pozwalają w pełni wykorzystać możliwości, jakie daje produkt. Na początek możesz skorzystać z gotowej konfiguracji, jednak w miarę jak Twoje praktyki i procesy będą nabierały dojrzałości, pożądana będzie elastyczność narzędzi wystarczająca do obsługi wymaganych zmian.

Ilustracja cyklu zarządzania incydentami

Przed incydentem

Monitorowanie

Systemy monitorowania umożliwiają zespołom DevOps i zespołom odpowiedzialnym za eksploatację systemów informatycznych gromadzenie i agregowanie danych napływających w czasie rzeczywistym z tysięcy różnych usług oraz wyzwalanie na ich podstawie alertów. Są one krytyczne dla zapewnienia pełnego wglądu w stan Twoich usług i często jako pierwsze sygnalizują alarm w czasie incydentu.

Korzyści

Narzędzia monitorujące zapewniają zespołowi ciągły wgląd w stan infrastruktury. Ponadto nowoczesne narzędzia monitorujące proaktywnie wyzwalają alerty w przypadku nieoczekiwanej aktywności.

Funkcje

 

Zestaw funkcji

Pytania, jakie należy zadać

 

Zestaw funkcji

Obsada 24/7 i analizy

Pytania, jakie należy zadać

Czy narzędzie zapewnia wgląd we wszystkie moje serwery i elementy infrastruktury?

Czy mój zespół ma dostęp do pulpitów i analiz w czasie rzeczywistym oraz możliwość ustawiania progów alertów?

 

Zestaw funkcji

Integracja z narzędziami do obsługi alertów

Pytania, jakie należy zadać

Czy produkt da się zintegrować z moim narzędziem do obsługi alertów i dyżurów domowych?

Pomoc techniczna

Oprogramowanie działu obsługi jest miejscem, w którym klienci oraz pracownicy mogą zgłaszać incydenty i potencjalne incydenty.

Korzyści

Oprócz wielu innych funkcji (takich jak obsługa wniosków o usługi lub działu pomocy IT) działy obsługi pozwalają zespołowi szybko otrzymać informacje o incydentach napływające od tych, którzy liczą się najbardziej: użytkowników i klientów.

Funkcje

 

Zestaw funkcji

Pytania, jakie należy zadać

 

Zestaw funkcji

Możliwość samoobsługi

Pytania, jakie należy zadać

Czy klienci mogą szybko tworzyć zgłoszenia za pośrednictwem portalu obsługi?

Czy klienci mogą uzyskać potrzebną pomoc dzięki zautomatyzowanym podpowiedziom z bazy wiedzy?

Nasza rekomendacja: Jira Service Management

Alerty i dyżury domowe

Szybkie i niezawodne ostrzeganie jest krytycznym etapem procesu reagowania na incydenty. Daje ono zespołom pewność, że odpowiednie osoby dowiedzą się o incydencie.

Korzyści

Narzędzia do obsługi alertów powiadamiają wyznaczone osoby reagujące pełniące dyżur domowy przy użyciu zaawansowanej kombinacji harmonogramów, ścieżek eskalacji i powiadomień.

Funkcje

 

Zestaw funkcji

Pytania, jakie należy zadać

 

Zestaw funkcji

Ma zasięg globalny

Pytania, jakie należy zadać

Czy mogę wysyłać powiadomienia (SMS-owe, głosowe, e-mailowe) do niemal każdego miejsca na świecie?

 

Zestaw funkcji

Wiele metod powiadamiania

Pytania, jakie należy zadać

Czy mogę wysyłać powiadomienia na wiele sposobów, na przykład e-mailem, SMS-em, na telefon, za pomocą aplikacji do powiadomień push na telefony komórkowe, oraz czy mogę wypróbować je wielokrotnie?

Nasza rekomendacja: Opsgenie

W trakcie incydentu

Przyspieszanie rozwiązania z wykorzystaniem bazy danych do zarządzania konfiguracjami (CMDB)

Zrozumienie wzajemnych zależności w obrębie infrastruktury jest kluczem do ustalenia wszystkich skutków incydentu i szybszego dotarcia do rozwiązania.

Korzyści

CMDB pomaga zrozumieć relacje i zależności w obrębie infrastruktury IT. Jeśli coś przestanie działać, ta mapa pomoże błyskawicznie ustalić:

  • Potencjalne przyczyny incydentu. Na przykład jednym kliknięciem ustalić, na którym hoście działa usługa.
  • Ocenić skutki incydentu. Na przykład wskazać inne usługi uruchomione na tym samym, problematycznym hoście.

Dzięki temu można szybko przeanalizować wszystkie aspekty incydentu i o nich poinformować.

 

Zestaw funkcji

Pytanie, jakie należy zadać

 

Zestaw funkcji

Wiele kanałów

Pytanie, jakie należy zadać

Na ile elastyczna jest baza CMDB? Czy mogę przechowywać dowolny element konfiguracji lub zasób?

Czy mogę zwizualizować moją infrastrukturę graficznie?

 

Zestaw funkcji

Integracje

Pytanie, jakie należy zadać

Czy mogę powiązać elementy konfiguracji / zasoby z moimi zgłoszeniami w dziale obsługi?

Czy mogę powiązać elementy konfiguracji / zasoby z wnioskami o zmiany?

Nasza rekomendacja: Insight

Logo Insight

Reaguj na incydenty szybciej

Zmapuj swoją infrastrukturę i jej zależności natywnie w systemie Jira. Błyskawicznie wyszukuj i rozwiązuj przyczyny incydentów i wydłuż czas dostępności!

Komunikacja zespołowa

Przejrzysta i niezawodna komunikacja niezaprzeczalnie ma krytyczne znaczenie w trakcie zarządzania incydentami.

Korzyści

Solidna platforma komunikacyjna ułatwia zespołom porozumiewanie się, dzielenie się obserwacjami, łączami i zrzutami ekranowymi z zastosowaniem znaczników czasowych. To pozwala zgromadzić właściwe informacje i odpowiednich ludzi w trakcie incydentu, a po zakończeniu incydentu stanowi bogaty rejestr danych, z którego można wyciągać wnioski.

Funkcje

 

Zestaw funkcji

Pytania, jakie należy zadać

 

Zestaw funkcji

Wiele kanałów

Pytania, jakie należy zadać

Czy mój zespół reagujący na incydenty może szybko stworzyć dedykowany kanał do obsługi incydentu?

 

Zestaw funkcji

Integracje

Pytania, jakie należy zadać

Czy inne narzędzia w moim łańcuchu narzędzi do obsługi incydentów mogą wysyłać komunikaty na kanał komunikacyjny mojego zespołu?

Nasza rekomendacja: Slack (tekst), Zoom (wideo)

Komunikacja z klientem

Narzędzia do komunikacji z klientami ułatwiają przekazywanie klientom informacji w trakcie incydentu.

Korzyści

Nie oszukujmy się, incydenty zazwyczaj są dla Twoich klientów negatywnym doświadczeniem. Informowanie klientów na bieżąco buduje zaufanie i przyspiesza reakcję. Przekazanie informacji klientom jest dla nich oznaką, że masz świadomość incydentu i pracujesz nad jego naprawieniem.

Funkcje

 

Zestaw funkcji

Pytania, jakie należy zadać

 

Zestaw funkcji

Awarie mojej własnej infrastruktury

Pytania, jakie należy zadać

Czy moje narzędzie komunikacyjne będzie sprawne i dostępne nawet w razie awarii mojej infrastruktury wewnętrznej?

 

Zestaw funkcji

Subskrybenci i powiadomienia

Pytania, jakie należy zadać

Czy klienci mogą zasubskrybować powiadomienia po zamieszczeniu komunikatu o incydencie?

Nasza rekomendacja: Statuspage

Centrum zarządzania incydentami

Centrum dowodzenia incydentami jest tam, gdzie prowadzisz swój rejestr incydentów i dodajesz najważniejsze informacje na ich temat. Może to być narzędzie do obsługi incydentów, takie jak Opsgenie, lub narzędzie do śledzenia zgłoszeń, na przykład Jira.

Korzyści

Narzędzie pełniące funkcję centrum dowodzenia jest pojedynczym miejscem, z którego każdy może błyskawicznie dołączyć do prac nad incydentem, a po zakończeniu incydentu znaleźć najważniejsze dane na jego temat, takie jak status incydentu, powiązane alerty, aktualizacje itp. Pozwala również prowadzić rejestr historii incydentu i prac podejmowanych w ramach reakcji na dany incydent.

Funkcje

 

Zestaw funkcji

Pytania, jakie należy zadać

 

Zestaw funkcji

Źródło rzetelnych informacji

Pytania, jakie należy zadać

Czy członkowie zespołu i interesariusze mogą szybko przystąpić do aktywnej pracy nad incydentem?

Czy członkowie zespołu i interesariusze wykorzystują ten rejestr do zlokalizowania wszystkich innych szczegółów incydentu oraz działań podejmowanych w ramach reakcji?

 

Zestaw funkcji

Timeline

Pytania, jakie należy zadać

Czy narzędzie agreguje dane na temat kluczowych zdarzeń, porządkując je chronologicznie na osi czasu?

Nasza rekomendacja: Opsgenie

Po incydencie

Analiza post-mortem

Analizy post-mortem stanowią pisemny zapis tego, co działo się w trakcie incydentu i uwzględniają kolejne kroki podjęte w celu zapobieżenia ponownemu wystąpieniu incydentu.

Korzyści

Po rozwiązaniu incydentu zespoły często wciąż nie znają głównych przyczyn jego wystąpienia, co stwarza ryzyko ponownego pojawienia się tego samego problemu. Analizy post-mortem pozwalają temu zapobiec dzięki przeprowadzanej przez cały zespół razem analizie po incydencie.

Funkcje

 

Zestaw funkcji

Pytania, jakie należy zadać

 

Zestaw funkcji

Szablony

Pytania, jakie należy zadać

Czy mój zespół korzysta z szablonu przy przeprowadzaniu analizy post-mortem?

 

Zestaw funkcji

Wskazywanie kolejnych kroków

Pytania, jakie należy zadać

Czy mój zespół planuje kolejne kroki i działania naprawcze w trakcie analizy post-mortem?

Nasza rekomendacja: Opsgenie

Śledzenie zgłoszeń

Narzędzie do śledzenia zgłoszeń pomaga zespołowi stworzyć zarys przyszłych prac naprawczych, jakie trzeba wykonać.

Korzyści

W wielu przypadkach rozwiązanie incydentu polega na przywróceniu usługi bez usunięcia głównej przyczyny problemu. Zazwyczaj konieczne jest przeprowadzenie dodatkowych prac inżynierskich w celu wyeliminowania głównych przyczyn, aby mieć pewność, że incydent się nie powtórzy. Narzędzia do monitorowania zgłoszeń oraz prac — których, miejmy nadzieję, Twój zespół używa już w trakcie innych prac programistycznych — pomogą nadać priorytet tym pracom, aby ich realizacja nie umknęła uwadze.

Funkcje

 

Zestaw funkcji

Pytania, jakie należy zadać

 

Zestaw funkcji

Wspólny pipeline przepływu pracy

Pytania, jakie należy zadać

Czy mój zespół planuje działania naprawcze w związku z incydentem równocześnie z realizacją innych prac i priorytetów?

 

Zestaw funkcji

Integracje

Pytania, jakie należy zadać

Czy mój zespół może pobierać dane i zawartość z innych moich narzędzi do obsługi incydentów?

Nasza rekomendacja: Jira Software