Close

Zarządzanie incydentami dla dynamicznych zespołów

Jak dobrać narzędzia do zarządzania incydentami?

Kategorie, kluczowe funkcje i istotne elementy

Nie ma jednego, uniwersalnego narzędzia do zarządzania incydentami.

Zespoły zajmujące się incydentami, które osiągają najlepsze wyniki, korzystają ze zbioru właściwych narzędzi, praktyk oraz ludzi.

Niektóre narzędzia są przeznaczone konkretnie do zarządzania incydentami, podczas gdy inne mają charakter uniwersalny i zespół używa ich do wykonywania także innych zadań. Niektóre narzędzia mogą również oferować całkowicie zindywidualizowane środowisko oparte na warstwach integracji i personalizacji.

Bez względu na przypadek użycia, dobre narzędzia do zarządzania incydentami mają kilka cech wspólnych. Najlepsze z nich są otwarte, niezawodne i elastyczne.

Otwartość: W sytuacjach obarczonych dużą presją, takich jak incydent, kluczowe jest zapewnienie odpowiednim ludziom natychmiastowego dostępu do właściwych narzędzi i informacji. Dotyczy to nie tylko osób reagujących na incydenty, ale także interesariuszy w firmie, którzy wymagają wglądu w prace podejmowane w ramach reakcji.

Niezawodność: Jedną z najgorszych rzeczy, jaka może przytrafić się podczas reagowania na incydent, jest awaria kluczowych narzędzi wykorzystywanych do podejmowania reakcji. Stosowanie narzędzi chmurowych, takich jak Slack i Opsgenie, minimalizuje ryzyko utraty dostępu do narzędzi reagowania wskutek awarii własnej infrastruktury.

Elastyczność: Takie elementy, jak integracje, przepływy pracy, dodatki, personalizacje i interfejsy API pozwalają w pełni wykorzystać możliwości, jakie daje produkt. Na początek możesz skorzystać z gotowej konfiguracji, jednak w miarę jak Twoje praktyki i procesy będą nabierały dojrzałości, pożądana będzie elastyczność narzędzi wystarczająca do obsługi wymaganych zmian.

Przed incydentem

Monitorowanie

Systemy monitorowania umożliwiają zespołom DevOps i zespołom odpowiedzialnym za eksploatację systemów informatycznych gromadzenie i agregowanie danych napływających w czasie rzeczywistym z tysięcy różnych usług oraz wyzwalanie na ich podstawie alertów. Są one krytyczne dla zapewnienia pełnego wglądu w stan Twoich usług i często jako pierwsze sygnalizują alarm w czasie incydentu.

Korzyści

Narzędzia monitorujące zapewniają zespołowi ciągły wgląd w stan infrastruktury. Ponadto nowoczesne narzędzia monitorujące proaktywnie wyzwalają alerty w przypadku nieoczekiwanej aktywności.

Korzyści

Narzędzia monitorujące zapewniają zespołowi ciągły wgląd w stan infrastruktury. Ponadto nowoczesne narzędzia monitorujące proaktywnie wyzwalają alerty w przypadku nieoczekiwanej aktywności.

Funkcje

Monitoring tools give your team constant insight into the health of the infrastructure. Modern monitoring tools also proactively trigger alerts during unexpected activity.

 

 

Feature Set

Questions to ask

24/7 coverage and analytics

Does the tool have visibility into all my servers and infrastructures?

Integrates with alerting tools

Can my team see real time analytics and dashboards and set alerting thresholds?

 

Does the product integrate with my alerting and on-call tool?

Pomoc techniczna

Oprogramowanie działu obsługi jest miejscem, w którym klienci oraz pracownicy mogą zgłaszać incydenty i potencjalne incydenty.

Korzyści

Oprócz wielu innych funkcji (takich jak obsługa wniosków o usługi lub działu pomocy IT) działy obsługi pozwalają zespołowi szybko otrzymać informacje o incydentach napływające od tych, którzy liczą się najbardziej: użytkowników i klientów.

Funkcje

 

 

Feature set

Questions to ask

Enable self serve

Can customers quickly file tickeCan customers quickly file tickets through a self-service support portal?

 

Can customers find the help they need with automated knowledge-based suggestions?

Nasza rekomendacja: Jira Service Management

Alerty i dyżury domowe

Szybkie i niezawodne ostrzeganie jest krytycznym etapem procesu reagowania na incydenty. Daje ono zespołom pewność, że odpowiednie osoby dowiedzą się o incydencie.

Korzyści

Narzędzia do obsługi alertów powiadamiają wyznaczone osoby reagujące pełniące dyżur domowy przy użyciu zaawansowanej kombinacji harmonogramów, ścieżek eskalacji i powiadomień.

Funkcje

 

 

Feature set

Questions to ask

Works globally

Can I send notifications (SMS, voice, email) to almost anywhere?

Multiple notification methods

Can I send notifications using multiple notification methods like email, SMS, phone, and mobile app push and try them multiple times?

Nasza rekomendacja: Opsgenie

W trakcie incydentu

Przyspieszanie rozwiązania z wykorzystaniem bazy danych do zarządzania konfiguracjami (CMDB)

Zrozumienie wzajemnych zależności w obrębie infrastruktury jest kluczem do ustalenia wszystkich skutków incydentu i szybszego dotarcia do rozwiązania.

Korzyści

CMDB pomaga zrozumieć relacje i zależności w obrębie infrastruktury IT. Jeśli coś przestanie działać, ta mapa pomoże błyskawicznie ustalić:

  • Potencjalne przyczyny incydentu. Na przykład jednym kliknięciem ustalić, na którym hoście działa usługa.
  • Ocenić skutki incydentu. Na przykład wskazać inne usługi uruchomione na tym samym, problematycznym hoście.

Dzięki temu można szybko przeanalizować wszystkie aspekty incydentu i o nich poinformować.

 

 

Feature set

Questions to ask

Multiple channels

How flexible is the CMDB? Can I store any CI or asset?

Integrations

Can I visualize my infrastructure graphically?

 

Can I link CIs/assets with my service desk issues?

 

Can I link CIs/assets to change requests?

Nasza rekomendacja: Insight

Logo Insight

Reaguj na incydenty szybciej

Zmapuj swoją infrastrukturę i jej zależności natywnie w systemie Jira. Błyskawicznie wyszukuj i rozwiązuj przyczyny incydentów i wydłuż czas dostępności!

Komunikacja zespołowa

Przejrzysta i niezawodna komunikacja niezaprzeczalnie ma krytyczne znaczenie w trakcie zarządzania incydentami.

Korzyści

Solidna platforma komunikacyjna ułatwia zespołom porozumiewanie się, dzielenie się obserwacjami, łączami i zrzutami ekranowymi z zastosowaniem znaczników czasowych. To pozwala zgromadzić właściwe informacje i odpowiednich ludzi w trakcie incydentu, a po zakończeniu incydentu stanowi bogaty rejestr danych, z którego można wyciągać wnioski.

Funkcje

 

 

Feature set

Questions to ask

Multiple channels

Can my incident response team quickly spin up a dedicated channel for an incident?

Integrations

Can other tools in my incident toolchain post into my team's communication channel?

Nasza rekomendacja: Slack (tekst), Zoom (wideo)

Komunikacja z klientem

Narzędzia do komunikacji z klientami ułatwiają przekazywanie klientom informacji w trakcie incydentu.

Korzyści

Nie oszukujmy się, incydenty zazwyczaj są dla Twoich klientów negatywnym doświadczeniem. Informowanie klientów na bieżąco buduje zaufanie i przyspiesza reakcję. Przekazanie informacji klientom jest dla nich oznaką, że masz świadomość incydentu i pracujesz nad jego naprawieniem.

Funkcje

 

 

Feature set

Questions to ask

Off of my infrastructure

Will my communication tool be operational and accessible even if my internal infrastructure is down?

Subscribers and notifications

Can customers opt in to get notifications when I post about an incident?

Nasza rekomendacja: Statuspage

Centrum zarządzania incydentami

Centrum dowodzenia incydentami jest tam, gdzie prowadzisz swój rejestr incydentów i dodajesz najważniejsze informacje na ich temat. Może to być narzędzie do obsługi incydentów, takie jak Opsgenie, lub narzędzie do śledzenia zgłoszeń, na przykład Jira.

Korzyści

Narzędzie pełniące funkcję centrum dowodzenia jest pojedynczym miejscem, z którego każdy może błyskawicznie dołączyć do prac nad incydentem, a po zakończeniu incydentu znaleźć najważniejsze dane na jego temat, takie jak status incydentu, powiązane alerty, aktualizacje itp. Pozwala również prowadzić rejestr historii incydentu i prac podejmowanych w ramach reakcji na dany incydent.

Funkcje

 

 

Feature set

Questions to ask

Source of truth

Can team members and stakeholders use this record to locate all the other details of the incident and response activities?

Timeline

Does the tool aggregate a chronological timeline of key events?

 

Can team members and stakeholders quickly get up to speed on the incident?

Nasza rekomendacja: Opsgenie

Po incydencie

Analiza post-mortem

Analizy post-mortem stanowią pisemny zapis tego, co działo się w trakcie incydentu i uwzględniają kolejne kroki podjęte w celu zapobieżenia ponownemu wystąpieniu incydentu.

Korzyści

Po rozwiązaniu incydentu zespoły często wciąż nie znają głównych przyczyn jego wystąpienia, co stwarza ryzyko ponownego pojawienia się tego samego problemu. Analizy post-mortem pozwalają temu zapobiec dzięki przeprowadzanej przez cały zespół razem analizie po incydencie.

Funkcje

 

 

Feature set

Questions to ask

Templates

Can my team use a template to fill out a postmortem?

Map out next actions

Can my team plan out next actions and remediation work during a postmortem?

Nasza rekomendacja: Opsgenie

Śledzenie zgłoszeń

Narzędzie do śledzenia zgłoszeń pomaga zespołowi stworzyć zarys przyszłych prac naprawczych, jakie trzeba wykonać.

Korzyści

W wielu przypadkach rozwiązanie incydentu polega na przywróceniu usługi bez usunięcia głównej przyczyny problemu. Zazwyczaj konieczne jest przeprowadzenie dodatkowych prac inżynierskich w celu wyeliminowania głównych przyczyn, aby mieć pewność, że incydent się nie powtórzy. Narzędzia do monitorowania zgłoszeń oraz prac — których, miejmy nadzieję, Twój zespół używa już w trakcie innych prac programistycznych — pomogą nadać priorytet tym pracom, aby ich realizacja nie umknęła uwadze.

Funkcje

 

 

Feature set

Questions to ask

Shared workflow pipeline

Can my team plan any incident remediation work alongside their other work and priorities?

Integrations

Can my team pull in data and content from my other incident tools?

Nasza rekomendacja: Jira Software

Następny
KPIs