Close

Zarządzanie incydentami dla dynamicznych zespołów

Usprawnianie dyżurów domowych — przewodnik dla menedżera

Podobnie, jak na izbach przyjęć, w których opracowanie harmonogramu dyżurów domowych jest konieczne do zapewnienia opieki w nagłych przypadkach, w zespołach DevOps są one potrzebne do sprawnego reagowania na problemy z oprogramowaniem i systemami wpływające na wydajność, wdrażanie i dostępność.

Jednak opracowanie praktyki dyżurów domowych nie jest tak proste, jak mogłoby się wydawać. Pełnienie dyżuru domowego bywa dla pracowników żmudnym zajęciem, które zakłóca rytm ich życia. Znalezienie właściwej równowagi między obsadzeniem, skalowalnością a jakością życie dla zespołu stanowi niekończące się wyzwanie.

Wraz ze zmianą najlepszych praktyk i rozwojem firm najbardziej zwinne zespoły pracujące z dużą prędkością z powodzeniem wdrażają nowe podejścia.

Odpowiadasz za to, co tworzysz

Jeszcze dziesięć lat temu reagowanie na incydenty IT było zadaniem przede wszystkich zespołów zajmujących się eksploatacją systemów informatycznych. Zespoły w organizacjach miały zazwyczaj strukturę warstwową (tj. pracownicy dzielili się na poziomy 1, 2 i 3, w zależności od poziomu umiejętności, a w konsekwencji także poziomu wynagrodzenia).

Taka struktura miała na celu obniżenie kosztów eksploatacyjnych. Zazwyczaj na poziomie 1 znajdowali się pracownicy rozpoczynający pracę w firmie. Jeśli poziom 1 nie był w stanie rozwiązać problemu, był on eskalowany do poziomu 2, który tworzyli bardziej doświadczeni (a zatem także lepiej wynagradzani) ludzie. Proces kontynuowano w ten sposób do czasu rozwiązania problemu.

Jednak wraz z rozwojem usług, które z założenia mają być dostępne przez cały czas, wzajemne zależności między systemami oraz oczekiwania klientów co do dostępności także wzrosły. Współcześnie wolna reakcja może kosztować więcej niż zaangażowanie bardziej doświadczonych programistów w rozwiązywanie incydentów na wczesnym etapie — reputację, zadowolenie i przychody.

Skutkiem tego zmieniającego się środowiska technologicznego jest konieczność zmiany struktury zespołów reagujących. Postaw na ruch DevOps i wprowadź zasadę „odpowiadasz za to, co tworzysz”.

Zamysł jest prosty: programista, który najlepiej zna kod, jest osobą, która najlepiej i najszybciej poradzi sobie ze związanymi z nim problemami. To dzięki DevOps i tej logice obecnie częste jest pełnienie dyżurów domowych przez programistów, kod działa dobrze, a wskaźniki MTTA i MTTR incydentów są niższe.

Dodatkową zaletą tego podejścia są bardziej rygorystyczne testy poprzedzające wdrożenie. Teraz, gdy programista odpowiedzialny za kod może spodziewać się alertów po godzinach, ma większe poczucie własności i dodatkową motywację do sprawdzenia kodu dwa, a nawet trzy razy. Jak przekonuje się coraz więcej firm, rezultatem są bardziej niezawodne i odporne systemy.

Opracowanie praktyki dyżurów domowych przyjaznej dla zespołów

Dyżury domowe cieszą się złą sławą — często nie bez powodu. Źle zrównoważone programy dyżurów domowych mogą wpływać niekorzystnie na równowagę między pracą a życiem prywatnym, zdrowie czy sen. Pracownicy, którzy mają za sobą złe doświadczenia z dyżurami domowymi lub w ogóle nie mają doświadczenia w tym temacie mogą widzieć oczyma wyobraźni, jak i równowaga między pracą i życiem prywatnym w mgnieniu oka wyparowuje.

Jednak prawda jest taka, że dyżury domowe nie muszą oznaczać nieuchronnej ścieżki prowadzącej do obniżenia jakości życia. Jeśli zrównoważysz obowiązki związane z dyżurami domowymi, weźmiesz pod uwagę preferencje zespołu i wdrożysz solidne systemy w celu zapobiegania incydentom i alertom w trakcie dyżurów domowych i ograniczenia ich liczby w miarę możliwości, możesz stworzyć praktykę, która pozwoli zminimalizować obciążenie i rozłożyć je między zespołami.

Aby kierownictwu udało się to osiągnąć, od początku musi przyjąć przejrzystą postawę w kontaktach z zespołami, zapewniając solidne szkolenie, wyznaczając rozsądne oczekiwania w odniesieniu do obowiązków programistów i osób pełniących dyżury domowe, opracowując solidne procesy i ustawicznie rewidując i udoskonalając plan na podstawie danych oraz informacji od samych zespołów.

Zachowaj przejrzystość w relacji z zespołami

Przejrzystość jest kluczem do skutecznej komunikacji. Sprecyzowanie oczekiwań dotyczących dostępności jest niezbędne przy wdrażaniu systemu dyżurów domowych lub zmian w istniejącym systemie. Zastanów się nad pytaniami zadawanymi często przez pracowników i udziel na nie jednoznacznej odpowiedzi:

  • Czy technicy będą pełnili dyżury domowe nocą?
  • Czy w przypadku nocnego dyżuru pracownik może wybrać opcję pracy z domu kolejnego dnia? Czy pracownik pełniący dyżur domowy zaczyna pracę później kolejnego dnia, jeśli musi odespać?
  • Czy w czasie dyżuru domowego programiści mają obowiązek realizować prace programistyczne?
  • Ile razy w miesiącu programista będzie pełnił dyżur domowy? Ile razy maksymalnie jedna osoba będzie pełniła dyżur domowy?
  • Jak pracownicy będą wynagradzani za dyżury domowe?

Zapewnij odpowiednie szkolenie

Do najlepszych praktyk w zakresie szkolenia zespołów pełniących dyżury domowe należą:

  • Opracowanie programu szkoleniowego, który uwzględnia zarówno procesy, jak i typowe problemy.
  • Udostępnianie aktualnych wykazów procedur.
  • Umożliwienie nowym pracownikom naśladowania doświadczonych techników pełniących dyżury domowe.
  • Zapewnienie pracownikom dostępu do wcześniejszych raportów na temat incydentów, aby mogli zobaczyć, jak udało się rozwiązać inne incydenty podobne do tego, z jakim akurat się borykają.

Dobrym pomysłem jest również zapewnienie wielu kanałów eskalacji. Typową z dobrych praktyk jest obsadzanie młodszych techników w podstawowej rotacji w ramach dyżurów domowych, a rotację rezerwową lub dodatkową obsadzić starszymi technikami. Dzięki temu młodsi technicy będą mogli nabyć umiejętności wymagane w trakcie dyżurów domowych, a jednocześnie uniknie się paniki w przypadku wystąpienia problemu przekraczającego ich możliwości.

Rozdzielaj obowiązki związane z dyżurami domowymi i pracą programistyczną

Pełnienie obowiązków programisty w trakcie dyżuru domowego zazwyczaj wymusza liczne zmiany kontekstu i zakłócenia, zwłaszcza w firmach, w których incydenty są częste i osoby pełniące dyżur domowy muszą często interweniować.

To wszystko oznacza zazwyczaj mniejszą wydajność programistyczną i większy stres dla techników pełniących dyżur domowy, co może prowadzić do wypalenia, zmęczenia alertami i braku zadowolenia z pracy. Taka sytuacja może również wpłynąć niekorzystnie na sprinty programistyczne, ponieważ trudno jest oszacować potencjalny i rzeczywisty wkład pracy osoby pełniącej dyżur domowy w dany sprint.

W związku z tym najlepszą zalecaną przez nas praktyką, jest rozdzielenie obowiązków związanych z dyżurami domowymi i obowiązków programistycznych. Gdy pracownicy pełniący dyżur domowy mają wolny czas, mogą pracować nad dokumentacją i automatyzacją dotyczącymi dyżurów domowych w celu dodatkowego zrównoważenia systemów i usług.

Dopracuj proces dyżurów domowych

Zdrowo funkcjonujący system dyżurów domowych może istnieć tylko wtedy, gdy jest stale ulepszany przez dopracowanie procesów i systemów. Dostosuj harmonogramy dyżurów domowych, reguły przekierowywania i zasady eskalacji za pomocą rozwiązania do zarządzania incydentami, takiego jak Jira Service Management, aby efektywnie obsługiwać alerty. W tym celu zalecamy:

  • Ocenę priorytetu i stopnia pilności alertów, a następnie skonfigurowanie systemów w oparciu o jej wyniki. Alerty mniej pilne mogą poczekać do rana, aby pracownicy pełniący dyżur domowy nie musieli wyrywać się ze snu.
  • Zmniejszenie liczby fałszywych alarmów poprzez klasyfikację alertów w oparciu o takie czynniki, jak główna przyczyna, system, z którego pochodzi alert, treść komunikatu, progi itp. To ułatwi odróżnienie alertów umożliwiających podjęcie praktycznych działań od innych rodzajów alertów.
  • Wyeliminowanie dublujących się i powiązanych ze sobą alertów w celu uniknięcia zmęczenia alertami.
  • Zaprojektowanie alertów bogatych w szczegóły, które będą zawierały precyzyjny opis zgłoszenia i umożliwiały technikom pełniącym dyżur domowy sprawne podejmowanie decyzji i zastosowanie wiedzy zawartej w wykazach procedur.
  • Udostępnianie raportów o alertach i wskaźników zespołom pełniącym dyżury domowe, aby umożliwić rozpoznawanie i usuwanie słabych punktów w systemach. (Innymi słowy, nie dopuszczaj, aby zespoły pełniące dyżur domowy ciągle borykały się na nowo z tymi samymi problemami).

Przeglądaj raporty na temat dyżurów domowych, a w razie potrzeby wprowadzaj poprawki

Aby zapewnić uczciwość w przydziale dyżurów i uniknąć wypalenia pracowników, menedżerowie powinni sprawdzać raporty dotyczące dyżurów domowych w celu ustalenia:

  • Jak często poszczególni członkowie zespołu są wywoływani lub budzeni?
  • Jak długo poszczególni członkowie zespołu pełnią dyżur domowy?
  • Jak wyglądają godzinowe i dzienne rozkłady dyżurów domowych poszczególnych osób?
  • Jak dostosować harmonogramy w taki sposób, aby podział pracy był sprawiedliwy?

Słuchaj swoich pracowników

Kierownictwo powinno organizować regularne spotkania ze wszystkimi technikami pełniącymi dyżur domowy w celu omówienia problemów, skarg i słabości, aby móc następnie podjąć działania mające na celu rozwiązanie tych trudności.

Systemy, narzędzia, procesy, dokumentacja i szkolenia związane z dyżurami domowymi ani ludzie, którzy się nimi zajmują, nie są czymś statycznym, co można opracować raz na zawsze. W miarę rozwoju firmy zespoły uczą się i zmieniają, incydenty z czasem przybierają inną formę, dlatego kierownictwo powinno stale poddawać swoje programy dyżurów domowych ocenie i je ulepszać.

O tym, co się sprawdza, a co nie, najlepiej wiedzą technicy pełniący dyżury domowe. Wysłuchaj ich. Wprowadź zmiany. A co najważniejsze, pamiętaj, że w kwestii organizacji i protokołu dyżurów domowych kierownictwo nie jest jedynym organem decyzyjnym. Im większą możliwość doskonalenia własnych procesów i praktyk zapewnisz zespołowi, tym jego członkowie będą bardziej skłonni do przyjmowania dyżurów domowych.

Tworzenie przyjaznej kultury dyżurów domowych

Technicy pełniący dyżury domowe biorą na siebie ogromną odpowiedzialność za powodzenie firm. Nie zaskakuje więc fakt, że stres i napięcie są wśród nich powszechnymi problemami, zwłaszcza w przypadku poważnych problemów o nieznanych przyczynach.

Kultura dyżurów domowych opracowana przez starszych techników pełniących takie dyżury oraz zespoły menedżerskie określa, jak ludzie radzą sobie z tym stresem i napięciem oraz jak czują się, pełniąc dyżur.

Dla dobra zarówno techników pełniących dyżury domowe, jak i kultury firmy, zespoły kierownicze powinny zwracać uwagę na stworzenie przyjaznej kultury dyżurów domowych i wyraźnie zaznaczać, że celem zawsze powinno być wykrycie problemów, zagrożeń i słabości w systemach oraz ich rozwiązanie.

W Atlassian oznacza to nie tylko ciągłe doskonalenie naszych systemów dyżurów domowych, ale także przeprowadzanie analiz post-mortem bez dociekania winy, w trakcie których koncentrujemy się na doskonaleniu, a nie wskazywaniu winnych.

Odkryj Jira Service Management — rozwiązanie wspierające pozytywną kulturę dyżurów domowych — i stwórz system z ulepszonymi możliwościami komunikacyjnymi, scentralizowaną obsługą alertów, elastyczną automatyzacją i zaawansowanym raportowaniem reakcji na incydenty na wyższy poziom.