Close

Zarządzanie incydentami dla dynamicznych zespołów

Plusy i minusy różnych podejść do zarządzania dyżurami domowymi

Świat zależy od stale dostępnych usług bardziej niż kiedykolwiek wcześniej. Awaria może dotknąć miliony ludzi, z prawdziwym wpływem: Nie mogą płacić rachunków, nie mogą zarezerwować lotów, nie mogą prowadzić rozmów wideo ze znajomymi.

Niezależnie od tego, czy masz poważny błąd, problemy z pojemnością, lub jesteś całkowicie w dół, klienci, którzy zależą od Twoich usług, oczekują natychmiastowej odpowiedzi. (To samo dotyczy zespołów wewnętrznych).

Incydenty mogą mieć realny wpływ nie tylko w dolarach — kosztują firmy 700 miliardów dolarów rocznie w samej Ameryce Północnej — ale także na reputację Twojej firmy, Twojego produktu i zespołu.

Ze względu na tak wysoką stawkę zespoły zaczęły obsadzać dyżury domowe członkami zespołów IT i programistycznych, aby zapewnić organizacji dostępność właściwych osób, które będą w stanie rozwiązać problem w razie incydentu, bez względu na porę.

Uczciwy harmonogram dyżurów domowych w połączeniu z planem wynagrodzeń za takie dyżury, może nawet wspierać kulturę wspólnej odpowiedzialności i pomóc zespołom dowiedzieć się więcej o tym, czego potrzeba, aby stworzyć odporne oprogramowanie i usługi, co zapewnia lepszy ogólny produkt i mniej przerw w dostawach.

Czym jest dyżur domowy?

Dyżur domowy jest praktyką polegającą na wyznaczaniu konkretnych osób, które w określonych godzinach pozostają w gotowości do zareagowania na wypadek pilnego problemu z usługą, nawet jeśli formalnie nie są w danej chwili w pracy.

Dyżury domowe są krytycznym elementem zakresu obowiązków w wielu zespołach IT, programistycznych, wsparcia i eksploatacji systemów informatycznych odpowiedzialnych za usługi, od których klienci oczekują dostępności 24/7. Członkowie zespołu pełnią dyżury domowe na zmianę, zapewniając obsadę przez całą dobę lub jedynie poza standardowymi godzinami pracy. Uzupełniając stosowane rozwiązania do zautomatyzowanego monitorowania i obsługi alertów, technik pełniący dyżur domowy ma reagować niezwłocznie na wszelkie zakłócenia w dostępności usługi.

Rosnące znaczenie dyżurów domowych w zespołach IT i programistycznych

Bywa, że dyżury domowe cieszą się złą sławą. Niektórzy weterani branży IT opowiadają historie rodem z horroru o pracy w zespołach, które eksploatowano do maksimum, nie oferując wsparcia potrzebnego do właściwego zareagowania na incydenty.

Zapewnienie właściwego wsparcia w trakcie dyżurów domowych pozwala wyeliminować dużą część niepokojów. Efektywnie opracowany plan dyżurów domowych może zapewnić Twojemu zespołowi możliwość skalowania w miarę rozbudowy usług, spójnego obsadzenia krytycznych funkcji IT oraz szybkiego zareagowania na incydent.

Dobry plan zarządzania dyżurami domowymi nie tylko pozwala uporać się z przestojami, ale także przynosi szereg innych korzyści. Z każdą awarią zespoły zyskują możliwość nabycia nowych umiejętności, takich jak nieco lepsze zrozumienie krytycznej usługi, zaobserwowanie, jak reaguje ona na usterkę, czy poznanie sposobów projektowania, które pozwolą zmniejszyć liczbę usterek. Mogą również doskonalić sam plan reagowania na incydenty.

A dysponowanie dobrym programem dyżurów domowych opartym na kulturze współodpowiedzialności może również skutkować zacieśnieniem więzi koleżeńskich i ograniczeniem wskaźnika wypalenia, co z kolei może przełożyć się na wzrost wskaźnika zatrzymania pracowników.

Zalety i wady pracy na dyżurach domowych

W organizacjach praktykujących DevOps zespoły tworzące oprogramowanie są w dużym stopniu odpowiedzialne za niezawodność i dostępność tworzonych usług, czyli za to, co dawniej było wyłączną domeną zespołów zajmujących się eksploatacją systemów informatycznych. Wiele z tych zespołów kieruje się nowym mottem, które brzmi: „odpowiadasz za to, co tworzysz”. Jako osoby, które najlepiej znają kod, programiści często są w stanie rozwiązać problemy najszybciej i najlepiej.

Efektem tego procesu jest także poprawa jakości oprogramowania tworzonego przez programistów, tak aby było ono mniej podatne na awarie. Taka zmiana w zakresie odpowiedzialności sprawia, że programiści poddają swój kod bardziej rygorystycznym testom, ponieważ to oni ryzykują wywołanie po godzinach pracy, jeśli w usłudze wystąpią problemy.

Rezultatem jest większa odporność systemów, a więcej osób dostępnych i zdolnych do podjęcia się rozwiązania incydentów oznacza z kolei mniej wypalonych pracowników.

Bez dobrego programu dyżurów domowych organizacje nie będą w stanie wykorzystać wszystkich zalet kulturowych modelu DevOps — ani zaspokoić wymagań infrastruktury podlegającej skalowaniu. Jeśli jeden zespół będzie w większym stopniu obciążony obowiązkami związanymi z reagowaniem na incydenty niż drugi, nie będzie miał mocy przerobowych koniecznych do wykonywania codziennych zadań. Programiści nie będą w stanie wdrażać zmian wynikających z informacji zwrotnych będących efektem incydentów, a osoby reagujące na incydenty nie będą miały możliwości wzmocnienia swoich systemów.

Jeśli obowiązki nie są dzielone po równo, osoby stale wyznaczane do pełnienia dyżurów domowych mają poczucie, że nigdy nie opuszczają pracy, co może łatwo doprowadzić do wypalenia.

Jednak plan, który będzie uwzględniał rzeczywiste zapotrzebowanie na obsadę w organizacji, równoważył obciążenie czasowe w zespołach programistycznych i odpowiedzialnych za eksploatację systemów informatycznych, a także przewidywał rejestrowanie danych na potrzeby ciągłego doskonalenia, może przynieść wielowymiarowe korzyści. Nie tylko przełoży się on na lepszą jakość usług dostarczanych klientom, ale także może pomóc pracownikom w doskonaleniu ich umiejętności oraz samego produktu, dzięki czemu pracownicy będą cieszyli się na myśl o dyżurze domowym.

Jak lepiej zdefiniować role dyżurnych programistów?

„Nie mogę się doczekać, aż spędzę wieczór na nadzorowaniu tego wdrożenia i reagowaniu na potencjalne awarie” — nie powiedział nigdy żaden technik.

Coraz więcej programistów przyjmuje na siebie obowiązki związane z utrzymaniem tworzonych przez siebie usług, dlatego ważne jest przygotowanie ich do wykonywania obowiązków przewidzianych dla dyżurów domowych, a najlepszym momentem oceny tego przygotowania jest proces rekrutacji.

Nie jest tajemnicą, że firmy zaciekle konkurują o największe talenty inżynierskie. A nie dla każdego wynagrodzenie jest jedyną formą motywacji, dlatego zwiększenie programistom stawki za pracę po godzinach może nie załatwić sprawy (później powiemy nieco więcej o wynagrodzeniach za dyżury domowe). W trakcie rozmowy kwalifikacyjnej inżynierowie oprogramowania z pewnością zapytają, jak często będą musieli rezygnować z życia prywatnego i podejmować się pełnienia dyżurów domowych.

Wykazanie, że masz udokumentowany plan dyżurów domowych, w którym obowiązki rozdzielane są sprawiedliwie wśród członków kompetentnego zespołu programistów oraz serwisantów witryn, może dać nowym kandydatom pewność, że Twoja organizacja ma pod kontrolą zarządzanie dyżurami domowymi. Udokumentowany plan pozwala zachować całkowitą przejrzystość w procesie rekrutacyjnym i zyskać pewność, że kandydaci są gotowy do podjęcia dyżurów domowych.

Pięć sposobów na dyżury domowe bardziej przyjazne dla programistów

  1. Zdefiniuj dokładnie obowiązki w trakcie dyżurów domowych.
    Obowiązki w trakcie dyżurów domowych powinny być dokładnie zdefiniowane. To pomaga uniknąć wypalenia, wątpliwości i frustracji. Zalecamy udokumentowanie procesu reagowania na incydenty oraz oczekiwań, czyli tego, co właściwie oznacza pełnienie dyżuru domowego.
  2. Upewnij się, że alerty są przypisywane do właściwej osoby.
    Nie można zapominać o właściwym skonfigurowaniu narzędzia do obsługi alertów. Opracowanie przejrzystego przepływu alertów uwzględniającego właściwe powiadomienia i zastąpienia pozwoli uniknąć wielu stresów.
  3. Wyznacz podstawowe i dodatkowe osoby reagujące.
    Życie nie kończy się wraz z podjęciem się pełnienia dyżuru domowego. Nieoczekiwane zdarzenia osobiste mogą wyłączyć programistę z pracy tak w ciągu typowego dnia pracy, jak i podczas dyżuru domowego. Zapewnienie osoby rezerwowej ogranicza potencjalne szkodliwe skutki tego rodzaju zakłócenia.
  4. Dostosowuj harmonogramy.
    Zespoły nie są statyczne i harmonogram dyżurów domowych też nie powinien być. Zalecamy stosowanie kultury ciągłego weryfikowania, dostosowywania i doskonalenia praktyk dyżurów domowych.
  5. Zapewnij dostęp do odpowiednich narzędzi diagnostycznych i zadbaj o ich znajomość.
    Każdy zespół stosuje inne narzędzia do monitorowania poprawności działania, wydajności aplikacji, użycia zasobów itp. Upewnij się, że technicy pełniący dyżury domowe znają używane narzędzia i mają do nich odpowiedni dostęp.

Usprawnianie dyżurów domowych dla wsparcia IT i działu obsługi

Nie tylko programiści spędzają więcej czasu na dyżurach domowych. Dla działalności firmy krytyczne znaczenie ma coraz częściej zapewnienie całodobowego wsparcia, co przekłada się na większe zaangażowanie zespołów wsparcia i zespołów zajmujących się eksploatacją usług IT.

Zespoły te stają w obliczu podobnych trudności, jak programiści pełniący dyżury domowe, czyli stresu, wypalenia, nieprecyzyjnie zdefiniowanych ról i obowiązków, dostępu do narzędzi.

Zespołom IT często towarzyszy dodatkowy stres związany z przebywaniem w jednym budynku ze swoimi klientami, co może spowalniać pracę wskutek zalania komunikatami zakłócającymi na temat incydentu (napływającymi pocztą elektroniczną, przez platformę Slack, a nawet osobiście).

Poniżej przedstawiamy kilka taktyk, które ułatwią zarządzanie incydentami IT:

  • Szybka i przejrzysta komunikacja: proaktywne powiadamianie o incydentach IT jest oznaką tego, że Ci zależy — oraz że kontrolujesz sytuację.
  • Śledź istotne informacje: Większość zespołów zajmujących się eksploatacją usług IT korzysta z jakiegoś rodzaju oprogramowania dla działu obsługi. Bardzo ważne, aby do rejestrowania szczegółów zgłoszeń nie używać ogólnych pól wprowadzania danych.
  • Wprowadź system monitorowania: Dawniej wiele zespołów zajmujących się eksploatacją systemów informatycznych samodzielnie monitorowało pulpity wydajności, starając się wykryć ewentualne awarie. Wyświadcz zespołowi przysługę i pozwól, żeby zajęły się tym narzędzia do monitorowania i obsługi alertów.

Wynagrodzenie za dyżur domowy

Dobry plan wynagrodzeń za dyżury domowe przewiduje nagradzanie pracowników za ich wiedzę i czas poświęcony na pracę po godzinach. Jeśli pracownicy mają poczucie, że się o nich dba, oni także będą dbać o firmę i przyczyniać się do jej sukcesu.

Zgodnie z amerykańską ustawą o uczciwej pracy (FLSA), która określa minimalną płacę, nadgodziny oraz minimalne wymagania wiekowe dla pracodawców i pracowników, jeśli pracownik pełni dyżur domowy, jednak może w tym czasie robić, co zechce, uznaje się, że „oczekuje na zaangażowanie”, a zatem nie pracuje.

Jeśli czyjś czas wolny jest ograniczony i taka osoba nie może robić po godzinach tego, na co ma ochotę, wówczas według FSLA czas pełnienia dyżuru domowego uznaje się za „czas przepracowany”, za który przysługuje wynagrodzenie.

Lokalne przepisy w tym względzie mogą się różnić, dlatego należy zasięgnąć porady eksperta. Na podstawie tych wymagań opracuj plan wynagrodzeń za dyżury domowe, który będzie konkurencyjny, uczciwy i będzie wzmacniał kulturę współodpowiedzialności.

Różne rodzaje planów wynagrodzeń za dyżury domowe

1. Dodatki motywacyjne za dyżury domowe

W planach wynagrodzeń za dyżury domowe wykorzystujących dodatkowe zachęty pracownicy zobowiązują się pełnić dyżury domowe w zamian za dodatkowe dni urlopu, elastyczne godziny pracy, wyższą pensję podstawową lub kombinację tych elementów.

Zaletą takiego podejścia do wynagrodzeń za dyżury domowe jest większe poczucie odpowiedzialności za usługi, co może przełożyć się na większą odporność systemów.

Zapewnienie dużej ilości czasu wolnego i konkurencyjnego wynagrodzenia daje pracownikom także poczucie, że ceni i docenia się ich pracę, co przyczynia się do ograniczenia wypalenia oraz rotacji pracowników.

2. Dyżury domowe płatne zgodnie z harmonogramem nadgodzin

Wypłacane wynagrodzenie za dyżur domowy oznacza, że pracownicy otrzymują bezpośrednie wynagrodzenie za czas spędzony na dyżurze domowym lub w gotowości do pracy, nawet jeśli w trakcie ich zmiany nie pojawią się żadne zgłoszenia.

Oczywistą zaletą tego modelu wynagrodzeń za dyżury domowe jest materialna zachęta. Jeśli wiesz, że płacą Ci za noszenie pagera (lub, co bardziej prawdopodobne, laptopa bądź telefonu komórkowego), łatwiej znosić ciężar pełnienia dyżuru domowego i zapewniania dostępności, nawet jeśli nie pojawiają się żadne zgłoszenia.

3. Dyżury domowe płatne według czasu spędzonego nad zgłoszeniami

Kolejne podejście do wynagrodzeń za dyżury domowe przewiduje zapłatę tylko za faktyczną pracę nad incydentem. Istnieje kilka sposobów naliczania takiego wynagrodzenia:

  • Kwota łączna za pełnienie dyżuru domowego.
  • Stawka godzinowa za czas poświęcony na pracę nad alertami/zgłoszeniami.
  • Stawka zależna od liczby obsłużonych alertów i zgłoszeń.

Zaletą tego modelu jest fakt, że pracownicy otrzymują wynagrodzenie za dodatkową pracę, jaką wykonują poza normalnymi godzinami pracy. Potencjalną wadą jest z kolei to, że ze względów finansowych niekorzystne jest zmniejszanie liczby alertów i zgłoszeń, co z kolei może wpływać niekorzystnie na ogólną integralność systemów.

4. Dyżury domowe płatne zgodnie z harmonogramem nadgodzin i według czasu spędzonego nad zgłoszeniami

Ta opcja jest połączeniem dwóch poprzednich modeli. Niektóre firmy płacą zarówno za dostępność wynikającą z harmonogramu dyżurów domowych, jak i dodatkową kwotę zależną od liczby odebranych alertów i obsłużonych zgłoszeń. Zaletą tego modelu wynagradzania za dyżury domowe jest poczucie pracowników, że są dobrze wynagradzani za dodatkowy czas i wysiłek, jakich wymaga od nich organizacja. Ponadto, jeśli komuś trafi się wyjątkowo trudne zgłoszenie, którego rozwiązanie będzie wymagało poświęcenia czasu prywatnego, pracownik otrzyma rekompensatę finansową także za to poświęcenie. Trzeba jednak raz jeszcze podkreślić, że musisz się zastanowić, czy wprowadzenie pośredniej nagrody za istnienie błędów w oprogramowaniu ma sens z perspektywy kultury w Twojej firmie.

Inne kwestie do rozważenia

Są to typowe modele planów wynagrodzeń za dyżury domowe. W stosownych przypadkach należy uwzględnić także inne kwestie, takie jak:

  • Liczba alertów otrzymanych w godzinach i poza godzinami pracy

Wartość ta ma krytyczne znaczenie dla ustalenia, czy potrzebujesz obsady harmonogramu dyżurów domowych po godzinach pracy czy raczej specjalnego zespołu pełniącego dyżur w godzinach pracy.

  • Czas spędzony na pracy nad incydentami

Incydenty występujące w Twojej organizacji mogą się różnić pod względem złożoności i poziomu istotności. Technik pełniący dyżur domowy może poświęcić na zgłoszenie kilka minut lub przez całą noc walczyć z incydentem. Powinno się zatem uwzględniać czas i wysiłek, jakie towarzyszą typowej zmianie w trakcie dyżuru domowego. Pomiar tych wartości jest konieczny do zapewnienia uczciwego wynagrodzenia.

  • Średni czas do potwierdzenia lub rozwiązania

Wprowadzony w zasadach eskalacji czas uzyskania potwierdzenia ma krytyczne znaczenie dla szybkiego rozwiązania. Regularny pomiar średniego czasu do potwierdzenia i rozwiązania pomoże kierownictwu podjąć decyzję dotyczącą dodatkowych form zachęty.

Wnioski

Odpowiednie narzędzia usprawniają poruszanie się po zasadach. Lepsze rozwiązania do zarządzania incydentami umożliwiają zarządzanie harmonogramami dyżurów domowych, monitorowanie alertów oraz dbałość o zdrowie i zadowolenie pracowników. Funkcje obsługi alertów w systemie Jira Service Management umożliwiają zespołom scentralizowanie i filtrowanie alertów ze wszystkich narzędzi do monitorowania, rejestrowania oraz CI/CD, zapewniając możliwość szybkiej reakcji bez zmęczenia alertami.