Close

Incidentmanagement voor razendsnelle teams

De voor- en nadelen van verschillende benaderingen van op afroep-beheer

De wereld is nu meer dan ooit afhankelijk van services. Een uitval kan miljoenen mensen treffen, met echte impact: ze kunnen hun rekeningen niet betalen, ze kunnen hun vluchten niet boeken, ze kunnen geen videogesprekken voeren met hun vrienden.

En of je nu een grote bug of capaciteitsproblemen hebt of helemaal offline bent, klanten die afhankelijk zijn van je services verwachten een onmiddellijke reactie. (Hetzelfde geldt voor interne teams.)

Incidenten kunnen een echte impact hebben, niet alleen wat geld betreft — ze kosten bedrijven alleen al in Noord-Amerika $ 700 miljard per jaar — maar ook op de reputatie van je bedrijf, je product en je team.

Omdat er zoveel op het spel staat, hebben teams IT- en ontwikkelingsteams op afroep gezet om ervoor te zorgen dat de organisatie de juiste mensen beschikbaar heeft om een probleem aan te pakken tijdens een incident, ongeacht wanneer er zich een voordoet.

Een eerlijk op afroep-rooster, gekoppeld aan een op afroep-compensatieplan, kan zelfs een cultuur van gedeelde verantwoordelijkheid bevorderen en je teams helpen meer te weten te komen over wat er nodig is om veerkrachtige software en services te maken, wat zorgt voor een beter totaalproduct en minder uitval.

Wat is op afroep?

Op afroep is de werkwijze om specifieke mensen aan te wijzen die op specifieke tijden beschikbaar zijn om te reageren in geval van een dringend serviceprobleem, ook al hebben ze geen formele dienst.

Op afroep is een cruciale verantwoordelijkheid binnen veel IT-, ontwikkelaars-, support- en operationele teams die services uitvoeren waarbij klanten 24/7 beschikbaarheid verwachten. Teamleden bemannen om de beurt een roulatie op afroep, waarbij ze 24 uur per dag of alleen buiten de normale kantooruren dekking bieden. Naast geautomatiseerde monitoring- en waarschuwingsoplossingen is de op afroep-engineer in staat om onmiddellijk te reageren op onderbrekingen in de beschikbaarheid van de service.

Het toenemende belang van 'op afroep' voor IT- en softwareteams

Soms krijgt op afroep-werk een slechte reputatie. Sommige ervaren IT-medewerkers hebben horrorverhalen over het werken in teams die te veel op hun bord kregen en niet de support kregen die ze nodig hadden om goed te reageren op incidenten.

Veel van die angst kan worden verlicht als de op afroep-ondersteuning goed wordt gedaan. Met een effectief op afroep-plan kun je ervoor zorgen dat je team kan schalen om te voldoen aan de groeiende services, een consistente dekking voor kritieke IT-functies en snelle incidentrespons.

Een goed op afroep-managementplan heeft meer voordelen dan alleen downtime doorstaan. Bij elke storing krijgen teams de kans om nieuwe vaardigheden te leren, zoals een kritische service een beetje beter begrijpen, zien hoe deze reageert op storingen en weten hoe ze moeten ontwerpen voor minder storingen of het incidentresponsplan kunnen verbeteren.

En het hebben van een goed op afroepprogramma dat is gebaseerd op een cultuur van gedeelde verantwoordelijkheid kan ook leiden tot verbeterde kameraadschap en minder burn-outs, wat op zijn beurt een hoger behoud van werknemers kan betekenen.

Voor- en nadelen van op afroep

In organisaties die DevOps gebruiken, nemen softwareteams veel verantwoordelijkheid voor de betrouwbaarheid en beschikbaarheid van de services die ze bouwen, een taak die vroeger het exclusieve domein was van operationele teams. Voor veel van deze teams is 'je bouwt het, je voert het uit' het nieuwe motto. Omdat ze het meest bekend zijn met de code, zijn ontwikkelaars vaak degenen die problemen het snelst kunnen oplossen.

En door dit proces bouwen ontwikkelaars betere software die eigenlijk minder snel zal falen. Met deze verschuiving in verantwoordelijkheid testen ze hun code strenger, omdat ze in feite degene kunnen zijn die buiten kantooruren wordt aangesproken als de service problemen heeft.

Het resultaat zijn veerkrachtigere systemen en, omdat er meer mensen beschikbaar en in staat zijn om incidenten aan te pakken, minder vermoeide werknemers.

Zonder een goed op afroep-programma kunnen organisaties niet alle culturele voordelen van DevOps realiseren of voldoen aan de eisen van een schaalbare infrastructuur. Als het ene team vaker op incidenten reageert dan het andere team, dan hebben ze waarschijnlijk niet de capaciteit om hun dagelijkse werkzaamheden uit te voeren. Ontwikkelaars kunnen de feedback die afkomstig is van incidenten niet implementeren en incidentresponders hebben niet de capaciteit om hun systemen te versterken.

Als de verantwoordelijkheden niet gelijk zijn, kunnen die mensen die gepland staan voor het op afroep-rooster nooit echt loskomen van het werk en kunnen ze gemakkelijk een burn-out krijgen.

Maar een plan dat rekening houdt met de werkelijke dekkingsvereisten van de organisatie, de tijdsdruk tussen de ontwikkelaars en IT-teams in evenwicht brengt en gegevens vastlegt voor continue verbetering, kan overal voordelen opleveren. Het zal niet alleen leiden tot een betere service voor klanten, het kan werknemers ook helpen hun vaardigheden en hun product te verbeteren. Misschien kijken ze er echt naar uit om op afroep-uren te werken.

Hoe je de rollen van op afroep-ontwikkelaars kunt verbeteren

"Ik kan niet wachten om tijdens mijn avond toezicht te houden op deze implementatie en te reageren op mogelijke uitval!”, zei geen enkele engineer, ooit.

Nu meer ontwikkelaars de rol op zich nemen om de services die ze bouwen te onderhouden, is het belangrijk om ervoor te zorgen dat ze voorbereid zijn op hun op afroep-verantwoordelijkheden, en de beste tijd om dit te beoordelen is tijdens het wervingsproces.

Nu is het geen geheim dat er intense concurrentie is voor technisch toptalent. En niet iedereen wordt alleen gemotiveerd door geld, dus het gooien van meer loon naar ontwikkelaars voor werk na sluitingstijd sluit de deal misschien niet (later meer over op afroep-compensatie). Software-engineers in het interviewproces hebben natuurlijk vragen over hoe vaak ze tijd uit hun persoonlijke leven moeten inleveren en op het op afroep-rooster moeten staan.

Door aan te tonen dat je een gedocumenteerd op afroep-plan hebt dat verantwoordelijkheden eerlijk verdeelt over een bekwaam team van ontwikkelaars, kunnen SRE's veel helpen om nieuwe werknemers gerust te stellen dat je organisatie het op afroep-beheer onder controle heeft. Met een gedocumenteerd plan kun je volledig transparant zijn in het interviewproces en ervoor zorgen dat kandidaten klaar zijn voor de toewijding aan op afroep-werkzaamheden.

Vijf eenvoudige manieren om op afroep vriendelijker voor ontwikkelaars te maken

  1. Definieer duidelijk de verantwoordelijkheden van op afroep
    Verantwoordelijkheden tijdens op afroepdiensten moeten duidelijk worden omschreven. Dit helpt burn-out, verwarring en frustratie te voorkomen. We raden je aan je incidentresponsproces en verwachtingen te documenteren over wat het betekent om op afroep te zijn.
  2. Zorg ervoor dat waarschuwingen aan de juiste persoon worden toegewezen
    Het effectief maken van je waarschuwingstools mag niet over het hoofd worden gezien. Door ervoor te zorgen dat je een duidelijke wijzigingsstroom hebt met de juiste meldingen en overschrijvingen, kun je veel moeilijkheden voorkomen.
  3. Primaire en secundaire respondenten hebben
    Het leven stopt niet alleen omdat iemand op afroep is. Net zoals een onverwachte persoonlijke noodsituatie een ontwikkelaar offline kan halen tijdens de werkdag, kan hetzelfde gebeuren wanneer ze op afroep zijn. Het inschakelen van een back-up beperkt de mogelijke schade door dit soort onderbrekingen.
  4. Verfijn je roosters
    Teams staan niet vast en je op afroep-rooster zou dat ook niet moeten zijn. We raden een cultuur waarbij je je op afroep-praktijken voortdurend herziet, aanpast en verbetert.
  5. Zorg ervoor dat ze toegang hebben tot en vertrouwd zijn met alle relevante diagnosetools
    Elk team varieert in de tools die ze gebruiken om de operationele status, applicatieprestaties, resourcegebruik, enz. te volgen. Zorg ervoor dat je op afroep-engineers bekend zijn met de gebruikte tools en er goede toegang tot hebben.

Op afroep voor IT-ondersteuning en servicerollen verbeteren

Het zijn niet alleen ontwikkelaars die meer tijd besteden aan op afroep. Voor IT-support en IT-serviceteams is 24 uur per dag ondersteuning steeds vaker van cruciaal belang om het bedrijf te helpen functioneren.

Deze teams staan voor veel van dezelfde uitdagingen als ontwikkelaars op afroep: stress, burn-out, onduidelijke rollen en verantwoordelijkheden, toegang tot tools.

IT-teams hebben vaak de extra stress dat ze zich vaak in hetzelfde gebouw bevinden als hun klanten, die de zaken kunnen vertragen met een stortvloed aan onderbrekingen (e-mail, Slack, zelfs persoonlijk) over het incident.

Hier volgen enkele tactieken om IT-incidenten beheersbaar te houden:

  • Snelle en transparante communicatie: proactief communiceren van IT-incidenten toont aan dat je om hen geeft — en dat je de controle hebt.
  • Blijf op de hoogte van wat telt: de meeste IT-serviceteams gebruiken een of andere vorm van servicedesksoftware. Het is van cruciaal belang dat je niet alleen velden voor gegevensinvoer in vrije vorm gebruikt om de details van elk ticket vast te leggen.
  • Zet een monitoringsysteem op: historisch gezien houden veel IT Ops-teams persoonlijk prestatiedashboards bij om uitval in de gaten te houden. Doe het team een plezier en laat monitoring- en waarschuwingstools dit afhandelen.

Op afroep-compensatie

Een goed op afroep-compensatieplan beloont je werknemers voor hun expertise en tijd die ze buiten kantooruren besteden. Als werknemers zich goed verzorgd voelen, zullen ze op hun beurt om het bedrijf geven en bijdragen aan het succes ervan.

Volgens de Amerikaanse Fair Labor Standard Act (FLSA), een federale wet die minimumloon-, overuren- en minimumleeftijdsvereisten vaststelt voor werkgevers en werknemers, als een werknemer op afroep is maar vrij is om te doen wat hij wil met zijn tijd, worden ze beschouwd als 'wachten op betrokkenheid' en werken ze daarom niet.

Als iemands vrije tijd beperkt wordt en hij niet kan doen wat hij wil tijdens zijn vrije uren, kan deze op afroep-tijd volgens de FSLA worden beschouwd als 'gewerkte uren' en in aanmerking komen voor compensatie.

Je lokale wetgeving kan variëren, dus zorg ervoor dat je een expert raadpleegt. Streef van daaruit naar een op afroep-compensatieplan dat concurrerend en eerlijk is en een cultuur van gedeelde verantwoordelijkheid ondersteunt.

Verschillende soorten op afroep-compensatieplannen

1. Op afroep gestimuleerd

Gestimuleerde op afroep-compensatieplannen belonen werknemers die op afroep-uren werken in ruil voor extra vrije dagen, flexibele uren, hogere basissalarissen of een combinatie van deze dingen.

Het voordeel van deze benadering van op afroep-compensatie is een groter gevoel van eigenaarschap over de services, wat kan leiden tot veerkrachtigere systemen.

En door voldoende vrije tijd te geven en competitief te betalen, weten werknemers ook dat hun werk gewaardeerd en op prijs gesteld wordt, waardoor een burn-out wordt voorkomen en de personeelsverloop wordt verminderd.

2. Betaald op afroep voor geplande overuren

Betaalde op afroep-compensatie betekent dat werknemers rechtstreeks worden gecompenseerd voor de tijd die ze op afroep doorbrengen of gepland staan om te werken, zelfs als er zich tijdens hun dienst geen problemen voordoen.

Het voor de hand liggende voordeel van dit model van op afroep-compensatie is de tastbare incentive. Weten dat je wordt betaald voor het dragen van een pieper (of, waarschijnlijker, een laptop en een mobiele telefoon), maakt het gemakkelijker om de last van op afroep en beschikbaar zijn te rechtvaardigen, zelfs als er zich geen problemen voordoen.

3. Betaald op afroep voor de tijd die aan de problemen werd besteed

Een andere benadering tot het op afroep-compensatiemodel is het alleen betalen van werknemers als ze aan een incident werken. Enkele manieren om dit te berekenen zijn:

  • Totaalbedrag betaald voor werken op afroep
  • Uurtarief voor tijd besteed aan het werken aan waarschuwingen/problemen
  • Tarief voor het aantal uitgevoerde waarschuwingen en problemen

Het voordeel van dit model is dat werknemers worden betaald voor het extra werk dat ze buiten de normale kantooruren verrichten. Een mogelijk nadeel is dat er een financiële ontmoediging is om waarschuwingen en problemen te verminderen, wat de algehele integriteit van de systemen in gevaar zou kunnen brengen.

4. Betaald op afroep voor geplande overuren en tijd besteed aan de problemen

Dit is een combinatie van de twee vorige modellen. Sommige bedrijven betalen zowel voor het volgen van het op afroep-rooster als een extra bedrag voor ontvangen waarschuwingen en problemen waaraan zijn gewerkt. Het voordeel van dit op afroep-compensatiemodel is dat werknemers zich goed gecompenseerd voelen voor de extra tijd en moeite die de organisatie van hen vraagt. Als iemand bovendien vastloopt met een bijzonder moeilijk probleem dat de persoonlijke tijd opeet, worden ze financieel gecompenseerd voor de opoffering. Maar nogmaals, overweeg of het in je bedrijfscultuur zinvol is om een indirecte beloning te creëren voor bugs in de software.

Andere dingen om te overwegen

Dit zijn de gebruikelijke modellen voor op afroep-compensatieplannen. Enkele andere dingen die je moet overwegen, indien van toepassing, zijn:

  • Aantal waarschuwingen ontvangen op en buiten kantooruren

Dit nummer is van cruciaal belang om te bepalen of je een op afroep-rooster nodig hebt na kantooruren, of een speciaal op afroep-team tijdens de kantooruren.

  • Tijd besteed aan de incidenten

De complexiteit en het belang van incidenten in je organisatie kan variëren. Een op afroep-engineer kan een paar minuten besteden aan een probleem of kan de hele nacht besteden aan het oplossen van een incident. Er moet rekening worden gehouden met de hoeveelheid tijd en moeite die in een doorsnee op afroep-dienst wordt gestoken. Dit moet worden gemeten voor een eerlijke compensatie.

  • Gemiddelde tijd om te erkennen of op te lossen

Door het escalatiebeleid is het erkenningsproces cruciaal voor een snelle oplossing. Het meten van de gemiddelde tijd om te erkennen en de gemiddelde oplossingstijd gedurende een bepaalde periode helpt managers om te beslissen over aanvullende incentives.

Conclusie

Met de juiste tools kan het navigeren door op afroep-beleid een soepeler proces zijn. Het beheren van op afroep-roosters, het bewaken van waarschuwingen en het handhaven van de tevredenheid en gezondheid van werknemers is mogelijk met betere oplossingen voor incidentmanagement. Met de waarschuwingsmogelijkheden van Jira Service Management kunnen teams waarschuwingen centraliseren en filteren in alle monitoring-, logging- en CI/CD-tools om een snelle reactie te garanderen en tegelijkertijd waarschuwingsmoeheid te voorkomen.