Bitly + Atlassian

Bitly wählt Opsgenie zur Skalierung seines Geschäftsbetriebs


Bitly-Logo
Branche

Technologie

Standorte

New York, NY

Anzahl an Benutzern

10

Seite teilen

Wenn du dich schon einmal nur auf SNS-Benachrichtigungen verlassen hast, um eine Infrastruktur ohne eine dazwischengeschaltete Lösung zu verwalten, weißt du, wie es ist, von Warnmeldungen überschwemmt zu werden. Kyle Moschetto, Director of DevOps & Security bei Bitly, kannte dieses Problem nur zu gut. Bitly, 2008 gegründet, ist eine Link-Management-Plattform, die Links kürzt und verfolgt und ihre Kunden im Zeitalter des digitalen Marketings unterstützt. Im Jahr 2016 stieg Kyle bei Bitly ein, um die Infrastruktur zu modernisieren und den Betrieb zu optimieren. Es war umständlich, unübersichtlich und kompliziert, über 150 Microservices bei drei verschiedenen Cloud-Anbietern, die rund um die Uhr arbeiten, nur über mobile SNS-Benachrichtigungen zu verwalten. 

Als neuer Geschäftsführer bei Bitly musste Kyle schnell die optimale Lösung finden und dem CTO den Business Case vorlegen. Aufgrund seiner umfangreichen Erfahrungen in den Bereichen ITOps, DevOps, Netzwerke und Sicherheit hatte er in seinen früheren Jobs Gelegenheit, verschiedene Lösungen auszuprobieren. "Ich kannte PagerDuty und wusste, welche Probleme damit verbunden waren. Opsgenie stach sofort heraus. Es war modern, die mobile App wirkte benutzerfreundlich, die API-Aufrufe waren gut und es verfügte über eine Slack-Integration." Während des Proof of Concept entschieden sich Kyle und sein Team schnell für Opsgenie und er beauftragte sogar einen Junior Engineer mit erst sechs Monaten Berufserfahrung mit dem Wechsel zu Opsgenie, da er davon ausging, dass das sehr einfach werden würde. 

"Wenn man eine Bereitschaftsperson kontaktieren wollte, musste man über seinen Laptop einen API-Aufruf an AWS durchführen, damit an die entsprechende Nummer eine Nachricht gesendet wurde. Allerdings wurde das oft vergessen und dann sendet man eine Paging-Nachricht an jemand, der gerade im Kino sitzt und nicht einmal Bereitschaftsdienst hat", sagt Kyle über das System, das vor Opsgenie eingesetzt wurde. 

"Für das Team waren die Vorteile von Opsgenie sofort offensichtlich: Wie wenn man Hungernden in der Wüste Salzstangen gibt und diese Salzstangen dann in ein saftiges Steak verwandelt werden."

Im Laufe der Zeit vergrößerte sich das Bereitschaftsteam, und es kamen mehr Mitarbeiter im Backend und Frontend sowie andere Servicezuständige hinzu. Das Bereitschaftsmanagement wurde deutlich besser und das Team musste keine manuellen API-Aufrufe an AWS und verschiedene Tools mehr durchführen, um zu wissen, an wen Paging-Nachrichten gesendet werden sollen.

"Dieses Produkt wurde definitiv von jemandem entwickelt, der viele Jahre Bereitschaftsdienst geleistet hat. Das wird uns jedes Mal klar, wenn wir es verwenden. In den zwei Jahren, die wir Opsgenie nun nutzen, ist es noch zu keinen Ausfällen gekommen." 

Mit DevOps ist es wie mit sanitären Anlagen: Wenn die Leitungen frei sind, schert sich niemand darum. Wenn sie aber verstopft sind und sich das Abwasser über den Boden verteilt, ist das das Wichtigste auf der Welt. Man braucht nur eine Lösung, die funktioniert, und Opsgenie funktioniert einfach.

Kyle Moschetto

Director of DevOps & Security, Bitly

"Neben der Konsolidierung von Warnmeldungen und dem leichteren Bereitschaftsmanagement eignet sich Opsgenie auch ideal für die Überwachung von Cloud- und Hybrid-Infrastrukturen. Durch die Verwendung von Opsgenie Heartbeats kann Bitly mit Opsgenie sicherstellen, dass die Warnsysteme funktionieren, und gleichzeitig die Cloud-Infrastruktur überwachen. Wenn man mehr als eine Umgebung hat, kann man sich keinen einzigen Ausfall des Warnmeldungssystems leisten. Opsgenie ist für unsere globale Disaster-Recovery- und Überwachungslösung in unserer Multi-Cloud-Umgebung von entscheidender Bedeutung."

Kyle ist nicht nur ein großer Fan des Produkts, sondern schätzt auch den ausgeprägten kundenorientierten Ansatz von Opsgenie. "Ich hatte bislang nur dreimal Kontakt mit dem Team von Opsgenie: beim Onboarding, bei der Vertragsverhandlung und um einige Berichtsfunktionen zu besprechen, die wir benötigten. Alle drei Kontakte verliefen absolut zufriedenstellend." 

Derzeit prüft Kyle die Erstellung einiger Berichte in Opsgenie, um störende Warnmeldungsquellen zu ermitteln. Dies soll dem Team bei der Entscheidung helfen, was in Zukunft möglicherweise nachgerüstet oder überarbeitet werden muss. Er hofft auch, den integrierten Bereitschaftsbericht nutzen zu können, um dem Team die ihm gebührende Anerkennung zu verschaffen.  "Wir haben ein starkes Team, das immer im Einsatz ist und wirklich schnell reagiert. Wenn wir diese Statistiken nicht an das Unternehmen kommunizieren, wird dieser Einsatz sehr schnell als selbstverständlich angesehen."

Starte noch heute deine 14-tägige Testversion von Opsgenie

Kent State-Logo

Warnmeldungen waren wenig aussagekräftig und es gab einfach zu viele Benachrichtigungen. Das Unternehmen benötigte ein Tool, das die Informationen bündelt, sie verständlich macht und eine Incident Response ermöglicht.

Logo von Looker

Looker stellt seine Services jeden Tag mehr als 200.000 Benutzern zur Verfügung und vertraut dabei auf Opsgenie.