Close
Bitly + Atlassian

Bitly Chooses Opsgenie to Scale Business Operations


bitly logo
Industry

Technologia

Locations

Nowy Jork

Number of Users

10

Share Page

Jeśli kiedykolwiek zdarzyło Ci się zarządzać infrastrukturą tylko w oparciu o powiadomienia SNS, bez rozwiązania pośredniczącego, z pewnością znasz potworne uczucie towarzyszące zalewowi alertów. Kyle Moschetto, dyrektor ds. DevOps i bezpieczeństwa w Bitly również zna ten ból. Założona w 2008 roku firma Bitly jest platformą do zarządzania łączami. Bitly, znane ze skracania i śledzenia łączy, zapewnia swoim klientom więcej możliwości w dobie marketingu cyfrowego. W 2016 roku Kyle dołączył do Bitly, aby zmodernizować infrastrukturę firmy i usprawnić jej działalność operacyjną. Utrzymywanie ponad 150 mikrousług rozproszonych wśród 3 różnych dostawców usług chmury 24/7 w oparciu jedynie o powiadomienia SNS na telefonie komórkowym było chaotyczne, niezgrabne i skomplikowane.

Jako nowy dyrektor dołączający do Bitly, Kyle musiał szybko znaleźć najlepsze rozwiązanie i zaprezentować uzasadnienie biznesowe dyrektorowi technologicznemu. Mając za sobą bogate doświadczenie w ITOps, DevOps, tworzeniu sieci i bezpieczeństwie, miał on okazję wypróbować różne rozwiązania na dotychczasowych stanowiskach. „Miałem styczność z PagerDuty — znałem ten ból. Narzędzie Opsgenie od razu wyróżniło się spośród innych. Było nowoczesne, aplikacja mobilna wydawała się prosta w użyciu, wywołania API były dobre, a do tego dostępna była integracja z usługą Slack”.W trakcie weryfikacji koncepcji Kyle i jego zespół szybko ustalili, że Opsgenie będzie dobrym rozwiązaniem. Kyle wyznaczył nawet młodszego inżyniera, który miał zająć się wdrożeniem Opsgenie, na okres zaledwie 6 miesięcy, ponieważ uznał, że będzie to proste.

„Kiedy ktoś chciał przejąć dyżur domowy, musiał wziąć laptopa i wykonać wywołanie API do AWS w celu powiadomienia systemu, aby ten wysyłał SMS-y na właściwy numer, o czym ludzie często zapominali, a później okazywało się, że powiadomienia zastawały w kinie kogoś, kto nawet nie był na dyżurze” — mówi Kyle, opowiadając o systemie stosowanym przed Opsgenie.

„Nie trzeba było geniusza, żeby zauważyć, że wprowadzenie Opsgenie było dla zespołu niczym słona woda dla pustynnego wędrowca, która następnie zamieniła się w upragnione źródło krystalicznie czystej wody pitnej”.

Z czasem zespół pełniący dyżury domowe rozrósł się i dołączyło do niego więcej członków zespołów back-endowych i front-endowych, a także inni właściciele usług. Jakość dyżurów domowych znacznie się poprawiła, a zespół nie musiał już wysyłać ręcznych wywołań API do AWS oraz różnych narzędzi, aby wiadomo było, na jaki numer przesyłać powiadomienia.

„Ten produkt zdecydowanie wyszedł z rąk osoby, która spędziła wiele lat, pełniąc dyżury domowe, i widać to wyraźnie każdego dnia, gdy się z niego korzysta. W 2-letnim okresie, w którym używamy Opsgenie, nie mieliśmy jeszcze żadnych awarii”.

Z DevOps jest trochę jak z hydrauliką — gdy instalacja działa, nikogo to nie obchodzi. Ale gdy coś się zepsuje i syf spływa po podłodze, staje się najważniejszą rzeczą na świecie. Po prostu potrzebujesz rozwiązania, które działa — a Opsgenie działa.

Kyle Moschetto

Dyrektor ds. DevOps i bezpieczeństwa, Bitly

„Oprócz konsolidacji alertów i ułatwienia zarządzania dyżurami domowymi, Opsgenie doskonale sprawdza się w monitorowaniu platformy Cloud i infrastruktury hybrydowej. Dzięki Opsgenie Heartbeats Bitly może wykorzystywać rozwiązanie Opsgenie do zapewniania sprawności systemów powiadamiania, przy jednoczesnym monitorowaniu swojej infrastruktury chmurowej. Jeśli masz więcej niż jedno środowisko, nie możesz sobie pozwolić na żadną lukę w systemie powiadamiania. Opsgenie odkrywa krytyczną rolę w naszym globalnym rozwiązaniu do monitorowania i przywracania po awariach obsługującym nasze wielochmurowe środowisko”.

Kyle nie tylko jest wielkim fanem samego produktu. Podkreśla również silnie ukierunkowane na klienta podejście Opsgenie do prowadzenia działalności. „Miałem do czynienia z zespołem Opsgenie jedynie trzy razy: 1. Podczas wdrażania — było świetnie, 2. Podczas negocjowania umowy — również było wspaniale i 3. Podczas omawiania potrzebnej nam funkcji raportowania — tutaj również było super”.

Obecnie Kyle sprawdza możliwość generowania niektórych raportów w Opsgenie, aby ustalić źródła częstych alertów, co pomogłoby zespołowi ustalić elementy, które mogą wymagać uaktualnienia lub przebudowania w przyszłości. Ma również nadzieje, że uda mu się wykorzystać wbudowany raport na temat dyżurów domowych, aby uzmysłowić innym, jak wiele pracy realizuje jego zespół. „Mamy mocny zespół, który zawsze czuwa i reaguje naprawdę szybko, a bez udostępnienia tych statystyk w firmie, bardzo łatwo przyjąć to za pewnik”.

Start your free 14-day trial of Opsgenie today

Kent State logo

Trudności związane z alertami, które nie przekładały się na działania praktyczne, oraz zbyt dużą liczbą powiadomień uświadomiły nam potrzebę wdrożenia narzędzia, które umożliwiłoby konsolidację informacji, nadanie im autentycznego znaczenia oraz zareagowanie na incydenty.

looker logo

Firma Looker powierzyła Opsgenie dostarczanie jej usług 200 000 użytkowników każdego dnia