Close
Imagine Learning + アトラシアン

Imagine Learning が Opsgenie によってノイズを低減し、アラートによる疲弊を軽減


Imagine Learning のロゴ
業界

EdTech

場所

ユタ州プロボ

ユーザー数

241 人

Marketplace アプリ
ページを共有

Imagine Learning は 2004 年に設立された EdTech の会社です。従来の教育が効果的ではない学生向けにサービスを提供しています。このソフトウェアは、読み書きや数学に苦労する可能性のある幼稚園入学前から高校までの年齢の学生向けに設計されています。学校では、学習が困難な生徒に応じてソフトウェアを購入し、学習で成功を収められるように支援します。

アラートによる疲弊のデメリット

Keith Smith 氏は DevOps 分野に長年携わった後、サイト信頼性エンジニア主任として Imagine Learning に入社しました。Smith 氏は、Opsgenie などのさまざまなインシデント監視ツールに精通していました。Imagine Learning には多くのツールが導入されていましたが、統合と効果的なアラート機能はありませんでした。

「(当時) オンコール チームはアラート メッセージをメールでしか受け取っていませんでした。これはひどい状況で、ノイズが相当ありました。私は毎晩午前 1 時に起きて、電話を確認してベッドに戻っていました。そこで、もっと良い方法があると提示しました」

すべてのノイズによって、アラートの意味がなくなり、実用的ではありませんでした。このプロセスは完全にリアクティブで、チームにはインシデント時に効率的にコミュニケーションを取る手段がありませんでした。

「サポートの問い合わせ件数が増加すると、問題が提示され、サポート担当者がその問題をエスカレーションしていました。しかし、それが唯一の一連のコミュニケーションでした。お客様から問題が発生したと伝えられたに、修正していました」

ビジネス ケースを作成

Keith Smith 氏は、Opsgenie のようなツールを実装する必要があるとわかっていましたが、上級管理職向けのビジネス ケースを策定する必要がありました。これは結果的に、予想したよりも簡単でした。

「仕事に就いて 2 週間後、アラートを設定して指標を確認していた際に、当社のシステムが 24 時間停止していたことに気付きました。思いもよりませんでした!」問題はかなり迅速に修正されましたが、24 時間の停止は回避できたものでした。

また、Smith 氏は基本的に単一障害点にもなっていました。米国、インド、アルゼンチンに 500 人以上の従業員が散在する企業にとって、これでは拡張可能でも持続可能でもありませんでした。

Opsgenie を採用してから 3 か月以内に、インシデントの数を 900% 削減しました。

Keith Smith 氏

サイト信頼性エンジニア主任

会社が成功するために必要なインフラストラクチャを維持するには、統合とコミュニケーションの改善が重要でした。

「私が休暇を取ったらどうなるか、アラートが 2 日間送信されたらどうなるか。上司のところに行き、説明しました。これは持続可能ではなく、問題や、引き合いに出した原因 [24 時間の停止を含む] が発生することになるでしょう、と」

主にメールでのアラートを使用している困難なオンコール スケジュール、問題へのリアクティブなアプローチ、最新のインシデント管理プラットフォームのニーズをバックアップするための指標の間でケースを作成し、Imagine Learning は Opsgenie を利用して前進しました。

信頼性の高いアラート機能

ノイズを低減するには、20 を超えるツールとアプリケーションを利用して Opsgenie の機能を管理し、その IT スタックと統合することが重要でした。

「ソースを OG に接続するたびに、Webhook だけでも、パスがあります」

Slack と Jira との緊密な統合によって、Imagine Learning のプロセスは自動化されました。Opsgenie では、ステータス ページが更新され、Jira チケットが作成され、Slack 通知が送信されて、適切なタイミングで適切な担当者に通知できます。

「今では、毎年重大インシデントが 1 件起こっていて、それが楽しくなってきました。夜に就寝できるようになりましたし、他のプロジェクトに取り組む時間もできました」

Keith Smith 氏

サイト信頼性エンジニア主任

「MTTR の短縮を上回る、最大の成功はコミュニケーションの向上です。インシデントが発生すると直ちに、お客様と全国 (および世界) の当社オフィスにいる 500 人の従業員に状況を伝えることができます」

Opsgenie 導入後の安心感

オンコール スケジュールを共有し、必要な時にのみ通知されるようになり、Keith Smith 氏は業務を多様化して、応答時間を 24 ~ 36 時間からわずか 15 分以内に短縮することができました。

Opsgenie により、Smith 氏は効率的なインシデント管理とオンコール プロセスを作成して、MTTR を短縮し、チームの生活の質も向上させることができました。ソフトウェア製品を提供する企業にとって、課題を迅速に解決することは不可欠です。Opsgenie を使用してから 3 か月以内に、インシデント件数は 900% 減少しました。

「今では、毎年重大インシデントが 1 件起こり、それが楽しくなってきました。夜に就寝できるようになりましたし、他のプロジェクトに取り組む時間もできました」

Opsgenie の 14 日間無料トライアルを今すぐ開始しましょう

tecRacer ロゴ

Opsgenie でクラウドフォーカスのビジネスを実現

EBSCO のロゴ

アジャイル インシデント管理を通じて常時稼働サービスを提供します