Opsgenie のアラート機能とオンコール機能が、Jira Service Management と Compass で利用できるようになりました。当社の自動移行ツールを使用して、2027 年 4 月 5 日までに既存の Opsgenie のデータと構成を移行してください。詳細を見る

IT 運用のインシデント管理を最適化する

停止は収益に影響します。

無料で入手する

ダウンタイムは、多くの場合、収益の損失だけでなく、風評被害、コンプライアンスおよび規制上の罰則、顧客離れ、および IT の専門家が他のプロジェクトからインシデント解決に振り向けられることによる運用コストと遅延の増加につながります。

無料の ITSM ランブックテンプレートを使用する

実際、IHS のあるレポートでは、北米の組織のダウンタイムコストは年間 7 千億ドルを超えて、そのコストの 78% は従業員の生産性の低下によるものだとされています。

IT ダウンタイムを示す 9 ページの図では、従業員の生産性が圧倒的に最大のコストであることが強調されています。北米企業の IT ダウンタイムは、主に従業員の生産性の低下が原因で年間 7,000 億ドルの費用に繋がっています。

このような数字により、収益の損失がインシデント管理の唯一の優先事項ではなく、最も重要な要素ですらないことが明らかになります。また、最適化されたインシデント管理プロセスでは、インシデント管理の背景にある人、プロセス、テクノロジーが抱える非常に現実的で、コストがかかる課題に対処する必要があります。

膨大な量のアラート/インシデント

多くの IT 運用部門では、大量の問題に対処するためにアラートをメールボックスに注ぎ込みます。しかしこれによって状況はさらに悪化して、インシデントの優先順位付けと重要なメッセージのエスカレーションを担当するシニアレベルのスタッフによる年中無休の監視を必要とする状況に陥ります。

この終わることのないアラートの波に圧倒されそうになると、アラートによる疲弊、燃え尽き症候群、仕事への不満、不安、より長い応答時間を招きます。これは職場における従業員の福利と生産性の両方に影響して、ビジネスの収益に直接影響します。

運用コストの増加

インフラストラクチャコストは減少しましたが、運用コストは増加しました。システム全体を制御しない場合は、課題のデバッグが複雑になることがその原因の 1 つとなっています。

間違った成功指標の測定

サービスデスク運用の成功は多くの場合は、コールスループットや平均コール時間などの指標を使用して測定されています。これらの指標は、インシデント管理の有効性に寄与するものでもなければ直接測定するものでもありません。

MTTR や MTBF のような有用な指標ですら、インシデント管理パフォーマンスの向上には不十分です。課題の特定に役立つものですが、インシデントの発生理由と解決方法、それらの指標を改善する方法について、より明確で定性的な疑問に答えられません。

旧態依然としたインシデント対応チームの構造

10 年前までは、IT インシデントへの対応は運用チームの主な仕事でした。組織は通常、顧客や監視ツールによって報告された課題に対応するために、階層化されたチーム構造 (レベル 1、レベル 2、レベル 3) を実装していました。

当時のインシデント管理の目標は、現在と同様、サービスレベルを維持しながら運用コストを最小化することでした。そのため、レベル 1 の対応者は、通常、低コストのエントリレベルの従業員でした。このレベルでインシデントを解決できなかった場合は、レベル 2 (通常はより経験豊富な中級プロフェッショナル) にエスカレーションされていました。このエスカレーションプロセスは、課題が解決するまで続きます。

このプロセスでは、コスト削減を優先してアジリティを犠牲にしています。エントリレベルの従業員がインシデントを開始して、複数のレベルのエスカレーションを必要とするチームでは、対応時間が長くなることで、インシデント解決のタイムラインに即座に影響が出る可能性があります。これによって顧客のフラストレーションがソーシャルメディアチャンネル全体で広がるため、企業の評判に直接影響します。

さらに、企業は従業員の生産性に対してインシデント管理費用の 78% を失うため、エスカレーションモデルによって実際には企業のコストを節約できないことは明らかです。ソフトウェアを構築した人が 15 分でバグを修正できるにもかかわらず、エントリレベルの人が 2 時間を費やしてエスカレーションする必要があるなら、それは効率的なシステムではありません。

常時稼働サービスの世界では、アジリティがかつてないほど重要になっています。平均対応時間や平均解決時間などの指標の重要性が高まっているのは、企業がコストを最小化するにはアジリティを最大化する必要があるためです。

IT インシデント管理プロセスを最適化する方法

現在の新しいビジネスの現実を反映したプロセス、チーム構造、プラクティスによって、インシデント管理の取り組みを見直すべきであることは明らかです。しかし、その見直しプロセスはどのようなものでしょうか?

アラートの優先順位付けと統合

アラート疲労の主な原因であり、そして生産性の低下に繋がる主な要因は、無意味で実行不可能な大量のアラートです。最も簡単な解決方法は何でしょうか? 重要なシステムを特定して冗長な通知の重複をなくし、アラートの明確な優先順位付け階層を作成することです。

チームに適したオンコールスケジュールの作成

アラートによる疲弊、燃え尽き症候群、非効率性の回避は、チームにとって有用なオンコールスケジュールの作成も意味します。このことは、1 人またはチームへの過剰な負担の回避、必要に応じたバックアップサポートの提供、スケジュールの有効性の定期的な再評価を意味します。

できる場所を自動化

重要なレポートを特定してエスカレーションするために数十件のレポートを手動で分類すると、確実に集中力を失います。良い点は、これはもはやチームメンバーが手動で行う必要はないということです。自動化によってタスクリストから削除することで、生産性の低下やアラートによる疲弊を回避できます。

アラートルーティング、通知、重複除外、メッセージワークフロー、会議ブリッジの作成、ステータスページの更新、オンコールスケジューリング、エスカレーションプロセス、KPI 追跡も全体的または部分的に自動化できるため、チームの時間を節約して反復的なタスクにおける人的ミスを削減できます。自動化によって長期的に会社の費用を節約できるのは言うまでもありません。

チャンネルや関係者の間で効果的にコミュニケーションを取る

多くの場合、インシデントは社内外のさまざまな関係者に影響を与えるため、それらの関係者に通知する必要があります。研究によって、ビジネス関係者の 87% が、インシデントに関する更新情報の提供を求めていること (また、56% がインシデント自体よりもコミュニケーション不足にフラストレーションを感じていること) がわかっています。そして、顧客は間違いなく同じように感じています。

常時稼働が期待される場合、しっかりとしたインシデントコミュニケーション計画を立てることは、最適化のパズルの重要なピースです。

適切な使用を簡単に追跡できるようにする

成功指標を追跡して確認することが簡単になるほど、チームはそれを達成できる可能性が高くなります。可能な場合はレポートを自動化して、チームにとって重要な指標とその理由を前もって明確にします。

非難なき事後分析を実施する

アプリまたはデータベースがオンラインに戻っただけでは、インシデントは終わりません。インシデントを防止して将来のインシデントに費やす時間を短縮し、プロセス、チーム、ポリシーがインシデント管理にどのような影響を与えているかをより深く理解するには、事後分析を行う必要があります。

Atlassian では、事後分析において誰も責めることはありません。つまり、パフォーマンスを改善して前進することに焦点を当てています。

プロセスとニーズをサポートするテクノロジーを選択する

自動化。アラートの優先順位付け。オンコールスケジューリング。KPI トラッキング。効果的にするには、これらの必須プロセスにはそれぞれをサポートするテクノロジーが必要です。テクノロジーを選択する前に、目標、プロセス、チームのニーズを理解しておく必要があります。アラートを自動で整理、重複除外、優先順位付けするには、それらの機能を備えたソリューションが必要です。つまり、Jira Service Management などのソリューションです。

Jira Service Management を無料でお試しください

推奨

チュートリアル

Statuspage でインシデントコミュニケーションを学ぶ

このチュートリアルでは、システム停止時にインシデントテンプレートを使用して効果的にコミュニケーションを取る方法について説明します。さまざまなサービス中断に適応可能です。

このチュートリアルを読む

インシデントコミュニケーションのテンプレートと例

インシデントに対応する場合、コミュニケーションテンプレートが極めて有用です。Atlassian のチームが使用しているテンプレートと、一般的なインシデントに関するさまざまな例をご確認ください。

この記事を読む

インシデント管理についてもっと学ぶ

その他のインシデント管理ガイドとリソースについては、このハブをご確認ください。

詳細を見る

おすすめのアプリ

Jira

Confluence

Jira Service Management

ユース ケース別

チーム別

サイズ別

業界別