インシデント管理改善への道はここから始まります
トピック一覧
オンコール管理に対するさまざまなアプローチの長所と短所
世界はかつてないほど常時稼働サービスに依存しています。稼働停止は何百万人もの人々に影響を与える可能性があります。請求書の支払いができなくなる、航空券を予約できなくなる、友人とビデオ通話ができなくなるなどの実害が生じます。
また、重大なバグがある、容量の課題がある、またはシステムが完全にダウンしているとしても、サービスに依存している顧客からは即時の対応が期待されます (これは社内チームの場合も同様です)。
インシデントは実際に、金銭面 (北米の企業だけで年間 7,000 億ドルのコストがかかっています) だけでなく、会社、製品、チームの評判にも影響を及ぼします。
非常に多くの問題を抱えているチームは、IT チームと開発者チームにオンコール業務を担当させるようになりました。これによって組織は、インシデントがいつ発生したとしても問題に対処できる適切な人材を確保できるようになります。
公平なオンコール スケジュールとオンコール報酬計画を組み合わせることで、共同責任の文化を育んで、チームが耐障害性に優れたソフトウェアやサービスの構築に必要なものについて詳しく学べるため、製品全体の改善やシステムの停止回数の減少に役立ちます。
Opsgenie を使用したオンコール スケジュールの設定
このチュートリアルでは、オンコール スケジュールの設定、オーバーライド ルールの適用、オンコール通知の設定などの方法を学習します。すべて Opsgenie 内で行います。
このチュートリアルを読むインシデント コミュニケーションのベスト プラクティス
インシデント コミュニケーションとは、サービスに何らかの停止またはパフォーマンスの低下が発生していることをユーザーに警告するプロセスです。
この記事を読む