ベロシティの高いチームのためのインシデント管理
トピック一覧
インシデント管理とは
インシデント管理は、DevOps および IT 運用チームが予期せぬイベントまたはサービス中断に対応し、サービスを運用状態に戻すために使用するプロセスです。
Atlassian では、インシデントをサービスの中断や質の低下を引き起こす、緊急対応が必要なイベントとして定義しています。ITIL または ITSM の実施基準に従うチームでは、「メジャー インシデント」という用語を使用することがあります。

インシデント管理ハンドブックを印刷版または PDF でご利用ください
インシデント管理ハンドブックの印刷版は、数量限定で無料配布しています。または、PDF 版をダウンロードしてください。
インシデントが解決済みとなるのは、影響を受けたサービスが意図された状態で稼働を再開したときです。これには、影響の軽減と機能の復元に必要なタスクのみが含まれます。
これらのタイプのインシデントは重大度の幅が広く、グローバルな Web サービス全体のクラッシュからごく少数のユーザーにおける断続的なエラーの発生まで広範囲にわたります。
インシデント管理のトピック
注目のチュートリアル
Atlassian が重大なインシデントをどのように処理するかご覧になりたいですか? 当社が発表した社内インシデント管理ハンドブックをご確認ください。このハンドブックから学び、自社に適応して、ぜひご活用ください。
Opsgenie を使用したオンコール スケジュールの設定
このチュートリアルでは、オンコール スケジュールの設定、オーバーライド ルールの適用、オンコール通知の設定などの方法を学習します。すべて Opsgenie 内で行います。
このチュートリアルを読む