ベロシティの高いチームのためのインシデント管理
インシデント管理とは
Incident management is the process used by development and IT Operations teams to respond to an unplanned event or service interruption and restore the service to its operational state.
Atlassian では、インシデントをサービスの中断や質の低下を引き起こす、緊急対応が必要なイベントとして定義しています。ITIL または ITSM の実施基準に従うチームでは、「メジャー インシデント」という用語を使用することがあります。

Get our Incident Management Handbook
Download the PDF to learn tips and best practices from Atlassian’s incident management experts.
Incidents are events of any kind that disrupt or reduce the quality of service (or threaten to do so). A business application going down is an incident. A crawling-but-not-yet-dead web server can be an incident, too. It’s running slowly and interfering with productivity. Worse yet, it poses the even-greater risk of complete failure. Incidents can vary widely in severity, ranging from an entire global web service crashing to a small number of users having intermittent errors.
インシデントが解決済みとなるのは、影響を受けたサービスが意図された状態で稼働を再開したときです。これには、影響の軽減と機能の復元に必要なタスクのみが含まれます。
インシデント管理のトピック
注目のチュートリアル
Atlassian が重大なインシデントをどのように処理するかご覧になりたいですか? 当社が発表した社内インシデント管理ハンドブックをご確認ください。このハンドブックから学び、自社に適応して、ぜひご活用ください。
Opsgenie を使用したオンコール スケジュールの設定
このチュートリアルでは、オンコール スケジュールの設定、オーバーライド ルールの適用、オンコール通知の設定などの方法を学習します。すべて Opsgenie 内で行います。
このチュートリアルを読む