Close

ベロシティの高いチームのためのインシデント管理

IT 運用と DevOps プロ向けのディザスタ リカバリ計画

IT サービスがバックオブハウス コスト センターからビジネスの中核的価値の推進に移行するにつれて、効果的な IT ディザスタ リカバリ プラクティスはかつてないほど重要になっています。

アプリケーションのダウンタイム、データ損失、敷地内火災など、災害時の対応は容易であることの方が珍しいです。

中小企業の場合、リカバリは壊滅的な可能性があります。FEMA によると、中小企業の約 40 ~ 60 % は災害の後にビジネスを再開できていません。

ディザスタ リカバリ計画とは何か?

ディザスタ リカバリ計画は、災害発生時に組織とその IT 資産を保護するために設定された、文書化された一連のプラクティスと手順です。計画には通常、シナリオ、ランブック、バックアップ、およびビジネス サービスと IT サービスを運用するための手順が含まれます。この計画は、特にシステム障害、ダウンタイム、セキュリティ侵害、データ損失などのイベントにおいて重要です。

IBM は以下のように述べています。

「1970 年代以前は、ほとんどの組織は紙ベースの記録のコピーを作成するだけで済みました。1970 年代には、企業がコンピュータ ベースの運用に強く依存し始めたため、ディザスタ リカバリ計画が際立ってきました。当時、ほとんどのシステムはバッチ中心適用型メインフレームでした。バックアップ テープから別のオフサイトのメインフレームをロードして、プライマリ サイトのリカバリを保留できました」

ディザスタ リカバリ計画とビジネス継続性計画

ディザスタ リカバリ計画は、ビジネス継続性計画のサブセットです。ディザスタ リカバリ計画が影響を受けたサービスを可能な限り迅速に実行することに重点を置いている場合、ビジネス継続性計画では災害発生時に業務を中断することなく運用できるようにすることに重点を置いています。

ディザスタ リカバリまたはビジネス継続性に関係なく、IT は両方のプラクティスにおいて中心的な役割を果たします。

ディザスタ リカバリとビジネス継続性を混同したり、交換可能なものとして扱ったりするのは簡単です。ディザスタ リカバリ計画は、インシデント後にサービスを復元することを目的としています。ディザスタ リカバリは、ビジネス継続性計画全体の小さな部分です。ビジネス継続性計画は、インシデントの前中後に組織が機能し続けるように設計されています。ディザスタ リカバリが「インシデントを終息させる方法」とするなら、ビジネス継続性は「インシデント発生時でも事業の運営を継続する方法」と言えます。

ディザスタ リカバリ計画とインシデント管理

DevOps および IT 運用チームの場合、インシデント管理は予期しないイベントまたはサービスの中断に対応して、サービスを運用状態に復元するために使用されるプロセスです。

多くの場合にインシデント管理とディザスタ リカバリは、チームや組織に応じて同じ意味で使用されます。インシデント管理はインシデントにリアルタイムで対処して、インシデント中にサービスを再稼働させることにも重点を置いています。

Atlassian では、インシデントをサービスの中断や質の低下を引き起こす、緊急対応が必要なイベントとして定義しています。

サイト信頼性エンジニアリングに関する Google の本では、以下のように述べられています。

「効果的なインシデント管理は、インシデントによる中断を制限して通常の業務を可能な限り迅速に復元するための鍵です。潜在的なインシデントへの対応を事前に想定していない場合、現実の状況では原則に基づいたインシデント管理ができないことがあります」

また Google は、組織のディザスタ リカバリ テスト プロセスの一環としてインシデント管理を含めることを推奨しています。インシデント対応プロセスを通して、対応者のアクションとコミュニケーションを記録し、優れたインシデント タイムラインを作成するのが理想的です。インシデント タイムラインは将来の関連するインシデントや停止に備えてリソースとして利用できます。これは、ディザスタ リカバリのテストを実行している組織に役立ちます。チームが運用の内容を完全に把握できるためです。

目標復旧時間とは何か?

目標復旧時間とは、システム停止後にビジネス機能が通常のサービスを再開するまでの許容可能なリカバリ期間です。これは、「DevOps の指標」で説明したリカバリの平均時間と密接に関連しています。

DevOps の世界におけるディザスタ リカバリ計画

継続的なデリバリー、自動テスト、1 日当たりの複数のデプロイが行われる世界において、どうすれば適切なディザスタ リカバリ計画を維持できますか?

つまり、DevOps を実践している組織では、ディザスタ リカバリ計画はどのような役割を果たしますか?

ありがたいことに、2 つのプラクティスは共存してお互いに補完し合えます。開発からテスト、本番環境へのコードのプッシュに使用するのと同じツールとプロセスも、ディザスタ リカバリにおいて役割を果たせます。たとえば、デプロイのテストに使用される本番環境のバックアップは、ディザスタ シミュレーションの実行にも使用できます。また、CI/CD パイプラインからコミットされた追跡コードは、ディザスタ リカバリ シナリオの最近の変更を洗い出すのに便利なツールです。

DevOps が社内の IT に関するあらゆる意思決定において、ますますペースを上げていることは不思議ではありません。しかしこれは、リカバリ計画やリソースに投入された労力が無駄になったり、ディザスタ リカバリ計画が不要になったりすることを意味するわけではありません。

アトラシアンのインシデント管理ソリューション、Jira Service Management に関する詳細や、開発チームと運用チームがインシデントを解決中かディザスタ リカバリ モードであるかを問わず、Jira Service Management によって柔軟に連携する方法をご覧ください。