ベロシティの高いチームのためのインシデント管理
トピック一覧
DevOps を気に入りましたか? SRE もご紹介します
Google という会社について少しでも聞いたことがあるでしょう。この会社は、無人自動車や宇宙エレベーターといったクールなものを発明しています。そう言えば、Gmail、Google ドキュメント、Google マップなどの大成功を収めたアプリケーションも開発していますね。彼らは、成功するアプリケーション開発について熟知していると言っても過言ではありません。
Google もまた、Site Reliability Engineering (SRE) と呼ばれる発展途上のムーブメントを支えている先駆者です。SRE は、開発チームと運用チーム間の長年の争いを事実上終わらせます。また、製品の信頼性、アカウンタビリティ、そしてイノベーションが促進されます (ただし、「Software Development High School」のような、廊下を舞台にした学園ドラマはありませんが)。
これはどうしてでしょうか。まず、基本を見てみましょう。
Opsgenie を使用したオンコール スケジュールの設定
このチュートリアルでは、オンコール スケジュールの設定、オーバーライド ルールの適用、オンコール通知の設定などの方法を学習します。すべて Opsgenie 内で行います。
このチュートリアルを読むインシデント コミュニケーション テンプレートと例
インシデントに対応する際は、コミュニケーション テンプレートが非常に有用です。Atlassian のチームが使用しているテンプレートと、一般的なインシデント用のさまざまなサンプルをご覧ください。
この記事を読む