Close

ベロシティの高いチームのためのインシデント管理

信頼性と可用性:違いを理解する

現代の顧客は、企業が常時稼働のサービスを提供することを以前にも増して期待しています。しかし、最も洗練された企業でさえ、障害や停止が発生することがあります。信頼性と可用性という、似ているようで異なる 2 つの指標を利用して、成功を測定し、改善できます。

システム即応性(信頼性)では、定義されたパフォーマンス標準に照らして、特定の間隔でパフォーマンスを測定します。システム機能(可用性)では、稼働時間や操作性の割合を測定します。これらは共に、ビジネス・システムの健全性に関するインサイトを提供し、パフォーマンスを向上できる領域を特定します。

このガイドでは、サービスの信頼性と可用性、インシデント管理の指標によって信頼性と可用性を測定する方法、信頼性と可用性を改善する方法についてご説明します。

信頼性とは

信頼性とは、システムまたはコンポーネントが特定の時点で障害なくその機能を実行する可能性です。また、信頼性はテクノロジーに対する顧客の信用にも影響を与えます。

たとえば、給与システムでは、毎月特定の日の決まった時間帯に、銀行口座への直接入金を処理する必要があります。コールド・ストレージ・システムは、停電を特定し、バックアップ発電機に自動的に切り替える必要があります。どの業界も、独自のインシデント管理 KPI を使用した、クリティカルな自動プロセスに依存しています。プロセスが失敗すると、収益に壊滅的な影響が及ぶ可能性があります。

信頼性の測定方法

信頼性は、次のような標準的なインシデント管理指標で測定できます。

  • 平均故障間隔:合計稼働時間を故障数で割って計算します。
  • 故障率:故障数をサービスの合計稼働時間で割って計算します。

サービス・レベル・アグリーメントや顧客がシステムに期待することなど、その他の要素を考慮することも重要です。信頼性の基準の定義は、システムに障害が発生した場合にどのようなリスクがあるかによって異なります。たとえば、障害が発生すると税務担当者のグループが午後を休むことになるのでしょうか?それとも、何千人もの旅客が旅先で立ち往生するのでしょうか?

信頼性を向上させる方法

サービスの信頼性を向上させるためには、次のようなステップを実行できます。

  • 定期的な保守スケジュールを作成して、システムを最新の状態に保ちます。
  • システムを冗長化して、コンポーネントに障害が発生したときにプロセスが停止するのを防ぎます。
  • アップグレードやシステム変更を行う際には、品質管理とテストを行って、本番環境に入る前に問題を修正します。
  • インシデント通知を改善して、対応と復旧の時間を短縮します。

可用性とは

可用性とは、システムまたはコンポーネントが稼働していて、その機能を実行できる時間、つまり稼働時間の割合です。

たとえば、大手オンライン小売業者は、顧客の需要を満たすために年中無休でサイトの可用性を維持しなければなりません。そうしないと、競合他社に市場シェアを奪われる恐れがあります。可用性では、ユーザーのインターネット速度やトラフィックのピーク時間など、さまざまな条件が考慮されます。新生児集中治療モニタリングなどのクリティカルなシステムの可用性が失われると、生命に関わることさえあります。

可用性を測定する方法

可用性の測定は、単一のパーセント指標です。合計経過時間からダウンタイムの合計を引き、合計経過時間で割ったものです。

可用性パーセンテージ =(合計経過時間 – ダウンタイム)/合計経過時間

たとえば、オンライン小売サイトがトラフィックの過負荷により 1 日 3 時間ダウンした場合、可用性スコアは 87.5% です。国際的な大手小売業者の場合、この基準はほぼ 99.5% なので、このオンライン小売業者には改善の余地が多くあります。

Jira Service Management などの ITSM ソフトウェアは、インシデントを追跡し、可用性を測定するためのデータを収集するのに役立ちます。

可用性を向上させる方法

可用性を向上させる方法はいくつかあります。

  • プロアクティブな標準保守スケジュールを実施して、高可用性を確保します。
  • フェイルオーバーの仕組みを利用してシステムの冗長性を追加します。
  • インシデント管理の一環として迅速な修理プロセスを作成します。

特に、プロアクティブな保守は、企業の可用性とサービス信頼性を高めるのに役立ちます。RAM(信頼性、可用性、保守性)を調査することで、保守の取り組みをどこに集中すべきかについての重要なインサイトが得られます。

信頼性と可用性

信頼性と可用性はしばしば混同されることがあります。しかし、これらは違うものであるだけでなく、常に連携するとは限りません。

それらの測定基準でさえ、システムとその機能によって異なる場合があります。ビジネス・システムを正確に把握するには、信頼性と可用性の指標を別々に分析する必要があります。

  • 信頼性は、システムが特定の決まった時間に正しい出力を提供したかどうかを測定します。たとえば、給与を適切な日に正しい口座に送金するなどです。
  • 可用性は、システムの稼働時間を測定します。たとえば、未熟児に必要な保育期間中、中断なく酸素モニタリングを提供するなどです。

Jira Service Management には、データを収集し、インシデント通知を強化し、顧客サービス全体を向上させる自動化テンプレートが含まれています。

違い

信頼性指標と可用性指標、およびそれらの違いは、それらを使用してどのようにパフォーマンスを向上させるかを検討すると明らかになります。信頼性はシステム障害とダウンタイムを最小限に抑えることを目的とし、可用性は稼働時間を最大化することを目的としています。

たとえば、食料品店のセルフレジ・システムのサービスの信頼性を測定するには、顧客が取引を完了するために店員のサポートを必要とする頻度を分析します。可用性を測定するには、顧客がセルフレジの使用を試みているかどうかを確認します。

類似点

信頼性と可用性は互いに補完し合います。激しい競争にさらされている企業は、最良の結果を得るために両方の指標の改善に努めています。たとえば、可用性は高いが信頼性の問題が頻繁に発生するシステムは、障害をどれだけ迅速に解決しても、顧客のニーズに応える可能性は低いものです。

両方の分野を改善するには、多くの場合、定期的な保守、冗長性の追加、緊急時対応計画、テストなど、類似のアプローチが必要です。

信頼性と可用性に影響を及ぼす要因

システムの信頼性と可用性に影響を及ぼす要因は、いくつかあります。

  • 環境:たとえば、悪天候にさらされる圧力計などの IoT コンポーネントや、特定の日に小売サイトのトラフィックが多いなどの周期的なユーザー・パターンなどです。
  • コンポーネントの品質:たとえば、サードパーティの統合やハードウェアなどです。
  • 運用:たとえば、検査や保守の頻度や最新型ソフトウェアへの投資などです。

サービス全体の信頼性と可用性を向上させるには、環境しきい値を標準化して冗長性を追加したり、コンポーネント品質に ISO コンプライアンスを要求したり、システムのあらゆる側面を検査、テスト、保守する手順を実装したりすることができます。

Jira Service Management で信頼性と可用性のバランスをとる

特に常時稼働の世界では、適切なツールとアプローチがあれば、システムの信頼性と可用性のバランスを取ることができます。Jira Service Management を使用すれば、サービスを迅速に復元できます。

Jira Software と Jira Service Management は、顧客が問題を報告できるようにし、サービス・チームがアラートを一元化して迅速な分類と優先順位付けを行えるようにします。ルールとコミュニケーション・チャンネルにより、誰も重大な課題を見逃しません。

Jira Service Management のインシデント管理に関する詳細を見る

信頼性と可用性:よくある質問

信頼性と可用性の例を挙げてください。

無人自動車のような新しいテクノロジーについて考えてみましょう。1 回でも故障すると死傷につながる可能性があるため、サービス信頼性基準はほぼ 100% です。

一方、無人自動車の可用性はユーザー・エクスペリエンスに影響します。可用性、つまり稼働時間が長いほど、エクスペリエンスは良くなります。可用性が低いと、市場シェアを失う可能性がありますが、死傷につながる可能性は低いです。

信頼性と可用性が重要な理由

信頼性と可用性はどちらも顧客満足度に影響するため、企業の収益に影響します。さらに、システムが利用できない、または信頼できないと、収益の損失、損傷物、計画外の保守、生産性の低下などのコストが企業に発生します。

サービスの信頼性と可用性の向上に集中的に取り組むことで、競争上の優位性の拡大、市場シェアの拡大、収益の増加、保守コストの予算計画の改善につながります。

信頼性と可用性のトレードオフ

企業は、可用性と信頼性のどちらかを優先しなければならないことがあります。スケジュールが短い場合や投資資金が限られている場合は、実際のトレードオフが必要になるかもしれません。

自動運転車の場合、企業はたとえ可用性を犠牲にしても、信頼性の向上により多くの時間と労力を費やす可能性が高いでしょう。しかし、オンライン小売など、それほどクリティカルではない状況では、「常時営業」していることが、e コマースや実店舗の競合他社との重要な差別化要因の 1 つであるため、可用性の向上に焦点を当てる可能性があります。

次の記事
DevOps