Close

빠른 속도의 팀을 위한 인시던트 관리

가동 중지 시간으로 인한 비용 계산

주요 인시던트의 재정적 영향 파악

2015년 3월, Apple Store가 12시간 동안 중단되면서 Apple에 2천 5백만 달러의 비용이 발생했습니다.

2016년 8월, 한 운영 센터에서 5시간 동안 정전이 발생하여 항공편 2,000편이 취소되었고 델타항공의 손실은 1억 5천만 달러로 추산됩니다.

2019년 3월, Facebook에서는 14시간의 서비스 중단으로 인해 9천만 달러로 예상되는 비용이 발생했습니다.

어마어마하게 큰 규모를 자랑하는 대기업이자 업계 리더인 회사에서 발생한 일입니다. 영업 마진이 매우 높고 은행에 수백만 달러를 보유한 회사들입니다. 이러한 회사는 하루 동안의 재정적 위기를 견딜 수 있습니다. 사실을 말씀드리자면 작은 규모의 회사는 주요 인시던트 발생 시 손해가 더 적을 수 있지만, 수익 면에서는 더 큰 영향을 받을 수 있습니다.

실제로 101개의 스타트업을 대상으로 진행된 한 연구에 따르면 실패하는 스타트업의 29%는 현금이 부족하기 때문인 것으로 나타났습니다. 스타트업이 이미 위험에 처해 있다면 대다수의 큰 인시던트를 헤쳐나갈 수 있다고 생각하기는 어렵습니다.

이러한 사례를 통해 얻을 수 있는 교훈은 가동 중지 시간이 중요한 문제라는 것입니다. 중요하지 않다고 말하는 경우, 관심을 기울이지 않은 것입니다. 인시던트는 고객의 신뢰도와 충성도에 잠재적으로 해로울 뿐만 아니라, 재정적인 측면에서도 죽음의 신과 같습니다.

가동 중지 시간으로 인한 평균 비용

Gartner에서 진행한 2014년 연구에 따르면 가동 중지 시간으로 인한 비용은 분당 평균 5,600달러입니다. 하지만 이 연구 회사에서는 이 수치가 평균에 불과하다는 점을 지적합니다. 같은 해의 Avaya 보고서에 따르면 평균치는 회사 규모 및 산업 분야와 같은 요인에 따라 분당 2,300달러에서 9,000달러 사이였습니다. 그리고 2014년 이후로 그 수치는 증가하고 있습니다. 더 최근의 보고서(2016년, Ponemon Institute)에서는 Gartner의 평균치였던 분당 5,600달러가 분당 거의 9,000달러로 증가했습니다.

소규모 기업의 경우, 그 수치는 분당 137달러에서 427달러 정도로 낮지만 여전히 상당한 금액에 해당합니다. 그리고 이렇게 광범위한 범위에서 회사가 어디에 속하는지는 산업 분야, 조직 규모, 비즈니스 모델을 포함한 여러 요인에 따라 달라집니다.

산업 분야

가장 높은 위험이 수반되는 산업에는 은행/금융, 정부, 의료, 제조, 미디어 및 커뮤니케이션, 소매, 교통/유틸리티가 포함됩니다. 2016년의 한 연구에 따르면 이러한 산업에서 가동 중지 시간으로 인해 발생한 비용은 시간당 500만 달러 이상이었습니다.

조직 규모

조직 규모도 핵심적인 요소입니다. IDC 설문 조사에 따르면 Fortune 선정 1,000대 기업의 경우 가동 중지 시간으로 인해 시간당 1백만 달러의 비용이 발생할 수 있습니다. IHS의 연구 보고서에 따르면 일반적인 중간 규모의 기업은 인시던트에 연간 1백만 달러, 대기업은 최대 6천만 달러 이상을 지출하는 것으로 나타났습니다.

비즈니스 모델

마지막으로, 비즈니스 모델은 가동 중지 시간으로 인한 비용 계산에도 상당한 영향을 줍니다. 물리적인 영업소가 없는 전자 상거래 사이트는 당연히 물리적인 영업소가 있는 비즈니스보다 웹 중단으로 인한 손실이 더 큽니다. 비즈니스 모델이 가동 시간에 더 많이 의존할수록 가동 중지 시간으로 인한 손실은 (논리적으로) 커질 것입니다.

비즈니스 모델 전체가 가동 시간에 의존하는 대규모 전자 상거래 기업인 Amazon의 경우, 예상 비용은 시간당 1,322만 달러에 달합니다. 광고 노출 횟수에 따라 수익이 좌우되는 Facebook도 마찬가지로 그 수치가 수백만 달러로 예상됩니다.

빠른 가동 중지 시간 계산기

회사의 가동 중지 시간으로 인한 예상 비용을 간단하게 추정하려면 비즈니스의 규모와 가장 최근에 발생한 인시던트가 지속된 시간(분)을 기준으로 다음 공식을 사용하세요.

가동 중지 시간으로 인한 비용 = 가동 중지 시간(분) x 분당 비용.

소규모 기업의 경우 분당 비용으로 427달러를 사용하세요. 중간 및 대규모 기업은 9천 달러를 사용하세요.

가동 중지 시간으로 인한 전체 비용 파악

일반적으로 가동 중지 시간으로 인한 비용을 생각할 때 아마 수익 손실에 초점을 맞출 것입니다. 또는 수익과 직원 생산성을 조합하여 초점을 맞출 수도 있습니다. 하지만 사실 가동 중지 시간으로 인한 비용은 훨씬 더 많은 것을 포괄합니다.

독립적인 데이터 보호 및 보안 연구 회사인 Ponemon에 따르면 가동 중지 시간으로 인한 비용 중 가장 큰 비중을 차지하는 것은 비즈니스 중단으로, 여기에는 평판 손상과 고객 이탈이 포함됩니다. 수익 손실은 조사에서 2위를 차지했습니다. 인시던트로 인한 세 번째로 큰 재정적 문제는 최종 사용자의 생산성이었습니다.

또다른 일반적인 손실 범주는 인시던트 해결을 담당하는 IT 팀, 인시던트 관리에 관여하는 인접 팀(예: PR, 소셜 미디어 매니저, 고객 서비스 담당자) 및 서비스 중단으로 인해 영향을 받은 다른 직원들의 내부적인 생산성 손실입니다.

소프트웨어 공급자의 경우, SLA의 재정적 불이익, 정부의 벌금(규제 요구 사항 위반 시), 소송 및 합의는 엄청난 타격을 주는 재정적 손해입니다. 그리고 물리적인 제품을 취급하는 회사에게 재고 소진은 상당한 위험에 해당합니다.

계약업체 비용, 장비 교체직원 유지율에 관한 문제는 말할 것도 없습니다. 인시던트는 결국 스트레스를 유발하고, 스트레스는 직원의 만족도를 떨어뜨리며, 만족도가 낮은 직원은 떠나게 됩니다. 전문가는 직원 교체 비용이 연봉의 33%라고 추정합니다.

가동 중지 시간으로 인한 비용을 최소화하는 방법

위와 같은 수치를 통해 업계를 불문하고 규모에 상관없이 모든 회사에서 가동 중지 시간의 최소화를 우선 순위로 삼아야 한다는 것을 분명하게 확인할 수 있습니다. 그렇다면 가동 중지 시간의 위험을 완화하고 비용을 최소화하려면 어떻게 해야 할까요? 검증된 다섯 가지 방법은 다음과 같습니다.

상세한 재해 복구 계획 수립

가동 중지 시간이 발생하면 어떻게 하시겠습니까? 이 질문에 대한 답을 아직 모른다면 “무엇을 해야 할지 고민하는 데 소중한 시간을 낭비”하게 될 가능성이 높습니다.

올바른 인시던트 대응 계획을 세울수록 팀이 인시던트를 더 빠르고 효과적으로 처리할 수 있습니다. 따라서 새로운 인시던트 관리 프로그램의 첫 번째 단계는 프로세스와 계획이어야 합니다.

명확하고 잦은 커뮤니케이션

비즈니스 중단이 가동 중지 시간으로 인한 비용의 무려 35%를 차지하는 상황에서, 인시던트 도중 및 인시던트 발생 후에 인시던트 커뮤니케이션과 고객 서비스를 우선시하는 것이 그 어느 때보다 중요합니다.

단일 장애 지점 제거

가동 중지 시간과 비용을 줄이는 가장 빠른 방법 중 하나는 기존 인프라와 프로세스에서 단일 장애 지점을 제거하는 것입니다. 서버 간 부하 분산, 올바른 백업 관행 준수, 배포에 동료 검토 및 기술적 장애 안전 장치 구축과 같은 작업을 수행하는 것을 의미합니다.

예방을 우선시

인시던트를 방지할 수 있는 확실한 방법은 없습니다. 하지만 그렇다고 해서 인시던트를 최소화할 수 없다는 뜻은 아닙니다.

사실 가동 중지 시간으로 인한 높은 비용은 경영진이 오래된 시스템과 보안 기능의 교체와 문제 해결을 우선시하고 본격적인 인시던트로 이어지기 전에 문제를 해결하는 데 큰 동기 부여가 됩니다.

사후 검토 건너뛰지 않기

가동 중지 시간이 발생했을 때(그리고 오늘날의 복잡하고 기술적인 세상에서는 결국 항상 발생함), 향후의 중단을 방지하는 가장 좋은 방법은 강력한 사후 검토 관행을 갖추는 것입니다.

인시던트 사후 검토에서는 팀이 함께 모여 인시던트의 세부 사항, 즉 인시던트가 발생한 이유, 영향, 완화하고 해결하기 위해 취한 조치 및 중요하게는 다시 발생하지 않도록 해야 할 일에 대해 논의합니다.

Atlassian에서의 사후 검토에는 비난이 배제되어 있으며, 책임을 전가하는 대신 문제의 근본 원인을 파악하는 데 중점을 둡니다. 또한 사후 검토 과정에서 알게 된 내용을 요약하고 방금 발생한 이슈가 반복되지 않도록 개선 사항을 제안하기 위해 고안된 스마트 설명서를 지지합니다.

Jira Service Management는 팀이 인시던트를 신속하게 처리하여 가동 중지 시간으로 인한 비용을 최소화할 수 있도록 구축되었습니다.