Close

빠른 속도의 팀을 위한 인시던트 관리

인시던트 관리 도구를 선택하는 방법

범주, 주요 기능 및 살펴봐야 할 사항

인시던트 관리를 위한 하나의 만능 도구란 없습니다.

최고의 성과를 내는 인시던트 팀은 적절한 도구, 관행 및 직원을 함께 사용합니다.

인시던트 관리에만 사용되는 도구도 있고, 팀이 다른 작업에도 사용하는 더 다양한 목적의 도구도 있습니다. 또한 일부 도구는 통합 및 사용자 지정 계층을 기반으로 구축된 완전히 맞춤화된 환경일 수 있습니다.

사용 사례에 관계없이, 훌륭한 인시던트 관리 도구에는 몇 가지 공통점이 있습니다. 바로 열려 있고 신뢰할 수 있으며 적응 가능하다는 것입니다.

개방성: 인시던트와 같이 압박감이 높은 환경에서는 적절한 담당자가 적절한 도구와 정보에 즉시 액세스할 수 있어야 합니다. 인시던트 대응자뿐만 아니라 대응 노력을 살펴봐야 하는 회사 이해 관계자에게도 마찬가지입니다.

신뢰성: 인시던트 대응 과정에서 주요 대응 도구가 중단되는 것보다 더 나쁜 상황은 거의 없습니다. Slack 및 Opsgenie와 같은 클라우드 도구를 활용하면 인프라가 중단되어 대응 도구가 중단될 위험이 최소화됩니다.

적응성: 통합, 워크플로, 애드온, 사용자 지정 및 API와 같은 것들이 모두 제품의 가능성을 열어줍니다. 즉시 사용할 수 있는 구성으로 시작하고 싶을 수도 있지만, 관행과 프로세스가 성숙해지면 변화하는 요구 사항을 지원할 수 있을 만큼 유연하게 도구를 사용할 수 있어야 합니다.

인시던트 전

모니터링

모니터링 시스템을 통해 DevOps 및 IT Ops 팀은 수천 개의 서로 다른 서비스에서 들어오는 데이터를 실시간으로 수집, 집계 및 트리거합니다. 서비스 상태를 완전히 보여주는 데 중요하며 인시던트 발생 시 첫 번째 경보가 울리도록 트리거하는 경우가 많습니다.

혜택

모니터링 도구를 통해 팀은 인프라의 상태를 지속적으로 파악할 수 있습니다. 또한 최신 모니터링 도구는 예기치 않은 활동이 발생하면 사전에 알림을 트리거합니다.

혜택

모니터링 도구를 통해 팀은 인프라의 상태를 지속적으로 파악할 수 있습니다. 또한 최신 모니터링 도구는 예기치 않은 활동이 발생하면 사전에 알림을 트리거합니다.

기능

Monitoring tools give your team constant insight into the health of the infrastructure. Modern monitoring tools also proactively trigger alerts during unexpected activity.

 

 

Feature Set

Questions to ask

24/7 coverage and analytics

Does the tool have visibility into all my servers and infrastructures?

Integrates with alerting tools

Can my team see real time analytics and dashboards and set alerting thresholds?

 

Does the product integrate with my alerting and on-call tool?

Service desk

고객과 직원은 서비스 데스크 소프트웨어를 통해 인시던트 및 잠재적 인시던트를 보고할 수 있습니다.

혜택

다른 여러 사용 사례(서비스 요청, IT 지원 센터)와 더불어, 팀은 서비스 데스크를 통해 가장 중요한 사용자와 고객으로부터 인시던트에 대해 빠르게 파악할 수 있습니다.

기능

 

 

Feature set

Questions to ask

Enable self serve

Can customers quickly file tickeCan customers quickly file tickets through a self-service support portal?

 

Can customers find the help they need with automated knowledge-based suggestions?

추천 제품: Jira Service Management

알림 및 대기 중 담당자

신속하고 신뢰할 수 있는 알림은 인시던트 대응의 중요한 단계입니다. 팀은 이 단계를 통해 적절한 담당자가 인시던트에 대해 알도록 합니다.

혜택

알림 도구는 일정, 에스컬레이션 경로 및 알림의 정교한 조합을 통해 지정된 대기 중 대응자에게 알립니다.

기능

 

 

Feature set

Questions to ask

Works globally

Can I send notifications (SMS, voice, email) to almost anywhere?

Multiple notification methods

Can I send notifications using multiple notification methods like email, SMS, phone, and mobile app push and try them multiple times?

추천 제품: Opsgenie

인시던트 중

더 빠른 해결을 위해 CMDB(구성 관리 데이터베이스) 활용

인프라 내의 상호 의존성을 이해하는 것은 인시던트의 전체 영향을 파악하고 더 빠른 해결에 도달하는 데 중요합니다.

혜택

CMDB는 IT 인프라 내의 관계와 종속성을 파악하는 데 도움이 됩니다. 문제가 발생하면 이 맵을 통해 다음과 같은 항목을 빠르게 찾을 수 있습니다.

  • 인시던트의 잠재적 원인. 예를 들어, 버튼을 한 번만 클릭하면 서비스가 어떤 호스트에서 실행 중인지 확인할 수 있습니다.
  • 인시던트의 낙수효과. 예를 들어, 문제가 있는 동일한 호스트에서 실행 중인 다른 서비스를 찾습니다.

즉, 인시던트의 모든 측면을 신속하게 조사하고 전달할 수 있습니다.

 

 

Feature set

Questions to ask

Multiple channels

How flexible is the CMDB? Can I store any CI or asset?

Integrations

Can I visualize my infrastructure graphically?

 

Can I link CIs/assets with my service desk issues?

 

Can I link CIs/assets to change requests?

추천 제품: Insight

Insight 로고

인시던트에 더 빠르게 대응

인프라와 종속성을 Jira 내에서 기본적으로 매핑하세요. 인시던트의 원인을 신속하게 찾아 해결하고 가동 시간을 늘리세요!

팀 커뮤니케이션

명확하고 신뢰할 수 있는 커뮤니케이션은 인시던트 관리 중에 매우 중요합니다.

혜택

견고한 커뮤니케이션 플랫폼은 팀이 타임스탬프가 기록되고 보존되는 방식으로 커뮤니케이션하고 관찰한 내용, 링크 및 스크린샷을 공유하도록 지원합니다. 이를 통해 인시던트 발생 시 적절한 정보와 담당자를 한곳으로 모을 수 있으며, 인시던트 이후에 배울 수 있는 풍부한 기록이 만들어집니다.

기능

 

 

Feature set

Questions to ask

Multiple channels

Can my incident response team quickly spin up a dedicated channel for an incident?

Integrations

Can other tools in my incident toolchain post into my team's communication channel?

추천 제품: Slack(텍스트), Zoom(동영상)

고객 커뮤니케이션

고객 커뮤니케이션 도구는 인시던트 발생 시 고객에게 정보를 제공하는 데 도움이 됩니다.

혜택

인시던트는 좋게 표현할 수 없으며, 일반적으로 고객에게 좋지 않은 경험입니다. 고객에게 정보를 제공하면 신뢰가 쌓이고 대응 노력이 가속화됩니다. 고객과의 커뮤니케이션을 통해 인시던트에 대해 인지하고 있으며 수정 작업 중이라는 것을 고객에게 알릴 수 있습니다.

기능

 

 

Feature set

Questions to ask

Off of my infrastructure

Will my communication tool be operational and accessible even if my internal infrastructure is down?

Subscribers and notifications

Can customers opt in to get notifications when I post about an incident?

추천 제품: Statuspage

인시던트 명령 센터

인시던트 관제 센터는 인시던트에 대한 정식 기록과 주요 세부 정보가 있는 곳입니다. Opsgenie와 같은 인시던트 도구나 Jira와 같은 이슈 추적 도구일 수 있습니다.

혜택

관제 센터 도구는 인시던트 상태, 관련 알림, 업데이트 등과 같은 주요 세부 정보를 나열하여 인시던트 중 그리고 이후에 모두가 빠르게 정보를 얻을 수 있는 하나의 공간을 제공합니다. 또한 인시던트 및 관련 대응 노력에 대한 과거 기록을 제공합니다.

기능

 

 

Feature set

Questions to ask

Source of truth

Can team members and stakeholders use this record to locate all the other details of the incident and response activities?

Timeline

Does the tool aggregate a chronological timeline of key events?

 

Can team members and stakeholders quickly get up to speed on the incident?

추천 제품: Opsgenie

인시던트 후

사후 검토 및 분석

사후 검토는 인시던트 중에 무엇이 발생했는지, 그리고 인시던트가 다시 발생하지 않도록 취한 후속 조치를 작성한 기록입니다.

혜택

인시던트가 해결된 후에도 팀은 여전히 근본 원인을 알지 못하는 경우가 많으며, 그러면 똑같은 인시던트가 다시 발생할 위험이 있습니다. 사후 검토는 인시던트 발생 후 분석을 위해 팀을 한데 모아 그러한 일이 발생하지 않도록 합니다.

기능

 

 

Feature set

Questions to ask

Templates

Can my team use a template to fill out a postmortem?

Map out next actions

Can my team plan out next actions and remediation work during a postmortem?

추천 제품: Opsgenie

이슈 추적

이슈 추적 도구는 팀에서 수행해야 할 향후 수정 작업을 계획하는 데 도움이 됩니다.

혜택

대부분의 경우 인시던트를 해결하면 근본 원인을 해결하지 않고도 서비스가 다시 온라인 상태로 전환됩니다. 일반적으로 근본 원인을 해결하고 인시던트가 반복되지 않도록 하려면 더 많은 엔지니어링 작업을 수행해야 합니다. 팀에서 이미 다른 개발 작업에 사용하고 있는 이슈 및 작업 추적 도구는 이 작업이 우선시되고 간과되지 않도록 하는 데 도움이 됩니다.

기능

 

 

Feature set

Questions to ask

Shared workflow pipeline

Can my team plan any incident remediation work alongside their other work and priorities?

Integrations

Can my team pull in data and content from my other incident tools?

추천 제품: Jira Software

다음 단계
KPIs