Close

针对高速团队的事件管理

事件响应指南

在日常运营中,IT 主管会突然收到一连串的警报—服务中断有可能中断他们的系统。但是,经验丰富的事件管理团队以前也面临过类似的挑战,并迅速采取行动。通过遵循经过充分演练的计划和事件响应最佳实践,他们协调缓解问题、限制损害并恢复运营,从而避免对客户造成影响。

事件响应不应该是被动的,而应该是一系列明确定义的实践和流程,以便您在不可预见的事件发生时予以实施。通过了解结构化事件响应生命周期,公司可以通过战略框架获得指导,以快速识别、应对和消除中断或安全威胁,确保迅速恢复正常运营。

本指南将介绍事件响应生命周期及其各个阶段、安全事件的类型以及用于有效事件管理的基本工具。此外,还将介绍关键团队成员、潜在挑战以及有关优化和加强事件响应策略的洞察信息。

什么是事件响应?

事件响应是指公司特别是 IT 和开发团队为迅速处理计划外事件或服务中断而执行的战略性流程。它旨在恢复运营功能并减轻网络威胁或泄露造成的潜在损害。

网络攻击或数据泄露会为企业带来严重风险,从而影响客户、品牌价值、知识产权和资源。事件响应旨在减轻这种损害并促进快速恢复。

事件响应是如何运作的?

事件响应是一系列结构严谨的行动,它从识别服务中断开始,以还原功能结束。

事件指挥官负责事件响应,协调和指导响应工作。技术负责人(通常是高级技术响应人员)将分析问题、做出决策并管理技术团队。

事件指挥官可以为不同的工作流指派多名技术负责人,并分配单独的内部和外部经理进行事件通信

以下是事件响应的七个主要阶段:

  1. 检测事件
  2. 设置团队事件通信通道

  3. 评估影响并应用严重性级别
  4. 与客户沟通
  5. 将事件上报给相应的响应者
  6. 委派事件响应角色和职责
  7. 解决事件

事件响应生命周期

事件响应生命周期是事件管理的重要框架。尽管每起事件都是独一无二的,但它们都是更好地处理未来事件的学习机会。

公司应在准备阶段制定事件响应小技巧,并确保关键团队成员熟悉。Atlassian 的事件响应最佳实践提供了一些提示和出色的事件响应流程。

该生命周期包括六个连续阶段:

  1. 准备:创建计划
  2. 识别:发现并确认事件
  3. 遏制:限制问题
  4. 根除:消除威胁
  5. 恢复:修复受影响的系统
  6. 经验教训:记录洞察信息

准备

准备是事件响应计划的核心,决定了公司应对攻击的响应能力。记录在案的事件前流程有助于从容应对紧张的高压情况。

借助基于《Atlassian 事件手册》的强大事件响应流程,任何公司都将更具弹性。

识别

此阶段包括通过错误消息、日志文件和监控工具检测和验证事件。事件可以通过社交媒体或客户支持请求单来确认,这要求响应团队在事件跟踪工具中手动记录事件。

诸如 Jira Service Management 等工具可集中管理来自监控、服务台和日志记录应用的所有警报和传入信号,便于对问题进行分类和确定优先级。

遏制

一旦检测到事故,遏制措施有助于防止发生进一步损害。在遏制期间,响应团队的目标是最大限度地减小事件的范围和影响。

根除

遏制之后,主要重点将转移到从公司网络或系统中消除威胁上。此阶段涉及对所有系统进行精心清理,删除所有存在的恶意内容,以最大限度地降低可能再次感染的风险。

各公司通过进行全面调查并成功消除威胁,开始恢复正常运营。

Six phases of the incident response life cycle

The incident response life cycle consists of six phases: preparation, identification, containment, eradication, recovery, and lessons learned. These phases, or incident response steps, provide a structured approach for companies to detect, respond to, and recover from cybersecurity incidents.

Preparation

The preparation phase includes developing policies, procedures, and tools to ensure the company can handle incident response.

One key activity is to create an incident response plan outlining the steps to take when an incident occurs. Many companies use incident response plan templates as a starting point to create customized plans. These templates provide a general framework that teams can adapt to their specific needs and structure.

Other key activities include establishing the computer incident response team, setting up communication channels and escalation procedures, implementing security monitoring, and adding detection and analysis tools.

Identification

In the identification phase, the team detects and classifies potential security incidents based on their incident severity levels.

This phase involves monitoring systems and networks for anomalies, collecting and analyzing security logs and alerts, and triaging and prioritizing incidents based on predefined criteria.

Containment

The containment phase focuses on limiting the spread and effect of an incident.

This comprises implementing short-term and long-term containment strategies, such as isolating affected systems and networks and blocking malicious traffic and access attempts. Additional strategies include applying security patches and updates and collecting and preserving evidence for further analysis.

Eradication

The eradication phase identifies the incident's root cause and removes it from the environment.

This may involve removing malware and compromised files, closing vulnerabilities and security gaps, resetting passwords, revoking compromised credentials, and rebuilding affected systems from clean backups.

Recovery

The recovery phase restores systems and operations to their normal state.

Core activities include restoring data and configurations from backups, testing and validating the integrity of restored systems, monitoring for any signs of re-infection or residual issues, and communicating the resolution to stakeholders.

Lessons learned

The lessons learned phase ensures continuous improvement of the incident response process.

It involves conducting a post-incident review and analysis, identifying strengths and weaknesses in the response process, updating incident response plans and procedures based on insights from the current incident, and providing additional training and resources to the incident response team.

IT service management (ITSM) tools streamline and automate incident response workflows across the six incident response life cycle phases. They help companies respond to incidents with speed, precision, and coordination.

使用 Jira Service Management 进行高效的事件响应

Jira Service Management 可简化事件响应。该工具可弥合开发与运营之间的差距,增强团队协作,打破组织孤岛,提高可见性,并确保问题得到及时解决。

Jira Service Management 与 Jira Software 相集成,提供业界领先的 ITSM 软件,该软件经过量身定制,可帮助 IT 支持、运营和业务团队为员工和客户提供卓越的服务体验。Jira Service Management 的自动化模板可自动执行重复任务,帮助扩展 IT 服务管理。

详细了解 Jira Service Management 中的事件管理。

事件响应:常见问题

为什么事件响应很重要?

结构严谨的事件响应计划可最大限度地降低事件影响,使企业能够迅速有效地采取行动应对威胁。它可以减少恢复时间和财务损失以及减轻声誉受损。

谁应该加入事件响应团队?

事件响应团队应该是多元化的,包括不同的角色和职责。该团队应包括事件指挥官、技术负责人、沟通经理、客户支持负责人、主题专家、社交媒体负责人和问题经理。公司内部多个领域的高管和领导者应协调该团队。

事件响应有哪些挑战?

事件响应团队经常面临一系列挑战,从资源限制到上下文、确定优先顺序、沟通、协作、利益相关者可见性等事务以及偶尔出现的人为错误。做好准备对于有效预测和应对这些挑战至关重要。例如,让法律团队参与准备阶段可以减少潜在的法律或监管障碍。

后续内容
Best Practices