Close

Atlassian Data Center 产品的灾难恢复

灾难恢复策略是任何业务连续性计划的关键。它概述了在发生灾难时应遵循的流程,确保您的业务能够恢复并继续运营。

什么是灾难恢复?

对于 Atlassian 的 Data Center 产品,这意味着在主实例不可用时确保可用性。在 Data Center 产品中,这通常包括制定冷备用策略。简而言之,机器必须继续运转,而故障转移策略是实现高可用性和灾难恢复规划的必备要素。

借助 Atlassian Data Center 产品的灾难恢复功能,您可以配置索引复制、附件更新和数据库同步,以满足灾难恢复计划的特定要求。

灾难恢复计划的类型

IT 事件可能是由自然或人为因素引起的,例如网络威胁、人为错误、计划不周以及硬件或软件故障等。不管灾难如何发生,停机都会导致生产力和收入损失。组织规模越庞大,就有越多团队指望灾难恢复计划取得成效。

组织所依赖的每一工具都要有对应的灾难恢复计划。这包括自行管理产品(如 Atlassian 的 Server 和 Data Center 产品),也包括云托管产品。近年来,灾难恢复即服务 (DRaaS) 工具越来越普及,它们提供第三方复制和托管服务来实现故障转移至另一位置。

根据组织所用的基础架构,您可能还需要制定灾难恢复计划来覆盖 IT 基础架构、组织的网络基础架构和所用的任何虚拟机的物理层面。

灾难恢复计划的好处

灾难恢复计划是一种正式记录的流程,用于在灾难发生后快速恢复任务关键型业务应用。但在灾难发生之前,灾难计划大多是纸上谈兵。

制定灾难恢复计划的好处包括缩短恢复时间,以及最大限度减少遭遇灾难时停机或数据丢失的可能性。

影响灾难恢复计划的三个要素有恢复点目标 (RPO)、恢复时间目标 (RTO) 和恢复成本目标 (RCO)。

恢复点目标

RPO 是指您要求系统在发生故障后保持多新的状态,或者您能够承受故障期间丢失多少数据。

恢复时间目标

RTO 是指您要求发生故障后备用系统以多快速度上线可用。

恢复成本目标

RCO 是您打算在灾难恢复解决方案或计划上花费多少资金。

配置 Data Center 产品以实施灾难恢复策略

通过配置 Atlassian Data Center 产品来实施灾难恢复策略,确保业务连续性并维持恢复时间目标,甚至是遭遇全系统或全站点停机时。借助 Data Center 版本的 JiraConfluenceBitbucket,团队可以设置冷备用实例来预防灾难发生。

首先,团队将创建一个备用系统,但不启动它。接着,您需要实施数据复制策略。冷备用策略的关键是将数据复制到备用位置,因为您不希望在故障转移到备用实例时发现它已过期,或者需要花费大量时间来重新编制数据库索引。

值得注意的是,只要拥有有效的 Data Center 许可证,您便无需购买额外或单独的许可证,就能在冷备用实例上启动 Jira、Confluence 或 Bitbucket。

灾难恢复测试

消防和医务等紧急服务团队会定期练习救援技能,您的团队有什么理由不这样做?通过练习,团队将熟悉和适应高压情况,从而获得更加快速、更加舒心的解决方案。

对于 Jira、Confluence 和 Bitbucket,建议您在执行任何灾难恢复测试前先隔离生产数据。然后,确保故障转移系统已准备就绪,再启动相关应用。不要忘记监控日志文件并检查一致性问题。测试完毕后,将备用组件恢复到可进行复制的状态,从而重置您的灾难恢复部署。许多时候,重新设置备用基础架构可能会更加省事。

业务连续性与灾难恢复

业务连续性和灾难恢复这两个术语通常可以互换使用,但它们所指的概念是不同的。

业务持续性

业务持续性规划是指一种让组织以最短停机期间运转的策略。

业务连续性规划的第一步是进行业务影响分析,其中应包括评估业务职能并确定其优先次序,以及确定 IT 灾难的潜在影响。业务影响分析还可能包括估算允许的最长停机期间和恢复时间目标。执行业务影响分析以确定潜在的依赖关系,这一点非常重要。

制定业务连续性计划的下一步是风险评估。利用业务影响分析,组织应分析威胁并考量潜在灾难的概率和严重性。然后,组织可以确定其业务流程的优先次序,并根据其现有的政策执行差距分析。风险评估也可能影响组织为取得更好成效而增加支出的意愿。

灾难恢复

灾难恢复是业务连续性的一个子集,指的是组织在发生灾难时需要遵循的流程,从而确保组织恢复正常并继续运转。灾难恢复计划若要取得成功,必须考量业务影响分析和风险评估中所确定的需求。

灾难恢复资源

博客

利用 Bitbucket Data Center 简化 Git 灾难恢复

文档

Atlassian Data Center 的灾难恢复

文档

Jira 灾难恢复指南

规划未来

有了 Atlassian Data Center 产品,即使整个系统或站点发生中断,也能确保业务连续性并维持恢复时间目标