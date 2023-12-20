什么是业务连续性灾难恢复 (BCDR)？

发布日期：2023 年 12 月 21 日
撰稿人：Mesh Flinders、Ian Smalley
什么是 BCDR？

业务连续性灾难恢复 (BCDR) 是指在发生灾难时帮助组织恢复正常业务运营的过程。虽然业务连续性和灾难恢复密切相关，但它们描述了企业可以采取的两种略有不同的危机管理方法。

随着数据丢失预防和停机成本变得越来越高，许多组织正在增加对应急管理的投资。根据 International Data Corporation 最近发布的报告，2023 年，全球公司准备为网络安全投入的金额为 2190 亿美元，比前一年增长 12%。

什么是灾难恢复计划？

灾难恢复计划 (DRP) 是企业如何从意外事件中恢复的应急计划。DRP 可帮助企业管理不同的灾难场景，例如大规模中断、自然灾害、勒索软件恶意软件攻击等。

什么是业务连续性计划？

与 DRP 一样，业务连续性计划 (BCP) 在灾难恢复中发挥着关键作用，并帮助组织在灾难发生时恢复正常的业务功能。DRP 特别关注 IT 系统，而业务连续性管理更广泛地关注准备的各个方面。
BCDR 是如何工作的？

大多数组织将 BCDR 计划分为两个单独的流程：业务连续性和灾难恢复。这种方法是有效的，因为尽管这两个流程共享许多步骤，但组织制定、实施和测试计划的方式也存在关键差异。

主要区别在于，BCP 是主动性的，旨在灾难发生前、灾难发生期间和灾难发生后维持正常运营。另一方面，DRP 是被动的，专注于如何响应事件并从事件中恢复。这种区别应指导 BCDR 策略的创建，其中 BCP 侧重于关键流程和角色，而 DRP 侧重于事件后的恢复操作。

这两个流程都严重依赖两个关键组成部分：恢复时间目标和恢复点目标。

恢复时间目标 (RTO)

RTO 是指意外事件发生后恢复业务流程所需的时间。建立合理的 RTO 是企业在创建 DRP 时首先要做的事情之一。

恢复点目标 (RPO)

企业的 RPO 是指企业在灾难中能够承受的、仍能恢复的数据丢失量。由于数据保护是许多现代企业的核心能力，因此一些企业不断将数据复制到远程数据中心，以确保在发生大规模数据泄露时能连续运行。另一些企业将从备份系统恢复业务数据的可接受 RPO 设置为几分钟（甚至几小时），这样他们知道能够恢复在此期间丢失的任何数据。

 如何制定业务连续性计划

1. 进行业务影响分析

要制定有效的 BCP，首先需要了解组织面临的各种风险。业务影响分析 (BIA) 对风险管理和业务弹性至关重要。BIA 是识别和评估灾难对正常运营的潜在影响的过程。强大的 BIA 包括所有潜在现有威胁和漏洞（内部和外部）的概述，以及详细的缓解计划。BIA 还必须确定事件发生的可能性，以便组织相应地优先排序。

2. 设计对策

完成 BIA 后，制定 BCP 的下一步是计划对您已识别的每个威胁的有效响应。不同的威胁自然需要不同的灾难恢复战略，因此您的每个响应都应该有一个详细的计划，说明组织如何发现特定威胁并解决它。

3. 确定关键角色和职责

此步骤决定了团队的关键成员在面临危机或破坏性事件时如何应对。它记录了对每个团队成员的期望以及他们履行职责所需的资源。这部分过程有利于考虑事件发生时人员如何进行沟通。一些威胁会关闭关键网络（例如蜂窝或 Internet 连接），因此拥有可靠的后备沟通方法非常重要。

4. 测试和更新您的计划

为了实现可操作，您需要不断实践和优化自己的 BCDR 计划。对员工进行不断的测试和培训有助于在实际灾难发生时实现无缝部署。演练现实场景，如网络攻击、火灾、洪水、人为错误、大规模中断和其他相关威胁，以便团队成员可以建立对自己角色和职责的信心。

 如何制定灾难恢复计划

与 BCP 一样，DRP 需要 BIA – 概述角色和职责并不断测试和优化。但是，由于 DRP 本质上更具被动性，因此更多地关注风险分析和数据备份和恢复。制定 DRP 的第 2 和第 3 步，即分析风险和编制资产清单，根本不是 BCP 制定流程的一部分。

以下是创建 DRP 时广泛使用的五步流程：

1. 进行业务影响分析

就像在您的 BCP 流程中一样，首先评估您的公司可能面临的每种威胁及其可能产生的后果。考虑潜在威胁可能如何影响日常运营、常规沟通渠道和员工安全。强有力的 BIA 的其他考虑因素包括收入损失、停机成本、声誉修复成本（公共关系）、客户和投资者损失（短期和长期）以及因违规而面临的处罚。

2. 分析风险

DRP 通常需要比 BCP 更仔细的风险评估，因为他们的角色是专注于从潜在灾难中恢复工作。在计划的风险分析部分，考虑风险发生的可能性以及对业务的潜在影响。

3. 编制资产清单

要创建有效的 DRP，您必须确切地知道您的企业拥有什么、其目的或功能以及它的状态。定期进行资产盘点有助于识别硬件、软件、 IT 基础设施 以及您的组织可能拥有的对您的 业务运营至关重要的任何其他东西。当你确定了你的资产后，可以将它们分为三类：关键、重要 和 不重要。

  • 关键： 只有当企业正常 业务运营需要这些资产时，才将其标记为关键资产。
  • 重要：将此标签应用于每天至少使用一次的资产，若这些资产中断，会对业务运营产生影响（但不会完全导致停摆）。
  • 不重要：此类资产在企业内使用频率不高，对正常业务运营并非不可或缺。

4. 确立角色和职责

就像制定 BCP 时一样，您需要明确概述职责并确保团队成员拥有履行必需职责所需的所有资源。没有这一关键步骤，就没有人知道在发生灾难时如何采取行动。制定 DRP 时需要考虑的一些角色和职责如下：

  • 事件报告人： 负责维护 相关方的联系信息 ，并在 破坏性事件 发生时与 业务负责人 和 利益相关者 沟通。
  • DRP 主管：DRP 主管负责确保团队成员在事件发生期间执行分配的任务。
  • 资产管理员：其职责是在灾难发生时保护关键资产。
  • 第三方联络员： 作为 DRP 的一部分，负责协调与第三方供应商或服务提供商的关系，并向 利益相关者 通报 DRP 的最新进展情况。

5. 测试和优化

与  BCP 一样，DRP 也需要不断实践和完善才能有效。定期练习它，并根据任何必要的有意义的更改进行更新。例如，如果贵公司在您制定 DRP 后购置了一项新资产，则需将其纳入相关计划，以确保其未来得到妥善保护。
    BCDR 示例

    在 BCDR 规划方面，每个企业都将有自己独特的需求。以下是一些对不同规模和行业的公司有效的计划示例：

    危机管理 计划

    危机管理计划，也称为事件管理计划，是管理特定事件的详细计划。它详细说明了组织如何应对停电、网络攻击或自然灾害等特定危机。

    沟通计划

    沟通计划概述了组织在发生灾难时如何处理公共关系 (PR)。企业领导者通常会与沟通专家协调，制定沟通计划，以补充在意外事件期间保持业务运营所需的任何危机管理活动。

    数据中心恢复计划

     数据中心 恢复计划的重点是 数据中心 设施的安全性以及在意外事故发生后恢复运行的能力。 数据存储 的一些常见威胁包括人员过度劳累，可能导致 人为错误，还有 网络攻击、 停电 以及遵守合规性要求的困难。 

    网络恢复计划

    网络恢复计划可帮助组织恢复中断的网络服务，其中包括互联网接入、蜂窝数据、局域网和广域网。由于网络服务在业务运营中发挥的关键作用，因此网络恢复计划必须明确概述在网络发生入侵后快速有效地恢复服务所需的步骤、角色和责任。

    虚拟化恢复计划

    虚拟化 恢复计划依赖于可在中断后几分钟内准备好运行的虚拟机 (VM)实例。虚拟机是对物理计算机的表示或仿真，通过高可用性提供 关键应用程序 恢复的能力，或使系统持续运行而不发生故障。
    BCDR 的优点

    BCDR 规划 可帮助组织更好地了解他们面临的威胁，并做好更好的准备来面对这些威胁。不进行  BCDR 规划的企业会 面临各种风险，包括 数据丢失、 停机时间、经济处罚和声誉受损。 有效的  BCDR 规划 有助于确保业务连续性并在 业务中断后迅速恢复服务。以下是拥有强大  BCDR 规划的公司可以 享受的一些好处：
    减少停机时间

    当意外事件导致正常业务中断时，可能会造成数亿美元的损失。此外，引人注目的网络攻击经常会引起媒体不必要的关注，并可能导致客户和投资者失去信心。BCDR 计划提高了组织在意外事件发生后迅速顺利恢复正常运行的能力。
    降低成本

    根据 IBM 最近的《数据泄露成本报告》，2023 年数据泄露的平均成本为 445 万美元，比过去三年增长了 15％。拥有强大 BCDR 的企业可以通过帮助在整个事件中保持业务连续性并加快事后的恢复速度来降低这些成本。拥有强大 BCDR 的另一个节省成本的机会是网络保险。许多保险公司不会为尚未制定强大 BCDR 计划的组织投保。
    降低罚款

    当私人客户信息被泄露时，数据泄露会导致巨额罚款。在医疗保健和个人金融等受到严格监管的行业中运营的企业面临的罚款尤其高昂。由于这些处罚通常与违规的持续时间和严重程度有关，因此保持业务连续性并缩短响应和恢复生命周期对于保持较低的经济处罚至关重要。
