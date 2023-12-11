发布日期：2023 年 12 月 12 日
撰稿人：Mesh Flinders、Ian Smalley
灾难恢复即服务 (DRaaS) 是通过互联网和即用即付的方式按需为企业提供数据保护和灾难恢复 (DR) 功能的第三方解决方案。
DraaS 解决方案复制并托管物理和虚拟服务器，提供故障转移。在此过程中，当主系统发生故障时，IT 操作将切换到辅助系统。当灾难发生时，有效的 DRaaS 有助于限制停机时间，缩短恢复点目标 (RPO) 和恢复时间目标 (RTO)。
近年来，随着商业界对数据安全重要性的认识不断提高，DR 解决方案越来越受欢迎。采用 DRaaS 方法的公司本质上是将其 DR 计划外包给第三方。根据 Global Market Insights (GMI) 的最新报告（ibm.com 外部链接），DRaaS 的市场规模在 2022 年为 115 亿美元，并有望在这一年增长 22%（ibm.com 外部链接）。
什么是灾难恢复计划？
DRaaS 解决方案依赖于灾难恢复计划 (DRP)，这些详细文档概述了组织如何应对意外事件。与业务连续性计划 (BCP) 一起，DR 计划有助于确保企业准备好面对许多不同类型的威胁，包括勒索软件和恶意软件攻击、自然灾害等等。
强大的 DRP 可以帮助恢复 连接 并在灾难发生后修复 数据丢失 。在计划外事件中，提供 DRaaS 支持的第三方供应商不太可能遭受与其客户相同的关闭，从而使 DRaaS 供应商能够比客户本身更有效地制定客户的 DRP。
什么是 故障转移/故障回复？
故障转移和故障恢复是 DRaaS 的核心概念，可帮助第三方供应商有效地支持其客户并实施其 DRP，无论他们面临的事件的严重程度如何。故障转移是指当主系统因断电、网络攻击或其他威胁而发生故障时，IT 操作将切换到辅助系统。
故障恢复 是在恢复全部功能后切换回原始系统的过程。在 DRaaS 服务模型中，供应商可能 会从客户的 数据中心 故障转移到 辅助站点，在那里冗余系统将立即生效。如果执行得当， 故障转移和故障恢复 可以创造一种无缝体验，用户甚至不会意识到他们被移动到辅助系统。
DRaaS 的第一步是为组织选择合适的供应商或主服务提供商 (MSP)。该公司将提供 DRaaS 功能，包括建立 RTO 和 RPO，并帮助制定业务连续性计划 (BCP)。通常，DRaaS MSP 会竞相提供越来越低的 RTO 和 RPO，因此在评估它们是否适合您的需求时，这是一个很好的起点。
恢复时间目标 (RTO)：RTO 是指意外事件发生后恢复业务运营所需的时间。在 DRaaS 模型中，服务级别协议 (SLA) 涵盖 RTO，并解释 MSP 与组织如何合作实现 RTO。
恢复点目标 (RPO)：RPO 是指组织在灾难中能够承受的、仍能恢复的数据丢失量。一些企业要求将其数据不断复制到远程数据中心，以确保在发生数据泄露时的连续性；其他公司可以容忍几分钟（甚至几小时）的 RPO。对组织的 RPO 设定明确的期望是设置 DRaaS 解决方案的关键步骤。
业务连续性计划：与 DRP、RTO 和 RPO 一样，业务连续性计划 (BCP) 对 DRaaS 流程至关重要。与 DRP 相比，BCP 通常会更广泛地研究各种威胁和解决方案选项，重点关注组织和 DRaaS 提供商在事件发生后需要采取哪些措施来恢复基本业务功能。在 DRaaS 模式下，组织的 BCP 通常由提供 DRaaS 服务的 MSP 在与组织领导层密切协商后制定。
DRaaS 依赖于 关键系统的 备份，因此可以在发生意外事件后恢复它们。选择将使用的备份的位置和类型是组织在 DRaaS 过程中将做出的最重要的决定之一。有三个选项可供选择： 数据中心、云和混合备份。
数据中心
当组织选择使用数据中心备份其最关键的数据时，数据将被移动到异地，从而保护其免受自然灾害或局部网络攻击。由于需要更多的基础设施，如异地设施以及物理服务器、系统和员工，数据中心备份往往是最昂贵的选择。此外，从异地数据中心恢复数据比从云端恢复数据的过程更长，有时可能需要几天甚至几周的时间。
云
云灾难恢复计划通常是最具可扩展性和最经济的，因为它们不需要物理基础设施和支持。基于云的 DR 计划将关键数据存储在云中，使组织能够创建一个虚拟机 (VM) 实例，该实例可以在发生灾难时在几分钟内甚至几秒钟内启动。
Hybrid cloud
混合 DRaaS 计划同时使用公有云环境和数据中心进行备份。混合云服务是三种可用选项中最灵活的一种，对于想要企业级 DRaaS 功能而无需投资物理基础设施的中小型企业 (SMB) 来说，它们是一个不错的选择。
许多考虑 DRaaS 的组织也将备份即服务 (BaaS) 视为一种更经济的选择。BaaS 是由第三方供应商提供的托管服务，可帮助企业在事件发生后恢复最有价值的数据。BaaS 解决方案将数据存储在安全的异地位置（通常在云中），使其免受各种威胁。
BaaS 数据备份可以包括对组织有价值的任何内容，例如文件、记录甚至整个工作负载。与 DRaaS 一样，BaaS 是由 MSP 提供的服务，并受 SLA 管辖，SLA 概述了双方的所有责任和期望。
BaaS 和 DRaaS 解决方案之间有三个关键区别值得考虑：
备份要求： DRaaS 同时备份数据和基础设施，而 BaaS 只备份数据。 DRaaS MSP 通常负责在事件发生期间和事件发生后立即保持服务器、办公楼和网络等关键基础设施的可用性和可访问性。 BaaS 提供商不提供此类服务。
恢复时间：BaaS 提供商可以恢复数据和执行数据恢复，但由于涉及的数据量，恢复所需的时间比 DraaS 提供商长。BaaS 部署处理的数据量通常比 DraaS 部署处理的数据量更大，并且可以在数小时和数天内衡量其 RPO 和 RTO。DRaaS 提供商可以在几分钟内，有时甚至在几秒钟内测量 RPO 和 RTO。
解决方案定价：BaaS 的成本明显低于 DRaaS。这主要是由于部署资源的成本所致。在 DRaaS 部署中，除了存储资源之外，企业还需要为复制软件和计算基础设施等资源付费，而在 BaaS 部署中，组织只需为存储资源付费。
大多数组织将 BCDR 计划分为两个单独的流程：业务连续性和灾难恢复。这是一种有效的方法，因为尽管这两个流程共享许多步骤，但计划的制定、实施和测试方式也存在关键差异。
主要区别在于，BCP 往往是主动的，而 DRP 往往更被动。在制定 BCDR 计划的两个部分时，最好牢记这一点，因为它决定了这两个流程如何相互关联。
强大的业务连续性战略重点关注灾难发生之前、期间和之后对业务运营至关重要的流程、程序和角色。DR 计划更侧重于对事件做出反应，并采取适当的措施从中恢复。
这两个流程都严重依赖于两个关键组件，即恢复时间目标 (RTO) 和恢复点目标 (RPO)：
1. 进行业务影响分析 (BIA)
要制定有效的 BCP，首先需要了解组织面临的各种风险。业务影响分析 (BIA) 在风险管理和业务弹性方面发挥着至关重要的作用。BIA 是识别和评估灾难对正常运营的潜在影响的过程。
强大的 BIA 包括所有潜在现有威胁和漏洞（内部和外部）的概述，以及详细的缓解计划。此外，BIA 必须确定事件发生的可能性，以便组织相应地优先排序。
2. 制定对策
完成 BIA 后，构建 BCP 的下一步是规划对您已识别的每个威胁的有效响应。不同的威胁自然需要不同的 灾难恢复策略，因此您的每个响应都应该有一个详细的计划，说明组织如何发现特定威胁并解决它。
3. 确定关键角色和职责
此步骤决定了团队的关键成员在面临危机或破坏性事件时将如何应对。它记录了对每个团队成员的期望以及他们履行职责所需的资源。
考虑在发生事件时人员如何进行沟通，是这个过程的一个重要部分。一些威胁会关闭关键网络（例如蜂窝或 Internet 连接），因此拥有员工可以依赖的后备沟通方法非常重要。
4. 测试和更新计划
为了实现可操作，您需要不断实践和优化自己的 BCDR 计划。对员工进行不断的测试和培训将有助于在实际灾难发生时实现无缝部署。演练现实场景，如网络攻击、火灾、洪水、人为错误、大规模中断和其他相关威胁，以便团队成员可以建立对自己角色和职责的信心。
与 BCP 一样，DRP 需要 业务影响分析 (BIA)——概述角色和职责并不断测试和改进。但由于 DRP 本质上更具被动性，因此更加注重风险分析和 数据备份和恢复。DRP 开发的第 2 步和第 3 步、执行风险分析 (RA) 和创建资产清单根本不属于 BCP 开发过程。
以下是创建 DRP 时广泛使用的五步流程：
1. 进行业务影响分析
就像在您的 BCP 流程中一样，首先评估您的公司可能面临的每个威胁及其可能产生的后果。考虑 潜在威胁 可能如何影响日常运营、常规沟通渠道和工人安全。
有效 BIA 的其他考虑因素包括收入损失、停机成本、声誉修复成本（公共关系）、客户和投资者（短期和长期）的损失以及因违规而产生的处罚。
2. 分析风险
DRP 通常需要比 BCP 更仔细的风险评估，因为他们的角色是专注于从潜在灾难中恢复工作。在计划的风险分析 (RA) 部分，考虑风险发生的可能性以及对业务的潜在影响。
3. 创建资产清单
要创建有效的 DRP，必须准确了解您的企业拥有什么、其目的、功能和状态。定期进行资产盘点有助于识别对业务运营至关重要的硬件、软件、IT 基础设施以及组织可能拥有的任何其他资产。确定所有资产后，您可以将其分为三类：关键、重要 和不重要：
4. 确立角色和职责
就像制定 BCP 时一样，您需要明确概述职责并确保团队成员拥有履行必需职责所需的所有资源。没有这一关键步骤，就没有人知道在发生灾难时如何采取行动。制定 DRP 时需要考虑的一些角色和职责如下：
5. 测试和优化
与 BCP 一样，DRP 也需要不断练习和优化才能使其发挥有效作用。定期练习，并根据需要做出的任何有意义的更改进行更新。例如，如果贵公司在 DRP 制定后获得了一项新资产，您就需要将其纳入您的计划，以确保其在未来受到保护。
现代企业对停机时间的容忍度越来越低，这是可以理解的。
似乎每天都有新的网络攻击或意外事件登上头条，给企业造成数百万美元的损失。DRaaS 等灾难恢复解决方案为各种威胁提供有效的数据保护和灾难恢复。
将 DRP 的实施外包并将组织最有价值的数据备份到单独的位置（DRaaS 的两个关键要素），有助于确保您在发生灾难时能够迅速、完全地恢复。
以下是 DRaaS 解决方案的一些主要优点：
当今最具竞争力的企业依靠技术进行其最关键的业务运营。当灾难来临时，正常流程中断的几天、几小时，甚至几分钟都可能造成数百万美元的损失。除此之外，知名公司的网络攻击和停机时间也经常成为新闻，这使得声誉成本也成为恢复费用的一项因素。有效的 DRaaS 为企业提供数据保护和备份，并提高其应对任何威胁的能力。
灾后恢复的成本每年都在增加。仅从数据泄露这种意外事件来看， IBM 最近发布的《数据泄露成本报告》 发现，2023 年数据泄露的平均成本为 445 万美元，比过去 3 年增长了 15%。
当灾难发生时，与不使用 DRaaS 的企业相比，使用 DRaaS 提供商的企业有两个显著优势：他们的备份数据和 负责执行 DRP 的一方都在另一个物理位置。这使得 DRaaS 提供商受到威胁组织的相同事件的影响的可能性要小得多。此外，DRaaS 提供商还提供基于订阅或即用即付的模式，无需对 IT 基础设施进行前期投资。
DRaaS 是一种高度自适应的解决方案，可以量身定制，以满足几乎所有企业的需求。DRaaS 提供商充分利用基于云的功能以及关键流程和任务的自动化，以最大限度地提高效率并减少开销。部署 DRaaS 解决方案的企业可以将关键资源专用于更多核心业务职能，否则这些职能将用于制定、实施和管理 DRP。
医疗保健和个人理财等受严格监管的行业会对发生数据泄露的公司处以巨额罚款。通常，罚款的金额与攻击期间停机时间的时长和泄露的数据量有关。DRaaS 有助于缩短响应和恢复时间，显著减少与数据泄露相关的经济处罚。
DRaaS 提供商部署了最强大的网络安全和加密措施，原因很简单：这是他们的核心业务。当您聘请 DRaaS 提供商时，您就是在聘请数据安全、防盗和灾难恢复方面的专家来做他们最擅长的事情 – 保护您和您最关键数据的安全。
灾难恢复即服务 (DRaaS) 解决方案 分为三种： 自助服务、辅助和托管式 DRaaS。根据组织的需求和资源，这些选项之间存在重大差异，值得考虑。
自助式 DRaaS 为组织提供制定和管理自己的 DRP 所需的业务工具和资源。它非常适合拥有专门的内部 IT 团队的技术先进的组织，这些团队需要对其流程进行高水平的控制。
因为它是如此简单，所以自助式 DRaaS 的定价选项比其他计划低，而且更加灵活。但是组织应该知道，采用自助式 DRaaS 解决方案，他们在 DRP 的计划、测试和管理阶段都是独立的。
对于需要平衡控制需求与第三方 MSP 的强大支持的组织来说，辅助 DRaaS 是一种很好的恢复服务。在辅助 DRaaS 中，MSP 帮助制定、计划、实施、测试和优化 DRP，并在整个过程中提供宝贵的专业知识和指导。
托管 DRaaS 是一种完全外包的 DRaaS 解决方案，其中 MSP 完全控制并负责组织 DRP 的制定和实施。对于没有自己的 IT 部门的企业来说，托管 DRaaS 是一个强大的选择，它提供了最强大的 DRaaS 产品。毫不奇怪，它往往也是最昂贵的。
