什么是数据迁移?
详细了解在企业范围内规划数据迁移项目所面临的挑战,并探索最佳实践以确保项目取得成功。
订阅 IBM 时事通讯
黑色和蓝色背景
什么是数据迁移?

数据迁移是将数据从一个存储系统或计算环境转移到另一个存储系统或计算环境的过程。

企业可能需要开展数据迁移项目的原因有很多。 例如,可能要更换服务器或存储设备,或者整合或停用数据中心。 在将本地 IT 基础架构迁移到云计算环境的整个过程中,数据迁移也是必不可少的一步。

无论是要迁移到公有云、私有云、混合云还是多云环境,都需要找到一种安全、经济实惠且高效的方法,将数据迁移到新的存储位置。

了解 watsonx.data

面向所有数据随处扩展 AI 工作负载

将数据迁移到云端

如今,企业产生的数据量不断增长,同时,他们也还面临着日益紧迫的压力,需要最大程度地发掘数据中蕴藏的价值。 在这种形势下,成功越来越取决于以下因素:能否为工作负载选择最合适的环境,以及能否确保数据高效存储且易于访问。

许多企业选择将工作负载迁移到云端,希望在最经济实惠、性能最高的可用 IT 环境中托管应用。 选择合适的数据迁移解决方案是云迁移规划过程中关键的一环,甚至在过程的最早阶段就应纳入考虑范畴。

有多个选项可用于将数据从本地数据中心传输到云,但从广义上讲,它们分为两类:

  • 联机迁移:通过互联网或者私有或专用 WAN 连接迁移数据。

  • 脱机迁移:通过在原始数据中心和目标云存储地点之间运输实体的存储设备来转移数据。

特定数据迁移项目的最佳选择取决于需要转移多少数据、必须以多快的速度完成迁移、所涉及的工作负载类型以及安全要求。

有关可用数据迁移选项的概述,请观看 Katie Morgan 的视频"数据迁移详解":

数据库迁移

数据库迁移是专用工作负载迁移的一个例子。 许多公有云和私有云提供商都会提供一些工具,用于帮助简化或自动完成数据库迁移过程的某些环节,确保数据库在整个转移过程中安全无虞,并且不会发生数据丢失或损坏等情况。 此外,大多数云提供商还提供迁移服务,可以在转移后验证数据的完整性。

通常情况下,数据库迁移过程中的第一步是转换源数据库的模式(如有必要),使其符合目标数据库的规范。 数据库的模式就像是表明其组织方式的蓝图,控制着数据库的逻辑架构和结构。 如果目标数据库管理系统使用的数据定义语言 (DDL) 与源数据库所用的语言不兼容,那么就需要转换模式。

接下来便是迁移数据并设置持续的数据仓库增量更新。 如有必要,还可在此过程中将多个不同的数据库合并为一个数据库。 要了解有关在云端存储数据时如何组织数据的更多信息,请查看"云数据库详解"。

数据中心迁移

将整个数据中心环境迁移到云端或另一地点是一个规模浩大的综合过程。 若想成功完成此类迁移项目,并尽可能地减少宕机时间或运营中断情况,就需要仔细进行规划和协调。

在考虑数据中心迁移或任何其他大规模数据迁移项目时,务必要在规划阶段及早制定时间表,因为 PB 级传输可能需要数周时间才能完成,即便使用相对高速的网络连接也不例外。

制定战略时需要考虑的因素

企业制定的数据迁移计划越细致,遭遇意外成本或计划外宕机的可能性也就越小,最终用户在迁移期间和迁移后感到不满或不便的可能性也就越低。 为此,您需要设定目标,建立时间表,并预测可能会遇到的任何挑战。

在确定如何处理项目时,应考虑以下三个主要因素:

工作负载的类型。专用工作负载(例如虚拟机 (VM)、备份或数据库)通常可以使用软件供应商专门针对要迁移的数据类型提供的工具进行迁移。 如果您无法使用这些工具,就需要仔细规划可能的宕机时间。 可以分阶段传输任务关键型工作负载的数据,在整个过程中不时进行测试,同时让源系统和目标系统保持并行运行。 或者,也可以规划在生产时间之外进行大规模转移(如果能够在可用时间窗口内完成)。

数据量。 如果迁移的数据量少于 10 TB,那么将数据传送到客户所提供存储设备上的新存储位置通常是最简单、最经济实惠的方法。 对于数据量更大的传输(例如,PB 级数据),那么云提供商提供的专用数据迁移设备可能是最方便、最实惠的选择。 虽然在理论上,可对任意数量的数据使用联机迁移方法,但时间因素限制了这种方法用于大量数据迁移的可行性。

完成速度。 对于联机迁移,传输的数据量和网络连接的速度将决定数据迁移所花的时间。 对于脱机迁移,则必须考虑运送时间。 如果由始至终的迁移速度是您关心的主要问题,并且您有足够的可用带宽可专门用于迁移,那么联机传输可能是最佳选择。 但是,如果您的迁移截止期限很灵活和/或存在带宽或其他网络方面的限制,那么脱机迁移可能是正确的选择。

最佳实践

为确保项目顺利进行,应遵循以下最佳实践:

了解数据及其用途。 现在谁使用这些数据,将来谁会使用它,又将如何使用? 例如,就存储和格式要求而言,用于分析的数据可能与为实现法规合规性而保留的数据截然不同。 在整个迁移过程中,务必要从所有相关的利益相关方和业务部门那里收集信息。

仔细评估源环境和目标环境。 同一操作系统是否将在两个环境中运行? 数据库模式或其他格式是否需要更改? 在迁移之前是否需要解决任何问题(例如冗余问题或"脏"数据过多的问题)?

在流程早期验证业务需求和潜在影响。 需要什么样的迁移时间表? 如果某个数据中心即将停用,其租约何时到期? 在整个迁移过程中,必须确保哪些类型的数据安全性? 是否可以容忍任何数据丢失或损坏,如果可以,容忍度是多少? 延迟或意外障碍会对业务有何影响?

风险

虽然 IT 系统现代化的好处大于数据迁移相关的风险(尤其是从长远来看),但数据迁移还是会带来压力并存在风险。 以下是一些需要考虑的风险:

  • 安全性:确保所有数据在迁移前都经过安全加密。 对于涉及运输数据存储设备的脱机迁移,应确认托运方的货运和物流服务的安全性。
  • 传输时间长:完全准确地预测联机传输时间可能十分困难。 网络瓶颈可能会限制连接速度,系统硬件限制也可能会影响可从中读写的数据量。

  • 高于预期的成本:意外成本通常是由于计划不当造成的。 例如,所需时间超出预期的联机传输会产生额外费用。 如果保留供应商提供的存储设备的时间比您最初同意的保留时间要长(这可能是由于将数据转移到设备或运输延迟所致),也会产生额外的费用。
工具

如今,有许多工具可帮助简化企业数据迁移。 这包括云提供商提供的特定于供应商的解决方案,用于支持客户迁移到特定供应商的公有云或私有云环境,此外还包括获得许可的工具和开源工具。 可通过数据迁移策略确定哪些工具最适合自己的项目。

一些比较热门的选择包括:

  • Veeam 提供面向 VMware vSphere 的快速迁移工具,旨在加快和简化在存储环境和主机之间迁移基于虚拟机的工作负载的过程。

  • Zerto 提供了一个用于灾难恢复、备份和工作负载移动的融合平台,支持从单一应用到整个数据中心的各种规模的迁移。

  • Rclone 是一个开源命令行实用程序,可用于向云对象存储迁移数据,或从云对象存储迁移数据。 它可以自动分割大型对象,并行上传对象的各个部分。

  • Cyberduck 是一个开源 FTP 和 SFTP 客户端,可用于在主机之间传输个别文件或批量文件,或者将文件传输到云环境中。
服务

有些数据迁移服务作为企业内部能力的有益补充,而有些则负责管理从策略制定直至完成、测试和归档的整个迁移过程。 如您所料,后一种服务(通常称为"白手套数据迁移服务")成本更高,但是,如果贵组织内部只具备有限的数据迁移专业知识,并且要迁移业务关键型应用,那么选择这种服务是物有所值的。 数据库迁移顾问可以帮助您规划经济实惠的迁移过程,最大程度地减少乃至完全避免宕机时间。

相关解决方案
数据迁移解决方案

利用简化的工具和专家服务,加速混合云之旅。

探索 IBM 数据迁移解决方案
迁移到云端

快速、安全、可靠地将数据库从本地数据中心迁移到 IBM Cloud。

探索 IBM Lift
资源 存储数据迁移 101:迁移过程

了解不同的应用如何访问存储以及对数据迁移有何影响。

什么是云迁移?

探索云迁移包含的内容,了解制定云迁移计划的好处,并了解如何管理成功的迁移。

采取下一步行动

当您在云之旅中对应用进行现代化改造时,看看数据可以做些什么。 探索 IBM 的数据迁移产品,这些产品旨在帮助客户以无缝、安全且经济有效的方式将数据迁移到 IBM Cloud。 IBM 提供了自助式数据传输选项(如 IBM Cloud Mass Data Migration)、高速在线传输服务(如 IBM Aspera)和 IBM Cloud Direct Link(用于通过专用网络在线传输数据)。

立即了解 IBM 数据迁移服务