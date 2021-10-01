可能会将 ELT 与其姊妹进程混淆，后者的首字母缩写几乎相同。然而 ELT 和 ETL 之间有几个明显的区别，ETL 代表提取、转换和加载。它是一个数据集成过程，将来自多个数据源的数据合并到一个单一的、一致的数据存储中，然后加载到数据仓库或其他目标系统中。传统的 ETL 工具旨在创建数据仓库，以支持商业智能 (BI) 和人工智能 (AI) 应用程序。

ETL 和 ELT—有什么区别？

其中明显的区别在于：ELT 流程会在“转换”功能之前执行“加载”功能，而这与 ETL 流程的第二步和第三步相反。ELT 会从源位置复制或导出这些数据，但不是将其加载到暂存区域进行转换，而是将原始数据直接加载到目标数据存储，以便按需在此进行转换。ELT 不会转换任何传输中的数据。

但是，这些步骤的顺序并不是唯一的区别所在。在 ELT 中，目标数据存储可以是数据仓库，但通常则是数据湖；后者是一个大型中央存储，它旨在保存大规模的结构化与非结构化数据。

数据湖的管理需使用大数据平台（如 Apache Hadoop）或分布式 NoSQL 数据管理系统。它们可为商业智能提供支持，但更多时候，它们则是为支持人工智能、机器学习、预测分析以及由实时数据与事件流驱动的应用程序而创建的。

此外，ETL 与 ELT 之间还存在其他差异。例如，由于 ETL 在将数据移动到中央存储库之前会对数据进行转换，因此较之 ELT，ETL 可进一步简化或系统化数据隐私合规性（例如，如果分析人员在需要使用敏感数据之前不对其进行转换，则可能会在数据湖中将其暴露。）然而，数据科学家可能更偏爱 ELT，因为此模式可让他们在原始数据的“沙盒”中随意操作，并根据特定应用程序进行自己的数据转换。但在大多数情况下，选择 ETL 还是 ELT 取决于在可用业务资源与需求之间进行选择。