IBM DataStage

数据流水线新时代：面向 AI 的非结构化数据集成

观看网络研讨会，了解 IBM 如何将我们的数据整合框架扩展到非结构化数据，助您充分解锁新的 AI 潜能。

驱动全球关键任务工作负载

IBM DataStage 是行业领先的数据集成解决方案，支持提取、转换、加载 (ETL) 及提取、加载、转换 (ELT) 模式。它能够帮助企业连接异构源，大规模转换海量复杂数据，并向分析与 AI 应用程序交付可信数据。

DataStage 的强大功能现已集成于 watsonx.data 平台，可跨任意集成模式（批处理、实时流、复制、数据可观测性）及数据类型（包括非结构化数据）创建可复用流水线。

一次设计，随处运行

根据数据所在位置（任何区域、本地、云或混合云环境）灵活定制数据流水线，并优化成本、性能与安全性。

赋能全体用户

提供无代码、低代码和专业代码选项简化流水线设计，使不同技能水平的用户都能构建流水线并交付高质量数据。

更快执行更多数据流水线

借助高性能处理实现数据转换的规模化扩展，加速从设计到生产的全过程。

内置可靠性

集成可观测性、质量管控、血缘分析与治理功能，有效减少流水线异常，交付更可信的数据。

采用全托管的云端控制面板（用于流水线设计）与安全数据面板（用于在数据所在地执行）相分离的架构，最大限度减少数据出入流量、延迟及安全风险。

单一设计界面支持用户创建可复用流水线，并根据用例选择运行时模式——无需手动修改代码即可在 ETL/ELT/TETL 运行时模式间自由切换。

顶尖的并行处理引擎通过自动流水线技术将数据任务拆分为大量同步运行的微操作，实现并发作业执行，从而提升速度、扩展性与性能。

全功能软件开发工具包 (SDK) 支持编程用户使用首选语言构建和维护流水线，同时保持图形化流水线的可复用性，并支持代码与图形用户界面 (GUI) 的灵活切换。

完全通过自然语言构建 DataStage 流水线。借助交互式聊天机器人，只需输入需求意图即可快速开始开发流水线，比以往更加轻松高效。

IBM 地址验证接口 (AVI) 通过 CASS 认证、解析、音译转写、地理编码及反向地理编码技术，对地址数据进行验证、整理和转换。

单一设计界面支持用户创建可复用流水线，并根据用例选择运行时模式——无需手动修改代码即可在 ETL/ELT/TETL 运行时模式间自由切换。

顶尖的并行处理引擎通过自动流水线技术将数据任务拆分为大量同步运行的微操作，实现并发作业执行，从而提升速度、扩展性与性能。

完全通过自然语言构建 DataStage 流水线。借助交互式聊天机器人，只需输入需求意图即可快速开始开发流水线，比以往更加轻松高效。

IBM 地址验证接口 (AVI) 通过 CASS 认证、解析、音译转写、地理编码及反向地理编码技术，对地址数据进行验证、整理和转换。