IBM® DataStage® 是一款行业领先的数据集成工具,可帮助您设计、开发和运行旨在移动和转换数据的作业。从核心功能看,DataStage 工具支持提取、转换和加载 (ETL) 以及提取、加载和转换 (ELT) 两类模式。该软件的基本版本可用于本地部署,但为了缩短数据集成时间和降低成本,可升级至 DataStage for IBM Cloud Pak for Data®,在混合或多云环境中体验其强大的自动集成功能。
立即开始为您的 AI 实施构建可信的数据基础。加入我们,了解 IBM 数据整合工具 DataStage 和 IBM 的下一代数据存储 watsonx.data 的实际应用。
什么是 IBM Cloud Pak for Data?这是建立于 Red Hat® OpenShift® 容器编排平台上的云原生洞察平台,集成了 Data Fabric 体系结构内收集、整理和分析数据所需的诸多工具。它对分布式环境上的数据进行动态的智能化编排,从而为各类数据使用方创建即时可用的信息网络。IBM Cloud Pak for Data 既可部署在本地,也可作为 IBM Cloud® 上的一项服务运行,还可部署于任何供应商的云端环境上。
DataStage 可作为 IBM Cloud Pak for Data 软件许可证的附加组件,也可通过“IBM Cloud Pak for Data as a Service”作为一项服务运行。
利用 SQL Pushdown 提取、加载和转换批量数据。
Cloud Pak for Data 4.7 现已上市。了解新增功能
了解有关 aaS 发布的更多信息
查看产品文档
注册参加 2022 年 Gartner® 数据整合工具魔力象限™
借助工作负载均衡和并行引擎,可确保工作负载运行速度加快 30%¹。
实现数据集成。只需一次设计,即可将运行时移动至数据存储位置。
在保留现有 DataStage 投资资产的同时,积极扩展各项功能。
在 IBM Cloud Pak for Data 上使用治理功能
在 IBM Cloud Pak for Data 平台上管理数据及分析生命周期。服务包括数据科学、事件消息传递、数据虚拟化和数据仓储等。
通过运行行业最佳的并行引擎和负载均衡功能,最大程度提高吞吐量,从而优化 ETL 性能,并实现大规模处理数据。
利用 IBM Watson® Knowledge Catalog,保护元数据交换中的敏感数据。采用数据沿袭功能,查看如何通过转换和集成实现数据流动。
自动执行从开发、测试到生产的持续集成/持续交付 (CI/CD) 作业管道,并帮助降低开发成本。
使用预构建的连接和阶段在多个云来源和数据仓库之间迁移数据,如 IBM Netezza® 和 IBM Db2® Warehouse on Cloud。
借助用户友好型界面中的机器学习辅助设计,提高开发人员工作效率,并帮助降低开发成本。
使用 IBM InfoSphere® QualityStage® 交付可信数据,在目标环境采集数据时自动解决质量问题。
基础架构管理工作量减少 65% - 85%²,让用户专注于更高价值的任务。
无论数据位于何处,都可以远程执行云运行时,同时维护数据主权并将成本减至最低。
访问作为 IBM DataStage on IBM Cloud Pak for Data as a Service 的一部分提供的全部最新功能,这个订阅模式提供了一套可以在 IBM Cloud 上完全托管的集成服务。
将 IBM DataStage Enterprise(或 IBM DataStage Enterprise Plus)添加至 IBM DataStage on IBM Cloud Pak for Data as a Service 中,以便在本地或任何云端环境运行工作负载。
使用 IBM DataStage on IBM Cloud Pak for Data as a Service 在本地运行基本 ETL 作业。采用并行处理以及企业连接功能,成功交付一个扩展自如的平台。
1 《借助 IBM DataStage on IBM Cloud Pak for Data 实现工作负载均衡》(PDF),2020 年 11 月
2 Forrester,《新技术:IBM Cloud Pak for Data 预计产生的总体经济影响》(PDF),2020 年 2 月