与 DataOps 专家一起参加六月份的最新系列网络研讨会

IBM InfoSphere DataStage 助力您的人工智能旅程

IBM ®InfoSphere®DataStage®产品是业界领先的云就绪数据集成解决方案。它能够将可信数据实时传递到数据湖、数据仓库或任何其他多云或混合云环境,从而将业务就绪数据输入到 AI 应用中。现在,借助基于容器和微服务构建的云原生架构,实时分析比以往任何时候都更加容易。

IBM DataStage on IBM Cloud Pak® for Data 允许您通过自动执行和加快完成管理任务来简化操作,从而降低总体拥有成本 (TCO) 并满足业务服务级别协议 (SLA) 要求。支持在任何云或多云环境中部署,可以避免供应商锁定,同时利用来自 Red Hat®OpenShift®的行业领先安全性、可靠性和可扩展性。

通过自动化集成模板,以及与 IBM DataStage on IBM Cloud Pak for Data 的治理、BI、数据虚拟化以及数据科学服务的无缝现成集成,加速 DataOps 和 AI 创新。

阅读 IBM DataStage on Cloud Pak for Data 解决方案简介 (PDF,232 KB)

Call Out

IBM InfoSphere DataStage 优势

通过多云灵活的扩展和均衡功能,缩短工作负载执行时间

利用内置的工作负载均衡和并行引擎,处理任何云环境中的海量数据,从而提高工作负载的运行速度和效率

满足关键任务服务级别协议要求

自动故障检测和解决功能可自动执行和加快完成管理任务,让用户能够专注于更高价值的任务。

加速 AI 计划

通过实时提供高质量数据,缩短交付 AI 计划所需的时间,并加快实现创新的速度。

降低总体拥有成本

通过基于容器的部署,以及自动执行 CI/CD 管道来完成从开发、测试再到生产的作业,从而提高运营效率。

实现数据仓库现代化

通过与 IBM Netezza® 或 IBM Db2® Warehouse 并置在 IBM Cloud Pak for Data System 上,消除网络瓶颈,优化加载时间。

保护数据安全

通过普遍的数据质量和安全性,帮助避免数据安全漏洞,并且能够在合适的时间接触合适的客户。

实践实验室:利用 IBM DataStage 转换数据

实践实验室:利用 IBM DataStage 转换数据 学习教程

IBM InfoSphere DataStage 主要特性

凭借内置的工作负载均衡工具、并行性和动态可扩展性,实现一次设计,随处运行

将设计与运行时分开,能够在数据所在位置运行远程作业。并行引擎优化了 ETL 性能,自动负载均衡工具最大程度增加了吞吐量,同时能够随着数据量的增长而扩展。

自动化的交付管道,能够使作业进入生产环节

基于容器的集成组件以及基于 git 的源代码控制工具,允许 CI/CD 管道实现自动化,用于完成从开发、测试再到生产的作业。

用户友好型设计,具有注入的机器学习功能和丰富的连接器与转换样式

IBM DataStage Flow Designer 具有注入的机器学习功能、内置搜索以及预构建的连接器和转换样式,使您能够快速创建和运行 DataStage 作业,并与治理建立连接。

动态数据质量和数据安全性,支持传输可信数据

在目标环境(例如数据湖)采集数据后,使用 IBM InfoSphere QualityStage® 自动解决质量问题。为策略驱动的敏感数据访问提供元数据支持。

与 Netezza、Db2 和其他仓库无缝集成

预构建的连接器允许您在云数据源和 IBM Cloud Pak for Data System 上的数据仓库之间快速建立连接和迁移数据。

自动生成作业的作业模板

快速创建可复用的作业模板以自动生成作业,并使用定制规则来执行不同模式。

Call Out

IBM InfoSphere DataStage 新增功能

步骤模式中的点

数据集成:AI 战略中至关重要的组成部分

探究为何数据集成对于支持实时访问大量数据的 AI 战略至关重要。

围着会议桌进行集思广益的人

为数据湖提供变更数据捕获功能以执行实时集成

了解如何使用 IBM InfoSphere DataStage 中的变更数据捕获功能来执行实时集成和分析。

在电脑前工作的人

IBM InfoSphere DataStage 可为任何云提供数据集成功能

IBM 商业价值研究院发现,85% 的公司需要管理多云环境。

其他数据集成产品

IBM InfoSphere Information Server for Data Integration

抽取和转换任何样式的数据,并将数据加载到任何系统中。

IBM BigIntegrate

更轻松地集成 Hadoop 大数据。

IBM Cloud Pak for Data

借助可在任何云端运行的开放式可扩展数据和 AI 平台,实现业务转型。

InfoSphere Information Server

提供大规模并行处理 (MPP) 功能,可以实现高度可扩展且灵活的集成平台,用于处理大量各种不同规模的数据。

法律信息

Red Hat® 和 OpenShift® 是 Red Hat, Inc. 或其子公司在美国和其他国家或地区的商标或注册商标。