DataStage

Versión: 5.1.3

Experiencia: Cloud Pak for Data

Descripción

Puede utilizar los servicios de DataStage, DataStage Enterprise y DataStage Enterprise Plus, para diseñar y ejecutar flujos de datos que mueven y transforman datos. Puede componer sus flujos de datos con agilidad y precisión utilizando una interfaz de diseño gráfico intuitiva que le permite conectar con una amplia gama de orígenes de datos, integrar y transformar los datos y entregarlos a su sistema de destino en lotes o en tiempo real.

Los dos servicios ofrecen cientos de operaciones empresariales integradas listas para su uso para sus flujos de datos. El tiempo de ejecución paralelo de alto rendimiento subyacente de DataStage le permite un escalado que se ajusta a sus necesidades de volúmenes de datos y a la complejidad de los datos.

Utilice DataStage Enterprise Plus para acceder a todas las capacidades que tiene DataStage Enterprise, aunque con características adicionales útiles para la calidad de los datos. Estas características incluyen:

  • Limpieza de datos mediante la identificación de posibles anomalías y discrepancias de los metadatos.
  • Identificación de duplicados mediante la coincidencia de datos y la coincidencia probabilística de las entidades de datos entre dos conjuntos de datos.

Si tiene la oferta ELT Pushdown Express , el uso se limita a compilar todos los flujos de DataStage en SQL y ejecutarlos en modalidad de envío de SQL.

Información sobre licencias

Este servicio está incluido en las siguientes licencias:

  • IBM® DataStage® Enterprise Cartridge
  • IBM DataStage Enterprise Plus Cartridge

Para más información, consulte Licencias y derechos.

Enlaces rápidos

Orígenes de datos compatibles

Consulte Orígenes de datos soportados para obtener una lista de servicios de orígenes de datos que son compatibles.

Servicios integrados

Tabla 1. Servicios relacionados. Los siguientes servicios relacionados se utilizan a menudo con este servicio y proporcionan características complementarias, pero no son necesarios.
Servicio Prestación
IBM Knowledge Catalog Cree catálogos de activos organizados con esta plataforma segura de gestión de catálogos empresariales que está soportada por la infraestructura de gobierno de datos.
Watson Studio Prepare, analice y modele datos en un entorno de colaboración con herramientas para científicos de datos, desarrolladores y expertos del dominio.
Orchestration Pipelines Utilice Orchestration Pipelines y cree flujos integrales de canalizaciones de aprendizaje automático para crear modelos y personalizar diversas funciones.