Orígenes de datos soportados

Puede conectarse a muchos orígenes de datos en Cloud Pak for Data. Algunos servicios dan soporte a conexiones con orígenes de datos definidos a nivel de plataforma, mientras que otros servicios utilizan conexiones específicas del servicio.

Modos de conectar con sus datos

Utilice la lista siguiente para elegir un método para conectarse a los datos para su caso de uso.

Creación de conexiones a nivel de plataforma
En general, las conexiones en el nivel de la plataforma simplifican el proceso de creación y mantenimiento de conexiones. Puede crear la conexión y, a continuación, varios servicios pueden hacer referencia a la conexión. Si actualiza la conexión, los cambios los seleccionan automáticamente los proyectos que utilizan la conexión.

Puede crear conexiones a nivel de plataforma desde la página Conexiones de plataforma. Estas conexiones las pueden utilizar distintos servicios en toda la plataforma. Sin embargo, la página Conexiones de plataforma sólo está disponible si se ha instalado Cloud Pak for Data common core services.

Para obtener más información, consulte Conexión a orígenes de datos a nivel de plataforma.

Considere la posibilidad de crear conexiones a nivel de plataforma si las sentencias siguientes son verdaderas:

  • Los servicios dan soporte a conexiones a nivel de plataforma.
  • Varios servicios o instancias o varios proyectos han de utilizar la misma conexión.
  • Tiene los permisos adecuados para crear conexiones a nivel de plataforma.

    Debe tener el rol Editor o Administrador en la página Conexiones de plataforma. Para obtener más información, consulte Gestión de colaboradores en conexiones de plataforma.

Las conexiones de la plataforma son visibles para todos los usuarios de la plataforma. Sin embargo, solo los usuarios con las credenciales del origen de datos pueden utilizar la conexión.

Si no ve el tipo de origen de datos al que desea conectarse, un administrador de Cloud Pak for Data puede crear un conector JDBC personalizado para el origen de datos. Si se está conectando a un solo origen de datos y los usuarios no necesitan un método repetible para conectarse a él, puede crear una conexión JDBC genérica.

No todos los servicios soportan los mismos tipos de conexiones. Si desea utilizar una conexión del catálogo de Conexiones de plataforma, la lista de conexiones se filtra en función de los tipos de conexiones a las que da soporte el servicio. Por ejemplo, si está utilizando una conexión para añadir un origen de datos a un proyecto, sólo se visualizan las conexiones soportadas para los proyectos.

Creación de conexiones a nivel de servicio
Cree conexiones a nivel de servicio, si alguna de las sentencias siguientes es verdadera:
  • El servicio que está utilizando no da soporte a las conexiones a nivel de plataforma.
  • No tiene los permisos adecuados para crear conexiones a nivel de plataforma.
  • No desea que la conexión se incluya en el catálogo de Conexiones por motivos de seguridad.

Para obtener más información, consulte Conexión a orígenes de datos en el nivel de servicio.

Conectores

La tabla siguiente lista los orígenes de datos a los que puede conectarse desde Cloud Pak for Data.

Conector IBM Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
Amazon RDS for MySQL Consulte la nota
Amazon RDS for Oracle Consulte la nota
Amazon RDS for PostgreSQL Consulte la nota
Amazon Redshift Consulte la nota
Amazon S3 Consulte la nota
Apache Cassandra Consulte la nota  
Apache Cassandra for DataStage      
Apache Derby Consulte la nota
Apache HBase      
Apache HDFS Consulte la nota  
Connector IBM Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
Apache Hive Consulte la nota
Apache Impala Consulte la nota
Apache Kafka Consulte la nota    
Box Consulte la nota  
DataStax Enterprise      
Dremio Consulte la nota    
Dropbox Consulte la nota  
Elasticsearch Consulte la nota  
Exasol Consulte la nota  
Sistema de archivos    
FTP (transferencia de sistema de archivos remoto) Consulte la nota  
JDBC genérico Consulte la nota
Connector IBM Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
S3 genérico Consulte la nota  
Google BigQuery Consulte la nota
Google Cloud Pub/Sub      
Google Cloud Storage Consulte la nota  
Google Looker Consulte la nota  
Greenplum Consulte la nota
HDFS a través de Execution Engine for Hadoop Consulte la nota    
Hive JDBC    
Hive a través de Execution Engine for Hadoop Consulte la nota    
HTTP Consulte la nota  
Connector IBM Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
IBM Cloud Data Engine Consulte la nota  
IBM Cloud Databases for MongoDB Consulte la nota
IBM Cloud Databases for MySQL Consulte la nota
IBM Cloud Databases for PostgreSQL Consulte la nota
IBM Cloud Object Storage Consulte la nota
IBM Cloud Object Storage (infraestructura) Consulte la nota    
IBM Cloudant Consulte la nota    
IBM Cognos Analytics Consulte la nota  
IBM Data Virtualization Consulte la nota  
IBM Data Virtualization Manager for z/OS Consulte la nota
Connector IBM Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
IBM Db2 Consulte la nota
IBM Db2 for DataStage      
IBM Db2 Big SQL Consulte la nota
IBM Db2 for i Consulte la nota
IBMDb2 for z/OS Consulte la nota
IBM Db2 on Cloud Consulte la nota
IBM Db2 Warehouse Consulte la nota
IBM Informix Consulte la nota
IBM Match 360 Consulte la nota    
Connector IBM Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
IBM MQ      
IBM Netezza Performance Server Consulte la nota
IBM Netezza Performance Server for DataStage      
IBM Planning Analytics Consulte la nota
IBM Product Master Consulte la nota      
IBM SPSS Analytic Server Consulte la nota    
IBM watsonx.data Presto Consulte la nota    
Impala mediante Execution Engine for Hadoop Consulte la nota    
MariaDB Consulte la nota
Microsoft Azure Blob Storage Consulte la nota  
Microsoft Azure Cosmos DB Consulte la nota  
Microsoft Azure Data Lake Storage Consulte la nota  
Microsoft Azure Databricks Ver nota    
Connector IBM Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
Microsoft Azure File Storage Consulte la nota  
Microsoft Azure SQL Database Consulte la nota
Microsoft Azure Synapse Analytics Consulte la nota    
Microsoft Power BI (Azure) IBM Knowledge Catalog      
Microsoft Power BI Desktop IBM Knowledge Catalog      
Microsoft SQL Server Consulte la nota
Microsoft SQL Server Integration Services IBM Knowledge Catalog      
Microsoft SQL Server Reporting Services IBM Knowledge Catalog      
MicroStrategy IBM Knowledge Catalog      
Milvus Consulte la nota      
MinIO Consulte la nota
MongoDB Consulte la nota
MySQL
( Mi SQL Community Edition )
( Mi SQL Enterprise Edition )
Consulte la nota
OData Consulte la nota      
ODBC    
Oracle Consulte la nota
Oracle Database for DataStage      
Oracle Business Intelligence Enterprise Edition IBM Knowledge Catalog      
Oracle Data Integrator IBM Knowledge Catalog      
PostgreSQL Consulte la nota
Presto Consulte la nota
Connector IBM Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
Qlik Sense IBM Knowledge Catalog      
Salesforce.com Consulte la nota
Salesforce API for DataStage      
SAP ASE Consulte la nota
SAP BAPI      
SAP BusinessObjects Consulte la nota    
SAP Bulk Extract      
SAP Delta Extract      
SAP HANA Consulte la nota
SAP IDoc      
SAP IQ Consulte la nota  
SAP OData Consulte la nota
SingleStoreDB Consulte la nota  
Snowflake Consulte la nota
Storage volume Consulte la nota  
Tableau Consulte la nota  
Teradata Consulte la nota
Teradata database for DataStage      
Vertica Consulte la nota    
Nota: En la columna IBM Knowledge Catalog, Watson Studio , esta tabla muestra los orígenes de datos soportados en catálogos y proyectos. Algunas herramientas para estos servicios sólo dan soporte a un subconjunto de esos orígenes de datos. Siga el enlace de un origen de datos específico para ver la lista de herramientas que dan soporte a ese origen de datos. Consulte también Conectores soportados por herramienta.

Otros orígenes de datos

Un administrador puede cargar controladores JDBC para habilitar conexiones con más orígenes de datos. Consulte Importación de controladores JBDC para orígenes de datos.

El servicio Data Virtualization da soporte a las conexiones que se establecen utilizando controladores JDBC de terceros.

Archivos de datos

Además de utilizar datos de orígenes de datos remotos o bases de datos integradas, puede utilizar datos de archivos. Puede trabajar con datos desde los siguientes tipos de archivos.

Tipo de archivo de datos Soportado en
Avro DataStage
IBM Knowledge Catalog
SPSS
Modeler
Watson Studio
CSV
DataStage
Decision Optimization
IBM Knowledge Catalog
SPSS
Modeler
Data Virtualization
Watson Studio
JSON
DataStage
Decision Optimization (formato tabular JSON)
IBM Knowledge Catalog
Data Virtualization
Watson Studio
Hojas de cálculo de Microsoft Excel
DataStage
IBM Knowledge Catalog
SPSS
Modeler
Data Virtualization
Watson Studio
ORC
DataStage
Data Virtualization
Parquet
DataStage
IBM Knowledge Catalog
Data Virtualization
Watson Studio
SAS SPSS Modeler
Watson Studio (Data Refinery)
SAV
DataStage
SPSS
Modeler
TSV
DataStage
IBM Knowledge Catalog
Data Virtualization
Watson Studio (Data Refinery)
XML
DataStage
Decision Optimization (formato tabular XML)
SPSS
Modeler

Conexión con orígenes de datos (por servicio)

Utilice los recursos siguientes para crear conexiones en la aplicación.

Cognos Dashboards
Puede utilizar archivos CSV, hojas de cálculo de Microsoft Excel, activos de datos conectados y activos de Data Virtualization como orígenes de datos para un panel de control. Debe añadir todos estos orígenes de datos a un proyecto antes de poder utilizarlos como orígenes de datos.

Añada orígenes de datos a un panel de instrumentos pulsando el botón Añadir un origen (+) en el panel Orígenes seleccionados .

Para obtener más información, consulte Orígenes de datos soportados para Cognos Dashboards.

Data Refinery

Puede limpiar y refinar datos tabulares con una herramienta de editor de flujo gráfico denominada Data Refinery. Para refinar datos, debe añadir conexiones a los orígenes de datos y comprender las limitaciones del archivo de origen. Para obtener más información, consulte Refinar datos (Refinería de datos) y Orígenes de datos soportados para Refinería de datos.

Data Virtualization
Puede crear conexiones que puedan utilizarse para controlar los datos desde las siguientes ubicaciones:
  • La página Conexiones de plataforma
  • La página Orígenes de datos del servicio Data Virtualization.

Para obtener más información, consulte Conexión a orígenes de datos en Data Virtualization.

Véase también Orígenes de datos soportados en Data Virtualization.

DataStage
DataStage utiliza conectores en el lienzo de DataStage para trabajar con orígenes de datos remotos. Para conectarse al origen de datos, debe crear un activo de conexión para el conector DataStage asociado antes de poder utilizarlo en DataStage.
Db2 Big SQL
Puede crear conexiones para consultar datos de un almacén de objetos o un clúster de Hadoop remoto. Se conecta a un origen de datos al suministrar una instancia de Db2 Big SQL .

Para obtener más información, consulte Creación de una instancia de servicio para Db2 Big SQL.

Decision Optimization
Puede utilizar CSV, JSON (formato tabular), XML (formato tabular) o activos conectados para crear y desplegar modelos de Decision Optimization .

Para obtener más información, consulte Orígenes de datos soportados para Decision Optimization.

IBM Knowledge Catalog
Puede crear conexiones que se pueden utilizar en el catálogo o en proyectos y conexiones que se pueden utilizar para organizar los datos. En general, puede crear conexiones desde la página Conexiones de plataforma . Además, puede crear conexiones como se indica a continuación:
IBM watsonx.ai

Cuando ajusta un modelo de base desde Tuning Studio, añade ejemplos de pares de entrada y salida de modelo de base como datos de entrenamiento. Puede obtener estos ejemplos de un archivo JSON o JSONL que almacena en un almacén de datos conectado o de datos tabulares almacenados en una base de datos conectada.

Debe crear la conexión con el origen de datos que desea utilizar para poder acceder a él desde Tuning Studio. A continuación, puede añadir datos directamente desde el origen de datos conectado o desde un activo de datos que cree con datos del origen de datos conectado.

Para obtener más información sobre los orígenes de datos soportados, consulte Formatos de datos para ajustar modelos de base.

Puede crear conexiones que se pueden utilizar en proyectos desde las ubicaciones siguientes:
  • La página Conexiones de plataforma
  • La página Activos del proyecto

Para obtener más información, consulte Adición de datos a un proyecto.

SPSS Modeler
Los orígenes de datos del servicio de SPSS Modeler dan soporte a acceso de sólo lectura, acceso de lectura/escritura y pushback de SQL.

El servicio SPSS Modeler también da soporte a varios otros tipos de archivo.

Para obtener más información, consulte Orígenes de datos soportados para SPSS Modeler.

Synthetic Data Generator
Los orígenes de datos del servicio de Synthetic Data Generator dan soporte al acceso de sólo lectura y al acceso de lectura/escritura.

El servicio Synthetic Data Generator también da soporte a varios otros tipos de archivo.

Para obtener más información, consulte Orígenes de datos soportados para Synthetic Data Generator.

Watson Machine Learning Accelerator
Puede crear conexiones que se pueden utilizar en proyectos desde las ubicaciones siguientes:
  • La página Conexiones
  • La página Activos del proyecto

También puede añadir datos desde archivos. Para añadir datos de archivos, vaya a la página Activos del proyecto.

Para obtener más información, consulte Adición de datos a un proyecto.

Consulte también Orígenes de datos soportados para Watson Machine Learning Accelerator.

Watson Studio

Lo ideal es utilizar datos que ya estén en un catálogo. Busque los datos que desea en un catálogo y añádalos a un proyecto.

De forma alternativa, puede crear conexiones que se pueden utilizar en proyectos desde las ubicaciones siguientes:
  • La página Conexiones
  • La página Activos del proyecto

También puede añadir datos desde archivos. Para añadir datos de archivos, vaya a la página Activos del proyecto.

Para obtener más información, consulte Adición de datos a un proyecto.

Data Product Hub

Puede añadir conexiones para acceder a una amplia selección de orígenes de datos para crear y entregar productos de datos.

Para obtener más información, consulte Conectores para Data Product Hub.

Más información