Orígenes de datos soportados

Puede conectarse a muchos orígenes de datos en Cloud Pak for Data. Algunos servicios dan soporte a conexiones con orígenes de datos definidos a nivel de plataforma, mientras que otros servicios utilizan conexiones específicas del servicio.

Modos de conectar con sus datos
Conectores
Otros orígenes de datos
Archivos de datos
Conexión con orígenes de datos (por servicio)

Modos de conectar con sus datos

Utilice la lista siguiente para elegir un método para conectarse a los datos para su caso de uso.

Creación de conexiones a nivel de plataforma

En general, las conexiones en el nivel de la plataforma simplifican el proceso de creación y mantenimiento de conexiones. Puede crear la conexión y, a continuación, varios servicios pueden hacer referencia a la conexión. Si actualiza la conexión, los cambios los seleccionan automáticamente los proyectos que utilizan la conexión.

Puede crear conexiones a nivel de plataforma desde la página Conexiones de plataforma. Estas conexiones las pueden utilizar distintos servicios en toda la plataforma. Sin embargo, la página Conexiones de plataforma sólo está disponible si se ha instalado Cloud Pak for Data common core services.

Para obtener más información, consulte Conexión a orígenes de datos a nivel de plataforma.

Considere la posibilidad de crear conexiones a nivel de plataforma si las sentencias siguientes son verdaderas:

Los servicios dan soporte a conexiones a nivel de plataforma.
Varios servicios o instancias o varios proyectos han de utilizar la misma conexión.
Tiene los permisos adecuados para crear conexiones a nivel de plataforma.
Debe tener el rol Editor o Administrador en la página Conexiones de plataforma. Para obtener más información, consulte Gestión de colaboradores en conexiones de plataforma.

Las conexiones de la plataforma son visibles para todos los usuarios de la plataforma. Sin embargo, solo los usuarios con las credenciales del origen de datos pueden utilizar la conexión.

Si no ve el tipo de origen de datos al que desea conectarse, un administrador de Cloud Pak for Data puede crear un conector JDBC personalizado para el origen de datos. Si se está conectando a un solo origen de datos y los usuarios no necesitan un método repetible para conectarse a él, puede crear una conexión JDBC genérica.

No todos los servicios soportan los mismos tipos de conexiones. Si desea utilizar una conexión del catálogo de Conexiones de plataforma, la lista de conexiones se filtra en función de los tipos de conexiones a las que da soporte el servicio. Por ejemplo, si está utilizando una conexión para añadir un origen de datos a un proyecto, sólo se visualizan las conexiones soportadas para los proyectos.

Creación de conexiones a nivel de servicio

Cree conexiones a nivel de servicio, si alguna de las sentencias siguientes es verdadera:

El servicio que está utilizando no da soporte a las conexiones a nivel de plataforma.
No tiene los permisos adecuados para crear conexiones a nivel de plataforma.
No desea que la conexión se incluya en el catálogo de Conexiones por motivos de seguridad.

Para obtener más información, consulte Conexión a orígenes de datos en el nivel de servicio.

Conectores

La tabla siguiente lista los orígenes de datos a los que puede conectarse desde Cloud Pak for Data.

Conector	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Amazon RDS for MySQL	✓ Consulte la nota	✓	✓	✓
Amazon RDS for Oracle	✓ Consulte la nota		✓	✓
Amazon RDS for PostgreSQL	✓ Consulte la nota	✓	✓	✓
Amazon Redshift	✓ Consulte la nota	✓	✓	✓
Amazon S3	✓ Consulte la nota	✓	✓	✓
Apache Cassandra	✓ Consulte la nota	✓	✓
Apache Cassandra for DataStage			✓
Apache Derby	✓ Consulte la nota	✓	✓	✓
Apache HBase			✓
Apache HDFS	✓ Consulte la nota	✓	✓
Connector	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Apache Hive	✓ Consulte la nota	✓	✓	✓
Apache Impala	✓ Consulte la nota	✓	✓	✓
Apache Kafka	✓ Consulte la nota		✓
Box	✓ Consulte la nota	✓	✓
DataStax Enterprise			✓
Dremio	✓ Consulte la nota		✓
Dropbox	✓ Consulte la nota	✓	✓
Elasticsearch	✓ Consulte la nota		✓
Exasol	✓ Consulte la nota	✓	✓
Sistema de archivos			✓	✓
FTP (transferencia de sistema de archivos remoto)	✓ Consulte la nota	✓	✓
JDBC genérico	✓ Consulte la nota		✓	✓
Connector	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
S3 genérico	✓ Consulte la nota		✓
Google BigQuery	✓ Consulte la nota	✓	✓	✓
Google Cloud Pub/Sub			✓
Google Cloud Storage	✓ Consulte la nota	✓	✓
Google Looker	✓ Consulte la nota	✓	✓
Greenplum	✓ Consulte la nota	✓	✓	✓
HDFS a través de Execution Engine for Hadoop	✓ Consulte la nota	✓
Hive JDBC			✓	✓
Hive a través de Execution Engine for Hadoop	✓ Consulte la nota	✓
HTTP	✓ Consulte la nota	✓	✓
Connector	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
IBM Cloud Data Engine	✓ Consulte la nota	✓	✓
IBM Cloud Databases for MongoDB	✓ Consulte la nota	✓	✓	✓
IBM Cloud Databases for MySQL	✓ Consulte la nota	✓	✓	✓
IBM Cloud Databases for PostgreSQL	✓ Consulte la nota	✓	✓	✓
IBM Cloud Object Storage	✓ Consulte la nota	✓	✓	✓
IBM Cloud Object Storage (infraestructura)	✓ Consulte la nota	✓
IBM Cloudant	✓ Consulte la nota	✓
IBM Cognos Analytics	✓ Consulte la nota	✓	✓
IBM Data Virtualization	✓ Consulte la nota	✓	✓
IBM Data Virtualization Manager for z/OS	✓ Consulte la nota	✓	✓	✓
Connector	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
IBM Db2	✓ Consulte la nota	✓	✓	✓
IBM Db2 for DataStage			✓
IBM Db2 Big SQL	✓ Consulte la nota	✓	✓	✓
IBM Db2 for i	✓ Consulte la nota	✓	✓	✓
IBMDb2 for z/OS	✓ Consulte la nota	✓	✓	✓
IBM Db2 on Cloud	✓ Consulte la nota	✓	✓	✓
IBM Db2 Warehouse	✓ Consulte la nota	✓	✓	✓
IBM Informix	✓ Consulte la nota	✓	✓	✓
IBM Match 360	✓ Consulte la nota		✓
Connector	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
IBM MQ			✓
IBM Netezza Performance Server	✓ Consulte la nota	✓	✓	✓
IBM Netezza Performance Server for DataStage			✓
IBM Planning Analytics	✓ Consulte la nota	✓	✓	✓
IBM Product Master	✓ Consulte la nota
IBM SPSS Analytic Server	✓ Consulte la nota	✓
IBM watsonx.data Presto	✓ Consulte la nota		✓
Impala mediante Execution Engine for Hadoop	✓ Consulte la nota	✓
MariaDB	✓ Consulte la nota	✓	✓	✓
Microsoft Azure Blob Storage	✓ Consulte la nota	✓	✓
Microsoft Azure Cosmos DB	✓ Consulte la nota	✓	✓
Microsoft Azure Data Lake Storage	✓ Consulte la nota	✓	✓
Microsoft Azure Databricks	✓ Ver nota		✓
Connector	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Microsoft Azure File Storage	✓ Consulte la nota	✓	✓
Microsoft Azure SQL Database	✓ Consulte la nota	✓	✓	✓
Microsoft Azure Synapse Analytics	✓ Consulte la nota		✓
Microsoft Power BI (Azure)	IBM Knowledge Catalog
Microsoft Power BI Desktop	IBM Knowledge Catalog
Microsoft SQL Server	✓ Consulte la nota	✓	✓	✓
Microsoft SQL Server Integration Services	IBM Knowledge Catalog
Microsoft SQL Server Reporting Services	IBM Knowledge Catalog
MicroStrategy	IBM Knowledge Catalog
Milvus	✓ Consulte la nota
MinIO	✓ Consulte la nota	✓	✓	✓
MongoDB	✓ Consulte la nota	✓	✓	✓
MySQL ( Mi SQL Community Edition ) ( Mi SQL Enterprise Edition )	✓ Consulte la nota	✓	✓	✓
OData	✓ Consulte la nota
ODBC		✓	✓
Oracle	✓ Consulte la nota	✓	✓	✓
Oracle Database for DataStage			✓
Oracle Business Intelligence Enterprise Edition	IBM Knowledge Catalog
Oracle Data Integrator	IBM Knowledge Catalog
PostgreSQL	✓ Consulte la nota	✓	✓	✓
Presto	✓ Consulte la nota	✓	✓	✓
Connector	IBM Knowledge Catalog, Watson Studio	SPSS Modeler	DataStage	Data Virtualization
Qlik Sense	IBM Knowledge Catalog
Salesforce.com	✓ Consulte la nota	✓	✓	✓
Salesforce API for DataStage			✓
SAP ASE	✓ Consulte la nota	✓	✓	✓
SAP BAPI			✓
SAP BusinessObjects	✓ Consulte la nota		✓
SAP Bulk Extract			✓
SAP Delta Extract			✓
SAP HANA	✓ Consulte la nota	✓	✓	✓
SAP IDoc			✓
SAP IQ	✓ Consulte la nota	✓	✓
SAP OData	✓ Consulte la nota	✓	✓	✓
SingleStoreDB	✓ Consulte la nota	✓	✓
Snowflake	✓ Consulte la nota	✓	✓	✓
Storage volume	✓ Consulte la nota	✓	✓
Tableau	✓ Consulte la nota	✓	✓
Teradata	✓ Consulte la nota	✓	✓	✓
Teradata database for DataStage			✓
Vertica	✓ Consulte la nota		✓

Nota: En la columna IBM Knowledge Catalog, Watson Studio , esta tabla muestra los orígenes de datos soportados en catálogos y proyectos. Algunas herramientas para estos servicios sólo dan soporte a un subconjunto de esos orígenes de datos. Siga el enlace de un origen de datos específico para ver la lista de herramientas que dan soporte a ese origen de datos. Consulte también Conectores soportados por herramienta.

Otros orígenes de datos

Un administrador puede cargar controladores JDBC para habilitar conexiones con más orígenes de datos. Consulte Importación de controladores JBDC para orígenes de datos.

El servicio Data Virtualization da soporte a las conexiones que se establecen utilizando controladores JDBC de terceros.

Archivos de datos

Además de utilizar datos de orígenes de datos remotos o bases de datos integradas, puede utilizar datos de archivos. Puede trabajar con datos desde los siguientes tipos de archivos.

Tipo de archivo de datos	Soportado en
Avro	DataStage IBM Knowledge Catalog SPSS Modeler Watson Studio
CSV	DataStage Decision Optimization IBM Knowledge Catalog SPSS Modeler Data Virtualization Watson Studio
JSON	DataStage Decision Optimization (formato tabular JSON) IBM Knowledge Catalog Data Virtualization Watson Studio
Hojas de cálculo de Microsoft Excel	DataStage IBM Knowledge Catalog SPSS Modeler Data Virtualization Watson Studio
ORC	DataStage Data Virtualization
Parquet	DataStage IBM Knowledge Catalog Data Virtualization Watson Studio
SAS	SPSS Modeler Watson Studio (Data Refinery)
SAV	DataStage SPSS Modeler
TSV	DataStage IBM Knowledge Catalog Data Virtualization Watson Studio (Data Refinery)
XML	DataStage Decision Optimization (formato tabular XML) SPSS Modeler

Conexión con orígenes de datos (por servicio)

Utilice los recursos siguientes para crear conexiones en la aplicación.

Cognos Dashboards

Puede utilizar archivos CSV, hojas de cálculo de Microsoft Excel, activos de datos conectados y activos de Data Virtualization como orígenes de datos para un panel de control. Debe añadir todos estos orígenes de datos a un proyecto antes de poder utilizarlos como orígenes de datos.

Añada orígenes de datos a un panel de instrumentos pulsando el botón Añadir un origen (+) en el panel Orígenes seleccionados .

Para obtener más información, consulte Orígenes de datos soportados para Cognos Dashboards.

Data Refinery

Puede limpiar y refinar datos tabulares con una herramienta de editor de flujo gráfico denominada Data Refinery. Para refinar datos, debe añadir conexiones a los orígenes de datos y comprender las limitaciones del archivo de origen. Para obtener más información, consulte Refinar datos (Refinería de datos) y Orígenes de datos soportados para Refinería de datos.

Data Virtualization

Puede crear conexiones que puedan utilizarse para controlar los datos desde las siguientes ubicaciones:

La página Conexiones de plataforma
La página Orígenes de datos del servicio Data Virtualization.

Para obtener más información, consulte Conexión a orígenes de datos en Data Virtualization.

Véase también Orígenes de datos soportados en Data Virtualization.

DataStage

DataStage utiliza conectores en el lienzo de DataStage para trabajar con orígenes de datos remotos. Para conectarse al origen de datos, debe crear un activo de conexión para el conector DataStage asociado antes de poder utilizarlo en DataStage.

Para obtener instrucciones sobre cómo conectarse a un origen de datos remoto en DataStage, consulte Conexión a un origen de datos en DataStage.
Para obtener la lista de conectores DataStage disponibles, consulte Orígenes de datos soportados en DataStage.
Para añadir un archivo local como, por ejemplo, un archivo CSV, consulte Adición de datos a un proyecto.

Db2 Big SQL

Puede crear conexiones para consultar datos de un almacén de objetos o un clúster de Hadoop remoto. Se conecta a un origen de datos al suministrar una instancia de Db2 Big SQL .

Para obtener más información, consulte Creación de una instancia de servicio para Db2 Big SQL.

Decision Optimization

Puede utilizar CSV, JSON (formato tabular), XML (formato tabular) o activos conectados para crear y desplegar modelos de Decision Optimization .

Para obtener más información, consulte Orígenes de datos soportados para Decision Optimization.

IBM Knowledge Catalog

Puede crear conexiones que se pueden utilizar en el catálogo o en proyectos y conexiones que se pueden utilizar para organizar los datos. En general, puede crear conexiones desde la página Conexiones de plataforma . Además, puede crear conexiones como se indica a continuación:

Conexiones que se pueden utilizar en un catálogo desde la página Activos del catálogo. Para obtener más información, consulte Adición de un activo de conexión a un catálogo.
Conexiones que se pueden utilizar en proyectos desde la página Activos del proyecto. Para obtener más información, consulte Adición de datos a un proyecto.
Conexiones que se pueden utilizar para la importación de metadatos en proyectos al crear el activo de importación de metadatos. Para obtener más información, consulte Gestión de importaciones de metadatos.

IBM watsonx.ai

Cuando ajusta un modelo de base desde Tuning Studio, añade ejemplos de pares de entrada y salida de modelo de base como datos de entrenamiento. Puede obtener estos ejemplos de un archivo JSON o JSONL que almacena en un almacén de datos conectado o de datos tabulares almacenados en una base de datos conectada.

Debe crear la conexión con el origen de datos que desea utilizar para poder acceder a él desde Tuning Studio. A continuación, puede añadir datos directamente desde el origen de datos conectado o desde un activo de datos que cree con datos del origen de datos conectado.

Para obtener más información sobre los orígenes de datos soportados, consulte Formatos de datos para ajustar modelos de base.

Puede crear conexiones que se pueden utilizar en proyectos desde las ubicaciones siguientes:

La página Conexiones de plataforma
La página Activos del proyecto

Para obtener más información, consulte Adición de datos a un proyecto.

SPSS Modeler

Los orígenes de datos del servicio de SPSS Modeler dan soporte a acceso de sólo lectura, acceso de lectura/escritura y pushback de SQL.

El servicio SPSS Modeler también da soporte a varios otros tipos de archivo.

Para obtener más información, consulte Orígenes de datos soportados para SPSS Modeler.

Synthetic Data Generator

Los orígenes de datos del servicio de Synthetic Data Generator dan soporte al acceso de sólo lectura y al acceso de lectura/escritura.

El servicio Synthetic Data Generator también da soporte a varios otros tipos de archivo.

Para obtener más información, consulte Orígenes de datos soportados para Synthetic Data Generator.

Watson Machine Learning Accelerator

Puede crear conexiones que se pueden utilizar en proyectos desde las ubicaciones siguientes:

La página Conexiones
La página Activos del proyecto

También puede añadir datos desde archivos. Para añadir datos de archivos, vaya a la página Activos del proyecto.

Para obtener más información, consulte Adición de datos a un proyecto.

Consulte también Orígenes de datos soportados para Watson Machine Learning Accelerator.

Watson Studio

Lo ideal es utilizar datos que ya estén en un catálogo. Busque los datos que desea en un catálogo y añádalos a un proyecto.

De forma alternativa, puede crear conexiones que se pueden utilizar en proyectos desde las ubicaciones siguientes:

La página Conexiones
La página Activos del proyecto

También puede añadir datos desde archivos. Para añadir datos de archivos, vaya a la página Activos del proyecto.

Para obtener más información, consulte Adición de datos a un proyecto.

Data Product Hub

Puede añadir conexiones para acceder a una amplia selección de orígenes de datos para crear y entregar productos de datos.

Para obtener más información, consulte Conectores para Data Product Hub.

Orígenes de datos soportados

Modos de conectar con sus datos

Conectores

Otros orígenes de datos

Archivos de datos

Conexión con orígenes de datos (por servicio)

Más información