支持的数据源

IBM® Cloud Pak for Data ,无论数据位于何处,您都可以连接到它们。

连接到数据的方式

连接到数据的方式取决于多个因素,包括安装在 Cloud Pak for Data上的服务。 某些服务可以使用在平台级别定义的连接,而其他服务使用特定于该服务的连接。

使用以下列表来确定适用于您的用例的方法。

在平台级别创建连接
通常,平台级别连接可简化创建和维护连接的过程。 创建连接,然后多个服务可以引用该连接。 如果更新连接,那么使用该连接的分析项目会自动选取更改。

您可以从 平台连接 页面创建平台级别连接。 这些连接可由整个平台上的各种服务使用。 但是,仅当安装了 Cloud Pak for Data common core services 时, " 平台连接 " 页面才可用。

有关更多信息,请参阅 在平台级别连接到数据源

如果以下语句成立,请考虑在平台级别创建连接:

  • 服务支持平台级连接。
  • 相同的连接需要由多个服务或实例使用或者在多个项目中使用。
  • 您具有创建平台级别连接的相应许可权。

    您必须在 " 平台连接 " 页面上具有 编辑者管理员 角色。 有关更多信息,请参阅 管理平台连接上的合作者

平台连接对所有平台用户可视。 但是,只有具有数据源的凭证的用户才能使用连接。

如果您看不到要连接到的数据源类型,那么 Cloud Pak for Data 管理员可以上载 JDBC 驱动程序 JAR 文件,以便您可以创建与该数据源的通用 JDBC 连接。 有关更多信息,请参阅 导入数据源的 JDBC 驱动程序

并非所有服务都支持相同类型的连接。 如果要使用 平台连接 目录中的连接,那么将根据服务支持的连接类型对连接列表进行过滤。 例如,如果您要使用某个连接向分析项目添加数据源,那么只会显示分析项目所支持的连接。

在服务级别创建连接
如果以下任何语句成立,请在服务级别创建连接:
  • 您正在使用的服务不支持平台级连接。
  • 您没有相应的许可权来创建平台级连接。
  • 出于安全原因,您不希望该连接包含在 Connections 目录中。

有关更多信息,请参阅 在服务级别连接到数据源

连接类型

下表列出了可以从 Cloud Pak for Data连接到的数据源。

备注 :在 Watson Knowledge CatalogWatson Studio 列中,本表显示了目录和分析项目中支持的数据源。 这些服务的某些工具仅支持这些数据源的子集。 遵循特定数据源的链接以查看支持该数据源的工具列表。 另请参阅 工具支持的连接类型
连接类型 Watson Knowledge Catalog,
Watson Studio
SPSS® Modeler DataStage® Data Virtualization
Amazon RDS for MySQL
Amazon RDS for Oracle
Amazon RDS for PostgreSQL
Amazon Redshift
Amazon S3
Analytics Engine HDFS    
Apache Cassandra  
Apache Derby  
Apache HDFS  
Apache Hive
连接类型 Watson Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
Apache Kafka      
Box  
Cloudant®    
Cloudera Impala
Cloud Object Storage
Cloud Object Storage (基础架构)    
Cognos® Analytics    
Compose for MySQL
Databases for DataStax    
Databases for MongoDB
连接类型 Watson Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
PostgreSQL 的数据库
Data Virtualization  
Data Virtualization Manager for z/OS®
Db2®
Db2 Big SQL
Db2 Event Store  
Db2 for i
Db2 for z/OS
Db2 Hosted
Db2 on Cloud
连接类型 Watson Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
Db2 Warehouse
Dropbox    
Elasticsearch    
Exasol    
文件系统    
FTP(远程文件系统传输)  
通用 JDBC
通用 S3  
通用服务        
Google BigQuery
连接类型 Watson Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
Google Cloud Pub/Sub      
Google Cloud Storage  
Greenplum
HDFS 通过 Execution Engine for Hadoop    
Hive JDBC    
Hive ,通过 Execution Engine for Hadoop    
HTTP  
Impala 通过 Execution Engine for Hadoop    
Informix®
Looker    
连接类型 Watson Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
MariaDB
Microsoft Azure Blob Storage  
Microsoft Azure Cosmos DB  
Microsoft Azure Data Lake Store  
Microsoft Azure File Storage  
Microsoft Azure SQL Database
Microsoft SQL Server
MinIO    
MongoDB
MQ      
连接类型 Watson Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
MySQL
(我的 SQL Community Edition)
(我的 SQL Enterprise Edition)
Netezza® Performance Server
OData      
ODBC    
Oracle
Planning Analytics  
PostgreSQL
Salesforce.com
SAP ASE
SAP HANA
连接类型 Watson Knowledge Catalog,
Watson Studio
SPSS Modeler DataStage Data Virtualization
SAP IQ    
SAP OData
雪花
SPSS Analytic Server    
SQL Query    
存储卷    
Tableau    
Teradata

其他数据源

管理员可以上载 JDBC 驱动程序以启用与更多数据源的连接。 请参阅 导入数据源的 JBDC 驱动程序

Data Virtualization 服务支持使用第三方 JDBC 驱动程序建立的连接。

请参阅产品路线图 ( http://ibm.biz/AnalyticsRoadmaps ) ,以获取有关支持更多数据源的信息。

数据文件

除了使用远程数据源或集成数据库中的数据之外,还可以使用文件中的数据。 您可以处理以下类型的文件中的数据。

数据文件的类型 支持于
Avro DataStage
SPSS Modeler
Watson Knowledge
目录
Watson Studio
CSV Data Virtualization
DataStage
SPSS Modeler
Watson Knowledge
目录
Watson Studio
JSON Data Virtualization
DataStage
Watson Knowledge
目录
Watson Studio
Microsoft Excel 电子表格 Data Virtualization
SPSS Modeler
Watson Knowledge
目录
Watson Studio
ORC Data Virtualization
Parquet Data Virtualization
DataStage
Watson Knowledge
目录
Watson Studio
SAS SPSS Modeler
Watson Studio (Data Refinery)
SAV SPSS Modeler
TSV Data Virtualization
DataStage
Watson Knowledge
目录
Watson Studio (Data Refinery)
XML SPSS Modeler

连接到数据源(按服务分类)

使用以下资源在应用程序中创建连接。

Cognos Dashboards
您可以使用分析项目中存在的本地和远程数据集。

或者,您可以通过选择分析仪表板菜单中的添加数据源来创建可在分析仪表板中使用的连接。

限制: 分析仪表板仅支持基于 JDBC的连接。

还可以通过在分析仪表板菜单中选择添加数据集来添加文件中的数据。

Data Refinery

您可以使用名为 Data Refinery的图形流编辑器工具来清理和优化表格数据。 要优化数据,必须向数据源添加连接,并且必须了解源文件限制。 有关更多信息,请参阅 优化数据 (Data Refinery) Data Refinery支持的数据源

DataStage
DataStage 使用 DataStage 画布上的 连接器 与远程数据源进行交互。 要连接到数据源,您需要先为关联的 DataStage 连接器创建项目 连接资产 ,然后才能在 DataStage中使用该项目。
Data Virtualization
您可以从以下位置创建可用于数据进行虚拟化的连接:
  • 平台连接 页面
  • Data Virtualization 服务中的 数据源 页面。

有关更多信息,请参阅 添加数据源 (Data Virtualization)

SPSS Modeler
SPSS Modeler 服务中的数据源支持只读访问,读/写访问和 SQL 回送。

SPSS Modeler 服务还支持其他几种文件类型。

有关更多信息,请参阅 SPSS Modeler 支持的数据源

Watson Knowledge Catalog

您可以创建可在目录中使用的连接以及可用于整理数据的连接。

对于可在目录中使用的连接,可以从目录的 " 概述 " 页面创建连接。

有关更多信息,请参阅 将连接资产添加到目录 (Watson Knowledge Catalog)

对于可用于组织数据的连接,可以从以下位置创建连接:
  • 平台连接 页面
  • 创建新发现作业时的 监管 > 数据发现 页面
有关更多信息,请参阅下列资源。
Watson Studio

理想情况下,使用已在目录中的数据。 在目录中搜索所需的数据并将其添加到分析项目。

或者,您可以创建能够在以下位置的分析项目中使用的连接:
  • 连接 页面
  • 分析项目的 资产 页面

还可以添加文件中的数据。 要从文件添加数据,请转至分析项目的 资产 页面。

有关更多信息,请参阅 向分析项目添加数据

了解更多