连接到数据源
在 IBM Cloud Pak for Data 4.6 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。
您可以通过多种方式连接 IBM Cloud Pak for Data 中的数据源。
在平台级别连接到数据源
您可以创建可由平台中的各种服务使用的连接。 有权访问平台的任何用户都可以查看这些连接。 但是,只有具有数据源的凭证的用户才能使用连接。
这些平台级别的连接在平台连接页面上可用。 但是,仅当安装了 Cloud Pak for Data common core services 时, " 平台连接 " 页面才可用。
- Cognos® Analytics
- DataStage®
- Watson Knowledge Catalog
- Watson Query
- Watson
Studio
在将连接添加到项目之后,许多使用 Watson Studio 的工具都可以使用来自这些连接的数据。
平台连接页面是平台资产目录的专门视图。 在 " 平台连接 " 页面上定义的连接也包含在 Platform assets catalog中。
平台连接页面显示平台上各种服务可以使用的连接的列表。 所有用户至少具有目录上的查看者角色,这意味着他们可以查看定义的连接。 更多信息,请参阅管理平台连接上的合作者。
- 必需的许可权
- 要创建平台级别的连接,您必须是 Platform assets catalog上的 编辑者 或 管理员 。
观看此视频以了解如何创建平台级别连接。
除了遵循本文档中的书面步骤,您还可以观看此视频了解相关操作。
要创建平台级别连接:
- 登录到 Cloud Pak for Data Web 客户机。
- 从导航菜单中选择。
- 单击 新建连接。
- 选择要连接到的数据源。以下连接具有必须满足的其他需求,然后才能使用这些连接:
- 通用 JDBC
- 如果要通过创建 通用 JDBC 连接来连接到不受支持的数据源,那么 Cloud Pak for Data 管理员必须上载该数据源的 JDBC 驱动程序。 有关更多信息,请参阅 导入数据源的 JDBC 驱动程序。
- 存储卷
- 如果要连接到存储卷 (例如,外部 NFS 服务器或持久卷声明) ,那么具有 创建服务实例 许可权的用户必须将该卷添加到 Cloud Pak for Data。 有关更多信息,请参阅 管理存储卷。
- 输入连接的名称和描述。
- 输入连接的详细信息。
您创建的连接类型确定了您必须指定的信息。 通常,连接需要以下任一项:
- 主机名和端口号
- URL
您可能还需要指定要连接到的数据库。
- 输入连接的凭证。
- 如果出现提示,请指定是要使用个人凭证还是共享凭证。 创建连接后,无法更改此选项。
- 个人
- 使用个人凭证时,每个用户必须指定自己的凭证才能访问连接。 每个用户的凭证都会保存,但不会与任何其他用户共享。 使用个人凭证而不是共享凭证来保护凭证。 例如,如果您使用个人凭证,并且其他用户更改了连接属性 (例如主机名或端口号) ,那么凭证将失效以防止恶意重定向。
- 共享
- 通过共享凭证,所有用户都可以使用您提供的凭证来访问连接。 缺省设置为 共享。 共享凭证可能由有权访问连接资产的用户检索。 因为凭证是共享的,所以很难审计对连接的访问权,识别数据丢失的来源,或者识别安全漏洞的来源。 管理员可以 禁用共享凭证。
- 连接类型确定必须指定的凭证类型。 通常,连接需要用户名和密码或 API 密钥和密钥。 某些数据源允许您以匿名方式连接。
- 您可能需要指定要如何提供凭证。 可用的选项取决于平台的配置方式。
- 手动输入凭证
- 使用此选项,您可以在 Web 客户机中手动输入凭证。 平台会存储这些凭证并使用它们对您进行认证。
这是输入凭证的缺省方法。 但是,管理员可以选择禁用此方法。 有关更多信息,请参阅 要求用户在创建连接时使用凭证的私钥。
- 使用保险库文件中的密钥
- 使用此选项,可以选择包含相应凭证的私钥。 例如,如果需要指定用户名和密码,请选择包含用户名的私钥和包含密码的私钥。 平台使用密钥 (存储在保险库文件中) 对您进行认证。
如果您正在使用外部保险库文件中的私钥,那么必须具有相应的许可权才能连接到外部保险库文件,或者管理员必须与您共享相应的私钥。 有关更多信息,请参阅 管理私钥和保险库。
- 使用我的平台登录凭证
- 通过此选项,平台将使用您的平台凭证对您进行认证。
仅当数据源是要在其中创建连接的 Cloud Pak for Data 实例上部署的服务时,此选项才可用。
- 如果出现提示,请指定是要使用个人凭证还是共享凭证。 创建连接后,无法更改此选项。
- 4.6.1 或更高版本 如果要阻止用户 (包括连接所有者) 通过 API 调用检索未屏蔽的敏感凭证,请将 通过 API 调用检索的掩码敏感凭证 设置为 开启 。 此设置对连接表单本身没有影响。 此设置要求您正在使用的服务支持 Flight service。 并非所有服务都支持 Flight。 如果对不支持 Flight 的服务或工具启用此设置,那么连接将失败。 请参阅 Flight service ,以获取受支持服务的数据源访问权 。 更新通过 API 调用引用此连接的任何 notebook 以使用实时服务。
- 如果适用,请指定连接到数据源所需的 SSL 信息。
某些数据源要求您使用 SSL 进行安全通信。 其他数据源支持 SSL,但不要求使用 SSL。 请确保了解您需要提供哪些信息以与数据源安全地通信:
- 如果您指定的端口号配置为接受 SSL 连接,请确保选中端口配置为接受 SSL 连接
- 如果数据源使用自签名证书,那么必须指定证书内容以启用 Cloud Pak for Data 与数据源之间的安全通信。
- 如果数据源使用链式证书,可以指定多个证书的内容。
某些服务可以使用存储为私钥的 SSL 证书。 如果您正在使用外部保险库文件中的私钥,那么必须具有相应的许可权才能连接到外部保险库文件,或者管理员必须与您共享相应的私钥。 有关更多信息,请参阅 管理私钥和保险库。
在服务级别连接到数据源
通常,如果在服务级别创建连接,该连接仅可从在其中创建该连接的服务进行访问。
| 服务 | 了解更多 |
|---|---|
| Cognos Dashboards | 您可以使用 CSV 文件,数据库连接,已连接的数据资产和 Watson
Query 资产作为仪表板的数据源。 所有这些数据源都必须先添加到项目,然后才能用作数据源。 通过从分析仪表板菜单中选择添加数据,可将数据源添加到仪表板。 有关受支持数据源的详细列表,请参阅 使用 Cognos Dashboards可视化数据。 中的 数据格式 部分 |
| DataStage | DataStage 使用 DataStage 画布上的 连接器 与远程数据源进行交互。 要连接到数据源,您需要先为关联的 DataStage 连接器创建项目 连接资产 ,然后才能在 DataStage中使用该项目。
|
| Watson Knowledge Catalog | 您可以创建可在目录中使用的连接以及可用于整理数据的连接。 从目录的 " 概述 " 页面添加可在目录中使用的连接。 可以创建新连接或从现有平台级别连接中选取。 有关更多信息,请参阅 将连接资产添加到目录 (Watson Knowledge Catalog)。 将数据资产发布到目录时,除非该连接存在于目录中,否则将与该数据资产一起发布该连接。 对于可用于整理数据的连接,可以按如下所示创建连接:
|
| Watson Query | 您可以从以下位置创建可用于数据进行虚拟化的连接:
有关更多信息,请参阅 添加数据源 (Watson Query)。 |
| Watson Studio | 理想情况下,您应该使用目录中已有的数据。 在目录中搜索所需的数据并将其添加到分析项目。 或者,您可以创建能够在以下位置的分析项目中使用的连接:
还可以添加文件中的数据。 要从文件添加数据,请转至分析项目的资产页面。 在所有项目,空间和目录中,资产的初始存储限制为 100 GB。 有关更多信息,请参阅 向分析项目添加数据。 |