连接到数据源
升级至 IBM Software Hub 版本 5.1 ,在 4.8 版本达到支持 IBM Cloud Pak for Data 终止前完成升级。 有关更多信息,请参阅从 IBM Cloud Pak for Data 版本 4.8 升级到 IBM 的说明: Software Hub 版本 5.1。
您可以在 IBM Cloud Pak for Data 平台层或服务层连接到数据源。 连接数据源的方式取决于多个因素,包括安装在上的服务 Cloud Pak for Data。
在平台级别连接到数据源
您可以创建可由平台中的各种服务使用的连接。 有权访问平台的任何用户都可以查看这些连接。 但是,只有具有数据源的凭证的用户才能使用连接。
这些平台级别的连接在平台连接页面上可用。 然而 ,平台连接页面仅在 已 common core servicesCloud Pak for Data 安装时才可用。
- Cognos® Analytics
- DataStage®
- IBM® Knowledge Catalog
- Watson Query
- Watson Studio
许多与 配合使用的工具,在将连接 Watson Studio 添加到项目后,即可使用这些连接中的数据。
平台连接页面是平台资产目录的专门视图。 在平台连接页面上定义的连接也包含在. 中 Platform assets catalog。
平台连接页面显示平台上各种服务可以使用的连接的列表。 所有用户至少具有目录上的查看者角色,这意味着他们可以查看定义的连接。 有关更多信息,请参阅平台连接中的协作者管理。
- 必需的许可权
- 要创建平台级连接,您必须是该平台的编辑 Platform assets catalog 或管理员。
观看此视频以了解如何创建平台级别连接。
本视频提供了一种可视化学习方法,用于掌握本文档中的概念和任务。
要创建平台级别连接:
- 登录到 Cloud Pak for Data Web 客户端。
- 从导航菜单中,选择。
- 点击新建连接。
- 选择要连接到的数据源。以下连接在使用前必须满足额外要求:
- 需要JAR文件的连接
- 某些预定义连接以及通用 JDBC 连接需要管理员 Cloud Pak for Data 为数据源上传 JDBC 驱动程序。 有关详细信息,请参阅《 为数据源导入 JDBC 驱动程序》。
- 存储卷
- 若需连接存储卷(例如外部 NFS 服务器或持久卷声明),则必须由具备" 创建服务实例 "权限的用户将该卷添加至 Cloud Pak for Data。 有关更多信息,请参阅 《管理存储卷》。
- 输入连接的名称和描述。
- 输入连接的详细信息。
您正在创建的连接器决定了您必须指定的信息。 通常,连接需要以下任一项:
- 主机名和端口号
- URL
您可能还需要指定要连接到的数据库。
- 输入连接的凭证。
- 若系统提示,请指定您要使用个人凭据还是共享凭据。 创建连接后,您无法更改此选项。
- 个人
- 使用个人凭证时,每个用户必须指定自己的凭证才能访问连接。 每个用户的凭据都会被保存,但不会与其他用户共享。 使用个人凭证而非共享凭证来保护凭证。 例如,若您使用个人凭据,而其他用户更改了连接属性(如主机名或端口号),则凭据将失效,以防止恶意重定向。
- 共享
- 使用共享凭据时,所有用户都将通过您提供的凭据访问该连接。 默认设置为共享。 共享凭据可能被能够访问连接资产的用户检索到。 由于凭证是共享的,因此难以审计连接访问情况、追溯数据泄露的源头或查明安全漏洞的根源。 管理员可以禁用共享凭据。
- 连接器决定了您必须指定的凭据。 通常,连接需要用户名和密码,或API密钥和密钥。 某些数据源允许您以匿名方式连接。
- 您可能需要指定希望如何提供凭据。 可用的选项取决于平台的配置方式。
- 手动输入凭证
- 选择此选项时,您需在网页客户端中手动输入凭据。 该平台存储这些凭证,并使用它们来验证您的身份。
这是输入凭据的默认方法。 然而,管理员可选择禁用此方法。 有关更多信息,请参阅 《要求用户在创建连接时使用凭据密钥》。
- 使用保险库文件中的密钥
- 通过此选项,您可以选择包含相应凭据的密钥。 例如,若需指定用户名和密码,请选择包含用户名的密钥和包含密码的密钥。 该平台使用密钥(存储在保险库中)来验证您的身份。
若您使用外部密钥库中的密钥,则必须具备连接外部密钥库的相应权限,或由管理员将相关密钥共享给您。 有关更多信息,请参阅管理机密和保险库。
- 使用我的平台登录凭证
- 选择此选项时,平台将使用您的平台凭据对您进行身份验证。
此选项仅在数据源是部署在您正在创建连接的实例 Cloud Pak for Data 上的服务时可用。
- 若系统提示,请指定您要使用个人凭据还是共享凭据。 创建连接后,您无法更改此选项。
- 若需阻止用户(包括连接所有者) 通过API调用获取未屏蔽的敏感凭据,请将通过API调用获取的敏感凭据设置为" 开启 "状态。 此设置对连接表单本身没有影响。 以下工具支持此设置:
- Analytics Engine powered by Apache Spark
- AutoAI (Watson Machine Learning)
- Data Refinery (Watson Studio)
- Decision Optimization
- IBM Match 360 with Watson
- 笔记本(Watson Studio)。更新任何通过API调用引用该连接的笔记本,使其使用 Flight service。
- 如果适用,请指定连接到数据源所需的 SSL 信息。
某些数据源要求您使用 SSL 进行安全通信。 其他数据源支持 SSL,但不要求使用 SSL。 请确保了解您需要提供哪些信息以与数据源安全地通信:
- 如果您指定的端口号配置为接受 SSL 连接,请确保选中端口配置为接受 SSL 连接
- 如果数据源使用自签名证书,则必须指定证书内容,以便在 Cloud Pak for Data 与数据源之间建立安全通信。
- 如果数据源使用链式证书,可以指定多个证书的内容。
某些服务可以使用以密钥形式存储的SSL证书。 若您使用外部密钥库中的密钥,则必须具备连接外部密钥库的相应权限,或由管理员将相关密钥共享给您。 有关更多信息,请参阅管理机密和保险库。
在服务级别连接到数据源
通常,如果在服务级别创建连接,该连接仅可从在其中创建该连接的服务进行访问。
| 服务 | 了解更多 |
|---|---|
| Cognos Dashboards | 您可以使用CSV文件、Microsoft Excel电子表格、关联数据资产以及 Watson Query 其他资产作为仪表板的数据源。 您必须先将所有这些数据源添加到项目中,才能将其用作数据源。 通过在 “已选数据源 ”窗格中点击 “添加数据源 ( + )”按钮,将数据源添加至仪表板。 有关更多信息,请参阅 Cognos Dashboards 支持的数据源。 |
| DataStage | DataStage 使用画布 DataStage 上的连接器与远程数据源进行交互。 要连接到数据源,您需要先为关联的 DataStage 连接器创建项目连接资源 ,之后才能在 中使用 DataStage它。
|
| IBM Knowledge Catalog | 您可以创建可在目录中使用的连接以及可用于整理数据的连接。 在目录概览页面中添加可用于目录的连接。 可以创建新连接或从现有平台级别连接中选取。 有关更多信息,请参阅《 向目录添加连接资产》。 当您将数据资产发布到目录时,连接也会随其一同发布,除非该连接已在目录中存在。 对于可用于数据整理的连接,您可以按以下方式创建连接:
|
| Watson Query | 您可以从以下位置创建可用于数据进行虚拟化的连接:
有关更多信息,请参阅添加数据源(Watson Query)。 |
| Watson Studio | 理想情况下,您应该使用目录中已有的数据。 在目录中搜索所需数据,并将其添加到项目中。 或者,您也可以从以下位置创建可在项目中使用的连接:
还可以添加文件中的数据。 要添加文件中的数据,请转到项目的资源页面。 资产的初始存储限制为100 GB,适用于所有项目、空间和目录。 有关更多信息,请参阅《 向项目添加数据》。 |