连接到数据源

重要提示:4.8IBM Cloud Pak® for Data 版本将于2025年7月31日达到支持终止(EOS)。 有关更多信息,请参阅 4.X 版本 IBM Cloud Pak for Data 的服务终止公告

升级至 IBM Software Hub 版本 5.1 ,在 4.8 版本达到支持 IBM Cloud Pak for Data 终止前完成升级。 有关更多信息,请参阅IBM Cloud Pak for Data 版本 4.8 升级到 IBM 的说明: Software Hub 版本 5.1。

您可以在 IBM Cloud Pak for Data 平台层或服务层连接到数据源。 连接数据源的方式取决于多个因素,包括安装在上的服务 Cloud Pak for Data

在平台级别连接到数据源

您可以创建可由平台中的各种服务使用的连接。 有权访问平台的任何用户都可以查看这些连接。 但是,只有具有数据源的凭证的用户才能使用连接。

这些平台级别的连接在平台连接页面上可用。 然而 ,平台连接页面仅在 已 common core servicesCloud Pak for Data 安装时才可用。

当前,以下服务可以使用平台连接页面中的连接:
  • Cognos® Analytics
  • DataStage®
  • IBM® Knowledge Catalog
  • Watson Query
  • Watson Studio

    许多与 配合使用的工具,在将连接 Watson Studio 添加到项目后,即可使用这些连接中的数据。

限制: 并非所有服务都支持相同的连接。 大多数服务支持该平台所支持的连接的一部分。 有关更多信息,请阅《连接到数据源(按服务分类)》。

平台连接页面是平台资产目录的专门视图。 在平台连接页面上定义的连接也包含在. 中 Platform assets catalog

平台连接页面显示平台上各种服务可以使用的连接的列表。 所有用户至少具有目录上的查看者角色,这意味着他们可以查看定义的连接。 有关更多信息,请参阅平台连接中的协作者管理

必需的许可权
要创建平台级连接,您必须是该平台的编辑 Platform assets catalog管理员
提示: 请与您的数据源管理员合作,确保您拥有连接数据源所需的正确信息。

观看此视频以了解如何创建平台级别连接。

本视频提供了一种可视化学习方法,用于掌握本文档中的概念和任务。

要创建平台级别连接:

  1. 登录到 Cloud Pak for Data Web 客户端。
  2. 从导航菜单中,选择数据 > 平台连接
  3. 点击新建连接
  4. 选择要连接到的数据源。
    以下连接在使用前必须满足额外要求:
    需要JAR文件的连接
    某些预定义连接以及通用 JDBC 连接需要管理员 Cloud Pak for Data 为数据源上传 JDBC 驱动程序。 有关详细信息,请参阅《 为数据源导入 JDBC 驱动程序》。
    存储卷
    若需连接存储卷(例如外部 NFS 服务器或持久卷声明),则必须由具备" 创建服务实例 "权限的用户将该卷添加至 Cloud Pak for Data。 有关更多信息,请参阅 《管理存储卷》
  5. 输入连接的名称和描述。
  6. 输入连接的详细信息。

    您正在创建的连接器决定了您必须指定的信息。 通常,连接需要以下任一项:

    • 主机名和端口号
    • URL

    您可能还需要指定要连接到的数据库。

  7. 输入连接的凭证。
    • 若系统提示,请指定您要使用个人凭据还是共享凭据。 创建连接后,您无法更改此选项。
      个人
      使用个人凭证时,每个用户必须指定自己的凭证才能访问连接。 每个用户的凭据都会被保存,但不会与其他用户共享。 使用个人凭证而非共享凭证来保护凭证。 例如,若您使用个人凭据,而其他用户更改了连接属性(如主机名或端口号),则凭据将失效,以防止恶意重定向。
      共享
      使用共享凭据时,所有用户都将通过您提供的凭据访问该连接。 默认设置为共享。 共享凭据可能被能够访问连接资产的用户检索到。 由于凭证是共享的,因此难以审计连接访问情况、追溯数据泄露的源头或查明安全漏洞的根源。 管理员可以禁用共享凭据
    • 连接器决定了您必须指定的凭据。 通常,连接需要用户名和密码,或API密钥和密钥。 某些数据源允许您以匿名方式连接。
    • 您可能需要指定希望如何提供凭据。 可用的选项取决于平台的配置方式。
      手动输入凭证
      选择此选项时,您需在网页客户端中手动输入凭据。 该平台存储这些凭证,并使用它们来验证您的身份。

      这是输入凭据的默认方法。 然而,管理员可选择禁用此方法。 有关更多信息,请参阅 《要求用户在创建连接时使用凭据密钥》

      使用保险库文件中的密钥
      通过此选项,您可以选择包含相应凭据的密钥。 例如,若需指定用户名和密码,请选择包含用户名的密钥和包含密码的密钥。 该平台使用密钥(存储在保险库中)来验证您的身份。

      若您使用外部密钥库中的密钥,则必须具备连接外部密钥库的相应权限,或由管理员将相关密钥共享给您。 有关更多信息,请参阅管理机密和保险库

      使用我的平台登录凭证
      选择此选项时,平台将使用您的平台凭据对您进行身份验证。

      此选项仅在数据源是部署在您正在创建连接的实例 Cloud Pak for Data 上的服务时可用。

  8. 若需阻止用户(包括连接所有者) 通过API调用获取未屏蔽的敏感凭据,请将通过API调用获取的敏感凭据设置为" 开启 "状态。 此设置对连接表单本身没有影响。 以下工具支持此设置:
    • Analytics Engine powered by Apache Spark
    • AutoAI (Watson Machine Learning)
    • Data Refinery (Watson Studio)
    • Decision Optimization
    • IBM Match 360 with Watson
    • 笔记本(Watson Studio)。更新任何通过API调用引用该连接的笔记本,使其使用 Flight service
  9. 如果适用,请指定连接到数据源所需的 SSL 信息。

    某些数据源要求您使用 SSL 进行安全通信。 其他数据源支持 SSL,但不要求使用 SSL。 请确保了解您需要提供哪些信息以与数据源安全地通信:

    • 如果您指定的端口号配置为接受 SSL 连接,请确保选中端口配置为接受 SSL 连接
    • 如果数据源使用自签名证书,则必须指定证书内容,以便在 Cloud Pak for Data 与数据源之间建立安全通信。
    • 如果数据源使用链式证书,可以指定多个证书的内容。

    某些服务可以使用以密钥形式存储的SSL证书。 若您使用外部密钥库中的密钥,则必须具备连接外部密钥库的相应权限,或由管理员将相关密钥共享给您。 有关更多信息,请参阅管理机密和保险库

在服务级别连接到数据源

通常,如果在服务级别创建连接,该连接仅可从在其中创建该连接的服务进行访问。

服务 了解更多
Cognos Dashboards 您可以使用CSV文件、Microsoft Excel电子表格、关联数据资产以及 Watson Query 其他资产作为仪表板的数据源。 您必须先将所有这些数据源添加到项目中,才能将其用作数据源。

通过在 “已选数据源 ”窗格中点击 “添加数据源 ( + )”按钮,将数据源添加至仪表板。

有关更多信息,请参阅 Cognos Dashboards 支持的数据源。

DataStage DataStage 使用画布 DataStage 上的连接器与远程数据源进行交互。 要连接到数据源,您需要先为关联的 DataStage 连接器创建项目连接资源 ,之后才能在 中使用 DataStage它。
IBM Knowledge Catalog 您可以创建可在目录中使用的连接以及可用于整理数据的连接。

在目录概览页面中添加可用于目录的连接。 可以创建新连接或从现有平台级别连接中选取。

有关更多信息,请参阅《 向目录添加连接资产》。

当您将数据资产发布到目录时,连接也会随其一同发布,除非该连接已在目录中存在。

对于可用于数据整理的连接,您可以按以下方式创建连接:
  • 平台连接页面。 在设置元数据导入时,您可以从这些平台级连接中进行选择。
  • 当您从项目的资源页面设置新的元数据导入时。
Watson Query 您可以从以下位置创建可用于数据进行虚拟化的连接:
  • 平台连接页面
  • 服务 Watson Query 中的数据源页面

有关更多信息,请参阅添加数据源(Watson Query

Watson Studio 理想情况下,您应该使用目录中已有的数据。 在目录中搜索所需数据,并将其添加到项目中。

或者,您也可以从以下位置创建可在项目中使用的连接:

还可以添加文件中的数据。 要添加文件中的数据,请转到项目的资源页面。 资产的初始存储限制为100 GB,适用于所有项目、空间和目录。

有关更多信息,请参阅《 向项目添加数据》。