连接到数据源

您可以在平台级别或服务级别连接到 IBM Cloud Pak for Data 中的数据源。 连接到数据源的方式取决于多个因素,包括安装在 Cloud Pak for Data上的服务。

在平台级别连接到数据源

您可以创建可由平台中的各种服务使用的连接。 有权访问平台的任何用户都可以查看这些连接。 但是,只有具有数据源的凭证的用户才能使用连接。

这些平台级别的连接在平台连接页面上可用。 但是,仅当安装了 Cloud Pak for Data common core services 时, " 平台连接 " 页面才可用。

当前,以下服务可以使用平台连接页面中的连接:
  • Cognos Analytics
  • DataStage
  • IBM Knowledge Catalog
  • IBM watsonx.ai
  • Data Virtualization
  • Watson Studio

    在将连接添加到项目之后,许多使用 Watson Studio 的工具都可以使用来自这些连接的数据。

限制: 并非所有服务都支持相同的连接。 大多数服务支持该平台所支持的连接的一部分。 有关更多信息,请参阅 连接到数据源 (通过服务)

平台连接页面是平台资产目录的专门视图。 在 " 平台连接 " 页面上定义的连接也包含在 Platform assets catalog中。

平台连接页面显示平台上各种服务可以使用的连接的列表。 所有用户至少具有目录上的查看者角色,这意味着他们可以查看定义的连接。 有关更多信息,请参阅 管理平台连接上的合作者

必需的许可权
要创建平台级别的连接,您必须是 Platform assets catalog上的 编辑者管理员
提示: 请与数据源管理员合作,以确保您具有正确的信息来连接到数据源。

观看此视频以了解如何创建平台级别连接。

此视频提供了一种可视方法来学习本文档中的概念和任务。

要创建平台级别连接:

  1. 登录到 Cloud Pak for Data Web 客户机。
  2. 从导航菜单中,选择 数据 > 连接
  3. 单击 平台连接 选项卡,然后单击 新建连接
  4. 选择数据源类型,然后选择连接器。
    以下连接具有必须满足的其他需求,然后才能使用这些连接:
    需要 JAR 文件的连接
    某些预定义连接以及 通用 JDBC 连接要求 Cloud Pak for Data 管理员上载数据源的 JDBC 驱动程序。 有关更多信息,请参阅 导入数据源的 JDBC 驱动程序
    存储卷
    如果要连接到存储卷 (例如,外部 NFS 服务器或持久卷声明) ,那么具有 创建服务实例 许可权的用户必须将该卷添加到 Cloud Pak for Data。 有关更多信息,请参阅 管理存储卷
  5. 输入连接的名称和描述。
  6. 输入连接的详细信息。

    要创建的连接器确定必须指定的信息。 通常,连接需要以下任一项:

    • 主机名和端口号
    • URL

    您可能还需要指定要连接到的数据库。

  7. 输入连接的凭证。
    • 如果出现提示,请指定是要使用个人凭证还是共享凭证。 创建连接后,无法更改此选项。
      个人
      使用个人凭证时,每个用户必须指定自己的凭证才能访问连接。 每个用户的凭证都会保存,但不会与任何其他用户共享。 使用个人凭证而不是共享凭证来保护凭证。 例如,如果您使用个人凭证,并且其他用户更改了连接属性 (例如主机名或端口号) ,那么凭证将失效以防止恶意重定向。
      共享
      通过共享凭证,所有用户都可以使用您提供的凭证来访问连接。 缺省设置为 共享。 共享凭证可能由有权访问连接资产的用户检索。 由于凭证是共享的,因此很难审计对连接的访问权,识别数据丢失的来源,或者识别安全漏洞的来源。 管理员可以 禁用共享凭证
    • 连接器确定必须指定的凭证。 通常,连接需要用户名和密码或者 API 密钥和密钥。 某些数据源允许您以匿名方式连接。
    • 您可能需要指定要如何提供凭证。 可用的选项取决于平台的配置方式。
      手动输入凭证
      使用此选项,您可以在 Web 客户机中手动输入凭证。 平台会存储这些凭证并使用它们对您进行认证。

      这是输入凭证的缺省方法。 但是,管理员可以选择禁用此方法。 有关更多信息,请参阅 要求用户在创建连接时使用凭证的私钥

      使用保险库文件中的密钥
      使用此选项,可以选择包含相应凭证的私钥。 例如,如果需要指定用户名和密码,请选择包含用户名的私钥和包含密码的私钥。 平台使用密钥 (存储在保险库文件中) 对您进行认证。

      如果您正在使用外部保险库文件中的私钥,那么必须具有相应的许可权才能连接到外部保险库文件,或者管理员必须与您共享相应的私钥。 有关更多信息,请参阅 管理私钥和保险库

      使用我的平台登录凭证
      通过此选项,平台将使用您的平台凭证对您进行认证。

      仅当数据源是要在其中创建连接的 Cloud Pak for Data 实例上部署的服务时,此选项才可用。

  8. 如果要阻止用户 (包括连接的所有者) 通过 API 调用检索未屏蔽的敏感凭证,请将 屏蔽通过 API 调用检索的敏感凭证 设置为 开启 。 此设置对连接表单本身没有影响。 以下工具支持此设置:
    • Analytics Engine powered by Apache Spark
    • AutoAI (Watson Machine Learning)
    • Data Refinery (Watson Studio)
    • Decision Optimization
    • IBM Match 360 with Watson
    • 笔记本 (Watson Studio)。 更新通过 API 调用引用连接的任何 Notebook 以使用 Flight service
  9. 如果适用,请指定连接到数据源所需的 SSL 信息。

    某些数据源要求您使用 SSL 进行安全通信。 其他数据源支持 SSL,但不要求使用 SSL。 请确保了解您需要提供哪些信息以与数据源安全地通信:

    • 如果您指定的端口号配置为接受 SSL 连接,请确保选中端口配置为接受 SSL 连接
    • 如果数据源使用自签名证书,那么必须指定证书内容以启用 Cloud Pak for Data 与数据源之间的安全通信。
    • 如果数据源使用链式证书,可以指定多个证书的内容。

    某些服务可以使用存储为私钥的 SSL 证书。 如果您正在使用外部保险库文件中的私钥,那么必须具有相应的许可权才能连接到外部保险库文件,或者管理员必须与您共享相应的私钥。 有关更多信息,请参阅 管理私钥和保险库

在服务级别连接到数据源

通常,如果在服务级别创建连接,该连接仅可从在其中创建该连接的服务进行访问。

服务 了解更多
Cognos Dashboards 您可以使用 CSV 文件, Microsoft Excel 电子表格,已连接的数据资产和 Data Virtualization 资产作为仪表板的数据源。 必须先将所有这些数据源添加到项目中,然后才能将其用作数据源。

通过单击 " 所选源 " 窗格中的 添加源 (+) 按钮,将数据源添加到仪表板。

有关更多信息,请参阅 Cognos Dashboards

DataStage DataStage 使用 DataStage 画布上的 连接器 与远程数据源进行交互。 要连接到数据源,您需要先为关联的 DataStage 连接器创建项目 连接资产 ,然后才能在 DataStage中使用该项目。
IBM Knowledge Catalog 您可以创建可在目录中使用的连接以及可用于整理数据的连接。

从目录的 " 概述 " 页面添加可在目录中使用的连接。 可以创建新连接或从现有平台级别连接中选取。

有关更多信息,请参阅 将连接资产添加到目录

将数据资产发布到目录时,除非该连接存在于目录中,否则将随该连接一起发布。

对于可用于整理数据的连接,可以按如下所示创建连接:
  • 平台连接页面。 您可以在设置元数据导入时从这些平台级别的连接中进行选取。
  • 从项目的 " 资产 " 页面设置新的元数据导入时。
IBM watsonx.ai

从 Tuning Studio中调整基础模型时,将基础模型输入/输出对的样本添加为训练数据。 您可以从存储在已连接数据存储器中的 JSON 或 JSONL 文件中获取这些样本,也可以从存储在已连接数据库中的表格数据中获取这些样本。

有关更多信息,请参阅 用于调整基础模型的数据格式

您可以从以下位置创建可在项目中使用的连接:
  • " 平台连接 " 页面
  • 项目的 " 资产 " 页面
Data Virtualization 您可以从以下位置创建可用于数据进行虚拟化的连接:
  • " 平台连接 " 页面
  • Data Virtualization 服务中的 " 数据源 " 页面

有关更多信息,请参阅 添加数据源 (Data Virtualization)

Db2 Big SQL 您可以创建连接以从对象存储库或远程 Hadoop 集群查询数据。 在供应 Db2 Big SQL 实例时连接到数据源。

有关更多信息,请参阅 Db2 Big SQL创建服务实例

Watson Studio 理想情况下,您应该使用目录中已有的数据。 在目录中搜索所需的数据,并将其添加到项目中。

或者,您可以从以下位置创建可在项目中使用的连接:

还可以添加文件中的数据。 要从文件添加数据,请转至项目的 " 资产 " 页面。 在所有项目,空间和目录中,资产的初始存储限制为 100 GB。

有关更多信息,请参阅 向项目添加数据

Data Product Hub

创建数据产品的大多数方法都需要与数据源连接。 您可以添加连接以访问广泛的数据源,从而创建和交付数据产品。

有关在 Data Product Hub中连接到远程数据源的指示信息,请参阅 Connectors for Data Product Hub

要查看受支持连接器的列表以及相应的交付方法,请参阅 连接器的交付方法