连接到数据源
在平台级别连接到数据源
您可以创建可由平台中的各种服务使用的连接。 有权访问平台的任何用户都可以查看这些连接。 但是,只有具有数据源的凭证的用户才能使用连接。
这些平台级别的连接在平台连接页面上可用。 但是,仅当安装了 Cloud Pak for Data common core services 时, " 平台连接 " 页面才可用。
- Cognos Analytics
- DataStage
- IBM Knowledge Catalog
- IBM watsonx.ai
- Data Virtualization
- Watson Studio
在将连接添加到项目之后,许多使用 Watson Studio 的工具都可以使用来自这些连接的数据。
平台连接页面是平台资产目录的专门视图。 在 " 平台连接 " 页面上定义的连接也包含在 Platform assets catalog中。
平台连接页面显示平台上各种服务可以使用的连接的列表。 所有用户至少具有目录上的查看者角色,这意味着他们可以查看定义的连接。 有关更多信息,请参阅 管理平台连接上的合作者。
- 必需的许可权
- 要创建平台级别的连接,您必须是 Platform assets catalog上的 编辑者 或 管理员 。
观看此视频以了解如何创建平台级别连接。
此视频提供了一种可视方法来学习本文档中的概念和任务。
要创建平台级别连接:
- 登录到 Cloud Pak for Data Web 客户机。
- 从导航菜单中,选择 。
- 单击 平台连接 选项卡,然后单击 新建连接。
- 选择数据源类型,然后选择连接器。以下连接具有必须满足的其他需求,然后才能使用这些连接:
- 需要 JAR 文件的连接
- 某些预定义连接以及 通用 JDBC 连接要求 Cloud Pak for Data 管理员上载数据源的 JDBC 驱动程序。 有关更多信息,请参阅 导入数据源的 JDBC 驱动程序。
- 存储卷
- 如果要连接到存储卷 (例如,外部 NFS 服务器或持久卷声明) ,那么具有 创建服务实例 许可权的用户必须将该卷添加到 Cloud Pak for Data。 有关更多信息,请参阅 管理存储卷。
- 输入连接的名称和描述。
- 输入连接的详细信息。
要创建的连接器确定必须指定的信息。 通常,连接需要以下任一项:
- 主机名和端口号
- URL
您可能还需要指定要连接到的数据库。
- 输入连接的凭证。
- 如果出现提示,请指定是要使用个人凭证还是共享凭证。 创建连接后,无法更改此选项。
- 个人
- 使用个人凭证时,每个用户必须指定自己的凭证才能访问连接。 每个用户的凭证都会保存,但不会与任何其他用户共享。 使用个人凭证而不是共享凭证来保护凭证。 例如,如果您使用个人凭证,并且其他用户更改了连接属性 (例如主机名或端口号) ,那么凭证将失效以防止恶意重定向。
- 共享
- 通过共享凭证,所有用户都可以使用您提供的凭证来访问连接。 缺省设置为 共享。 共享凭证可能由有权访问连接资产的用户检索。 由于凭证是共享的,因此很难审计对连接的访问权,识别数据丢失的来源,或者识别安全漏洞的来源。 管理员可以 禁用共享凭证。
- 连接器确定必须指定的凭证。 通常,连接需要用户名和密码或者 API 密钥和密钥。 某些数据源允许您以匿名方式连接。
- 您可能需要指定要如何提供凭证。 可用的选项取决于平台的配置方式。
- 手动输入凭证
- 使用此选项,您可以在 Web 客户机中手动输入凭证。 平台会存储这些凭证并使用它们对您进行认证。
这是输入凭证的缺省方法。 但是,管理员可以选择禁用此方法。 有关更多信息,请参阅 要求用户在创建连接时使用凭证的私钥。
- 使用保险库文件中的密钥
- 使用此选项,可以选择包含相应凭证的私钥。 例如,如果需要指定用户名和密码,请选择包含用户名的私钥和包含密码的私钥。 平台使用密钥 (存储在保险库文件中) 对您进行认证。
如果您正在使用外部保险库文件中的私钥,那么必须具有相应的许可权才能连接到外部保险库文件,或者管理员必须与您共享相应的私钥。 有关更多信息,请参阅 管理私钥和保险库。
- 使用我的平台登录凭证
- 通过此选项,平台将使用您的平台凭证对您进行认证。
仅当数据源是要在其中创建连接的 Cloud Pak for Data 实例上部署的服务时,此选项才可用。
- 如果出现提示,请指定是要使用个人凭证还是共享凭证。 创建连接后,无法更改此选项。
- 如果要阻止用户 (包括连接的所有者) 通过 API 调用检索未屏蔽的敏感凭证,请将 屏蔽通过 API 调用检索的敏感凭证 设置为 开启 。 此设置对连接表单本身没有影响。 以下工具支持此设置:
- Analytics Engine powered by Apache Spark
- AutoAI (Watson Machine Learning)
- Data Refinery (Watson Studio)
- Decision Optimization
- IBM Match 360 with Watson
- 笔记本 (Watson Studio)。 更新通过 API 调用引用连接的任何 Notebook 以使用 Flight service。
- 如果适用,请指定连接到数据源所需的 SSL 信息。
某些数据源要求您使用 SSL 进行安全通信。 其他数据源支持 SSL,但不要求使用 SSL。 请确保了解您需要提供哪些信息以与数据源安全地通信:
- 如果您指定的端口号配置为接受 SSL 连接,请确保选中端口配置为接受 SSL 连接
- 如果数据源使用自签名证书,那么必须指定证书内容以启用 Cloud Pak for Data 与数据源之间的安全通信。
- 如果数据源使用链式证书,可以指定多个证书的内容。
某些服务可以使用存储为私钥的 SSL 证书。 如果您正在使用外部保险库文件中的私钥,那么必须具有相应的许可权才能连接到外部保险库文件,或者管理员必须与您共享相应的私钥。 有关更多信息,请参阅 管理私钥和保险库。
在服务级别连接到数据源
通常,如果在服务级别创建连接,该连接仅可从在其中创建该连接的服务进行访问。
| 服务 | 了解更多 |
|---|---|
| Cognos Dashboards | 您可以使用 CSV 文件, Microsoft Excel 电子表格,已连接的数据资产和 Data Virtualization 资产作为仪表板的数据源。 必须先将所有这些数据源添加到项目中,然后才能将其用作数据源。 通过单击 " 所选源 " 窗格中的 添加源 (+) 按钮,将数据源添加到仪表板。 有关更多信息,请参阅 Cognos Dashboards。 |
| DataStage | DataStage 使用 DataStage 画布上的 连接器 与远程数据源进行交互。 要连接到数据源,您需要先为关联的 DataStage 连接器创建项目 连接资产 ,然后才能在 DataStage中使用该项目。
|
| IBM Knowledge Catalog | 您可以创建可在目录中使用的连接以及可用于整理数据的连接。 从目录的 " 概述 " 页面添加可在目录中使用的连接。 可以创建新连接或从现有平台级别连接中选取。 有关更多信息,请参阅 将连接资产添加到目录。 将数据资产发布到目录时,除非该连接存在于目录中,否则将随该连接一起发布。 对于可用于整理数据的连接,可以按如下所示创建连接:
|
| IBM watsonx.ai | 从 Tuning Studio中调整基础模型时,将基础模型输入/输出对的样本添加为训练数据。 您可以从存储在已连接数据存储器中的 JSON 或 JSONL 文件中获取这些样本,也可以从存储在已连接数据库中的表格数据中获取这些样本。 有关更多信息,请参阅 用于调整基础模型的数据格式。 您可以从以下位置创建可在项目中使用的连接:
|
| Data Virtualization | 您可以从以下位置创建可用于数据进行虚拟化的连接:
有关更多信息,请参阅 添加数据源 (Data Virtualization)。 |
| Db2 Big SQL | 您可以创建连接以从对象存储库或远程 Hadoop 集群查询数据。 在供应 Db2
Big SQL 实例时连接到数据源。 有关更多信息,请参阅 为 Db2 Big SQL创建服务实例。 |
| Watson Studio | 理想情况下,您应该使用目录中已有的数据。 在目录中搜索所需的数据,并将其添加到项目中。 或者,您可以从以下位置创建可在项目中使用的连接:
还可以添加文件中的数据。 要从文件添加数据,请转至项目的 " 资产 " 页面。 在所有项目,空间和目录中,资产的初始存储限制为 100 GB。 有关更多信息,请参阅 向项目添加数据。 |
| Data Product Hub | 创建数据产品的大多数方法都需要与数据源连接。 您可以添加连接以访问广泛的数据源,从而创建和交付数据产品。 有关在 Data Product Hub中连接到远程数据源的指示信息,请参阅 Connectors for Data Product Hub。 要查看受支持连接器的列表以及相应的交付方法,请参阅 连接器的交付方法。 |