使用集成 IBM Db2 Event Store 数据库

如果在 IBM® Cloud Pak for Data 集群中创建了 IBM Db2® Event Store 数据库部署,那么可访问集成数据库控制台以创建表并监视数据库。要将数据装入数据库,可使用 IBM Db2 Event Store 批量插入 API、Notebook、JDBC 和 CSV 文件。

访问数据库

所有 Cloud Pak for Data 用户都可访问数据库。

要访问数据库:
  1. 从导航菜单中,选择数据 > 数据库
  2. 打开要访问的数据库的“操作”菜单,然后选择打开数据库

访问样本 Notebook

IBM Db2 Event Store 包含可以从 GitHub 下载的样本配置页。样本 Notebook 是入门使用 IBM Db2 Event Store API 的一种绝佳方式。

要访问 Notebook,请执行以下操作:
  1. 从导航菜单中,选择数据 > 数据库
  2. 打开要连接到的数据库的“操作”菜单,然后选择详细信息
  3. 从“数据库详细信息”页面上的操作菜单中,选择以下 Notebook 之一:
    • Notebook:IBM Db2 Event Store API

      此 Notebook 包含使用 IBM Db2 Event Store Scala 客户机界面来创建数据库和表的示例。它还显示如何通过使用 Spark SQL 在 IBM Db2 Event Store 中插入和查询数据。

    • Notebook:Event Store ML 评分 Python

      此 Notebook 包含使用 IBM Db2 Event Store Scala 客户机界面来创建数据库和表的示例。它还显示如何通过使用 Spark SQL 在 IBM Db2 Event Store 中插入和查询数据。此外,此 Notebook 显示如何使用 IBM Db2 Event Store 数据库中的数据来构建和部署机器学习模型。

  4. 要使用 Cloud Pak for Data 中的样本 Notebook,请执行以下操作:
    1. 在 GitHub 中,打开代码选项卡并下载存储库。
    2. 将样本 Notebook ipynb 文件上载到 Cloud Pak for Data 中的项目。请注意,需要 Watson Studio 才能运行 Notebook。

监视数据库

您可以使用集成的监视控制台以确保该数据库正常运行。

要监视数据库:

  1. 访问数据库
  2. 选择监视以打开控制台。
从控制台,您可以看到以下度量:
指标 描述
数据流概述 指示以下信息:
  • 将数据从数据源采集到数据库的速率。
  • 将数据从数据库日志持久存储到共享存储器的速率。
  • 集群中节点的总体运行状况。
资源使用情况 在 CPU、内存、存储和日志空间方面,指示数据库的资源使用情况。此外,该表指示打开的数据库连接数。
汇总的采集速率 指示将流式数据采集到数据库日志文件(在持久存储到共享存储器之前)的速率。显示每个节点的速率并进行汇总以给出整个数据库的速率。
汇总的共享存储器速率 指示将流式数据持久存储到共享存储器的速率。显示每个节点的速率并进行汇总以给出整个数据库的速率。

在将数据持久存储到共享存储器时,将移除重复条目、生成关联的索引,并将数据写入到高度压缩的 Apache Parquet 格式。

创建表

要点: 创建表后,无法进行编辑。必须删除表并重新创建。有关更多信息,请参阅 Develop applications for IBM Db2 Event Store 中相应的 API 指南。

您可以使用以下方法来创建表:

  • Cloud Pak for Data Web 控制台。
  • 通过使用其中一个 Db2 Event Store API,从独立程序或 Notebook。
  • 通过使用 eventstoreUtils 宏
  • 通过使用连接到数据库的远程 Db2 客户机,以远程方式。

要从 Web 控制台创建表:

  1. 访问数据库
  2. 打开菜单并选择
  3. 单击添加表
  4. 名称选项卡上,指定表的名称。
  5. 选项卡上,指定要在表中包含的列。

    对于每个列,指定列名称、数据类型以及列是否可具有空值。

  6. 选项卡上,添加添加键。指定表的主键。

    主键是针对每个条目唯一的值。它可以是单个值(例如事务号),也可以是值的组合(例如客户标识和时间戳记)。为防止重复,数据库确保表中仅存在每个主键的单个版本。

    限制: 主键不能是字符串。
  7. 指定要用于对表进行共享的键。

    IBM Db2 Event Store 数据库表已分区为微分区或分片。微分区数根据可用节点数在数据库创建时确定。将微分区分配给节点是动态进行的,并且可能根据节点的可用性而更改。

装入数据

您可以通过多种方式将数据采集到 IBM Db2 Event Store 中:Db2 Event Store 客户机 API(可以从独立程序或 Notebook 调用),通过使用来自标准 Db2 客户机的远程连接并从 CSV 文件装入,或在集群中从 Watson Studio 服务中运行的 Notebook,或通过使用 CSV 装入页面描述中提供的信息从 CSV 采集。

有关连接的更多信息,请参阅连接到 Db2 Event Store

您必须使用 Notebook 或 IBM Db2 Event Store 客户机 API 以将数据插入到数据库。有关更多信息,请参阅以下 API 指南:

运行 SQL 查询

您必须使用 Notebook 或 IBM Db2 Event Store API 以针对数据库运行 SQL 查询。有关更多信息,请参阅相应的 API 指南:

另请参阅以下主题:

删除数据库

数据库管理员可以删除数据库。

要删除数据库:

  1. 登录 Cloud Pak for Data Web 客户机。
  2. 从导航菜单中,选择数据 > 数据库
  3. 为要访问的数据库打开“操作”菜单,然后选择删除
要点: 如果使用了动态供应,并且存储类上的回收策略设置为保留,那么即使删除数据库,也会预留数据库中的数据。如果将回收策略设置为回收删除,删除数据库时,也会删除数据。