使用 Python 进行分析

您可以运行从 Db2® 数据库检索数据以及将数据写入其中的 Python 脚本。

此类脚本可以是帮助您分析数据的强大工具。例如,您可以使用这些工具根据数据库中的数据生成统计模型,以及绘制这些模型的结果。脚本可以直接从 Python 执行环境中运行,也可以从 Jupyter 配置页中运行。

使用 Python 进行数据库内分析

为了处理数据,大部分本机 Python 函数要求先将数据从数据库抽取到工作内存。此类函数称为应用程序内函数。另一类函数称为数据库内函数,它们直接对数据库中的数据执行操作,而不需要抽取数据。因此,您可以使用数据库内函数来分析抽取操作不可行或无法完成的大量数据。

数据库内函数可以使用底层数据库管理系统的性能增强功能,例如,列式技术。使用数据库内函数还可避免与抽取数据相关的安全问题,并确保所分析的数据尽可能最新。另外,某些数据库内函数还使用延迟装入功能,仅装入实际需要的数据部分,以进一步提高效率。

应用程序内函数与数据库内函数同样容易使用。应用程序内函数对称为数据帧的构造执行操作,后者是内存中的容器,用于存放要处理的数据副本。数据库内函数对称为 IDA 数据帧的类似构造执行操作。IDA 数据帧并不直接存放任何数据。相反,它存放对数据库中表或视图的引用,或者,存放对该表或视图中选定行和列的引用。当函数或方法应用于 IDA 数据帧时,它通常不是在应用程序中运行,而是转换为 SQL 查询。然后,该查询针对数据库运行,结果将转换为 Python 对象。

ibmdbPy 程序包

ibmdbPy 程序包提供用于从 Db2 数据库读取数据、将数据写入其中以及从中进行数据采样的方法。另外,还提供数据库内分析函数或地理空间函数的访问方法。要下载 ibmdbPy 程序包以及获取更多信息,请访问以下 Web 站点:

Jupyter 配置页

可以从 Jupyter 配置页连接到 Db2 数据库。该配置页可以运行 Python 代码,包括使用 ibmdbPy 函数的代码。要下载样本配置页以及获取更多信息,请访问以下 Web 站点: