Python での分析

Python スクリプトを実行して、Db2® データベースからデータを取得したり、書き込んだりすることができます。

このようなスクリプトは、データの分析に役立つ強力なツールになる可能性があります。例えば、それらを使用して、データベース内のデータに基づく統計モデルを生成したり、これらのモデルの結果をプロットしたりできます。スクリプトは、Python 実行環境内から直接実行することも、Jupyter ノートブック内から実行することもできます。

Python を使用したデータベース内分析

データを処理するために、ほとんどのネイティブ Python 関数では、最初にデータベースから作業メモリーにデータを抽出する必要があります。このような関数は、アプリケーション内関数と呼ばれます。データベース内関数と呼ばれる異なるタイプの関数は、データベース内のデータを直接操作し、データを抽出する必要がありません。したがって、データベース内関数を使用すると、抽出が現実的ではないか、または不可能である大量のデータを分析できます。

データベース内関数では、カラムナ・テクノロジーなど、基礎となるデータベース管理システムのパフォーマンス向上機能を使用できます。また、データベース内関数を使用すると、データの抽出に伴うセキュリティー問題が回避され、分析されるデータが可能な限り現行のものとなります。一部のデータベース内関数では、追加で遅延ロードを使用して、実際に必要なデータ部分のみをロードすることにより、さらに効率を向上させます。

アプリケーション内関数とデータベース内関数は、どちらも同様に使いやすいものです。アプリケーション内関数は、データ・フレームと呼ばれる構成体を操作します。データ・フレームは、処理対象データのコピーを保持する、メモリー内のコンテナーです。データベース内関数は、IDA データ・フレームと呼ばれる同様の構成体を操作します。IDA データ・フレームは、直接データを保持するわけではありません。その代わりに、データベース内の表またはビューへの参照、またはその表またはビュー内の行と列の選択に対する参照を保持します。関数またはメソッドは、IDA データ・フレームに適用される場合、通常はアプリケーション内で実行されませんが、SQL 照会に変換されます。次に、照会がデータベースに対して実行され、結果が Python オブジェクトに変換されます。

ibmdbPy パッケージ

ibmdbPy パッケージは、Db2 データベースに対するデータの読み取りやデータの書き込みのメソッド、およびサンプル・データを提供します。また、データベース内分析や地理空間関数へのアクセス方式も提供します。ibmdbPy パッケージのダウンロードや、詳細情報については、以下の Web サイトを参照してください。

Jupyter ノートブック

Jupyter ノートブック内から Db2 データベースに接続できます。ノートブックでは、ibmdbPy 関数を使用するコードを含め、Python コードを実行できます。サンプル・ノートブックのダウンロードや詳細情報については、以下の Web サイトを参照してください。