Python での分析
Python スクリプトを実行して、Db2® データベースからデータを取得したり、書き込んだりすることができます。
このようなスクリプトは、データの分析に役立つ強力なツールになる可能性があります。例えば、それらを使用して、データベース内のデータに基づく統計モデルを生成したり、これらのモデルの結果をプロットしたりできます。スクリプトは、Python 実行環境内から直接実行することも、Jupyter ノートブック内から実行することもできます。
Python を使用したデータベース内分析
データを処理するために、ほとんどのネイティブ Python 関数では、最初にデータベースから作業メモリーにデータを抽出する必要があります。このような関数は、アプリケーション内関数と呼ばれます。データベース内関数と呼ばれる異なるタイプの関数は、データベース内のデータを直接操作し、データを抽出する必要がありません。したがって、データベース内関数を使用すると、抽出が現実的ではないか、または不可能である大量のデータを分析できます。
データベース内関数では、カラムナ・テクノロジーなど、基礎となるデータベース管理システムのパフォーマンス向上機能を使用できます。また、データベース内関数を使用すると、データの抽出に伴うセキュリティー問題が回避され、分析されるデータが可能な限り現行のものとなります。一部のデータベース内関数では、追加で遅延ロードを使用して、実際に必要なデータ部分のみをロードすることにより、さらに効率を向上させます。
アプリケーション内関数とデータベース内関数は、どちらも同様に使いやすいものです。アプリケーション内関数は、データ・フレームと呼ばれる構成体を操作します。データ・フレームは、処理対象データのコピーを保持する、メモリー内のコンテナーです。データベース内関数は、IDA データ・フレームと呼ばれる同様の構成体を操作します。IDA データ・フレームは、直接データを保持するわけではありません。その代わりに、データベース内の表またはビューへの参照、またはその表またはビュー内の行と列の選択に対する参照を保持します。関数またはメソッドは、IDA データ・フレームに適用される場合、通常はアプリケーション内で実行されませんが、SQL 照会に変換されます。次に、照会がデータベースに対して実行され、結果が Python オブジェクトに変換されます。