使用 Python 分析
您可以執行 Python Script,從 Db2® 資料庫擷取資料以及將資料寫入到其中。
這類 Script 是功能強大的工具,可協助您分析資料。例如,您可以使用它們根據資料庫中的資料來產生統計模型,以及繪製這些模型的結果。Script 可以直接從 Python 執行環境中執行,或從 Jupyter Notebook 內執行。
使用 Python 的資料庫內分析
若要處理資料,大部分原生 Python 函數需要您先將資料從資料庫擷取至工作記憶體。這類函數稱為應用程式內函數。有另一種不同類型的函數稱為資料庫內函數,會直接對資料庫中的資料進行操作,而不需要擷取資料。因此,您可以使用資料庫內函數來分析不方便擷取或無法擷取的大量資料。
資料庫內函數可以使用基礎資料庫管理系統的效能加強特性,例如直欄式技術。使用資料庫內函數也可避免與擷取資料相關聯的安全問題,並確保所要分析的資料盡可能保持最新。部分資料庫內函數還另外使用延遲載入,只載入資料中實際需要的那些部分,以進一步提高效率。
應用程式內函數及資料庫內函數同樣容易使用。應用程式內函數是在一個稱為資料框的建構上進行操作,資料框是一個儲存器,它把要處理的資料的副本保存在記憶體中。資料庫內函數是在一個稱為 IDA 資料框的類似建構上進行操作。IDA 資料框不直接保存任何資料。 相反地,它保存資料庫中的表格或視圖的參照,或該表格或視圖內一些選定的列及直欄的參照。當您對 IDA 資料框套用函數或方法時,它通常不會在應用程式中執行,而是轉換為 SQL 查詢。然後,此查詢會針對資料庫而執行,其結果會轉換為 Python 物件。
ibmdbPy 套件
ibmdbPy 套件提供方法從 Db2 資料庫中讀取資料、將資料寫入其中,以及從中進行資料取樣。它也提供用於資料庫內分析或地理空間功能的存取方法。若要下載 ibmdbPy 套件並取得相關資訊,請造訪下列網站:
Jupyter Notebook
您可以從 Jupyter Notebook 連接至 Db2 資料庫。這個 Notebook 可以執行 Python 程式碼,包括使用 ibmdbPy 函數的程式碼。若要下載 Notebook 範例並取得相關資訊,請造訪下列網站: