節點快取

為最佳化串流執行,可以在任何非終端節點上建立快取。如果已在節點上建立了快取,則在下一次執行資料串流時串流過節點的資料會充滿快取。從這時起,就會從快取(儲存在磁碟的暫存目錄中)而不是從資料來源中讀取資料了。

對於諸如排序、合併或聚集這樣比較耗時的作業,快取是最有用的。例如,假設已設定可從資料庫中讀取銷售資料的來源節點,和可按區域聚合銷售資料的「聚集」節點。可以在「聚集」節點上建立快取而不是在來源節點上建立快取,因為希望快取儲存的是已聚合的資料而不是整個資料集 。

註: 來源節點位置的快取僅用於儲存讀入 IBM® SPSS® Modeler 的原始資料複本,在大多數情況下,它不會帶來效能方面的提升。

對於已啟用快取的節點,會在右上角落顯示一個小的文件圖示。當節點上的資料被快取時,文件圖示將變綠。

啟用快取

  1. 在串流畫布上,用滑鼠右鍵按一下節點並按一下功能表上的快取
  2. 在快取子功能表中,按一下啟用
  3. 可以通過用滑鼠右鍵按一下節點,然後在快取子功能表中按一下取消來關閉快取。

資料庫中的快取節點

對於在資料庫中執行的串流,可於中遊將資料快取到資料庫的暫時表格中而不是檔案系統中。結合 SQL 最佳化使用時,這可能會造成效能顯著提升。例如,合併多個表格以建立資料採礦視圖的串流中的輸出在必要時可能會加以快取並重複使用。通過為所有下游節點自動產生 SQL,效能可得到進一步的提高。

為利用資料庫快取,必須同時啟用 SQL 最佳化和資料庫快取。注意,伺服器上的最佳化設定將置換用戶端上的最佳化設定。請參閱設定串流的最佳化選項主題,以取得更多資訊。

如果已啟用資料庫快取,則只需用用滑鼠右鍵按一下任意非終端節點就可以快取該點上的資料,並且在下次執行串流時,可以直接在資料庫中自動建立快取。如果未啟用資料庫快取或 SQL 最佳化,則快取將會改為寫入檔案系統。

註: 下列資料庫支援用於快取用途的暫存表格:Db2、Oracle、SQL Server 和 Teradata。其他資料庫(例如 Netezza)將使用標準表格來進行資料庫快取。可以針對特定資料庫自訂 SQL 代碼 - 請與服務人員聯絡以獲取協助。