資料審核節點

通過資料審核節點,可對您放置到 IBM® SPSS® Modeler 中並且以易於讀取的矩陣(可對該矩陣進行排序並使用它產生正常大小的圖形和各式各樣的資料預備節點)形式顯示的資料有個初步的全面瞭解。

  • 「審核」標籤顯示具有彙總統計量、直方圖和分佈圖的報告,它們有助於獲得對資料的初步瞭解。該報告在欄位名稱之前還顯示儲存圖示。
  • 審核報告中的「品質」標籤顯示有關離群值、極端值和遺漏值的資訊,並提供用於處理這些值的工具。

使用資料審核節點

資料審核節點可直接附加到來源節點,或附加到已實例化的類型 節點的下游。您也可以根據結果產生多個資料預備節點。例如,可以產生過濾器節點來排除具有過多遺漏值的欄位,這在建模中很有用,並產生 SuperNode 為任何或所有保留欄位歸因遺漏值。這便是審核帶來的實際功能,讓您不僅可以評量資料的現行狀態,還可以基於評量結果採取動作。

篩選資料或對資料取樣。因為初始審核在處理大型資料時特別有效,所以可以在初始探索期間使用「樣本」節點僅選取一部分記錄,以此縮短處理時間。在分析的探索階段,也可以將 資料審核節點與 Feature Selection 節點和 Anomaly Detection 節點等節點組合使用。