焦點特色

變數標籤

會使用「驗證資料」對話框來驗證資料。「變數」標籤顯示您檔案中的變數。開始時先選取您要的變數,然後將它們移至「分析變數」清單。

基本檢查

您可以指定基本檢查來套用至您檔案中的變數和案例。例如,您可以取得報告,識別具有高百分比遺漏值或空案例的變數。

標準和自訂規則

將規則套用至識別無效值的個別變數 – 指在有效範圍之外的值或遺漏值。您也可以建立自己的規則、交叉變數規則或套用預先定義的規則。

建議

自動化資料準備會提供建議,讓使用者能夠操練及檢查各項建議。

準備資料只需單一步驟 – 自動

人工資料準備是一項既複進又耗時的流程。當您需要快速得到結果時,ADP 流程可用一個有效率的步驟協助您偵測及更正品質錯誤,並揣測遺漏值。ADP 特性提供容易瞭解的報告,提出綜合性的建議和視覺化功能,來協助您決定要用於分析的正確資料。

資料準備的其他選項

使用驗證資料流程執行自動資料檢查,及協助刪去耗時而繁瑣的人工檢查。此流程可讓您套用規則,根據每一個變數的測量層次(是分類或連續)來執行資料檢查。然後,決定資料有效性,並在分析之前由您自行移除或更正可疑案例。

分選或設定尺度變數的切點

利用最佳分選流程,您可以更精確使用專為額定屬性設計的演算法(例如 Naive Bayes 和 logit 模型)。最佳分選可讓您分選 – 或設定 – 尺度變數的切點。

從三種類型的最佳分選中選取

選擇三種最佳分選類型的其中之一,在模型建置之前預先處理資料。1) 非監督式:建立具有同等計數的分選。2) 監督式:在決定切點時將目標變數列入考量。此方法比非監督式更精確;但是,它也更需要更密集的計算。3) 混合式方法:結合非監督式與監督式方法。當您有大量相異值時,此方法特別有用。

技術詳細資料

軟體需求

IBM SPSS Data Preparation 需要有效的 IBM SPSS Statistics Base 授權。

  • 必要條件:IBM SPSS Statistics

硬體需求

  • 處理器:2 GHz 或更快
  • 顯示器:1024*768 或更高
  • 記憶體:需要 4 GB RAM,建議 8 GB RAM 或更多
  • 磁碟空間:2 GB 或更多

瞭解如何運作

立即購買與開始使用