smotenode 內容

SMOTE 節點圖示Synthetic Minority Over-sampling Technique (SMOTE) 節點提供一個過度取樣演算法來處理不平衡的資料集。 它提供進階方法來平衡資料。 SPSS Modeler 中的 SMOTE 程序節點使用 Python 實作並且需要 imbalanced-learn© Python 程式庫。

表 1. smotenode 內容
smotenode 內容 資料類型 內容說明
target 欄位 目標欄位。
sample_ratio 字串 用於啟用自訂比例值。 兩個選項分別為「自動」(sample_ratio_auto) 和「設定比例」(sample_ratio_manual)。
sample_ratio_value float 比例是少數類別中的樣本數除以多數類別中的樣本數。 它必須大於 0 並小於或等於 1。 預設值為 auto
enable_random_seed 布林 如果設為 true,則將啟用 random_seed 內容。
random_seed 整數 這是由亂數產生器使用的種子。
k_neighbours 整數 要用於建構合成樣本的最近鄰接項數目。 預設值為 5
m_neighbours 整數 用於判定少數樣本是否有危險的最近鄰接項數目。 只有在 SMOTE 演算法類型為 borderline1borderline2 時,才啟用此選項。 預設值為 10
algorithm 字串 SMOTE 演算法的類型:regularborderline1borderline2
use_partition 布林 如果設定為 true,那麼僅將訓練資料用於模型建置。 預設值為 true