smotenode 內容
Synthetic Minority Over-sampling Technique (SMOTE) 節點提供一個過度取樣演算法來處理不平衡的資料集。 它提供進階方法來平衡資料。 SPSS Modeler 中的 SMOTE 程序節點使用 Python 實作並且需要 imbalanced-learn© Python 程式庫。
smotenode 內容 |
資料類型 | 內容說明 |
|---|---|---|
target |
欄位 | 目標欄位。 |
sample_ratio |
字串 | 用於啟用自訂比例值。 兩個選項分別為「自動」(sample_ratio_auto) 和「設定比例」(sample_ratio_manual)。 |
sample_ratio_value |
float | 比例是少數類別中的樣本數除以多數類別中的樣本數。 它必須大於 0 並小於或等於 1。 預設值為 auto。 |
enable_random_seed |
布林 | 如果設為 true,則將啟用 random_seed 內容。 |
random_seed |
整數 | 這是由亂數產生器使用的種子。 |
k_neighbours |
整數 | 要用於建構合成樣本的最近鄰接項數目。 預設值為 5。 |
m_neighbours |
整數 | 用於判定少數樣本是否有危險的最近鄰接項數目。 只有在 SMOTE 演算法類型為 borderline1 和 borderline2 時,才啟用此選項。 預設值為 10。 |
algorithm |
字串 | SMOTE 演算法的類型:regular、borderline1 或 borderline2。 |
use_partition |
布林 | 如果設定為 true,那麼僅將訓練資料用於模型建置。 預設值為 true。 |