K-Means クラスタリングの関数

K-Means アルゴリズムは、KMEANS ストアード・プロシージャーおよび PREDICT_KMEANS ストアード・プロシージャーに実装されています。K-Means モデルを印刷するには、PRINT_MODEL ストアード・プロシージャーを使用します。

KMEANS ストアード・プロシージャーおよび PREDICT_KMEANS ストアード・プロシージャーには、以下の機能があります。

以下の計算および表現に関する連続型属性および離散型属性のサポート。

差に基づく計算

離散値が等しい場合、値の差は 0 と見なされます。値が等しくない場合、差は 1 と見なされます。

クラスター中心の表現

離散型属性には、平均値の代わりにモードが使用されます。モードは最も頻度の高い値です。
正規化ユークリッド (「distance=norm_euclidean」) およびユークリッド (「distance=euclidean」) 距離関数
ユークリッドがデフォルトです。
収束時または指定された最大反復数が実行された後に基づく停止基準
新規データのクラスター・メンバーシップ予測

注: 入力表で NULL 値が含まれている行は、無視されます。

すべてのストアード・プロシージャーは、<parameter>=<value> 項目のペアを含む必須の 1 ストリング・パラメーターで構成されます。これらの項目はコンマで区切ります。パラメーターのデータ型は VARCHAR(any) です。

有効な <parameter>=<value> 項目は、各ストアード・プロシージャーのパラメーターの説明にリストされます。