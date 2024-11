このチュートリアルでは、k平均法を実行するscikit-learn(sklearn)ライブラリーのモジュールを使用します。このモジュールには、クラス・パラメーターで調整を行う組み込み最適化手法が含まれています。モジュールのクラスは次のようになります。

class sklearn.cluster.KMeans(n_clusters=8, *, init='k-means++', n_init='auto', max_iter=300, tol=0.0001, verbose=0, random_state=None, copy_x=True, algorithm='lloyd')12

パラメーターには、形成するクラスタの数と生成するセントロイドの数(n_clusters)が含まれます。初期化の方法はk-means++とrandom選択の2つが用意されています。また、最大反復回数を設定する属性も含まれています。各反復は、データ・セットをn_clustersparameterの値に分割することから始まります。

これらのライブラリーは、テスト・データ・セットを生成し、クラスタリングを実行するために使用されます。

import pandas as pd import sklearn import matplotlib.pyplot as plt import seaborn as sns import numpy from sklearn.cluster import KMeans from sklearn.datasets import make_blobs from sklearn.decomposition import PCA from sklearn.preprocessing import StandardScaler