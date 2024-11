이 튜토리얼에서는 K-평균 클러스터링을 수행하는 scikit-learn(sklearn) 라이브러리의 모듈을 사용합니다. 이 모듈에는 클래스 매개변수로 조작되는 최적화 기술이 내장되어 있습니다. 모듈의 클래스는 다음과 같습니다:

class sklearn.cluster.KMeans(n_clusters=8, *, init='k-means++', n_init='auto', max_iter=300, tol=0.0001, verbose=0, random_state=None, copy_x=True, algorithm='lloyd')12

매개변수에는 형성할 클러스터의 수와 생성할 중심점의 수(n_clusters)가 포함됩니다. 초기화 방법에는 k-평균++와 무작위 두 가지를 사용할 수 있습니다. 또한 최대 반복 횟수를 설정하기 위한 속성도 포함되어 있습니다. 각 반복은 데이터 세트를 n_clustersparameter의 값으로 분할하는 것으로 시작됩니다.

다음 라이브러리는 테스트 데이터 세트를 생성하고 클러스터링을 수행하는 데 사용됩니다.

import pandas as pd import sklearn import matplotlib.pyplot as plt import seaborn as sns import numpy from sklearn.cluster import KMeans from sklearn.datasets import make_blobs from sklearn.decomposition import PCA from sklearn.preprocessing import StandardScaler