Der k-Means-Clustering-Algorithmus kategorisiert Datenpunkte in Cluster, indem er ein mathematisches Distanzmaß, in der Regel das euklidische, vom Clusterzentrum verwendet. Das Ziel ist es, die Summe der Entfernungen zwischen Datenpunkten und den ihnen zugewiesenen Clustern zu minimieren. Datenpunkte, die einem Schwerpunkt am nächsten liegen, werden in derselben Kategorie zusammengefasst. Ein höherer k-Wert oder die Anzahl der Cluster bedeutet kleinere Cluster mit mehr Details, während ein niedrigerer k-Wert zu größeren Clustern mit weniger Details führt.