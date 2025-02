Os clusters de qualidade contêm pelo menos duas propriedades:



. Todos os pontos de dados de um cluster devem ser semelhantes.

Os clusters devem ser distintos uns dos outros.

Essas propriedades são obtidas minimizando-se a distância intracluster e maximizando a distância entre clusters de todos os pontos de dados em um conjunto de dados. Em outras palavras, quanto mais compacto e isolado for um cluster de outros clusters, melhor. O objetivo do algoritmo de agrupamento k-means é minimizar a soma dos erros quadrados (SSE).2 O cálculo do SSE da distância euclidiana quadrada de cada ponto até o centroide mais próximo avalia a qualidade das atribuições do agrupamento medindo a variação total dentro de cada agrupamento.

As métricas de avaliação de cluster verificam a qualidade e apresentam diversas perspectivas para analisar os resultados do cluster. Isso ajuda a selecionar o número ideal de clusters e a inicialização do centroide. As seguintes métricas de avaliação são maneiras comuns de medir as distâncias intra e intercluster no agrupamento.