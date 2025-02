Ces méthodes, introduites par Sokal et Michelen7 , définissent la distance entre les clusters comme la distance moyenne entre les paires sur toutes les paires de points des clusters. L’algorithme peut être soit la méthode des groupes de paires non pondérés avec moyenne arithmétique (UPGMA), soit la méthode des groupes de paires pondérés avec moyenne arithmétique (WPGMA). Le terme « non pondéré » signifie que toutes les distances contribuent de manière égale à chaque moyenne.

UPGMA est représenté par la formule suivante :

1∣A∣·∣B∣∑a∈A∑b∈Bd(a,b)

où *A* et *B* sont deux jeux observés et *d* est la distance.

WPGMA est représenté par la formule suivante :

d(i∪j,k)=d(i,k)+d(j,k)2

où i et j sont les clusters les plus proches combinés à chaque étape pour former un nouveau cluster composé de l’union de i et j. Nous pouvons ensuite calculer la distance par rapport à un autre cluster k, qui est la moyenne arithmétique des distances moyennes entre les points de données en k et i et k et j.