La classe Partitioner

Le partitionneur contrôle le partitionnement des données intermédiaires. Il attribue un numéro de partition à chaque paire intermédiaire <clé, valeur>. Le cadre utilise ce nombre pour redistribuer les enregistrements intermédiaires avant le début de l'étape de réduction. Les enregistrements ayant le même numéro de partition seront stockés sur la même tranche de données. Vous pouvez définir votre propre classe de partitionneur, qui remplace la méthode de partitionnement getPartition(KEY key, VALUE value, int numPartitions). La valeur de numPartitions est calculée par le cadre et correspond au nombre de tranches de données NPS disponibles qui peuvent exécuter des tâches map/reduce.

Lorsqu'aucun partitionneur n'est défini pour un travail, les données sont redistribuées en fonction des valeurs produites par la fonction de hachage intégrée de NPS appliquée aux clés intermédiaires.