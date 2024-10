Certaines caractéristiques ont des limites supérieures et inférieures intrinsèques aux données qui restreignent leurs valeurs possibles, par exemple les données de séries chronologiques ou l’âge. Mais dans de nombreux cas, les caractéristiques du modèle peuvent ne pas être limitées sur les valeurs possibles, et de telles amplitudes dans les caractéristiques (différence entre les valeurs les plus basses et les plus élevées d’une caractéristique) peuvent avoir des effets négatifs sur certains modèles. Le dimensionnement des caractéristiques (parfois appelé normalisation des caractéristiques), est une technique de standardisation qui permet de redimensionner les caractéristiques et de limiter l’impact des grandes amplitudes sur les modèles.12 Alors que la transformation des caractéristiques convertit les données d'un type en un autre, la mise à l’échelle des caractéristiques transforme les données en termes d’étendue et de distribution, en conservant le type de données d’origine.13

Mise à l’échelle min-max. La mise à l’échelle min-max redimensionne toutes les valeurs d’une caractéristique donnée afin qu’elles se situent entre les valeurs minimale et maximale spécifiées, souvent 0 et 1. La valeur de chaque point de données pour la caractéristique sélectionnée (représentée par x) est calculée en fonction des valeurs minimale et maximale décidées pour cette caractéristique, min(x) et max(x) respectivement, produisant la nouvelle valeur de caractéristique pour ce point de données (représentée par x̃). La mise à l’échelle min-max est calculée à l’aide de la formule suivante :14