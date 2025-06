Avec l’apprentissage non supervisé, les modèles déterminent eux-mêmes les fonctionnalités, les modèles et les relations des données. L’adaptation des variables d’entrée en fonction d’une variable cible connue n’est pas possible. Les méthodes de sélection non supervisée des fonctionnalités s’appuient sur d’autres techniques pour simplifier et rationaliser l’espace des fonctionnalités.

L’analyse en composantes principales (ACP) est une méthode de sélection de fonctionnalités non supervisée. L’ACP réduit la dimensionnalité des grands jeux de données en transformant les variables potentiellement corrélées en un ensemble plus petit de variables. Ces composantes principales conservent la plupart des informations contenues dans le jeu de données d’origine. L’ACP permet de contourner le problème de la dimensionnalité et réduit également le surajustement.

Parmi celles-ci, citons l’analyse en composantes indépendantes (ACI), qui sépare les données multivariées en composantes individuelles statistiquement indépendantes, et les auto-encodeurs.

Largement utilisé avec les architectures transformatrices, un auto-encodeur est un type de réseau de neurones qui apprend à compresser puis à reconstruire des données. Ce faisant, les auto-encodeurs découvrent des variables latentes, c’est-à-dire celles qui ne sont pas directement observables, mais qui influencent fortement la distribution des données.