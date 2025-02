Contrairement à l’apprentissage supervisé, l’apprentissage non supervisé utilise des données non étiquetées. À partir de ces données, l’algorithme découvre des modèles qui aident à résoudre les problèmes de regroupement (clustering) ou d’association. Ceci est particulièrement utile lorsque les experts du domaine ne sont pas sûrs des propriétés communes dans un jeu de données. Les algorithmes de clustering courants sont un mélange de modèles hiérarchiques, en k moyennes, gaussiens et de méthodes de réduction de la dimensionnalité comme PCA et t-SNE.

Clustering : ces algorithmes peuvent identifier des modèles dans les données afin de pouvoir les regrouper. Ils aident les data scientists à identifier les différences entre des éléments de données que les humains n’ont pas remarquées.

Clustering hiérarchique : cette méthode regroupe les données dans une arborescence de clusters8. Le clustering hiérarchique commence par traiter chaque point de données comme un cluster distinct. Ensuite, ces étapes sont répétées plusieurs fois : 1) identification des deux clusters les plus proches, 2) fusion des deux clusters les plus comparables. Ces étapes se poursuivent jusqu’à ce que tous les clusters soient fusionnés.

Clustering k-means : cette méthode identifie les groupes au sein des données sans étiquette9 dans différents clusters en recherchant des groupes de données semblables les uns aux autres. L’expression « k-means » provient des centroïdes utilisés pour définir les clusters. Un point est attribué à un cluster particulier s’il est plus proche du centroïde de ce cluster qu’un autre centroïde.

Algorithmes d’apprentissage semi-supervisé

Dans ce cas, l’apprentissage intervient lorsque seule une partie des données d’entrée a été étiquetée, ce qui donne à l’algorithme une certaine « longueur d’avance ». Cette approche permet de combiner le meilleur des deux mondes :10 une précision améliorée associée au machine learning supervisé et la possibilité d’utiliser des données non étiquetées de manière rentable, comme dans le cas du machine learning non supervisé.

Algorithmes par renforcement



Dans ce cas, les algorithmes sont entraînés de la même manière que l’apprentissage humain, à l’aide de récompenses et de pénalités, qui sont mesurées et suivies par un agent d’apprentissage par renforcement.11 Celui-ci a une compréhension générale de la probabilité de réussir à faire monter le score ou à le faire descendre. Par essais et erreurs, l’agent apprend à appliquer des mesures qui conduisent aux résultats les plus favorables au fil du temps. L’apprentissage par renforcement est souvent utilisé12 dans la gestion des ressources, la robotique et les jeux vidéo.