Qu'est-ce que l'apprentissage supervisé ?
Découvrez le fonctionnement de l'apprentissage supervisé et comment il peut être utilisé pour créer des modèles de machine learning très précis
Fond bleu avec triangles bleu vert
Qu'est-ce que l'apprentissage supervisé ?

L'apprentissage supervisé, également appelé apprentissage automatique supervisé, est une sous-catégorie de l'apprentissage automatique et de l'intelligence artificielle. Il se caractérise par l'utilisation de jeux de données étiquetés qui entraînent des algorithmes permettant de classer des données ou de prédire des résultats avec précision. Au fur et à mesure que les données en entrée sont introduites dans le modèle, celui-ci ajuste ses pondérations jusqu'à ce que le modèle soit correctement ajusté. C'est le processus de validation croisée. Avec l'apprentissage supervisé, les organisations peuvent résoudre divers problèmes du monde réel à grande échelle, comme la classification des courriers indésirables dans un dossier distinct de votre boîte de réception.

Produits à la une

Watson Studio

SPSS Statistics

Fonctionnement de l'apprentissage supervisé

L'apprentissage supervisé utilise un jeu d'entraînement pour apprendre aux modèles à produire les résultats souhaités. Ce jeu de données d'apprentissage comprend des entrées et des sorties correctes, qui permettent au modèle d'apprendre au fil du temps. L'algorithme mesure sa précision par le biais de la fonction de perte, et s'ajuste jusqu'à ce que l'erreur soit suffisamment minimisée.

L'apprentissage supervisé peut être divisé en deux types de problèmes lors de l'extraction de données, à savoir la classification et la régression :

  • La classification utilise un algorithme pour classer avec précision les données de test dans des catégories spécifiques. Elle reconnaît des entités spécifiques dans l'ensemble de données et tente de tirer des conclusions sur la façon dont ces entités doivent être étiquetées ou définies. Les algorithmes de classification courants sont les classificateurs linéaires, les machines à vecteurs de support (SVM), les arbres de décision, les k plus proches voisins (k-NN) et les forêts aléatoires, qui sont décrits plus en détail ci-dessous.
  • La régression est utilisée pour comprendre la relation entre les variables dépendantes et indépendantes. Elle est couramment utilisée pour faire des projections, par exemple, sur le chiffre d'affaires d'une entreprise. La régression linéaire, la régression logistique et la régression polynomiale sont des algorithmes de régression couramment utilisés.
Algorithmes d'apprentissage supervisé

Divers algorithmes et techniques de calcul sont utilisés dans les processus de machine learning supervisé. Vous trouverez ci-dessous des explications succinctes de certaines des méthodes d'apprentissage les plus couramment utilisées, généralement calculées à l'aide de programmes tels que R ou Python :

  • Réseaux neuronaux : Principalement utilisés pour les algorithmes d'apprentissage en profondeur, les réseaux neuronaux traitent les données d'entraînement en imitant l'interconnectivité du cerveau humain par des couches de nœuds. Chaque nœud est composé d'entrées, de pondérations, d'un biais (ou d'un seuil) et d'une sortie. Si cette valeur de sortie dépasse un seuil donné, elle "déclenche" ou active le nœud, en transmettant les données à la couche suivante du réseau. Les réseaux neuronaux apprennent cette fonction de mappage par un apprentissage supervisé, en s'ajustant sur la base de la fonction de perte par le processus de descente de gradient. Lorsque la fonction de coût est égale à zéro ou proche de zéro, la précision du modèle peut être considérée comme assez fiable pour générer la bonne réponse.
  • Classification naïve bayésienne :  La classification naïve bayésienne est une approche de classification qui adopte le principe d'indépendance conditionnelle de classe du théorème de Bayes. Ainsi, la présence d'une caractéristique n'a pas d'incidence sur la présence d'une autre caractéristique dans la probabilité d'un résultat donné, et chaque prédicteur a un effet égal sur ce résultat. Il existe trois types de classifieurs bayésiens naïfs : bayésien naïf multinomial, bayésien naïf de Bernoulli et bayésien naïf gaussien. Cette technique est principalement utilisée dans la classification des textes, l'identification des courriers indésirables et les systèmes de recommandation.
  • Régression linéaire : La régression linéaire est utilisée pour identifier la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Elle sert généralement à faire des prédictions sur les résultats futurs. Lorsqu'il n'existe qu'une seule variable indépendante et une seule variable dépendante, on parle de régression linéaire simple. Lorsque le nombre de variables indépendantes augmente, on parle de régression linéaire multiple. Pour chaque type de régression linéaire, la régression linéaire tente de tracer une ligne de meilleur ajustement, qui est calculée par la méthode des moindres carrés. Cependant, contrairement aux autres modèles de régression, cette ligne est droite lorsqu'elle est tracée sur un graphique.
  • Régression logistique : Alors que la régression linéaire est utilisée lorsque les variables dépendantes sont continues, la régression logistique est choisie lorsque la variable dépendante est catégorique, c'est-à-dire qu'elle a des résultats binaires, tels que « vrai » et « faux » ou « oui » et « non ». Si les deux modèles de régression cherchent à comprendre les relations entre les entrées de données, la régression logistique est principalement utilisée pour résoudre les problèmes de classification binaire, tels que l'identification des courriers indésirables.
  • Machine à vecteurs de support (SVM) : Une machine à vecteurs de support est un modèle d'apprentissage supervisé, développé par Vladimir Vapnik, couramment utilisé à la fois pour la classification et la régression des données. Cela dit, elle est généralement utilisée pour les problèmes de classification, en construisant un hyperplan où la distance entre deux classes de points de données est maximale. Cet hyperplan s'appelle la limite de décision. Elle sépare les classes de points de données (par exemple, des oranges comparées à des pommes) de chaque côté du plan.
  • k plus proches voisins : L'algorithme k plus proches voisins, également appelé algorithme k-NN, est un algorithme non paramétrique qui classe les points de données en fonction de leur proximité et de leur association avec d'autres données disponibles. Cet algorithme part du principe que des points de données similaires peuvent être trouvés à proximité des uns des autres. Par conséquent, il cherche à calculer la distance entre les points de données, généralement par la distance euclidienne, puis il attribue une catégorie basée sur la catégorie ou la moyenne la plus fréquente. Sa facilité d'utilisation et son faible temps de calcul en font un algorithme privilégié par les spécialistes de données, mais au fur et à mesure que le jeu de données de test augmente, le temps de traitement s'allonge, ce qui le rend moins intéressant pour les tâches de classification. Cet algorithme est généralement utilisé pour les moteurs de recommandation et la reconnaissance d'images.
  • Forêt aléatoire : Une forêt aléatoire est un autre algorithme flexible de machine learning supervisé utilisé à des fins de classification et de régression. La « forêt » fait référence à une collection d'arbres de décision non corrélés qui sont ensuite fusionnés pour réduire la variance et créer des prédictions de données plus précises.

 

Comparaison de l'apprentissage non supervisé, supervisé et semi-supervisé

L'apprentissage automatique non supervisé et l'apprentissage automatique supervisé sont fréquemment abordés ensemble. Contrairement à l'apprentissage supervisé, l'apprentissage non supervisé utilise des données non étiquetées. À partir de ces données, il découvre des modèles qui aident à résoudre les problèmes de regroupement ou d'association. Cette méthode est particulièrement utile lorsque les experts de domaine ne sont pas certains des propriétés communes d'un jeu de données. Les algorithmes de regroupement courants sont les modèles hiérarchiques, des k-moyennes et de mélange gaussien.

L'apprentissage semi-supervisé se produit lorsque seule une partie des données d'entrée a été étiquetée. L'apprentissage non supervisé et semi-supervisé peuvent constituer des alternatives plus intéressantes, car faire appel à des experts de domaine pour étiqueter les données correctement pour l'apprentissage supervisé est un processus parfois chronophage et coûteux.

Pour une analyse approfondie des différences entre ces approches, consultez le blog « Quelle est la différence entre l'apprentissage supervisé et l'apprentissage non supervisé ? »

Exemples d'apprentissage supervisé

Les modèles d'apprentissage supervisé peuvent être utilisés pour créer et perfectionner un certain nombre d'applications métier, notamment :

  • Reconnaissance d'images et d'objets : Les algorithmes d'apprentissage supervisé permettent de localiser, isoler et catégoriser des objets à partir de vidéos ou d'images. Ils se révèlent ainsi très utiles lorsqu'ils sont appliqués à diverses techniques de vision par ordinateur et d'analyse d'images.
  • Analytique prédictive :  Un cas d'utilisation répandu pour les modèles d'apprentissage supervisé consiste à créer des systèmes d'analytique prédictive pour fournir une vision approfondie de divers points de données métier. Les entreprises peuvent ainsi anticiper certains résultats en fonction d'une variable de sortie donnée, ce qui permet aux dirigeants de justifier des décisions ou d'opter pour d'autres stratégies plus bénéfiques pour l'organisation.
  • Analyse du sentiment des clients :  Grâce à des algorithmes d'apprentissage automatique supervisés, les entreprises peuvent extraire et classer des éléments d'information importants à partir de grands volumes de données - y compris le contexte, l'émotion et l'intention - moyennant très peu d'intervention humaine. C'est une possibilité incroyablement utile pour mieux comprendre les interactions avec les clients et qui peut être utilisée pour améliorer les actions d'engagement avec la marque.
  • Détection des spams :  La détection des spams est un autre exemple de modèle d'apprentissage supervisé. À l'aide d'algorithmes de classification supervisée, les organisations peuvent entraîner les bases de données à reconnaître des schémas ou des anomalies au sein des nouvelles données afin d'organiser efficacement les correspondances liées ou non au spam.
Les défis de l'apprentissage supervisé

Bien que l'apprentissage supervisé puisse apporter des avantages aux entreprises, tels qu'une compréhension approfondie des données et une meilleure automatisation, la création de modèles d'apprentissage supervisé durables comporte plusieurs défis. En voici quelques-uns :

  • Les modèles d'apprentissage supervisé peuvent nécessiter certains niveaux d'expertise pour être structurés avec précision.
  • L'entraînement des modèles d'apprentissage supervisé peut prendre beaucoup de temps.
  • Les jeux de données ont plus de chance de contenir des erreurs humaines, ce qui entraîne un apprentissage incorrect des algorithmes.
  • Contrairement aux modèles d'apprentissage non supervisé, l'apprentissage supervisé ne peut pas regrouper ou classer les données par lui-même.
Solutions connexes
IBM Watson® Studio

Créez et mettez à l'échelle une IA fiable quel que soit le cloud. Automatisez le cycle de vie de l'IA pour ModelOps.

Explorer IBM Watson® Studio
Cloud Pak for Data

Connectez les bonnes données, au bon moment, aux bonnes personnes n'importe où.

Explorer Cloud Pak for Data
Solutions IBM Cloud

Hybride. Ouvert. Résilient. Votre plateforme et partenaire pour la transformation numérique.

Explorer les solutions cloud
Ressources Quelle est la différence entre l'apprentissage supervisé et l'apprentissage non supervisé ?

Dans cet article, nous allons explorer les bases de deux approches de la science des données : supervisée et non supervisée.

Modèles d'apprentissage supervisé

Explorer certaines approches d'apprentissage supervisé telles que les machines à vecteur de support et les classificateurs probabilistes

Pour aller plus loin

Les modèles d'apprentissage supervisé peuvent être une solution utile pour éliminer les tâches de classification manuelles et pour établir des prédictions en fonction de données étiquetées. Cependant, le formatage de vos algorithmes de machine learning nécessite des connaissances et une expertise humaines pour éviter le surajustement des modèles de données.IBM et ses équipes de science des données et d'IA ont perfectionné pendant de nombreuses années le développement et le déploiement de modèles d'apprentissage supervisé avec de nombreux cas d'utilisation métier. Grâce à de puissants outils tels qu'IBM Watson Studio on IBM Cloud Pak for Data, les organisations peuvent créer des modèles de machine learning hautement évolutifs, quel que soit l'endroit où résident leurs données, tout en bénéficiant du robuste environnement multicloud hybride d'IBM.

Explorer IBM Watson® Studio