L'apprentissage supervisé, également appelé apprentissage automatique supervisé, est une sous-catégorie de l'apprentissage automatique et de l'intelligence artificielle. Il se caractérise par l'utilisation de jeux de données étiquetés qui entraînent des algorithmes permettant de classer des données ou de prédire des résultats avec précision. Au fur et à mesure que les données en entrée sont introduites dans le modèle, celui-ci ajuste ses pondérations jusqu'à ce que le modèle soit correctement ajusté. C'est le processus de validation croisée. Avec l'apprentissage supervisé, les organisations peuvent résoudre divers problèmes du monde réel à grande échelle, comme la classification des courriers indésirables dans un dossier distinct de votre boîte de réception.
Watson Studio
SPSS Statistics
L'apprentissage supervisé utilise un jeu d'entraînement pour apprendre aux modèles à produire les résultats souhaités. Ce jeu de données d'apprentissage comprend des entrées et des sorties correctes, qui permettent au modèle d'apprendre au fil du temps. L'algorithme mesure sa précision par le biais de la fonction de perte, et s'ajuste jusqu'à ce que l'erreur soit suffisamment minimisée.
L'apprentissage supervisé peut être divisé en deux types de problèmes lors de l'extraction de données, à savoir la classification et la régression :
Divers algorithmes et techniques de calcul sont utilisés dans les processus de machine learning supervisé. Vous trouverez ci-dessous des explications succinctes de certaines des méthodes d'apprentissage les plus couramment utilisées, généralement calculées à l'aide de programmes tels que R ou Python :
L'apprentissage automatique non supervisé et l'apprentissage automatique supervisé sont fréquemment abordés ensemble. Contrairement à l'apprentissage supervisé, l'apprentissage non supervisé utilise des données non étiquetées. À partir de ces données, il découvre des modèles qui aident à résoudre les problèmes de regroupement ou d'association. Cette méthode est particulièrement utile lorsque les experts de domaine ne sont pas certains des propriétés communes d'un jeu de données. Les algorithmes de regroupement courants sont les modèles hiérarchiques, des k-moyennes et de mélange gaussien.
L'apprentissage semi-supervisé se produit lorsque seule une partie des données d'entrée a été étiquetée. L'apprentissage non supervisé et semi-supervisé peuvent constituer des alternatives plus intéressantes, car faire appel à des experts de domaine pour étiqueter les données correctement pour l'apprentissage supervisé est un processus parfois chronophage et coûteux.
Pour une analyse approfondie des différences entre ces approches, consultez le blog « Quelle est la différence entre l'apprentissage supervisé et l'apprentissage non supervisé ? »
Les modèles d'apprentissage supervisé peuvent être utilisés pour créer et perfectionner un certain nombre d'applications métier, notamment :
Bien que l'apprentissage supervisé puisse apporter des avantages aux entreprises, tels qu'une compréhension approfondie des données et une meilleure automatisation, la création de modèles d'apprentissage supervisé durables comporte plusieurs défis. En voici quelques-uns :
Créez et mettez à l'échelle une IA fiable quel que soit le cloud. Automatisez le cycle de vie de l'IA pour ModelOps.
Connectez les bonnes données, au bon moment, aux bonnes personnes n'importe où.
Hybride. Ouvert. Résilient. Votre plateforme et partenaire pour la transformation numérique.
Dans cet article, nous allons explorer les bases de deux approches de la science des données : supervisée et non supervisée.
Explorer certaines approches d'apprentissage supervisé telles que les machines à vecteur de support et les classificateurs probabilistes