Qu’est-ce que l’apprentissage supervisé ?

Qu'est-ce que l'apprentissage supervisé ?

Également connu sous le nom de machine learning supervisé, l’apprentissage supervisé est une sous-catégorie de machine learning et d’intelligence artificielle. Il consiste à utiliser des jeux de données annotées pour entraîner les algorithmes à classer les données ou à prédire les résultats avec précision.

Au fur et à mesure que les données d’entrée alimentent le modèle, on procède à une pondération jusqu’à ce que ce dernier soit correctement ajusté dans le cadre du processus de validation croisée. L’apprentissage supervisé permet aux entreprises de résoudre divers problèmes à l’échelle, comme le classement du courrier indésirable dans un dossier autre que leur boîte de réception. Il peut également être utilisé pour créer des modèles de machine learning de haute précision.

Pourquoi la gouvernance de l’IA est un impératif stratégique pour la mise à l’échelle de l’IA d’entreprise

Découvrez les obstacles à l’adoption de l’IA, en particulier le manque de solutions de gouvernance de l’IA et de gestion des risques.

Contenu connexe

Obtenir le rapport IDC

Commencer votre transition vers l’IA

Découvrir comment dimensionner l’IA

Explorer l’AI Academy

Apprentissage supervisé : comment ça marche ?

L’apprentissage supervisé utilise un ensemble d’apprentissage pour enseigner aux modèles à produire le résultat souhaité. Ce jeu de données d’entraînement comprend des entrées et des sorties correctes, ce qui permet au modèle de s’améliorer au fil du temps. L’algorithme mesure sa précision par le biais de la fonction de perte, en s’ajustant jusqu’à ce que l’erreur soit suffisamment réduite.

L’apprentissage supervisé permet de traiter deux types de problèmes lors de l’exploration de données, la classification et la régression :

La classification utilise un algorithme pour attribuer avec précision des données de test à des catégories particulières. L’algorithme reconnaît des entités spécifiques dans le jeu de données et tente de tirer des conclusions sur la façon dont ces entités doivent être étiquetées ou définies. Les algorithmes de classification courants sont les classificateurs linéaires, les machines à vecteurs de support (SVM), les arbres de décision, les k plus proches voisins et les forêts d’arbres décisionnels, qui sont décrits plus en détail ci-dessous.
La régression permet de comprendre la relation entre les variables dépendantes et indépendantes. Elle est couramment utilisée pour établir des projections, telles que le chiffre d’affaires d’une entreprise donnée. La régression linéaire, la régression logistique et la régression polynomiale sont des algorithmes de régression populaires.

Algorithmes d’apprentissage supervisé

Divers algorithmes et techniques de calcul sont utilisés dans les processus d’apprentissage automatique supervisé. Vous trouverez ci-dessous de brèves explications sur certaines des méthodes d’apprentissage les plus couramment utilisées, généralement calculées à l’aide de programmes tels que R ou Python :

Réseaux neuronaux : principalement utilisés pour les algorithmes d’apprentissage profond, les réseaux neuronaux traitent les données d’entraînement en imitant l’interconnectivité du cerveau humain au moyen de couches de nœuds. Chaque nœud est composé d’entrées, de poids, d’un biais (seuil) et d’une sortie. Si cette valeur de sortie dépasse un seuil donné, elle « déclenche » ou active le nœud, transmettant les données à la couche suivante du réseau. Les réseaux neuronaux apprennent cette fonction de mappage au moyen de l’apprentissage supervisé, apportant des ajustements basés sur la fonction de perte grâce au processus de descente de gradient. Lorsque la fonction coût est égale ou proche de zéro, vous pouvez être sûr de la précision du modèle.
Naïve Bayes : cette approche de classification applique le principe de l’indépendance conditionnelle des classes du théorème de Bayes. Cela signifie que la présence d’une caractéristique n’affecte pas la présence d’une autre dans la probabilité d’un résultat donné, et que chaque prédicteur a un effet égal sur ce résultat. Il existe trois types de classificateurs naïfs bayésiens : le multinomial, Bernoulli et le gaussien.Cette technique est principalement utilisée dans les systèmes de classification de texte, d’identification du spam et de recommandations.
Régression linéaire : la régression linéaire est utilisée pour identifier la relation entre une variable dépendante et une ou plusieurs variables indépendantes et est généralement utilisée pour faire des prédictions sur les résultats futurs. Lorsqu’il n’y a qu’une seule variable indépendante et une seule variable dépendante, on parle de régression linéaire simple. Lorsque le nombre de variables indépendantes augmente, on parle de régression linéaire multiple. Pour chaque type de régression linéaire, on cherche à tracer une ligne de meilleur ajustement, qui est calculée par la méthode des moindres carrés. Cependant, contrairement aux autres modèles de régression, cette ligne est droite lorsqu’elle est tracée sur un graphique.
Régression logistique : alors que la régression linéaire est utilisée lorsque les variables dépendantes sont continues, la régression logistique est choisie lorsque la variable dépendante est catégorique, c’est-à-dire qu’elle a des résultats binaires, tels que « true » et « false » ou « yes » et « no ». Bien que les deux modèles de régression cherchent à comprendre les relations entre les entrées de données, la régression logistique est principalement utilisée pour résoudre les problèmes de classification binaire, par exemple l’identification du spam.
Machines à vecteurs de support (SVM) : une machine à vecteurs de support est un modèle d’apprentissage supervisé populaire développé par Vladimir Vapnik, utilisé à la fois pour la classification et la régression des données. Cela dit, il est généralement utilisé pour les problèmes de classification, en construisant un hyperplan où la distance entre deux classes de points de données est maximale. Cet hyperplan est connu sous le nom de limite de décision, séparant les classes de points de données (par exemple, oranges et pommes) de chaque côté du plan.
K plus proche voisin : le k plus proche voisin, également connu sous le nom d’algorithme kNN, est un algorithme non paramétrique qui classe les points de données en fonction de leur proximité et de leur association avec d’autres données disponibles. Cet algorithme suppose que des points de données similaires peuvent être trouvés à proximité les uns des autres. En conséquence, il cherche à calculer la distance entre les points de données, généralement au moyen de la distance euclidienne, puis attribue une catégorie en fonction de la moyenne ou de la catégorie la plus fréquente. Sa facilité d’utilisation et son faible temps de calcul en font un algorithme privilégié par les data scientists, mais à mesure que le jeu de données de test s’agrandit, le temps de traitement s’allonge, ce qui le rend moins attrayant pour les tâches de classification. Le kNN est généralement utilisé pour les moteurs de recommandation et la reconnaissance d’images.
Forêt d’arbres décisionnels : la forêt d’arbres décisionnels est un autre algorithme d’apprentissage automatique supervisé flexible utilisé à la fois à des fins de classification et de régression. La « forêt » fait référence à un ensemble d’arbres de décision non corrélés, qui sont ensuite fusionnés pour réduire la variance et créer des prédictions de données plus précises.

Apprentissage non supervisé, supervisé ou semi-supervisé

L’apprentissage machine non supervisé et l’apprentissage machine supervisé sont souvent abordés ensemble. Contrairement à l’apprentissage supervisé, l’apprentissage non supervisé utilise des données non étiquetées. À partir de ces données, il découvre des modèles qui aident à résoudre les problèmes de regroupement ou d’association. Ceci est particulièrement utile lorsque les spécialistes du domaine ne sont pas sûrs des propriétés communes dans un jeu de données. Les algorithmes de regroupement courants sont des modèles hiérarchiques, k-moyennes et de mélange gaussien.

L’apprentissage semi-supervisé se produit lorsque seule une partie des données d’entrée données a été étiquetée. Les apprentissages non supervisé et semi-supervisé peuvent être des alternatives plus attrayantes, car il peut être long et coûteux de s’appuyer sur l’expertise du domaine pour étiqueter les données de manière appropriée dans le cadre de l’apprentissage supervisé.

Pour une analyse approfondie des différences entre ces approches, consultez « Apprentissage supervisé et non supervisé : quelle est la différence ? »

exemples d’apprentissage supervisé

Les modèles d’apprentissage supervisé peuvent être utilisés pour créer et développer un certain nombre d’applications métier, notamment les suivantes :

Reconnaissance d’images et d’objets : les algorithmes d’apprentissage supervisé peuvent être utilisés pour localiser, isoler et catégoriser des objets dans des vidéos ou des images, ce qui les rend utiles lorsqu’ils sont appliqués à diverses techniques de vision par ordinateur et d’analyse d’images.
Analytique prédictive : un cas d’utilisation répandu des modèles d’apprentissage supervisé consiste à créer des systèmes d’analytique prédictive pour fournir des informations approfondies sur divers points de données métier. Cela permet aux entreprises d’anticiper certains résultats en fonction d’une variable de sortie donnée, aidant ainsi les dirigeants d’entreprise à justifier leurs décisions ou à pivoter au profit de l’organisation.
Analyse des sentiments des clients : en utilisant des algorithmes d’apprentissage automatique supervisé, les entreprises peuvent extraire et classer des éléments d’information importants à partir de grands volumes de données, y compris le contexte, l’émotion et l’intention, avec très peu d’intervention humaine. Cela peut être incroyablement utile pour mieux comprendre les interactions avec les clients et peut être utilisé pour améliorer les efforts d’engagement de la marque.
Détection du spam : la détection du spam est un autre exemple de modèle d’apprentissage supervisé. À l’aide d’algorithmes de classification supervisés, les organisations peuvent entraîner des bases de données à reconnaître des modèles ou des anomalies dans les nouvelles données afin d’organiser efficacement les courriers indésirables ou non.

Les défis de l’apprentissage supervisé

Bien que l’apprentissage supervisé puisse offrir des avantages aux entreprises, tels que la connaissance approfondie des données et l’amélioration de l’automatisation, l’élaboration de modèles d’apprentissage supervisé durables pose certains problèmes. Voici quelques-uns de ces défis :

Les modèles d’apprentissage supervisé peuvent nécessiter certains niveaux d’expertise pour être structurés avec précision.
L’entraînement de modèles d’apprentissage supervisé peut prendre beaucoup de temps.
Les jeux de données peuvent présenter une probabilité plus élevée d’erreur humaine, ce qui entraîne un apprentissage incorrect des algorithmes.
Contrairement aux modèles d’apprentissage non supervisé, l’apprentissage supervisé ne peut pas regrouper ou classer les données à lui seul.

Solutions connexes

IBM Watson Studio

Créez et faites évoluer une IA digne de confiance dans n’importe quel cloud. Automatisez le cycle de vie de l’IA pour les ModelOps.

Découvrir IBM Watson Studio

IBM Cloud Pak for Data

Connectez les bonnes données, au bon moment, aux bonnes personnes, où que vous soyez.

Explorer Cloud Pak for Data

Solutions IBM Cloud

Hybride. Ouvert. Résilient. Votre plateforme et partenaire pour la transformation numérique.

Découvrir les solutions cloud

Ressources

Découvrir les LLM Granite d’IBM

Granite est la série phare d’IBM pour les modèles de fondation LLM basés sur l’architecture transformatrice à décodeur uniquement. Les modèles de langage Granite sont entraînés sur des données d’entreprise fiables qui couvrent l’Internet, le monde universitaire, le code, le droit et la finance.

Apprentissage pratique gratuit pour les technologies d’IA générative

Découvrez les concepts fondamentaux de l’IA et de l’IA générative, notamment le prompt engineering, les grands modèles de langage et les meilleurs projets open source.

Apprentissage supervisé et non supervisé : quelle est la différence ?

Dans cet article, nous allons explorer les bases de deux approches de la science des données : les approches supervisée et non supervisée.

Modèles d’apprentissage supervisés

Découvrez certaines approches d’apprentissage supervisées, telles que les machines à vecteurs de support et les classificateurs probabilistes.

Passez à l’étape suivante

Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio professionnel de nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.

Découvrir watsonx.ai

Réserver une démo live