Qu'est-ce que l'apprentissage automatique ?
Découvrez l'histoire de l'apprentissage automatique, ainsi que des définitions indispensables, des exemples d'applications importants et les défis des entreprises actuelles
Découvrir Watson Assistant
Fond dégradé noir et bleu
Qu'est-ce que l'apprentissage automatique ?

L'apprentissage automatique est une branche de l'intelligence artificielle (IA) et de l'informatique qui porte sur l'utilisation des données et des algorithmes pour imiter la manière dont les êtres humains apprennent, afin d'améliorer progressivement sa précision.

IBM a un riche passé dans le domaine de l'apprentissage automatique. C'est à l'un de ses membres, Arthur Samuel, que l'on doit l'invention du terme « apprentissage automatique » dans le cadre de ses recherches (PDF, 481 ko) (lien externe à IBM) sur le jeu de dames. Robert Nealey, le maître autoproclamé du jeu de dames, a joué à ce jeu sur un ordinateur IBM 7094 en 1962, et il a perdu contre l'ordinateur. Comparé à ce qui est possible aujourd'hui, cet exploit semble presque futile, mais il est considéré comme une étape majeure dans le domaine de l'intelligence artificielle.

Au cours des deux dernières décennies, les avancées technologiques dans le domaine du stockage et de la puissance de traitement ont permis de créer des produits innovants basés sur l'apprentissage automatique, tels que le moteur de recommandation de Netflix et les voitures autonomes.

L'apprentissage automatique est une composante importante du domaine en pleine expansion qu'est la science des données. Grâce à l'utilisation de méthodes statistiques, des algorithmes sont entraînés à effectuer des classifications ou des prévisions, ce qui permet de découvrir des informations essentielles dans le cadre de projets d'exploration de données. Ces informations permettent ensuite de prendre des décisions dans les applications et les entreprises, et ont idéalement un impact sur les principales mesures de croissance. Avec l'essor du Big Data, la demande de spécialistes des données va continuer d'augmenter. Ces derniers devront identifier les questions économiques les plus pertinentes et les données permettant d'y répondre.

Les algorithmes d'apprentissage automatique sont généralement créés à l'aide d'infrastructures qui accélèrent le développement de solutions, tels que TensorFlow et PyTorch.

Découvrir watsonx.ai

Entraîner, valider, adapter et déployer facilement des modèles de base et d'apprentissage automatique

Apprentissage automatique, apprentissage en profondeur et réseaux de neurones

Les termes « apprentissage en profondeur » et « apprentissage automatique » ayant tendance à être utilisés indifféremment, il convient de noter les nuances entre les deux. L'apprentissage automatique, l'apprentissage en profondeur et les réseaux de neurones sont tous des sous-domaines de l'intelligence artificielle. Cependant, les réseaux de neurones sont en fait un sous-domaine de l'apprentissage automatique, et apprentissage en profondeur est un sous-domaine des réseaux de neurones.

La différence entre l'apprentissage en profondeur et l'apprentissage automatique réside dans la manière dont chaque algorithme apprend. L'apprentissage « en profondeur » peut s'appuyer sur des ensembles de données étiquetées (on parle également d'apprentissage supervisé), pour alimenter son algorithme, bien que cela ne soit pas absolument nécessaire. L'apprentissage en profondeur peut ingérer des données non structurées dans leur forme brute (texte, images, etc.) et déterminer automatiquement l'ensemble des caractéristiques qui distinguent les différentes catégories de données les unes des autres. Ainsi, une partie de l'intervention humaine requise est éliminée, et il est possible d'utiliser des jeux de données plus importants. L'apprentissage en profondeur s'apparente à l'« apprentissage automatique évolutif », comme le note Lex Fridman dans cette conférence du MIT (01:08:05) (lien externe à IBM).

L'apprentissage automatique classique, ou « non profond », dépend davantage de l'intervention humaine pour apprendre. Les experts humains déterminent l'ensemble des caractéristiques pour comprendre les différences entre les entrées de données, ce qui nécessite généralement des données plus structurées pour apprendre.

Les réseaux de neurones, ou réseaux de neurones artificiels, sont constitués de couches nodales contenant une couche d'entrée, une ou plusieurs couches cachées et une couche de sortie. Chaque nœud, ou neurone artificiel, se connecte à un autre et possède un poids et un seuil. Si la sortie d'un nœud est supérieure à la valeur de seuil spécifiée, ce nœud est activé et envoie des données à la couche suivante du réseau. Dans le cas contraire, aucune donnée n'est transmise à la couche suivante du réseau. « En profondeur » dans le terme « apprentissage en profondeur » fait simplement référence au nombre de couches d'un réseau de neurones. Un réseau de neurones composé de plus de trois couches (incluant les entrées et les sorties) peut être considéré comme un algorithme d'apprentissage en profondeur ou un réseau de neurones profonds. Un réseau de neurones qui ne comporte que deux ou trois couches est simplement un réseau de neurones de base.

On attribue principalement à l'apprentissage en profondeur et aux réseaux de neurones l'accélération des progrès dans des domaines tels que la vision par ordinateur, le traitement automatique du langage naturel et la reconnaissance vocale.

Voir l'article de blogue « IA, apprentissage automatique, apprentissage en profondeur et réseaux de neurones : quelle différence ? » pour en savoir plus sur la relation entre ces différents concepts.

Fonctionnement de l'apprentissage automatique

UC Berkeley (lien externe à IBM) décompose le système d'apprentissage d'un algorithme d'apprentissage automatique en trois parties principales.

  1. Un processus de décision : en général, les algorithmes d'apprentissage automatique servent à effectuer une prévision ou une classification. En fonction de certaines données d'entrée, qui peuvent être étiquetées ou non, votre algorithme produit une estimation sur un modèle dans les données.
  2. Une fonction d'erreur : une fonction d'erreur évalue la prévision du modèle. S'il existe des exemples connus, une fonction d'erreur permet d'effectuer une comparaison pour évaluer la précision du modèle.
  1. Un processus d'optimisation de modèle : si le modèle peut mieux s'adapter aux points de données de l'ensemble d'apprentissage, les poids sont ajustés pour réduire l'écart entre l'exemple connu et l'estimation du modèle. L'algorithme répète ce processus d'évaluation et d'optimisation, en mettant à jour les poids de manière autonome jusqu'à ce qu'un seuil de précision soit atteint.  
Méthodes d'apprentissage automatique

Les modèles d'apprentissage automatique appartiennent à trois catégories principales.

Apprentissage automatique supervisé            

L'apprentissage supervisé, également appelé apprentissage automatique supervisé, est l'utilisation d'ensembles de données étiquetées pour entraîner des algorithmes qui permettent de classer des données ou de prédire des résultats avec précision. Lorsque des données d'entrée sont introduites dans le modèle, il ajuste ses pondérations jusqu'à ce qu'il soit correctement ajusté. Cette opération se produit dans le cadre du processus de validation croisée, afin que le modèle évite le sur-ajustement ou le sous-ajustement. Avec l'apprentissage supervisé, les organisations peuvent résoudre divers problèmes du monde réel à grande échelle, comme la classification des courriers indésirables dans un dossier distinct de votre boîte de réception. Les réseaux de neurones, le modèle naïf de Bayes, la régression linéaire, la régression logistique, la forêt aléatoire, la machine à vecteurs de support (SVM), etc. figurent parmi les méthodes utilisées dans l'apprentissage supervisé.

Apprentissage automatique non supervisé

L'apprentissage non supervisé, ou apprentissage automatique non supervisé, utilise des algorithmes d'apprentissage automatique pour analyser et regrouper des jeux de données non étiquetées. Ces algorithmes découvrent des modèles cachés ou des regroupements de données sans nécessiter d'intervention humaine. La capacité de l'apprentissage automatique non supervisé à découvrir des similitudes et des différences dans les informations en fait la solution idéale pour l'analyse exploratoire des données, les stratégies de vente croisée, la segmentation de la clientèle et la reconnaissance d'images et de modèles. Il permet également de réduire le nombre de caractéristiques dans un modèle grâce au processus de réduction de la dimensionnalité. L'analyse en composantes principales (PCA, Principal Component Analysis) et la décomposition en valeurs singulières (SVD, Singular Value Cecomposition) sont deux approches courantes en la matière. Les réseaux de neurones, le regroupement avec les k-moyennes, les méthodes de classification probabiliste, etc. figurent parmi les autres algorithmes utilisés dans l'apprentissage non supervisé.

Apprentissage semi-supervisé 

L'apprentissage semi-supervisé est un juste milieu entre l'apprentissage supervisé et l'apprentissage non supervisé. Pendant l'entraînement, il utilise un jeu de données étiquetées plus petit pour guider la classification et l'extraction de caractéristiques à partir d'un jeu de données non étiquetées plus grand. L'apprentissage semi-supervisé peut résoudre le problème de quantité insuffisante de données étiquetées pour un algorithme d'apprentissage supervisé. Il est également utile lorsqu'il est trop coûteux d'étiqueter suffisamment de données. 

Pour une analyse approfondie des différentes approches, consultez la page « Différence entre l'apprentissage supervisé et l'apprentissage non supervisé ».

Renforcement de l'apprentissage automatique

L'apprentissage automatique par renforcement est un modèle d'apprentissage similaire à l'apprentissage supervisé, mais l'algorithme n'est pas entraîné à l'aide d'échantillons de données. Ce modèle apprend au fur et à mesure de l'essai et de l'erreur. Une séquence de résultats positifs sera renforcée pour élaborer la meilleure recommandation ou politique pour un problème donné.

Le système IBM Watson® qui a remporté le défi Jeopardy! en 2011 est un bon exemple. Il a utilisé l'apprentissage par renforcement pour apprendre quand tenter une réponse (ou une question), quelle case choisir sur le tableau et combien miser, en particulier sur les doubles quotidiens.

En savoir plus sur l'apprentissage par renforcement.          

Algorithmes courants d'apprentissage automatique

Un certain nombre d'algorithmes d'apprentissage automatique sont couramment utilisés, notamment :

  • Réseaux de neurones : les réseaux de neurones simulent le fonctionnement du cerveau humain, avec un grand nombre de nœuds de traitement liés. Ils sont capables de reconnaître des modèles et jouent un rôle important dans des applications telles que la traduction en langage naturel, la reconnaissance d'images, la reconnaissance vocale et la création d'images.
  • Régression linéaire : cet algorithme est utilisé pour prédire des valeurs numériques en fonction d'une relation linéaire entre différentes valeurs. Par exemple, la technique peut être utilisée pour prédire les prix de maisons en fonction données d'historique d'une région.
  • Régression logistique : cet algorithme d'apprentissage supervisé fait des prédictions pour des variables de réponse catégorielles, telles que des réponses « oui/non » à des questions. Il peut être utilisé pour des applications telles que la classification des courriers électroniques et le contrôle de la qualité sur une ligne de production.
  • Regroupement : en utilisant l'apprentissage non supervisé, les algorithmes de regroupement peuvent identifier des modèles dans les données pour les regrouper. Les ordinateurs peuvent aider les spécialistes des données en identifiant les différences entre les éléments de données que les humains ont négligées.
  • Arbres de décision : les arbres de décision peuvent être utilisés à la fois pour prédire des valeurs numériques (régression) et pour classer des données en catégories. Ils utilisent une séquence de branchement de décisions liées qui peuvent être représentées à l'aide d'un diagramme arborescent. L'un des avantages des arbres de décision est qu'ils sont faciles à valider et à contrôler, contrairement à la boîte noire d'un réseau de neurones.
  • Forêts aléatoires : dans une forêt aléatoire, l'algorithme d'apprentissage automatique prédit une valeur ou une catégorie en combinant les résultats d'un certain nombre d'arbres de décision.
Scénario d'utilisation de l'apprentissage automatique dans le monde réel

Voici quelques exemples d'apprentissage automatique que vous pouvez rencontrer tous les jours :

Reconnaissance vocale : également appelée reconnaissance automatique de la parole, reconnaissance vocale par ordinateur ou retranscription de la voix en texte, cette fonctionnalité utilise le traitement automatique du langage naturel pour retranscrire la parole humaine en un format écrit. De nombreux terminaux mobiles intègrent la reconnaissance vocale dans leurs systèmes pour effectuer une recherche vocale (comme Siri) ou fournir une meilleure accessibilité aux SMS.

Service client : les agents conversationnels en ligne remplacent les agents humains tout au long du parcours client et modifient la façon dont nous concevons l'engagement client sur les sites Web et les plateformes de médias sociaux. Les agents conversationnels répondent à des questions fréquentes sur des sujets tels que l'expédition de produits, ou fournissent des conseils personnalisés en effectuant de la vente croisée de produits ou en suggérant des tailles aux utilisateurs. Les agents virtuels sur les sites d'e-commerce, les bots de messagerie, qui utilisent Slack et Facebook Messenger, et les tâches habituellement effectuées par les assistants virtuels et les assistants vocaux sont des exemples.

Vision par ordinateur : cette technologie d'IA permet aux ordinateurs et aux systèmes de déduire des informations significatives d'images numériques, de vidéos et d'autres entrées visuelles et d'agir en fonction de ces données. Optimisée par des réseaux de neurones convolutifs, la vision par ordinateur trouve des applications dans l'étiquetage des photos sur les médias sociaux, l'imagerie radiologique dans les soins de santé et les voitures autonomes dans l'industrie automobile. 

Moteurs de recommandations : en utilisant des données sur les comportements de consommation passés, les algorithmes d'IA facilitent la découverte de tendances de données qui peuvent être utilisées pour développer des stratégies de vente croisée plus efficaces. Cette approche est utilisée par les enseignes en ligne pour recommander des produits pertinents aux clients pendant le processus de paiement.

Transactions boursières automatisées : conçues pour optimiser les portefeuilles d'actions, les plateformes de transactions boursières à haute fréquence optimisées par l'IA effectuent des milliers, voire des millions, de transactions par jour sans intervention humaine.

Détection des fraudes : les banques et autres institutions financières peuvent utiliser l'apprentissage automatique pour détecter les transactions suspectes. L'apprentissage supervisé permet d'entraîner un modèle à l'aide d'informations sur des transactions frauduleuses connues. La détection des anomalies permet d'identifier les transactions qui semblent atypiques et qui doivent être examinées attentivement.

Les défis de l'apprentissage automatique

À mesure que la technologie d'apprentissage automatique progresse, elle nous facilite assurément la vie. Cependant, la mise en œuvre de l'apprentissage automatique dans les entreprises soulève également un certain nombre de questions éthiques sur les technologies d'IA, notamment :

Singularité technologique

Alors que ce sujet suscite un certain émoi dans le grand public, l'idée que l'IA surpasse l'intelligence humaine dans un avenir proche ou immédiat ne préoccupe pas les chercheurs. La singularité technologique s'appelle également l'IA forte ou la super intelligence. Le philosophe Nick Bostrum définit la super intelligence comme « toute intelligence qui surpasse largement les cerveaux humains les plus brillants dans pratiquement tous les domaines, y compris la créativité scientifique, la sagesse générale et les compétences sociales ». Bien que l'IA forte et la super intelligence ne soient pas imminentes dans la société, leur idée soulève des questions intéressantes lorsque nous envisageons l'utilisation de systèmes autonomes, comme les voitures autonomes. Il est irréaliste de penser qu'une voiture sans conducteur n'aura jamais d'accident. Mais qui est responsable et redevable dans ce cas ? Devons-nous continuer à développer des véhicules autonomes ou limiter cette technologie aux véhicules semi-autonomes qui permettent aux gens de conduire en toute sécurité ? La question n'est pas encore tranchée, mais ce sont là les types de débats éthiques qui émergent à mesure que se développent de nouvelles technologies innovantes dans le domaine de l'IA.

Impact de l'IA sur l'emploi

Si l'intelligence artificielle est souvent perçue par le grand public comme une source de chômage, cette préoccupation doit être probablement reformulée. Avec chaque nouvelle technologie disruptive, nous constatons que la demande du marché pour des fonctions professionnelles spécifiques change. Par exemple, dans l'industrie automobile, de nombreux fabricants, comme GM, se concentrent désormais sur la production de véhicules électriques pour s'inscrire dans les projets écologiques. Le secteur de l'énergie ne disparaît pas, mais la source d'énergie passe d'une économie reposant sur l'utilisation de carburants à une économie exploitant l'électricité.

De la même façon, l'intelligence artificielle déplacera la demande d'emplois vers d'autres domaines. Des personnes seront nécessaires pour gérer les systèmes d'IA et d'autres pour résoudre les problèmes plus complexes dans les secteurs d'activité les plus susceptibles d'être touchés par les changements sur le marché de l'emploi, tels que les services client. Le plus grand défi de l'intelligence artificielle et de ses effets sur le marché de l'emploi sera d'aider les gens à faire la transition vers les nouvelles fonctions recherchées.

Confidentialité

La confidentialité s'inscrit généralement dans le contexte de la confidentialité, de la protection et de la sécurité des données. Ces préoccupations ont permis aux législateurs de progresser davantage ces dernières années. En 2016, par exemple, la législation du RGPD a été créée pour protéger les données personnelles des citoyens de l'Union européenne et de l'Espace économique européen, donnant aux individus un plus grand contrôle sur leurs données. Aux États-Unis, certains États développent des politiques, telles que la California Consumer Privacy Act (CCPA), qui obligent les entreprises à informer les consommateurs de la collecte de leurs données. Cette législation oblige les entreprises à repenser la manière dont elles stockent et utilisent les informations personnellement identifiables (PII). Par conséquent, les investissements dans la sécurité sont devenus une priorité croissante pour les entreprises qui cherchent à éliminer toute vulnérabilité et toute possibilité de surveillance, de piratage et de cyberattaques.

Partialité et discrimination

Des cas de partialité et de discrimination dans un certain nombre de systèmes d'apprentissage automatique ont soulevé de nombreuses questions éthiques concernant l'utilisation de l'intelligence artificielle. Comment pouvons-nous nous protéger contre la partialité et la discrimination lorsque les données d'entraînement elles-mêmes peuvent être générées par des processus humains discriminatoires ? Alors que les entreprises ont généralement de bonnes intentions en ce qui concerne leurs efforts d'automatisation, Reuters (lien externe à IBM) met en lumière certaines des conséquences imprévues de l'incorporation de l'IA dans les pratiques d'embauche. Dans le cadre de l'automatisation et de la simplification d'un processus, Amazon a involontairement discriminé des candidats potentiels en fonction de leur sexe pour des postes techniques ouverts et a finalement dû abandonner le projet. La Harvard Business Review (lien externe à IBM) a soulevé d'autres questions sur l'utilisation de l'IA dans les pratiques d'embauche, notamment sur les données à utiliser pour évaluer un candidat à un poste.

Les préjugés et la discrimination ne se limitent pas non plus aux ressources humaines ; on les retrouve dans un certain nombre d'applications, des logiciels de reconnaissance faciale aux algorithmes des médias sociaux.

Plus les entreprises ont conscience des risques liés à l'IA, plus elles interviennent dans le débat sur l'éthique et les valeurs de l'IA. Par exemple, IBM a mis un terme à ses produits d'analyse et de reconnaissance faciale à usage général. Le PDG d'IBM, Arvind Krishna, a déclaré : « IBM s'oppose fermement et ne tolérera pas l'utilisation de toute technologie, y compris la technologie de reconnaissance faciale proposée par d'autres fournisseurs, pour la surveillance de masse, le profilage racial, les violations des droits de l'homme et des libertés fondamentales, ou tout autre objectif qui n'est pas conforme à nos valeurs et à nos principes de confiance et de transparence ».

Responsabilité

Comme il n'existe pas de législation significative pour réglementer les pratiques de l'IA, aucun véritable mécanisme de contrôle n'est en vigueur pour garantir que l'IA est pratiquée de manière éthique. Les incitations actuelles pour les entreprises à faire preuve d'éthique sont les répercussions négatives d'un système d'IA contraire à l'éthique sur les résultats. Pour combler cette lacune, des cadres éthiques sont apparus dans les activités de collaboration entre éthiciens et chercheurs pour régir la construction et la distribution de modèles d'IA dans la société. Mais, pour le moment, ils ne fournissent que des orientations. Des recherches (lien externe à IBM) (PDF, 1 Mo) montrent que la combinaison d'une responsabilité répartie et d'un manque de prévoyance, quant aux conséquences potentielles, n'est pas propice à la prévention des dommages causés à la société.

En savoir plus sur la position d'IBM sur l'éthique de l'IA.

Solutions connexes
Apprentissage en profondeur

Concevez des réseaux de neurones complexes. Expérimentez à l’échelle appropriée pour déployer des modèles d’apprentissage optimisé dans IBM Watson Studio.

Explorer l'apprentissage en profondeur
Analyses prédictives

Analysez les données et créez des modèles d'analyse pour prévoir les résultats futurs. Découvrez les risques et les opportunités pour votre entreprise.

Explorer l'analyse prédictive
Création d'applications avec le traitement automatique du langage naturel

Le traitement automatique du langage naturel, ou NLP, est une IA qui parle la langue de votre entreprise. Créez des solutions qui génèrent un retour sur investissement de 382 % sur trois ans avec IBM Watson Discovery.

Explorer la création d'applications avec NLP
Ressources AI in the enterprise, 2021: Unleashing opportunity through data

La technologie de l'IA a évolué rapidement au cours des deux dernières décennies. Découvrez comment les entreprises mettent en œuvre l'IA aujourd'hui.

Gartner Magic Quadrant for Data Science and Machine Learning Platforms

Découvrez les outils qu'utilisent les entreprises pour exécuter et gérer efficacement les modèles d'IA et permettre à leurs spécialistes des données d'utiliser des technologies qui les aident à optimiser leurs prises de décisions basées sur les données.

eBook Machine learning for dummies

Découvrez comment l'apprentissage automatique permet d'apprendre continuellement à partir des données et de prédire l'avenir.

Magic Quadrant for Enterprise Conversational AI Platforms, 2023

IBM à nouveau reconnu comme leader dans le Gartner® Magic Quadrant™ for Enterprise Conversational AI de 2023.

Pour aller plus loin

IBM Watson Studio on IBM Cloud Pak for Data prend en charge le cycle de vie de l'apprentissage automatique de bout en bout sur une plateforme de données et d'IA. Vous pouvez créer, entraîner et gérer des modèles d'apprentissage automatique, quel que soit l'emplacement de vos données, et les déployer n'importe où dans votre environnement multicloud hybride.Découvrez comment créer, entraîner et gérer des modèles d'apprentissage automatique, quel que soit l'emplacement de vos données, et les déployer n'importe où dans votre environnement multicloud hybride.

Explorer IBM Cloud Pak for Data maintenant