menu icon

Apprentissage automatique

Cette présentation de l'apprentissage automatique donne un aperçu de son histoire, de ses définitions importantes, de ses applications et des questions qu'elle pose dans les entreprises actuelles.

Qu'est-ce que l'apprentissage automatique ?

L'apprentissage automatique est une branche de l'intelligence artificielle (IA) et de l'informatique qui utilise principalement des données et des algorithmes pour imiter la manière dont les être humains apprennent, en améliorant progressivement sa précision.

IBM a un riche passé dans le domaine de l'apprentissage automatique. C'est à l'un de ses pionniers, Arthur Samuel, que l'on doit l'invention du terme « apprentissage automatique » grâce à ses recherches (PDF, 481 ko, lien externe à IBM) sur le jeu de dames. Robert Nealey, le maître autoproclamé du jeu de dames, a joué à ce jeu sur un ordinateur IBM 7094 en 1962, et il a perdu contre l'ordinateur. Comparé à ce qui peut être fait aujourd'hui, cet exploit semble presque futile, mais il est considéré comme une étape majeure dans le domaine de l'intelligence artificielle. Au cours des deux décennies suivantes, les développements technologiques autour du stockage et de la puissance de traitement vont permettre de proposer certains produits innovants que nous connaissons et apprécions, comme le moteur de recommandation de Netflix ou les voitures à conduite autonome.

L'apprentissage automatique est une composante importante du domaine en pleine expansion qu'est la science des données. Grâce à l'utilisation de méthodes statistiques, des algorithmes sont entraînés à effectuer des classifications ou des prévisions, ce qui permet de découvrir des informations essentielles dans le cadre de projets d'exploration des données. Ces informations permettent ensuite de prendre des décisions dans les applications et les entreprises, et ont idéalement un impact sur les principales métriques de croissance. Au fur et à mesure que le big data poursuit son développement et sa croissance, les besoins en spécialistes des données va augmenter, ce qui les obligera à contribuer à l'identification des questions commerciales les plus pertinentes et, par conséquent, des données permettant d'y répondre.

Apprentissage automatique versus Apprentissage en profondeur versus Réseaux neuronaux

Apprentissage en profondeur et apprentissage automatique ayant tendance à être utilisés indifféremment, il convient de noter les nuances entre les deux. L'apprentissage automatique, l'apprentissage en profondeur et les réseaux de neurones sont tous des sous-domaines de l'intelligence artificielle. Cependant, l'apprentissage en profondeur est en fait un sous-domaine de l'apprentissage automatique, et les réseaux de neurones sont un sous-domaine de l'apprentissage en profondeur.

La différence entre l'apprentissage en profondeur et l'apprentissage automatique réside dans la manière dont chaque algorithme apprend. L'apprentissage en profondeur automatise une grande partie de l'extraction des caractéristiques, éliminant ainsi une partie de l'intervention humaine manuelle requise et permettant d'utiliser de plus grands ensembles de données. L'apprentissage en profondeur s'apparente à un « apprentissage automatique évolutif », comme le note Lex Fridman dans cette conférence du MIT (00:30, lien externe à IBM). L'apprentissage automatique classique, ou « non profond », dépend davantage de l'intervention humaine pour apprendre. Les experts humains déterminent l'ensemble des caractéristiques permettant de comprendre les différences entre les entrées de données, ce qui nécessite généralement des données plus structurées pour apprendre.

L'apprentissage machine « en profondeur » peut s'appuyer sur des ensembles de données étiquetées, également appelés apprentissage supervisé, pour informer son algorithme, mais il ne requiert pas nécessairement un ensemble de données étiquetées. Il peut ingérer des données non structurées dans leur forme brute (texte, images, etc.) et déterminer automatiquement l'ensemble des caractéristiques qui distinguent les différentes catégories de données les unes des autres. Contrairement à l'apprentissage automatique, il ne nécessite pas d'intervention humaine pour traiter les données, ce qui nous permet de faire évoluer l'apprentissage automatique de manière plus intéressante. On attribue principalement à l'apprentissage en profondeur et aux réseaux de neurones l'accélération des progrès dans des domaines tels que la vision par ordinateur, le traitement du langage naturel et la reconnaissance vocale.

Les réseaux de neurones, ou réseaux de neurones artificiels, sont constitués de couches nodales, contenant une couche d'entrée, une ou plusieurs couches cachées et une couche de sortie. Chaque nœud, ou neurone artificiel, se connecte à un autre et possède un poids et un seuil associés. Si la sortie d'un nœud est supérieure à la valeur de seuil spécifiée, ce nœud est activé et envoie des données à la couche suivante du réseau. Dans le cas contraire, aucune donnée n'est transmise à la couche suivante du réseau. Le terme « en profondeur » dans l'expression « apprentissage en profondeur » fait simplement référence à la profondeur des couches d'un réseau de neurones. Un réseau de neurones composé de plus de trois couches (incluant les entrées et les sorties) peut être considéré comme un algorithme d'apprentissage en profondeur ou un réseau de neurones profonds. Un réseau de neurones qui ne comporte que deux ou trois couches est simplement un réseau de neurones de base.

Consultez l'article de blog « AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What’s the Difference ? » pour un examen plus approfondi de la relation entre ces différents concepts.

Fonctionnement de l'apprentissage automatique

L'université UC Berkeley (lien externe à IBM) décompose le système d'apprentissage d'un algorithme d'apprentissage automatique en trois parties principales.

  1. Un processus de décision : En général, les algorithmes d'apprentissage automatique servent à effectuer une prévision ou une classification. En fonction de certaines données d'entrée, qui peuvent être étiquetées ou non, votre algorithme produira une estimation sur un modèle dans les données.
  2. Une fonction d'erreur : Une fonction d'erreur permet d'évaluer la prévision du modèle. S'il existe des exemples connus, une fonction d'erreur permet d'effectuer une comparaison pour évaluer la précision du modèle.
  3. Un processus d'optimisation de modèle : Si le modèle peut mieux s'adapter aux points de données de l'ensemble d'apprentissage, les poids sont ajustés pour réduire l'écart entre l'exemple connu et l'estimation du modèle. L'algorithme répète ce processus d'évaluation et d'optimisation, en mettant à jour les poids de manière autonome jusqu'à ce qu'un seuil de précision soit atteint.

Méthodes d'apprentissage automatique

Les classificateurs d'apprentissage automatique appartiennent à trois catégories principales.

Apprentissage automatique supervisé

L'apprentissage supervisé, également appelé apprentissage automatique supervisé, se définit par l'utilisation d'ensembles de données étiquetées pour entraîner des algorithmes permettant de classer des données ou de prévoir des résultats avec précision. Lorsque des données d'entrée sont introduites dans le modèle, il ajuste ses poids jusqu'à ce que le modèle soit ajusté de manière appropriée. Cela se produit dans le cadre du processus de validation croisée, afin que le modèle évite le sur-ajustement ou le sous-ajustement. Avec l'apprentissage supervisé, les organisations peuvent résoudre divers problèmes du monde réel à grande échelle, comme la classification des courriers indésirables dans un dossier distinct de votre boîte de réception. Les réseaux de neurones, le modèle naïf de Bayes, la régression linéaire, la régression logistique, la forêt aléatoire, la machine à vecteurs de support (SVM), etc. figurent parmi les méthodes utilisées dans l'apprentissage supervisé.

Apprentissage automatique non supervisé

L'apprentissage non supervisé, également appelé apprentissage automatique non supervisé, utilise des algorithmes d'apprentissage automatique pour analyser et regrouper des ensembles de données non étiquetées. Ces algorithmes découvrent des modèles cachés ou des regroupements de données sans nécessiter d'intervention humaine. Sa capacité à découvrir des similitudes et des différences dans les informations en fait la solution idéale pour l'analyse d'exploration des données, les stratégies de vente croisée, la segmentation de la clientèle et la reconnaissance d'images et de formes. Il est également utilisé pour réduire le nombre de caractéristiques d'un modèle par le biais du processus de réduction de la dimensionnalité. L'analyse en composantes principales (ACP) et la décomposition en valeurs singulières (SVD) sont deux approches courantes à cet égard. Les réseaux de neurones, le regroupement avec les k-moyennes, les méthodes de classification probabiliste, etc. figurent parmi les autres algorithmes utilisés dans l'apprentissage non supervisé.

Entraînement semi-supervisé

L'entraînement semi-supervisé offre un juste milieu entre l'entraînement supervisé et l'entraînement non supervisé. Pendant l'entraînement, il utilise un ensemble de données étiquetées plus petit pour guider la classification et l'extraction de caractéristiques à partir d'un ensemble de données non étiquetées plus grand. L'entraînement semi-supervisé peut résoudre le problème du manque de données étiquetées (ou du manque de moyens pour étiqueter suffisamment de données) pour entraîner un algorithme d'apprentissage supervisé.

Pour un examen approfondi des différences entre ces approches, consultez « Entraînement supervisé et entraînement non supervisé : quelle est la différence ? »

Renforcement de l'apprentissage automatique

L'apprentissage automatique par renforcement est un modèle d'apprentissage automatique comportemental similaire à l'apprentissage supervisé, mais l'algorithme n'est pas entraîné à l'aide d'échantillons de données. Ce modèle apprend au fur et à mesure de l'essai et de l'erreur. Une séquence de résultats positifs sera renforcée pour élaborer la meilleure recommandation ou politique pour un problème donné.

Le système IBM Watson®, qui a remporté le défi Jeopardy! en 2011, en est un bon exemple. Le système a utilisé l'apprentissage par renforcement pour décider s'il fallait tenter une réponse (ou une question, pour être exact), quelle case choisir sur le tableau et combien miser, surtout sur les doubés du jour.

En savoir plus sur l'apprentissage par renforcement

Scénario d'utilisation de l'apprentissage automatique dans le monde réel

Voici quelques exemples d'apprentissage automatique que vous pouvez rencontrer tous les jours :

Reconnaissance vocale : Également appelée reconnaissance automatique de la parole, reconnaissance de la parole par ordinateur ou de synthèse vocale, la reconnaissance de la parole est une fonctionnalité qui utilise le traitement du langage naturel pour transcrire la parole humaine dans un format écrit. Une multitude d'appareils mobiles intègrent la reconnaissance vocale dans leurs systèmes pour effectuer des recherches vocales, comme Siri, ou pour fournir une plus grande accessibilité au texte.

Centre de support : Les assistants conversationnels en ligne remplacent les agents humains tout au long du parcours du client. Ils répondent aux questions fréquentes sur des sujets tels que l'expédition, ou fournissent des conseils personnalisés, des ventes croisées de produits ou des suggestions de taille pour les utilisateurs, changeant ainsi notre façon de concevoir l'engagement des clients sur les sites Web et les plateformes de médias sociaux. Les bots de messagerie sur les sites de commerce électronique avec des agents virtuels, les applications de messagerie, comme Slack et Facebook Messenger, et les tâches habituellement effectuées par les assistants virtuels et les assistants vocaux en sont des exemples.

Vision par ordinateur : Cette technologie d'IA permet aux ordinateurs et aux systèmes de déduire des informations significatives à partir d'images numériques, de vidéos et autres données visuelles, et d'exécuter des actions en fonction de ces données. Cette capacité à fournir des recommandations la distingue des tâches de reconnaissance d'images. Optimisée par des réseaux de neurones convolutifs, la vision par ordinateur trouve des applications dans le marquage des photos sur les médias sociaux, l'imagerie radiologique dans les soins de santé et les voitures à conduite autonome dans l'industrie automobile.

Moteurs de recommandation : En utilisant des données sur les comportements de consommation passés, les algorithmes d'IA peuvent découvrir des tendances de données qui peuvent être utilisées pour développer des stratégies de vente croisée plus efficaces. Les enseignes en ligne s'en servent pour faire des recommandations pertinentes de produits complémentaires aux clients lors du processus de règlement.

Négociation boursière automatisée : Destinées à optimiser les portefeuilles d'actions, les plateformes de négociation haute fréquence optimisées par l'IA effectuent des milliers, voire des millions de transactions par jour sans intervention humaine.

Les défis de l'apprentissage automatique

À mesure que la technologie d'apprentissage automatique progresse, elle rend certainement nos vies plus faciles. Cependant, la mise en œuvre de l'apprentissage automatique au sein des entreprises a également soulevé un certain nombre de questions éthiques autour des technologies d'IA, notamment :

Singularité technologique

Bien que ce sujet suscite une grande attention de la part du public, de nombreux chercheurs ne sont pas préoccupés par l'idée que l'IA surpasse l'intelligence humaine dans un avenir proche ou immédiat. On parle également de superintelligence, que Nick Bostrum définit comme « tout intellect qui surpasse largement les plus brillants cerveaux humains dans pratiquement tous les domaines, y compris la créativité scientifique, la sagesse générale et les compétences sociales ». Malgré le fait que l'IA forte et la superintelligence ne soient pas imminentes dans la société, leur idée soulève des questions intéressantes alors que nous envisageons l'utilisation de systèmes autonomes, comme les voitures à conduite autonome. Il est irréaliste de penser qu'une voiture sans conducteur n'aura jamais d'accident de voiture. Mais qui est responsable et redevable dans ce cas ? Devons-nous continuer dans la voie des véhicules autonomes ou devons-nous limiter l'intégration de cette technologie pour créer uniquement des véhicules semi-autonomes qui favorisent la sécurité des conducteurs ? La question n'est pas encore tranchée, mais ce sont les types de débats éthiques qui se déroulent à mesure que se développent de nouvelles technologies innovantes dans le domaine de l'IA.

Impact de l'IA sur l'emploi

Alors que la perception qu'a le public de l'intelligence artificielle est souvent liée à la perte d'emploi, cette préoccupation devrait sans doute être recadrée. Avec chaque nouvelle technologie disruptive, nous constatons que la demande du marché pour des rôles professionnels spécifiques change. Par exemple, dans l'industrie automobile, de nombreux fabricants, comme GM, se concentrent désormais sur la production de véhicules électriques pour s'aligner sur les projets écologiques. Le secteur de l'énergie ne disparaît pas, mais la source d'énergie passe d'une économie reposant sur l'utilisation de carburants à une économie exploitant l'électricité. L'intelligence artificielle doit être considérée de la même manière, car elle va déplacer la demande d'emplois vers d'autres domaines. Des personnes seront nécessaires pour gérer ces systèmes, car les données augmentent et changent tous les jours. Il faudra encore des ressources pour résoudre des problèmes plus complexes dans les secteurs les plus susceptibles d'être affectés par les changements sur le marché du travail, comme le centre de support. L'aspect important de l'intelligence artificielle et de son effet sur le marché de l'emploi sera d'aider les individus à faire la transition vers ces nouveaux secteurs du marché.

Confidentialité

On a tendance à aborder la protection de la vie privée dans le contexte de la confidentialité des données, de la protection des données et de la sécurité des données, et ces préoccupations ont permis aux décideurs politiques de connaître des avancées dans ce domaine au cours dernières années. En 2016, par exemple, la législation du RGPD a été créée pour protéger les données personnelles des citoyens de l'Union européenne et de l'Espace économique européen, donnant aux individus un plus grand contrôle sur leurs données. Aux États-Unis, certains États développent des politiques, telles que la California Consumer Privacy Act (CCPA), qui obligent les entreprises à informer les consommateurs de la collecte de leurs données. Cette législation récente a obligé les entreprises à repenser la manière dont elles stockent et utilisent les données personnelles identifiables (PII). Par conséquent, les investissements dans la sécurité sont devenus une priorité croissante pour les entreprises qui cherchent à éliminer toute vulnérabilité et toute possibilité de surveillance, de piratage et de cyberattaques.

Partialité (biais) et discrimination

Des cas de partialité et de discrimination dans un certain nombre de systèmes intelligents ont soulevé de nombreuses questions éthiques concernant l'utilisation de l'intelligence artificielle. Comment se protéger contre la partialité et la discrimination lorsque les données d'entraînement elles-mêmes peuvent se prêter à la partialité ? Alors que les entreprises ont généralement de bonnes intentions en ce qui concerne leurs efforts d'automatisation, Reuters (lien externe à IBM) met en lumière certaines des conséquences imprévues de l'intégration de l'IA dans les pratiques d'embauche. Dans le cadre de l'automatisation et de la simplification d'un processus, Amazon a involontairement discriminé des candidats potentiels en fonction de leur sexe pour les postes techniques ouverts, et a finalement dû abandonner le projet. Face à ce genre de situations, Harvard Business Review (lien externe à IBM) soulève d'autres questions pointues sur l'utilisation de l'IA dans les pratiques d'embauche, telles que les données que vous devriez être en mesure d'utiliser pour évaluer un candidat à un poste.

La partialité et la discrimination ne se limitent pas non plus aux « Ressources Humaines », elles existent dans un certain nombre d'applications, depuis les logiciels de reconnaissance faciale jusqu'aux algorithmes des médias sociaux.

Les entreprises, de plus en plus conscientes des risques liés à l'IA, sont également devenues plus actives dans le débat sur l'éthique et les valeurs de l'IA L'année dernière, par exemple, le PDG d'IBM, Arvind Krishna, a annoncé qu'IBM avait mis fin à ses produits d'analyse et de reconnaissance faciale à usage général, soulignant que « IBM s'oppose fermement à toute technologie, y compris la technologie de reconnaissance faciale proposée par d'autres fournisseurs, et ne tolèrera pas son utilisation à des fins de surveillance de masse, de profilage racial, de violation des droits de l'homme et des libertés fondamentales, ou à toute autre fin qui ne serait pas conforme aux valeurs et aux principes de confiance et de transparence d'IBM ».

Pour en savoir plus sur ce sujet, consultez le blogue de la stratégie d'IBM, qui relaie son point de vue sur « Une approche de réglementation de précision pour contrôler les exportations de technologies de reconnaissance faciale ».

Responsabilité

Comme il n'existe pas de législation significative pour réglementer les pratiques de l'IA, aucun véritable mécanisme d'application n'est en vigueur pour garantir que l'IA est pratiquée de manière éthique. Ce qui incite actuellement les entreprises à adhérer à ces directives, ce sont les répercussions négatives d'un système d'IA non éthique sur les résultats financiers. Pour combler cette lacune, des cadres éthiques sont apparus dans le cadre d'une collaboration entre éthiciens et chercheurs pour régir la construction et la distribution de modèles d'IA dans la société. Pour le moment, cependant, elles ne servent qu'à guider, et la recherche (lien externe à IBM, PDF, 984 ko) montre que la combinaison d'une responsabilité distribuée et d'un manque de prévision des conséquences potentielles n'est pas nécessairement propice à la prévention des dommages pour la société.

Pour en savoir plus sur la position d'IBM sur l'éthique de l'IA, cliquez ici.

Apprentissage automatique et IBM Cloud

IBM Watson Machine Learning prend en charge l'intégralité du cycle de vie de l'apprentissage automatique. Il est disponible dans une gamme d'offres qui vous permettent de créer des modèles d'apprentissage automatique là où vos données se trouvent et de les déployer partout dans votre environnement hybride multicloud.

IBM Watson Machine Learning sur IBM Cloud Pak for Data aide les équipes spécialistes en IA et en science des données d'entreprise à accélérer le développement et le déploiement de l'IA partout, sur une plateforme de données et d'IA native cloud. IBM Watson Machine Learning Cloud, service géré dans l'environnement IBM Cloud, constitue le moyen le plus rapide de faire passer des modèles de l'expérimentation sur l'ordinateur de bureau au déploiement pour les charges de travail de production. Pour les petites équipes qui veulent mettre à l'échelle des déploiements d'apprentissage automatique, IBM Watson Machine Learning Server offre une installation simple sur tout cloud privé ou public.

Pour démarrer, inscrivez-vous pour obtenir un IBMid et créez votre compte IBM Cloud.