Qu'est-ce que l'apprentissage automatique ?

L'apprentissage automatique est une forme d'intelligence artificielle (IA) qui permet à un système d'apprendre à partir des données et non à l'aide d'une programmation explicite. Cependant, l'apprentissage automatique n'est pas un processus simple. Au fur et à mesure que les algorithmes ingèrent les données de formation, il devient possible de créer des modèles plus précis basés sur ces données. Un modèle d'apprentissage automatique est le résultat qui est généré lorsque vous formez votre algorithme d'apprentissage automatique à l'aide de données. Après la formation, lorsque vous fournissez des données en entrée à un modèle, vous recevez un résultat en sortie. Par exemple, un algorithme prédictif crée un modèle prédictif. Ensuite, lorsque vous fournissez des données au modèle prédictif, vous recevez une prévision qui est déterminée par les données qui ont servi à former le modèle.

Illustration de l'apprentissage automatique

Apprentissage itératif

L'apprentissage automatique permet aux modèles de se former sur des ensembles de données avant d'être déployés. Certains modèles d'apprentissage automatique sont en ligne et opèrent en continu. Ce processus itératif des modèles en ligne permet d'améliorer les types des associations établies entre des éléments de données. En raison de leur complexité et de leur taille, ces tendances et ces associations risquent de ne pas être détectées par un observateur humain. Lorsqu'un modèle a été formé, il peut être utilisé en temps réel pour apprendre à partir des données. Les améliorations sur le plan de l'exactitude résultent du processus de formation et d'automatisation qui font partie de l'apprentissage automatique.

Approches de l'apprentissage automatique

Des techniques d'apprentissage automatique sont nécessaires pour améliorer l'exactitude des modèles prédictifs. Selon la nature du problème métier traité, il existe différentes approches qui varient selon le type et le volume des données. Dans cette section, nous discutons des catégories de l'apprentissage automatique.

Apprentissage supervisé

L'apprentissage supervisé commence généralement par un ensemble de données bien défini et une certaine compréhension de la façon dont ces données sont classifiées. L'apprentissage supervisé a pour but de déceler des modèles au sein des données et de les appliquer à un processus analytique. Ces données comportent des caractéristiques associées à des libellés qui définissent leur signification. Vous pouvez, par exemple, créer une application d'apprentissage automatique capable de faire la distinction entre plusieurs millions d'animaux, en se basant sur des images et des descriptions écrites.

Apprentissage non supervisé

L'apprentissage non supervisé est utilisé lorsque le problème nécessite une quantité massive de données non étiquetées. Par exemple, les applications de réseaux sociaux, telles que Twitter, Instagram et Snapchat, exploitent toutes de très grandes quantités de données non étiquetées. Pour comprendre le sens de ces données, il est nécessaire d'utiliser des algorithmes qui classifient les données en fonction des tendances ou des clusters qu'ils décèlent. L'apprentissage non supervisé exécute un processus itératif et analyse les données sans intervention humaine. Il est utilisé avec la technologie de détection de spam envoyé par e-mail. Les e-mails normaux et les spams comportent un nombre de variables beaucoup trop élevé pour qu'un analyste puisse étiqueter les e-mails indésirables envoyés en masse. À la place, ce sont les classifieurs de l'apprentissage automatique, basés sur le clustering et l'association, qui sont utilisés pour identifier les e-mails indésirables.

Apprentissage par renforcement

L'apprentissage par renforcement est un modèle d'apprentissage comportemental. L'algorithme reçoit un feedback de l'analyse des données et guide l'utilisateur vers le meilleur résultat. L'apprentissage par renforcement diffère des autres types d'apprentissage supervisé, car le système n'est pas formé avec un ensemble de données exemple. Au lieu de cela, le système apprend plutôt par le biais d'une méthode d'essais et d'erreurs. Par conséquent, une séquence de décisions fructueuses aboutit au renforcement du processus, car c'est lui qui résout le plus efficacement le problème posé.

Apprentissage en profondeur

L'apprentissage en profondeur est une méthode spécifique d'apprentissage automatique qui intègre des réseaux neuronaux en couches successives afin d'apprendre des données de manière itérative. L'apprentissage en profondeur est particulièrement utile lorsque vous tentez de détecter des tendances à partir de données non structurées. Les réseaux neuronaux complexes de l'apprentissage en profondeur sont conçus pour imiter le fonctionnement du cerveau humain. Le but est de former les ordinateurs à gérer des définitions médiocres de concepts abstraits et de problèmes. La plupart des enfants de cinq ans distiguent facilement le visage de leur instituteur de celui de l'agent chargé de leur faire traverser le passage piéton. En revanche, l'ordinateur doit fournir un travail considérable pour identifier chaque visage. Les réseaux neuronaux et l'apprentissage en profondeur sont souvent utilisés dans les applications de reconnaissance d'image, de communication orale et de vision numérique.

Graphique de l'apprentissage automatique

Big Data dans le contexte de l'apprentissage automatique

L'apprentissage automatique nécessite d'appliquer un ensemble de données adéquat à un processus d'apprentissage. Une organisation n'a pas besoin de Big Data pour utiliser des techniques d'apprentissage automatique. Toutefois, le Big Data contribue à améliorer la précision des modèles d'apprentissage automatique. Grâce au Big Data, il est désormais possible de virtualiser les données afin de sélectionner le mode de stockage le plus efficace et le plus rentable, soit sur site, soit dans le Cloud. En outre, les améliorations de la vitesse et de la fiabilité du réseau ont fait disparaître d'autres limitations physiques liées à la gestion de quantités massives de données à une vitesse acceptable. Si l'on ajoute à cela l'impact de la baisse du coût de la mémoire, associée à sa sophistication croissante, il est désormais possible d'imaginer que les entreprises puissent tirer parti des données d'une façon qui aurait été inconcevable il y a seulement encore cinq ans.

L'apprentissage automatique appliqué aux besoins métier

L'apprentissage automatique peut intéresser les entreprises souhaitant exploiter le Big Data et les aider à mieux comprendre les modifications subtiles de comportement, de préférences ou de satisfaction des clients. Les chefs d'entreprise commencent à se rendre compte qu'une simple recherche ne permet pas de comprendre de nombreux événements au sein de leurs organisations et de leurs secteurs d'activité. Ce ne sont pas des questions, mais les tendances cachées et les anomalies enfouies au sein des données qui peuvent être utiles à l'entreprise, ou au contraire lui porter préjudice.

Le secret : une coordination harmonieuse

L'avantage de l'apprentissage automatique est qu'il permet d'utiliser des algorithmes et des modèles pour prédire les résultats. L'astuce consiste à s'assurer que les spécialistes des données utilisent les bons algorithmes, les données les plus appropriées (précises et propres) et les meilleurs modèles d'exécution. Si tous ces éléments se coordonnent harmonieusement, il devient alors possible de former en continu le modèle et d'exploiter les résultats en apprenant à partir des données. L'automatisation de ce processus de modélisation, de formation du modèle et de test débouche sur des prédictions précises qui accompagnent utilement le changement métier.

Intelligence artificielle

Produits

IBM Watson Studio

Cette solution sur site ou sur Cloud public ou privé fournit une plateforme collaborative d'apprentissage automatique qui permet aux équipes d'explorer, de modéliser et de déployer des solutions de données, à l'aide des meilleurs outils open source.

IBM Machine Learning for z/OS

Solution d'apprentissage automatique sur site qui extrait la valeur cachée au sein des données de l'entreprise. Ingérez et transformez rapidement les données pour créer, déployer et gérer des modèles d'auto-apprentissage de très haute précision à l'aide des données d'IBM z Systems®.

IBM SPSS® Modeler

Plateforme analytique graphique destinée aux utilisateurs, tous niveaux de compétences confondus. Elle permet de déployer des connaissances à grande échelle, grâce à un vaste choix d'algorithmes et de fonctionnalités telles que l'analyse de texte, l'analyse géospatiale et l'optimisation.

IBM Watson Explorer

Plateforme d'analyse de contenu et de recherche cognitive utilisant l'apprentissage automatique. Elle fournit aux utilisateurs des connaissances exploitables, extraites de toutes les données, et permet d'obtenir de meilleurs résultats métier.

Études de cas

Ahus obtient de nouvelles connaissances grâce à Watson Explorer et optimise la qualité des soins de santé

L'hôpital universitaire Akershus (Ahus) utilise Watson Explorer, avec son partenaire Capgemini, pour analyser des milliers de rapports de radiologie afin de confirmer que les équipes suivent les meilleures pratiques et aident à maintenir des normes élevées en matière de soins de santé.

L'analyse de contenu en temps réel aide les centres d'appels à servir efficacement leurs clients

Mizuho Bank Ltd. gère efficacement les interactions avec les clients et réduit le temps de résolution de chaque demande grâce à IBM Watson Explorer et à sa fonction de traitement en langage naturel en temps réel.

Ressources

Visite guidée d'IBM Watson Studio : découvrez comment créer un modèle d'apprentissage automatique capable de prévoir l'attrition des clients

Consultez d'autres tutoriels sur l'apprentissage automatique et les applications d'apprentissage en profondeur

Commencez votre essai gratuit de Watson Studio