Qu'est-ce que l'apprentissage en profondeur?
L'apprentissage en profondeur tente de simuler le cerveau humain, même s'il est loin d'en égaler les capacités, en permettant aux systèmes de regrouper des données et de faire des prédictions avec une précision inouïe.
Découvrir l’IA conversationnelle d’IBM
Fond dégradé noir et bleu
Qu'est-ce que l'apprentissage en profondeur?

L'apprentissage en profondeur est un sous-ensemble de l'apprentissage automatique, qui consiste essentiellement en un réseau neuronal de trois couches ou plus. Ces réseaux neuronaux tentent de simuler le comportement du cerveau humain - même s'ils sont loin d'en égaler les capacités - en leur permettant "d'apprendre" à partir de grandes quantités de données. Alors qu'un réseau de neurones à une seule couche peut toujours faire des prédictions approximatives, des couches cachées supplémentaires contribuent à optimiser et à affiner la précision des résultats.

L'apprentissage en profondeur est à la base de nombreuses applications et services d'intelligence artificielle (IA) qui améliorent l'automatisation, en exécutant des tâches analytiques et physiques sans intervention humaine. La technologie de l'apprentissage en profondeur est sous-jacente dans les produits et les services du quotidien (tels que les assistants numériques, les télécommandes de télévision à commande vocale et la détection des fraudes à la carte de crédit), ainsi que dans les technologies émergentes (telles que les voitures à conduite autonome).

Apprentissage en profondeur versus Apprentissage automatique

Si l'apprentissage en profondeur est un sous-ensemble du machine learning, en quoi diffèrent-ils ? L'apprentissage profond se distingue du machine learning classique par le type de données qu'il utilise et par ses méthodes d'apprentissage.

Les algorithmes de machine learning exploitent des données structurées et étiquetées pour faire des prédictions, ce qui implique que des caractéristiques spécifiques sont définies à partir des données d'entrée du modèle, puis organisées dans des tables. Cela ne signifie pas qu'il n'utilise pas de données non structurés, mais que s'il en utilise, ces données passent par un traitement préalable qui les organise dans un format structuré.

L'apprentissage en profondeur élimine une partie de ce prétraitement qui intervient généralement dans le machine learning. Ces algorithmes peuvent ingérer et traiter des données non structurées, comme du texte et des images,  et ils automatisent l'extraction de caractéristiques, ce qui leur permet de moins dépendre d'experts humains. Par exemple, imaginons que nous disposions d'un ensemble de photos de différents animaux domestiques et que nous voulions les classer par espèces : "chat", "chien", "hamster", etc. Les algorithmes d'apprentissage en profondeur peuvent déterminer quelles caractéristiques (par exemple les oreilles) sont les plus importantes pour distinguer les animaux les uns des autres. Dans le machine learning, cette hiérarchie de fonctions est établie manuellement par un expert humain.

Ensuite, grâce aux processus de descente de gradient et de rétropropagation, l'algorithme d'apprentissage en profondeur s'ajuste pour améliorer l'exactitude de ses résultats, ce qui lui permet de faire des prédictions plus précises quand il traite une nouvelle photo d'animal.  

Les modèles de machine learning et d'apprentissage en profondeur peuvent également recevoir différents types d'apprentissage généralement classés en apprentissage supervisé, apprentissage non supervisé et apprentissage par renforcement. L'apprentissage supervisé utilise des ensembles de données étiquetées pour catégoriser ou faire des prédictions, ce qui nécessite une certaine forme d'intervention humaine pour étiqueter correctement les données d'entrée. En revanche, l'apprentissage non supervisé ne nécessite pas d'ensembles de données étiquetées. A la place, il détecte des modèles dans les données, en les regroupant en fonction de leurs caractéristiques distinctives. L'apprentissage par renforcement est un processus dans lequel un modèle apprend à devenir plus précis lors de l'exécution d'une action dans un environnement, en se basant sur le retour d'information, afin de maximiser la récompense.

Pour une analyse plus détaillée des nuances distinguant les différentes technologies, voir "AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What's the Difference?"

Pour en savoir plus sur les différences entre l'apprentissage supervisé et non supervisé, voir "Supervised vs. Unsupervised Learning: What's the Difference?"

Comment fonctionne l'apprentissage en profondeur

Les réseaux de neurones d'apprentissage en profondeur, ou réseaux de neurones artificiels, tentent d'imiter le cerveau humain à l'aide d'une combinaison d'entrées de données, de pondérations et de biais. Ces éléments fonctionnent ensemble pour reconnaître, classer et décrire avec précision les objets présents dans les données

Les réseaux neuronaux profonds se composent de plusieurs couches de nœuds interconnectés, chacune s'appuyant sur la couche précédente pour affiner et optimiser la prédiction ou la catégorisation. Cette progression des calculs dans le réseau est appelée propagation avant. Les couches d'entrée et de sortie d'un réseau de neurones profond s'appellent des couches  visibles . La couche d'entrée est celle où le modèle d'apprentissage profond ingère les données à traiter, et la couche de sortie est celle où la prédiction ou la classification finale est effectuée.

Un autre processus appelé rétropropagation utilise des algorithmes, comme l'algorithme de gradient, pour calculer les erreurs dans les prédictions, puis ajuste les pondérations et les biais de la fonction en remontant en arrière dans les couches afin d'entraîner le modèle. Ensemble, la propagation avant et la rétropropagation permettent à un réseau neuronal de faire des prédictions et de corriger les erreurs en conséquence. Au fil du temps, l'algorithme devient progressivement plus précis.

Ces explications décrivent le type le plus basique de réseau neuronal profond dans les termes les plus simples. Cependant, les algorithmes d'apprentissage en profondeur sont incroyablement complexes, et il existe différents types de réseaux de neurones qui répondent à des problèmes ou des ensembles de données spécifiques. Par exemple,

  • Par exemple,les réseaux de neurones convolutifs (CNN), utilisés principalement dans les applications de vision par ordinateur et de classification d'images, peuvent détecter des caractéristiques et des motifs dans une image, ce qui permet d'effectuer des tâches telles que la détection ou la reconnaissance d'objets. En 2015, un réseau de neurones convulsifs a battu pour la première fois un humain dans un concours de reconnaissance d'objets.
  • Les réseaux neuronaux récurrents (RNN) sont généralement utilisés dans les applications de reconnaissance du langage naturel et de la parole, car ils exploitent des données séquentielles ou des séries chronologiques.
Applications d'apprentissage en profondeur

Les applications d'apprentissage en profondeur dans le monde réel font partie de notre quotidien, mais dans la plupart des cas, elles sont si bien intégrées aux produits et services que les utilisateurs n'ont pas conscience du traitement complexe des données qui se déroule en arrière-plan. Certaines de ces tâches comprennent :

Maintien de l'ordre
 

Les algorithmes d'apprentissage en profondeur peuvent analyser et apprendre à partir de données transactionnelles pour identifier des modèles dangereux qui indiquent une éventuelle activité frauduleuse ou criminelle. La reconnaissance vocale, la vision par ordinateur et d'autres applications d'apprentissage en profondeur peuvent améliorer l'efficacité de l'analyse d'investigation en extrayant des modèles et des preuves à partir d'enregistrements sonores et vidéo, d'images et de documents. Les forces de l'ordre peuvent ainsi analyser de grandes quantités de données plus rapidement et plus précisément.

Services financiers
 

Les institutions financières utilisent régulièrement l'analyse prédictive pour gérer la vente d'actions à l'aide d'algorithmes, évaluer les risques commerciaux pour l'approbation des prêts, détecter les fraudes et aider à gérer les portefeuilles de crédit et d'investissement des clients.

Service client
 

De nombreuses organisations intègrent la technologie d'apprentissage en profondeur dans leurs processus de service à la clientèle. Agents conversationnels : utilisés dans divers applications, services et portails de service client. Il s'agit d'une forme simple d'IA. Les chatbots traditionnels utilisent le langage naturel et même la reconnaissance visuelle, que l'on trouve couramment dans les menus du style de ceux utilisés dans les centres d'appels. Toutefois, des solutions de chatbot plus sophistiquées tentent de déterminer, par l'apprentissage, s'il existe plusieurs réponses à des questions ambiguës. En fonction des réponses qu'il reçoit, l'agent conversationnel tente de répondre directement à ces questions ou de diriger la conversation vers un utilisateur humain.

Les assistants virtuels tels que Siri chez Apple, Alexa chez Amazon ou Google Assistant étendent l'idée du chatbot en permettant la reconnaissance vocale. Il en émerge une nouvelle méthode permettant une interaction personnalisée avec les utilisateurs.

Santé
 

Le secteur de la santé a grandement bénéficié des capacités de l'apprentissage en profondeur depuis la numérisation des dossiers et de l'imagerie dans les hôpitaux. Les applications de reconnaissance d'images peuvent apporter une aide aux spécialistes de l'imagerie médicale et aux radiologues, en les aidant à analyser et à évaluer davantage d'images en moins de temps.

Configuration matérielles requises par une solution d'apprentissage en profondeur

L'apprentissage en profondeur requiert une énorme puissance de calcul. Les unités de traitement graphique (GPU) haute performance sont idéales, car elles peuvent gérer un grand volume de calculs dans plusieurs cœurs avec une grande capacité de mémoire. Cependant, la gestion de plusieurs GPU sur site peut fortement solliciter les ressources internes et s'avérer incroyablement coûteuse à mettre à l'échelle.

Solutions connexes
IBM Watson, l'IA pour une entreprise plus intelligente

Le portefeuille Watson d'outils, d'applications et de solutions prêts à l'emploi réduit les coûts et les obstacles à l'adoption de l'IA tout en optimisant les résultats et l'utilisation responsable de l'IA.

Explorer IBM Watson - L'IA pour une entreprise intelligente
Watson Assistant - Agent conversationnel d'IA

Watson Assistant est l'agent conversationnel IA de l'entreprise. Cette technologie d'intelligence artificielle d'entreprise permet aux utilisateurs de créer des solutions d'IA conversationnelles.

Explorer Watson Assistant
Watson Studio

Créez, exécutez et gérez des modèles d'IA. Préparez les données et construisez des modèles dans n'importe quel cloud à l'aide d'un code source ouvert ou de la modélisation visuelle. Prévoyez et optimisez vos résultats.

Explorer Watson Studio
Ressources Livre électronique sur l'intelligence artificielle Introduction à l'apprentissage en profondeur

Explorez cette branche du machine learning qui est entraînée sur de grandes quantités de données et traite des unités de calcul travaillant en tandem pour effectuer des prédictions

Architectures d'apprentissage en profondeur

L'essor de intelligence artificielle

Pour aller plus loin

Depuis des décennies, IBM fait figure de pionnier dans le développement des technologies d'IA et de l'apprentissage en profondeur, avec notamment le développement d'IBM Watson, l'agent conversationnel d'IA d'IBM. Watson, l'une des premières réalisations dans le domaine des technologies d'apprentissage en profondeur, est aujourd'hui une solution fiable pour les entreprises qui cherchent à appliquer des techniques avancées de traitement automatique du langage naturel et de machine learning à leurs systèmes, en utilisant une approche progressive reconnue d'adoption et de mise en œuvre de l'IA.

Démarrer avec IBM Watson Studio dès maintenant