L'apprentissage en profondeur est un sous-ensemble de l'apprentissage automatique, qui consiste essentiellement en un réseau neuronal de trois couches ou plus. Ces réseaux neuronaux tentent de simuler le comportement du cerveau humain - même s'ils sont loin d'en égaler les capacités - en leur permettant "d'apprendre" à partir de grandes quantités de données. Alors qu'un réseau de neurones à une seule couche peut toujours faire des prédictions approximatives, des couches cachées supplémentaires contribuent à optimiser et à affiner la précision des résultats.
L'apprentissage en profondeur est à la base de nombreuses applications et services d'intelligence artificielle (IA) qui améliorent l'automatisation, en exécutant des tâches analytiques et physiques sans intervention humaine. La technologie de l'apprentissage en profondeur est sous-jacente dans les produits et les services du quotidien (tels que les assistants numériques, les télécommandes de télévision à commande vocale et la détection des fraudes à la carte de crédit), ainsi que dans les technologies émergentes (telles que les voitures à conduite autonome).
Si l'apprentissage en profondeur est un sous-ensemble du machine learning, en quoi diffèrent-ils ? L'apprentissage profond se distingue du machine learning classique par le type de données qu'il utilise et par ses méthodes d'apprentissage.
Les algorithmes de machine learning exploitent des données structurées et étiquetées pour faire des prédictions, ce qui implique que des caractéristiques spécifiques sont définies à partir des données d'entrée du modèle, puis organisées dans des tables. Cela ne signifie pas qu'il n'utilise pas de données non structurés, mais que s'il en utilise, ces données passent par un traitement préalable qui les organise dans un format structuré.
L'apprentissage en profondeur élimine une partie de ce prétraitement qui intervient généralement dans le machine learning. Ces algorithmes peuvent ingérer et traiter des données non structurées, comme du texte et des images, et ils automatisent l'extraction de caractéristiques, ce qui leur permet de moins dépendre d'experts humains. Par exemple, imaginons que nous disposions d'un ensemble de photos de différents animaux domestiques et que nous voulions les classer par espèces : "chat", "chien", "hamster", etc. Les algorithmes d'apprentissage en profondeur peuvent déterminer quelles caractéristiques (par exemple les oreilles) sont les plus importantes pour distinguer les animaux les uns des autres. Dans le machine learning, cette hiérarchie de fonctions est établie manuellement par un expert humain.
Ensuite, grâce aux processus de descente de gradient et de rétropropagation, l'algorithme d'apprentissage en profondeur s'ajuste pour améliorer l'exactitude de ses résultats, ce qui lui permet de faire des prédictions plus précises quand il traite une nouvelle photo d'animal.
Les modèles de machine learning et d'apprentissage en profondeur peuvent également recevoir différents types d'apprentissage généralement classés en apprentissage supervisé, apprentissage non supervisé et apprentissage par renforcement. L'apprentissage supervisé utilise des ensembles de données étiquetées pour catégoriser ou faire des prédictions, ce qui nécessite une certaine forme d'intervention humaine pour étiqueter correctement les données d'entrée. En revanche, l'apprentissage non supervisé ne nécessite pas d'ensembles de données étiquetées. A la place, il détecte des modèles dans les données, en les regroupant en fonction de leurs caractéristiques distinctives. L'apprentissage par renforcement est un processus dans lequel un modèle apprend à devenir plus précis lors de l'exécution d'une action dans un environnement, en se basant sur le retour d'information, afin de maximiser la récompense.
Pour une analyse plus détaillée des nuances distinguant les différentes technologies, voir "AI vs. Machine Learning vs. Deep Learning vs. Neural Networks: What's the Difference?"
Pour en savoir plus sur les différences entre l'apprentissage supervisé et non supervisé, voir "Supervised vs. Unsupervised Learning: What's the Difference?"
Les réseaux de neurones d'apprentissage en profondeur, ou réseaux de neurones artificiels, tentent d'imiter le cerveau humain à l'aide d'une combinaison d'entrées de données, de pondérations et de biais. Ces éléments fonctionnent ensemble pour reconnaître, classer et décrire avec précision les objets présents dans les données
Les réseaux neuronaux profonds se composent de plusieurs couches de nœuds interconnectés, chacune s'appuyant sur la couche précédente pour affiner et optimiser la prédiction ou la catégorisation. Cette progression des calculs dans le réseau est appelée propagation avant. Les couches d'entrée et de sortie d'un réseau de neurones profond s'appellent des couches visibles . La couche d'entrée est celle où le modèle d'apprentissage profond ingère les données à traiter, et la couche de sortie est celle où la prédiction ou la classification finale est effectuée.
Un autre processus appelé rétropropagation utilise des algorithmes, comme l'algorithme de gradient, pour calculer les erreurs dans les prédictions, puis ajuste les pondérations et les biais de la fonction en remontant en arrière dans les couches afin d'entraîner le modèle. Ensemble, la propagation avant et la rétropropagation permettent à un réseau neuronal de faire des prédictions et de corriger les erreurs en conséquence. Au fil du temps, l'algorithme devient progressivement plus précis.
Ces explications décrivent le type le plus basique de réseau neuronal profond dans les termes les plus simples. Cependant, les algorithmes d'apprentissage en profondeur sont incroyablement complexes, et il existe différents types de réseaux de neurones qui répondent à des problèmes ou des ensembles de données spécifiques. Par exemple,
Les applications d'apprentissage en profondeur dans le monde réel font partie de notre quotidien, mais dans la plupart des cas, elles sont si bien intégrées aux produits et services que les utilisateurs n'ont pas conscience du traitement complexe des données qui se déroule en arrière-plan. Certaines de ces tâches comprennent :
Les algorithmes d'apprentissage en profondeur peuvent analyser et apprendre à partir de données transactionnelles pour identifier des modèles dangereux qui indiquent une éventuelle activité frauduleuse ou criminelle. La reconnaissance vocale, la vision par ordinateur et d'autres applications d'apprentissage en profondeur peuvent améliorer l'efficacité de l'analyse d'investigation en extrayant des modèles et des preuves à partir d'enregistrements sonores et vidéo, d'images et de documents. Les forces de l'ordre peuvent ainsi analyser de grandes quantités de données plus rapidement et plus précisément.
Les institutions financières utilisent régulièrement l'analyse prédictive pour gérer la vente d'actions à l'aide d'algorithmes, évaluer les risques commerciaux pour l'approbation des prêts, détecter les fraudes et aider à gérer les portefeuilles de crédit et d'investissement des clients.
De nombreuses organisations intègrent la technologie d'apprentissage en profondeur dans leurs processus de service à la clientèle. Agents conversationnels : utilisés dans divers applications, services et portails de service client. Il s'agit d'une forme simple d'IA. Les chatbots traditionnels utilisent le langage naturel et même la reconnaissance visuelle, que l'on trouve couramment dans les menus du style de ceux utilisés dans les centres d'appels. Toutefois, des solutions de chatbot plus sophistiquées tentent de déterminer, par l'apprentissage, s'il existe plusieurs réponses à des questions ambiguës. En fonction des réponses qu'il reçoit, l'agent conversationnel tente de répondre directement à ces questions ou de diriger la conversation vers un utilisateur humain.
Les assistants virtuels tels que Siri chez Apple, Alexa chez Amazon ou Google Assistant étendent l'idée du chatbot en permettant la reconnaissance vocale. Il en émerge une nouvelle méthode permettant une interaction personnalisée avec les utilisateurs.
Le secteur de la santé a grandement bénéficié des capacités de l'apprentissage en profondeur depuis la numérisation des dossiers et de l'imagerie dans les hôpitaux. Les applications de reconnaissance d'images peuvent apporter une aide aux spécialistes de l'imagerie médicale et aux radiologues, en les aidant à analyser et à évaluer davantage d'images en moins de temps.
L'apprentissage en profondeur requiert une énorme puissance de calcul. Les unités de traitement graphique (GPU) haute performance sont idéales, car elles peuvent gérer un grand volume de calculs dans plusieurs cœurs avec une grande capacité de mémoire. Cependant, la gestion de plusieurs GPU sur site peut fortement solliciter les ressources internes et s'avérer incroyablement coûteuse à mettre à l'échelle.
Le portefeuille Watson d'outils, d'applications et de solutions prêts à l'emploi réduit les coûts et les obstacles à l'adoption de l'IA tout en optimisant les résultats et l'utilisation responsable de l'IA.
Watson Assistant est l'agent conversationnel IA de l'entreprise. Cette technologie d'intelligence artificielle d'entreprise permet aux utilisateurs de créer des solutions d'IA conversationnelles.
Créez, exécutez et gérez des modèles d'IA. Préparez les données et construisez des modèles dans n'importe quel cloud à l'aide d'un code source ouvert ou de la modélisation visuelle. Prévoyez et optimisez vos résultats.
Explorez cette branche du machine learning qui est entraînée sur de grandes quantités de données et traite des unités de calcul travaillant en tandem pour effectuer des prédictions
L'essor de intelligence artificielle