Ces termes informatiques sont souvent utilisés de manière interchangeable, mais en quoi chacune de ces technologies est-elle unique ?
La technologie s’intègre de plus en plus dans notre quotidien. Pour suivre le rythme des attentes des consommateurs, les entreprises s’appuient davantage sur les algorithmes de machine learning pour faciliter les choses. Vous pouvez voir son application sur les réseaux sociaux (grâce à la reconnaissance d’objets sur les photos) ou en parlant directement aux appareils (comme Alexa ou Siri).
Bien que l’intelligence artificielle (IA), le machine learning (ML), l’apprentissage profond et les réseaux de neurones soient des technologies connexes, les termes sont souvent utilisés de manière interchangeable, ce qui entraîne souvent une confusion quant à leurs différences. Cet article de blog clarifiera certaines ambiguïtés.
La façon la plus simple d’aborder l’intelligence artificielle, le machine learning, le deep learning et les réseaux neuronaux est de les considérer comme une série de systèmes d’IA du plus grand au plus petit, chacun englobant le suivant.
L’IA constitue le système principal. Le machine learning est un sous-ensemble de l’IA. Le deep learning est un sous-domaine du machine learning, et les réseaux neuronaux sont l’épine dorsale des algorithmes de deep learning. C’est le nombre de couches de nœuds, ou profondeur, des réseaux neuronaux qui distingue un réseau neuronal unique d’un algorithme de deep learning, qui doit en avoir plus de trois.
L'intelligence artificielle ou IA, le terme le plus large des trois, est utilisé pour classer les machines qui imitent l'intelligence humaine et les fonctions cognitives humaines telles que la résolution de problèmes et l'apprentissage. L'IA utilise les prédictions et l'automatisation pour optimiser et résoudre des tâches complexes que les humains accomplissent historiquement, telles que la reconnaissance faciale et vocale, la prise de décision et la traduction.
Les trois principales catégories d'IA sont les suivantes :
L’ANI est considérée comme une IA « faible », tandis que les deux autres types sont classés comme une IA « forte ». Nous définissons l'IA faible par sa capacité à accomplir une tâche spécifique, comme gagner une partie d'échecs ou identifier un individu particulier dans une série de photos. Le traitement automatique du langage naturel et la vision par ordinateur, qui permettent aux entreprises d’automatiser les tâches et de soutenir les chatbots et les assistants virtuels tels que Siri et Alexa, sont des exemples d’ANI. La vision par ordinateur est un facteur important dans le développement des voitures autonomes.
Les formes d’IA plus fortes, comme l’AGI et l’ASI, intègrent plus largement les comportements humains, comme la capacité à interpréter le ton et l’émotion. L’IA forte se définit par ses capacités comparées à celles des humains. L’AGI fonctionnerait au même titre qu’un autre humain, tandis que l’ASI, également appelée superintelligence, dépasserait l’intelligence et les capacités d’un humain. Aucune des deux formes d’IA forte n’existe encore, mais la recherche dans ce domaine est en cours.
Un nombre croissant d’entreprises, environ 35 % à l’échelle mondiale, utilisent l’IA, et 42 % découvrent la technologie. Le développement de l’IA générative, qui utilise des modèles de fondation puissants s’entraînant sur de grandes quantités de données non étiquetées, peut être adapté à de nouveaux cas d’utilisation et apporter de l’évolutivité et de la flexibilité qui sont susceptibles d’accélérer considérablement l’adoption de l’IA. Dans les premiers tests, IBM a constaté que l’IA générative crée de la valeur jusqu’à 70 % plus vite que l’IA traditionnelle.
Que vous utilisiez des applications basées sur le ML ou des modèles de fondation, l'IA peut donner un avantage concurrentiel à votre entreprise. Intégrer des modèles d'IA dans vos workflows et vos systèmes, et automatiser des fonctions comme le service client, la gestion de la chaîne d'approvisionnement et la cybersécurité, peut aider une entreprise à répondre aux attentes des clients, à la fois aujourd'hui et à mesure qu'elles augmentent à l'avenir.
La clé est d’identifier les bons ensembles de données dès le départ pour vous assurer que vous utilisez des données de qualité pour obtenir l’avantage concurrentiel le plus substantiel. Vous devrez également créer une architecture hybride, prête pour l'IA, capable d'utiliser avec succès les données où qu'elles se trouvent, sur des mainframes, dans des centres de données, dans des clouds publics et en edge.
Il est impératif que votre IA soit fiable ; dans le cas contraire, vous risquez de nuire à la réputation de l’entreprise et de subir des pénalités réglementaires. Les modèles trompeurs et ceux qui contiennent des biais ou qui hallucinent peuvent avoir un coût élevé pour la vie privée, les droits des données et la confiance des clients. Votre IA doit être explicable, juste et transparente.
Le machine learning est un sous-ensemble de l’IA qui permet l’optimisation. Lorsqu’il est correctement configuré, il vous aide à faire des prédictions qui minimisent les erreurs qui découlent de simples conjectures. Par exemple, des entreprises comme Amazon utilisent le machine learning pour recommander des produits à un client spécifique en fonction de ce qu’il a vu et acheté auparavant.
Le machine learning classique ou « non profond » dépend de l’intervention humaine pour permettre au système informatique d’identifier des schémas, d’apprendre, d’effectuer des tâches spécifiques et de fournir des résultats précis. Les experts humains déterminent la hiérarchie des caractéristiques pour comprendre les différences entre les entrées de données, ce qui nécessite généralement des données plus structurées pour l’apprentissage.
Par exemple, imaginons que je vous montre une série d'images de différents types de fast-food : pizza, burger et tacos. Un expert humain travaillant sur ces images déterminerait les caractéristiques distinguant chaque image d’un type de restauration rapide spécifique. Le pain dans chaque type d'aliment peut être une fonctionnalité distinctive. Ils peuvent également utiliser des étiquettes, du type « pizza », « burger » ou « taco » pour rationaliser le processus d’apprentissage grâce à l’apprentissage supervisé.
Bien que le sous-ensemble de l’IA appelé deep machine learning puisse tirer parti de données étiquetées pour informer son algorithme dans l’apprentissage supervisé, il n’a pas nécessairement besoin d’un ensemble de données étiquetées. Il peut ingérer des données non structurées sous leur forme brute (par exemple, du texte, des images) et déterminer automatiquement l’ensemble des fonctionnalités qui distinguent « pizza », « burger » et « taco » l’un de l’autre. Au fur et à mesure que nous générons davantage de big data, les data scientists utilisent davantage le machine learning. Pour en savoir plus sur les différences entre ces approches, consultez Apprentissage supervisé ou non supervisé : quelle est la différence ?
Une troisième catégorie de machine learning est l’apprentissage par renforcement, dans lequel un ordinateur apprend en interagissant avec son environnement et en obtenant des commentaires (récompenses ou pénalités) pour ses actions. L’apprentissage en ligne est un type de ML dans lequel un data scientist met à jour le modèle de ML au fur et à mesure que de nouvelles données sont disponibles.
Pour en savoir plus sur le machine learning, regardez la vidéo suivante :
Comme notre article sur l’apprentissage profond l'explique, l’apprentissage profond est un sous-ensemble du machine learning. La principale différence entre machine learning et apprentissage profond est la manière dont chaque algorithme apprend et la quantité de données que chaque type d'algorithme utilise.
L'apprentissage profond automatise une grande partie de la pièce d'extraction de fonctionnalité du processus, éliminant une partie de l'intervention humaine manuelle requise. Il permet également l'utilisation de grands ensembles de données, ce qui lui vaut le titre de machine learning évolutif. Cette capacité est prometteuse alors que nous explorons plus avant l’utilisation des données non structurées, d’autant plus qu’on estime que plus de 80 % des données d’une organisation sont non structurées.
L’observation de modèles dans les données permet à un modèle d’apprentissage profond de cluster les entrées de manière appropriée. En reprenant l’exemple précédent, nous pourrions regrouper les photos de pizzas, de burgers et de tacos dans leurs catégories respectives en fonction des similitudes ou des différences identifiées dans les images. Un modèle de deep learning a besoin de plus de points de données pour améliorer la précision, tandis qu’un modèle de machine learning s’appuie sur moins de données compte tenu de sa structure de données sous-jacente. Les entreprises utilisent généralement l’apprentissage profond pour des tâches plus complexes, comme les assistants virtuels ou la détection des fraudes.
Les réseaux de neurones, également appelés réseaux neuronaux artificiels ou réseaux neuronaux simulés, sont un sous-ensemble du machine learning et constituent l’épine dorsale des algorithmes d’apprentissage profond. On les appelle « neuronaux », car ils imitent la façon dont les neurones du cerveau se signalent les uns aux autres.
Les réseaux de neurones sont composés de couches de nœuds, d’une couche d’entrée, d’une ou de plusieurs couches masquées et d’une couche de sortie. Chaque nœud est un neurone artificiel qui se connecte au suivant et chacun possède un poids et une valeur de seuil. Lorsque la sortie d’un nœud est supérieure à la valeur de seuil, ce nœud est activé et envoie ses données à la couche suivante du réseau. Si le temps est inférieur au seuil, aucune donnée ne sera transmise.
Les données d’entraînement enseignent les réseaux de neurones et contribuent à améliorer leur précision au fil du temps. Une fois que les algorithmes d’apprentissage sont affinés, ils deviennent de puissants outils d’informatique et d’IA, car ils nous permettent de classer et de partitionner rapidement les données. Grâce aux réseaux de neurones, les tâches de reconnaissance vocale et d’image peuvent être effectuées en quelques minutes au lieu de plusieurs heures lorsqu’elles sont effectuées manuellement. L’algorithme de recherche de Google est un exemple bien connu de réseaux de neurones.
Comme indiqué dans la section sur les réseaux de neurones, mais qu’il est utile de rappeler de manière plus explicite, le terme « profond » dans l'apprentissage profond fait référence à la profondeur des couches d'un réseau neuronal. Un réseau neuronal de plus de trois couches, y compris les entrées et la production, peut être considéré comme un algorithme d’apprentissage profond. On peut le représenter au moyen du graphique suivant :
La plupart des réseaux neuronaux profonds sont à propagation, ce qui signifie qu’ils circulent uniquement dans une direction, de l’entrée vers la sortie. Cependant, vous pouvez également entraîner votre modèle par rétropropagation ; c’est-à-dire se déplacer dans la direction opposée de la sortie à l’entrée. La rétropropagation nous permet de calculer et d’attribuer l’erreur associée à chaque neurone, ce qui nous permet d’ajuster et d’ajuster l’algorithme de manière appropriée.
Si tous ces domaines de l'IA peuvent contribuer à rationaliser des secteurs de votre entreprise et à améliorer l'expérience de vos clients, atteindre les objectifs de l'IA peut s'avérer difficile, car vous devrez d'abord vous assurer que vous disposez des bons systèmes pour construire des algorithmes d'apprentissage afin de gérer vos données. La gestion des données ne se limite pas à la création de modèles que vous utilisez pour votre entreprise. Il vous faut un emplacement pour stocker vos données, ainsi que des mécanismes pour les nettoyer et en contrôler les biais, avant de pouvoir commencer à construire quoi que ce soit.
Chez IBM, nous combinons la puissance du machine learning et de l’IA dans notre nouveau studio pour les modèles de fondation, l’IA générative et le machine learning, IBM watsonx.ai.
