Cole Stryker

Staff Editor, AI Models

IBM Think

Quels sont les composants d’un agent IA ?

Les agents IA prennent des décisions intelligentes et interagissent sans heurts avec les systèmes numériques, le tout avec une intervention humaine minimale. Mais qu’est-ce qui rend ces agents si intelligents ? Les agents IA s’appuient essentiellement sur un ensemble de composants interconnectés qui leur permettent de percevoir leur environnement, de traiter l’information, de décider, de collaborer, de prendre des mesures efficaces et d’apprendre de leur expérience.

Les différents types d’agents IA sont nombreux, et leur comportement est régi par l’architecture d’agent IA sur laquelle ils reposent.

D’un côté, les agents réactifs sont des agents réflexes simples, qui répondent instantanément aux stimuli, parfois avec des actionneurs qui leur permettent d’interagir avec leur environnement. Les agents réflexes basés sur des modèles s’appuient sur un modèle interne de l’environnement pour améliorer leur prise de décision. À l’autre bout du spectre, les agents cognitifs proactifs associent raisonnement avancé et planification à long terme. Certains agents sont spécialisés, tandis que d’autres sont conçus pour diriger les autres agents dans ce que l’on pourrait appeler une orchestration de l’IA.

Une fois ces précisions apportées, voici les principaux composants des agents d’intelligence artificielle, chacun essentiel pour créer des systèmes adaptatifs et intelligents.

Perception et traitement des entrées

L’IA agentique doit être capable d’ingérer et d’interpréter les informations provenant de diverses sources. Les entrées peuvent prendre différentes formes comme les requêtes utilisateur, les journaux système, les données structurées provenant d’API ou les relevés de capteurs. L’agent doit pouvoir analyser et comprendre ces informations, souvent à l’aide de technologies d’IA comme le traitement automatique du langage naturel (NPL) pour les entrées textuelles, ou les techniques d’extraction des données pour les sources structurées. La complexité du module de perception dépend du rôle de l’agent. Par exemple, un chatbot comme Alexa d’Amazon s’appuie sur le TAL pour interpréter les entrées humaines, tandis qu’une voiture autonome traite les flux de caméra, les données LIDAR et les signaux radar pour reconnaître les objets et circuler. Cette fusion multi-capteurs est couplée à la vision par ordinateur pour donner aux véhicules autonomes une perception de leur environnement en temps réel.

Une fois les données brutes reçues, le module de perception les nettoie, les traite et les structure pour obtenir un format utilisable. On emploie généralement des solutions d’IA telles que la transcription automatique de la parole, la détection d’objets, l’analyse des sentiments, la reconnaissance d’entités et la détection des anomalies. Dans le cas des systèmes d’IA en temps réel, la perception doit être efficace et adaptative en filtrant les informations afin de privilégier la pertinence. La précision et la robustesse de ce module affectent directement l’efficacité de l’agent IA, puisque les mauvaises interprétations en matière de perception peuvent entraîner des décisions et des actions incorrectes.

Le prompt engineering peut s’avérer nécessaire pour guider efficacement le comportement des agents dans certains workflows.

Agents d'AI

5 types d'agents d'IA : fonctions autonomes et applications du monde réel

Découvrez comment l'IA axée sur les objectifs et la fonctionnalité s'adapte aux workflows et aux environnements complexes.
Créer, déployer et surveiller les agents d’IA

Planification et décomposition des tâches

Contrairement aux agents réactifs, qui répondent instinctivement aux entrées immédiates, les agents de planification cartographient les séquences d’actions avant l’exécution. Ce module est important pour les applications d’IA telles que les robots autonomes, l’optimisation logistique et les systèmes de planification pilotés par l’IA.

Une fois que l’IA a compris l’entrée, elle doit décomposer le problème en tâches plus petites et plus faciles à gérer. Parmi les composants clés, citons le séquençage des actions et l’identification des dépendances entre les tâches. Les agents IA s’appuient sur la logique, sur des modèles de machine learning ou encore sur des critères heuristiques prédéfinis pour déterminer le plan d’action le plus approprié.

Dans les systèmes multi-agents, la planification devient encore plus sophistiquée, car les agents doivent se coordonner ou négocier pour obtenir des ressources. Une planification efficace intègre également l’incertitude, en s’appuyant sur des modèles IA probabilistes pour parer à des événements imprévus. Sans un module de planification robuste, un agent peut rencontrer des difficultés dans l’exécution de tâches à long terme, ne pas parvenir à optimiser les processus ou devenir inefficace face à des conditions changeantes.

Mémoire

Le module de mémoire permet à l’agent IA de conserver et de récupérer des informations, ce qui lui permet de tirer des enseignements des interactions passées et de rester cohérent dans le temps. Ce module est généralement divisé en mémoire à court terme et mémoire à long terme. La mémoire à court terme stocke le contexte de la session, ce qui permet à un assistant d’IA de se souvenir des messages récents d’une conversation et de garantir la cohérence. Cela permet un apprentissage contextuel. La mémoire à long terme, quant à elle, se compose de bases de connaissances structurées, d’embeddings vectoriels et de données historiques auxquelles l’agent peut se référer pour prendre ses décisions.

La persistance et l’organisation de la mémoire sont essentielles pour améliorer la personnalisation dans des applications telles que les bots de support client, les moteurs de recommandation et les assistants virtuels. Sans un module de mémoire efficace, l’agent fonctionne sans état, obligeant les utilisateurs à répéter les informations, ce qui affecte la qualité de leur expérience. La mémoire joue également un rôle important dans les systèmes multi-agents, au sein desquels les agents partagent et mettent à jour une base de connaissances commune pour améliorer la collaboration.

Raisonnement et prise de décision

Les chatbots simples de la décennie précédente utilisaient des règles prédéfinies pour choisir parmi un ensemble restreint de décisions. Les agents IA plus avancés s’efforcent d’évaluer différents chemins de solution, d’évaluer la performance et d’affiner leur Approche au fil du temps. Le module de raisonnement est au cœur d’un agent. Ce module détermine comment un agent réagit à son environnement en tenant compte de différents facteurs, en évaluant les probabilités et en appliquant des règles logiques ou des comportements appris. En fonction de la complexité de l’IA, le raisonnement peut être basé sur des règles, probabiliste, heuristique ou alimenté par des modèles d’apprentissage profond. Deux paradigmes de raisonnement populaires sont ReAct (raisonnement et action) et ReWOO (raisonnement sans observation).

L’approche du raisonnement varie selon le type d’agent. Par exemple, pour prendre une décision, les agents axés sur les objectifs prennent en compte un objectif prédéfini et sélectionnent les actions qui permettent de l’atteindre. Ces agents se concentrent sur l’obtention d’un résultat, et non sur l’optimisation de ce dernier. Les agents axés sur l’utilité, quant à eux, vont plus loin dans la prise de décision. En effet, ils cherchent non seulement à déterminer si l’objectif est atteint, mais aussi si le résultat est optimal, selon une fonction d’utilité.

Les systèmes d’IA simples, basés sur des règles, suivent une logique prédéfinie (par exemple, « en cas de X, faire Y »). Les systèmes plus avancés s’appuient sur l’inférence bayésienne, l’apprentissage par renforcement ou les réseaux de neurones pour s’adapter dynamiquement à de nouvelles situations. Ce module peut également associer raisonnement en chaîne de pensée et techniques de résolution des problèmes multi-étapes, indispensables aux applications d’IA telles que l’analyse financière automatisée ou l’examen des contrats. La capacité de l’agent à raisonner efficacement et à prendre des décisions éclairées détermine son intelligence globale, ainsi que sa fiabilité face aux tâches complexes.

Action et appel d’outil

Le module d’action met en œuvre les décisions de l’agent dans le monde réel, lui permettant d’interagir avec les utilisateurs, les systèmes numériques ou même les environnements physiques. Une fois que les modules de raisonnement et de planification ont identifiée une réponse adaptée, le module d’action exécute les étapes nécessaires, qu’il s’agisse d’appeler un outil tel qu’une API ou d’interagir avec l’environnement externe en déplaçant un bras robotisé.

Les workflows agentiques peuvent nécessiter l’accès à des outils externes, des jeux de données, des API et des systèmes d’automatisation pour accomplir les tâches. L’appel d’outil est le mécanisme utilisé dans les systèmes d’IA agentique qui consiste pour les agents à faire appel à des outils, des API ou des fonctions externes pour compléter leurs capacités de raisonnement et leurs connaissances natives. Cela permet à l’IA d’agir, de récupérer des données en temps réel, d’exécuter des calculs et d’interagir dynamiquement avec les systèmes externes.

En bref, l’appel d’outil permet aux grands modèles de langage (LLM) d’interfacer des outils structurés, afin d’accéder à des informations autres que ses données d’entraînement.

Communication

Le module de communication permet aux agents d’interagir avec les humains, d’autres agents ou des systèmes logiciels externes, afin d’assurer une intégration et une collaboration fluides. Ce module gère la génération de texte en langage naturel (NLG) et la messagerie basée sur des protocoles. Le niveau de complexité varie. En effet, les agents simples suivent des scripts prédéfinis, tandis que les agents avancés utilisent des modèles d’IA générative entraînés sur de grandes quantités de données pour générer des réponses dynamiques et adaptées au contexte.

Le composant communication permet aux systèmes multi-agents (SMA) de partager leurs connaissances, de négocier des actions ou de coordonner les tâches. Par exemple, dans le domaine de la finance, plusieurs agents peuvent analyser les tendances du marché et échanger des informations pour optimiser les stratégies de trading. De la même manière, les réseaux de chaîne d’approvisionnement alimentés par l’IA s’appuient sur des agents logiciels pour synchroniser les données de stock, prévoir les ruptures et optimiser la logistique. Dans les cas d’utilisation impliquant une interaction humaine, comme les assistants virtuels ou les chatbots, ce module permet de s’assurer que les réponses ont un caractère naturels, informatif et engageant. La capacité à communiquer efficacement avec les agents humains améliore la convivialité des agents et les rend plus efficaces dans différents domaines.

Apprentissage et adaptation

L’une des principales caractéristiques des agents intelligents est leur capacité à apprendre des expériences antérieures et à s’améliorer au fil du temps. Les algorithmes d’apprentissage permettent aux agents de reconnaître les schémas, d’affiner leurs prévisions et d’ajuster leur prise de décision en fonction du feedback. Pour ce faire, différents paradigmes d’apprentissage sont utilisés, notamment l’apprentissage supervisé, l’apprentissage non supervisé et l’apprentissage par renforcement.

Par exemple, un chatbot de service client doté d’un module d’apprentissage analyse les interactions antérieures pour améliorer son ton, sa précision et l’efficacité de sa réponse. De la même manière, un système de recommandation affine en permanence ses suggestions en fonction des préférences de l’utilisateur. Les agents avec apprentissage par renforcement, comme ceux utilisés dans la robotique et les jeux, améliorent leurs actions en maximisant les récompenses et en minimisant les pénalités. Sans son module d’apprentissage, le système d’IA resterait statique et serait incapable de s’adapter aux nouvelles tendances, aux attentes des utilisateurs ou encore aux défis imprévus tels que la défaillance des dépendances.

Dans divers secteurs, de la santé au transport en passant par la chaîne d’approvisionnement, nous pouvons nous attendre à une multiplication des agents, en raison de leur incroyable évolutivité. Les dirigeants devront suivre de près l’évolution de la technologie agentique afin de tirer pleinement parti de ces outils, tout en tenant compte des questions d’ordre éthique.

