Des microservices aux agents IA : l’évolution de l’architecture des applications

Deux collègues partagent des idées dans un bureau moderne

L’architecture des applications a de nouveau atteint un tournant. Les agents IA se révèlent être de puissants éléments constitutifs des systèmes modernes, qui complètent, étendent, voire remplacent les microservices traditionnels.

Ce changement d’architecture maintient le modèle fondamental du composant composable tout en apportant des gains significatifs en termes de vitesse de développement, d’adaptabilité et de capacités d’intégration. Les entreprises qui créent de nouvelles applications avec un cadre agentique se positionnent de manière à bénéficier d’un avantage concurrentiel dans l’environnement technologique (informatique) en évolution rapide.

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA  

La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets.

Vue d’ensemble de l’évolution de l’architecture

L’histoire de l’architecture des applications révèle un schéma constant de décomposition en composants de plus en plus intelligents.

Années 1990 : applications monolithiques
Les systèmes à code unique ont dominé l’informatique d’entreprise, ce qui a créé d’importants défis opérationnels :

Les déploiements nécessitaient des cycles de tests étendus
La mise à l’échelle exigeait une duplication complète du système
Les changements dans un domaine risquaient de perturber des fonctions non liées
Les cycles de développement s’étendaient sur des mois ou des années

Début des années 2000 : architecture orientée services (SOA)
L’architecture orientée services s’attaque aux limites du monolithisme en décomposant les applications en services adaptés aux besoins de l’entreprise :

Nouvelle architecture améliorant la réutilisation et les capacités d’intégration
Les services sont restés relativement lourds
La complexité de l’orchestration a créé des systèmes fragiles
Les cycles de développement étaient mesurés en mois

Années 2010 : microservices
L’architecture de microservices divise les applications en unités plus petites, pouvant être déployées de manière indépendante :

Chaque microservice fonctionnait de manière autonome
Les services étaient communiqués via des interfaces de programmation d’applications (API) bien définies
Composants mis à l’échelle indépendamment
Les technologies de conteneurisation ont simplifié le déploiement
Les cycles de développement ont été réduits à quelques semaines

Mixture of Experts | 12 décembre, épisode 85

Décryptage de l’IA : Tour d’horizon hebdomadaire

Rejoignez notre panel d’ingénieurs, de chercheurs, de chefs de produits et autres spécialistes de premier plan pour connaître l’essentiel de l’actualité et des dernières tendances dans le domaine de l’IA.

Regardez tous les épisodes de Mixture of Experts

Agents IA : le nouveau paradigme architectural

La frontière architecturale d’aujourd’hui est constituée d’agents IA : des composants intelligents et autonomes qui améliorent les capacités des microservices traditionnels. Les principales différences sont les suivantes :

Caractéristique	Microservice	Agent IA
Modèle de programmation	Impose des règles et une logique explicites	Propose un modèle hybride : noyau compilé avec couche de raisonnement
Capacité d’adaptation	Nécessite des modifications de code	Combine optimisation et raisonnement dynamique
Intégration	Utilise des contrats API	Utilise un mode double : contrats d’API avec compréhension sémantique
Gestion des erreurs	Possède des réponses préprogrammées	Possède des chemins optimisés avec des solutions de repli adaptatives
Effort de développement	Nécessite un niveau d’effort élevé (code à usage unique)	Est plus stratégique (chemins critiques et interfaces de raisonnement)

Un microservice traditionnel de traitement des paiements nécessite des milliers de lignes de code pour gérer la validation, le traitement, les états d’erreur et les intégrations. En revanche, les agents IA haute performance combinent des composants précompilés pour des chemins critiques avec des capacités de raisonnement pour des décisions complexes. Cette approche hybride permet de garantir à la fois la fiabilité de performance et l’intelligence adaptative.

Par exemple, la mise en œuvre d’agents Semantic Kernel en C# avec compilation anticipée (AOT) démontre que les systèmes agentiques de production peuvent égaler ou dépasser les microservices traditionnels en termes de performance tout en ajoutant de précieuses capacités de raisonnement.

Cadres agentiques : orchestration moderne

Tout comme les microservices nécessitent des plateformes d’orchestration sous-jacentes, les agents IA ont besoin de cadres agentiques spécialisés. Les solutions modernes telles que Semantic Kernel et LangChain Enterprise fournissent cette infrastructure nécessaire à la coordination des agents avec des performances de niveau entreprise.

Ces cadres offrent des capacités qui vont au-delà de l’orchestration traditionnelle des services, tout en maintenant des normes de performance de niveau entreprise :

Fondation à haute performance : les cadres agentiques sont construits sur des langages compilés avec compilation AOT pour une exécution prévisible et à faible latence.
Conception efficace en termes de mémoire : les cadres agentiques sont optimisés pour les systèmes à haut débit afin de garantir une consommation minimale des ressources.
Traitement sémantique : les agents allouent les ressources de calcul en fonction de la complexité de la tâche.
Intégration d’entreprise : Les cadres agentiques fournissent des connecteurs sûrs aux systèmes existants avec une forte application des contrats.
Planification hybride : les chemins critiques pour les performances du cadre agentique utilisent la logique compilée tandis que les scénarios complexes utilisent l’IA pour le raisonnement.

Avantages pratiques pour les entreprises

Le passage à une architecture agentique présente des avantages mesurables :

L’intelligence au service de la performance : des agents IA bien conçus offrent des performances supérieures. Les agents compilés peuvent atteindre un débit plus élevé que les microservices traditionnels et ajouter un raisonnement pour la détection complexe des fraudes.
Fiabilité de niveau entreprise : les cadres agentiques permettent une intégration robuste. Un système de chaîne d’approvisionnement peut traiter des milliers de transactions et gérer sans problème les incohérences des données.
Traitement supérieur des erreurs : les agents IA combinent les voies de récupération et le raisonnement. Le système de traitement des commandes garantit une haute disponibilité grâce à des méthodes de gestion des erreurs optimisées et à un raisonnement en cas de nouvelles défaillances.
Architecture prête pour l’avenir : les entreprises bénéficient aujourd’hui d’un avantage tout en se positionnant pour demain. Les agents compilés avec des couches de raisonnement optimisent les performances actuelles et ouvrent la voie aux progrès futurs de l’IA.

Stratégie de mise en œuvre : une approche axée sur la performance

Les entreprises ont besoin d’une stratégie de mise en œuvre concrète qui maintienne les normes d’entreprise tout en tirant parti des avantages de l’IA :

Profilage des performances : identifiez les microservices présentant à la fois des chemins critiques en termes de performances et des points de décision complexes qui bénéficieraient de capacités de raisonnement.
Conception de l’architecture : créez des modèles d’agents qui séparent les chemins critiques pour les performances (implémentés dans du code compilé) des composants de raisonnement qui gèrent les cas edge.
Sélection du cadre : évaluez les cadres agentiques sur la base des références de performance, de la compatibilité linguistique avec les systèmes existants et des options de compilation.
Amélioration d’équipe : constituez des équipes d’ingénieurs qui combinent l’expertise traditionnelle en matière de développement de logiciels et les compétences en ingénierie de l’IA.
Déploiement systématique : mettez en œuvre et testez des benchmarks de performance rigoureux ainsi que des capacités de raisonnement.

La mise en œuvre d’une approche axée sur la performance peut aider les entreprises à obtenir des avantages opérationnels tout en développant des capacités d’IA stratégiques.

Évaluations et développement axé sur les évaluations

L’ingénierie de la qualité des agents IA exige une approche fondamentalement différente de celle des tests de logiciels traditionnels. Les entreprises leaders dans le domaine de l’architecture agentique ont été les premières à développer une méthodologie basée sur l’évaluation, qui garantit que les agents répondent à la fois aux exigences fonctionnelles et aux normes de raisonnement.

Le cadre d’évaluation

Les évaluations sont des suites de tests spécialisées conçues pour évaluer le comportement des agents sous plusieurs angles :

Évaluations fonctionnelles : vérifier les capacités du cœur de métier par le biais d’assertions d’entrée et de production.
Évaluations du raisonnement : évaluer la qualité des décisions et les approches de résolution de problèmes.
Évaluations comportementales : tester l’alignement avec les directives organisationnelles et les normes éthiques.
Évaluations des performances : mesurer les temps de réponse, le débit et l’utilisation des ressources.
Évaluations contradictoires : défier les agents avec des cas edge et des modes d’échec potentiels.

Les données internes de certains fournisseurs de cloud, de données et d’IA montrent une réduction significative des incidents de production après la mise en œuvre d’évaluations multidimensionnelles pour leurs systèmes d’agents.

Mettre en œuvre un développement axé sur les évaluations

Un processus de développement mature axé sur l’évaluation inclut les éléments clés suivants :

1. Protocole de définition de l’évaluation

Commencez par définir les attentes dans toutes les dimensions. Pour chaque agent :

Documentez les fonctionnalités de base attendues avec des critères de réussite clairs
Spécifiez les modèles de raisonnement que les agents doivent démontrer
Établissez des limites comportementales et des garde-fous
Fixez des seuils de performance en fonction des besoins de l’entreprise

2. Pipelines d’évaluation continue

Créez des pipelines automatisés qui exécutent des évaluations tout au long du cycle de développement :

Les évaluations préalables à la validation identifient les problèmes avant l’intégration du code
Les évaluations d’intégration vérifient les interactions avec les agents
Test d’évaluation de la mise en œuvre avec des données de production
La surveillance de la production valide en continu les agents déployés

3. Génération de tests dynamiques

Allez au-delà des cas de test statiques avec des scénarios générés dynamiquement :

Utilisez de grands modèles linguistiques (LLM) pour créer divers cas de test qui mettent l’accent sur le raisonnement des agents
Générez des variations de cas edge connus
Simulez de nouvelles entrées en fonction des modèles de production

4. Évaluation collaborative entre l’homme et l’IA

Combinez les tests automatisés avec l’expertise humaine :

Des experts évaluent le raisonnement des agents sur des scénarios complexes
Les chercheurs en UX évaluent la qualité des interactions humain-agent
Les spécialistes du domaine vérifient l’exactitude de la logique d’entreprise

5. Prévention de la régression

Prévenez la régression de capacité avec :

Des suites d’évaluation complètes qui évoluent au fur et à mesure de chaque problème découvert
Des comparaisons A/B entre les versions des agents
Une surveillance continue des indicateurs clés de performance

Une étude de 2024 de l’Institut Stanford pour l’IA centrée sur l’humain (HAI) a constaté que les entreprises utilisant des cadres connaissent des cycles de développement 65 % plus rapides et 42 % de retraits en production en moins.

Étude de cas : Mise en œuvre des services financiers

L’une des 10 plus grandes banques mondiales a mis en œuvre un développement axé sur les évaluations pour ses agents du service client avec des résultats impressionnants.

Son approche est centrée sur un cadre à trois niveaux : des suites pour la validation fonctionnelle, des évaluations pour les scénarios de décision complexes et des avis par des experts pour les interactions à fort enjeu.

Le cadre a révélé des problèmes subtils que les tests traditionnels pouvaient ignorer. Par exemple, un agent a correctement approuvé les applications conformément à la politique, mais a utilisé un raisonnement qui a involontairement renforcé les préjugés dans les cas limites, un problème identifié par leurs évaluations de raisonnement avant le déploiement.

Stratégies d’optimisation des coûts pour l’architecture agentique

La viabilité économique des architectures agentiques dépend de stratégies efficaces de gestion des coûts. Bien que les agents IA apportent une valeur commerciale significative, la gestion des dépenses opérationnelles reste un facteur de réussite critique.

Le défi économique

En ce qui concerne les coûts, les entreprises sont confrontées à deux considérations principales :

Coût des tokens : chaque interaction avec les modèles de fondation entraîne des frais par token qui s’accumulent rapidement à l’échelle. Les réseaux d’agents complexes avec raisonnement à plusieurs étapes peuvent générer 10 à 15 fois plus de tokens que les appels API directs similaires.

Coûts de calcul : l’exécution de l’inférence, en particulier pour les raisonnements sophistiqués, nécessite des ressources informatiques substantielles. Les clusters GPU sur site pour l’inférence nécessitent généralement un investissement initial important. L’inférence basée sur le cloud peut entraîner des coûts mensuels allant de 10 000 à 50 000 USD pour les déploiements à petite et moyenne échelle.

Approches d’optimisation efficaces

Les principales entreprises ont développé des approches systématiques pour gérer ces coûts.

1. Optimisation architecturale

Conception d’agent hybride qui oriente les décisions complexes vers des modèles de fondation
Quantification des modèles pour le déploiement en production
Mise en cache stratégique des réponses aux requêtes courantes

JPMorgan Chase réduit leurs coûts d’inférence de 67 % grâce à une architecture hybride qui traite 89 % des transactions par des chemins déterministes, réserver les ressources des LLM pour des scénarios complexes.

2. Prompt engineering pour une meilleure efficacité

Précision dans la conception des instructions afin de minimiser l’utilisation des tokens
Élagage contextuel qui élimine les informations inutiles
Optimisation du format de réponse pour réduire la génération de tokens

3. Optimisation par inférence

Mise en œuvre d’un cache clé-valeur (KV) pour les interactions répétées
Traitement par lots pour les opérations non sensibles au temps
Adapter l’infrastructure de déploiement aux modèles de charge de travail

4. Mise en œuvre du RAG

Génération augmentée de récupération stratégique pour réduire la taille du contexte
Optimisation des bases de données vectorielles pour un accès efficace à l’information
Techniques de distillation du contexte qui compressent les informations pertinentes

5. Ajustement pour la spécialisation des domaines

Création de modèles spécifiques au domaine avec un nombre réduit de paramètres
Distillation des modèles généraux en variantes spécialisées efficaces
Des approches de réglage efficaces en termes de paramètres telles que LoRA et QLoRA

Le rapport 2024 de l’économie de l’IA de McKinsey indique que la mise en œuvre d’au moins trois de ces stratégies réduit les coûts opérationnels de l’IA de 62 % en moyenne, tout en maintenant ou en améliorant les capacités du système.

Défis de mise en œuvre

Les architectures agentiques introduisent de nouvelles considérations de mise en œuvre.

Complexité d’orchestration
La coordination d’agents autonomes nécessite des approches différentes de l’orchestration traditionnelle de microservice :

La prise de décision décentralisée nécessite une coordination sophistiquée
Plusieurs agents doivent travailler vers des objectifs communs
L’état du système se complexifie avec les changements asynchrones

Les cadres modernes répondent à ces défis grâce à des systèmes de priorisation et un contexte partagé. Semantic Kernel de Microsoft met en œuvre une orchestration qui équilibre l’autonomie des agents et la cohérence du système.

Observabilité et surveillance
Les approches traditionnelles de surveillance doivent évoluer :

Les systèmes doivent saisir les voies de raisonnement et les critères de décision
L’analyse analytique permet d’identifier les tendances des interactions entre les agents
La surveillance prédictive anticipe les états potentiels du système

Sécurité et gouvernance
Les architectures agentiques introduisent de nouvelles dimensions de sécurité :

Mécanismes de vérification de l’alignement des instructions des agents sur les politiques de l’organisation
Systèmes de validation des actions des agents avant leur exécution
Capacités à contrôler le raisonnement des agents en matière de conformité

Comparaison entre les microservices et les systèmes agentiques : un cas d’utilisation

Pour illustrer la différence entre microservices et architectures agentiques, considérons une plateforme de trading de services financiers.

Mise en œuvre traditionnelle de microservices :

Un service de compte gère les informations des clients et les soldes
Un service de trading gère les ordres sur la base de demandes explicites
Un service de données de marché fournit les prix sur demande
Un service de notification envoie des alertes après des événements prédéfinis
Un service de gestion des risques applique des contrôles basés sur des règles

Lorsqu’un client effectue une transaction, le système suit un chemin prédéterminé, chaque étape se produisant lorsqu’elle est explicitement déclenchée.

Mise en œuvre par agent :

Un agent de portefeuille surveille en permanence les avoirs et suggère des opportunités de rééquilibrage
Un agent d’exécution de trading sélectionne le timing optimal en fonction des conditions du marché
Un agent d’évaluation des risques évalue de manière proactive la volatilité du marché
Un agent de communication fournit des informations pertinentes par les canaux préférés

En pratique, la mise en œuvre par agents crée des expériences client fondamentalement différentes. Lorsque la volatilité du marché augmente, l’agent d’évaluation des risques peut ajuster de manière autonome les limites de négociation et en informer l’agent de portefeuille, qui analyse les avoirs des clients pour y déceler d’éventuelles vulnérabilités. Le système fait preuve d’une intelligence qui va au-delà de ce qui a été explicitement codé.

Un regard vers l’avenir : ingénierie de plateforme pour l’échelle agentique

La progression des monolithes vers les services, les microservices et les agents suit des schémas historiques clairs. Chaque évolution apportait des composantes plus granulaires, avec une intelligence et une autonomie croissantes.

Les entreprises qui mettent en œuvre des architectures agentiques à l’échelle doivent adopter des principes d’ingénierie de plateforme afin d’obtenir une qualité, une rentabilité et une gouvernance cohérentes dans l’ensemble du portefeuille application.

Adoption pilotée par la plateforme

Les entreprises avant-gardistes utilisent des plateformes internes pour développeurs (IDP) pour accélérer l’adoption des agents.

Infrastructure d’agent standardisée

Modèles d’agents préconfigurés avec surveillance intégrée
Modèles de mise en œuvre selon la méthode Golden Path pour les types d’agents courants
Déploiement en libre-service avec des barrières de qualité automatisées

Observabilité unifiée

Surveillance centralisée de la performance et du comportement des agents
Traçage et visualisation des interactions inter-agents
Détection automatisée des anomalies avec analyse des causes profondes

Focus sur l’expérience développeur

Outils en libre-service pour le développement et les tests des agents
Environnements de développement intégrés avec débogage d’agents spécialisés
Contrôles de conformité automatisés pendant le développement

Gouvernance à l’échelle

Gestion centralisée des politiques et application
Évaluation automatisée du comportement des agents par rapport aux normes
Des pistes d’audit complètes pour toutes les actions des agents

Le rapport 2024 de Gartner sur l’ingénierie de plateforme indique que les approches de plateformes matures permettent une mise sur le marché 3,2 fois plus rapide des nouvelles capacités des agents et une satisfaction des développeurs supérieure de 76 %.

Les entreprises sont désormais confrontées à un choix : prendre les devants en adoptant une architecture agentique pour un cas d’utilisation approprié ou suivre les concurrents qui s’emparent des avantages précoces. L’expérience montre que les pionniers qui mettent en œuvre des approches axées sur les plateformes bénéficient d’avantages concurrentiels substantiels en termes de rapidité de développement, de flexibilité des systèmes et de capacités techniques.

En savoir plus et discuter avec un expert en IA d’IBM Consulting

Ressources

Maximiser le ROI : les agents d’IA dans votre entreprise

Rejoignez un webinaire IBM pour découvrir comment réaliser un véritable ROI grâce à des initiatives d’IA agentique, avec des exemples dans plusieurs secteurs, des cas d’utilisation et même les propres témoignages de réussite d’IBM.

Des projets d’IA aux bénéfices : comment l’IA agentique génère des résultats financiers

Découvrez comment les entreprises délaissent le lancement de projets pilotes disparates en matière d’IA au profit d’une utilisation visant à stimuler la transformation en profondeur.

Renforcez votre expertise en matière d’IA

Accédez à notre catalogue complet de plus de 100 cours en ligne en souscrivant aujourd’hui un abonnement individuel ou multiutilisateur afin d’élargir vos compétences dans certains de nos produits à un prix avantageux.

Découvrir IBM Granite

IBM Granite est une famille de modèles d’IA ouverts, performants et fiables, conçus pour les entreprises et optimisés pour dimensionner vos applications d’IA. Explorez les options de langage, de code, de séries temporelles et de garde-fous.

IBM AI Academy

Dirigé par des leaders d’opinion IBM, le programme a pour but d’aider les chefs d’entreprise à acquérir les connaissances nécessaires qui leur permettront d’orienter leurs investissements IA vers les opportunités les plus prometteuses.

L’IA en action 2024

Nous avons interrogé 2 000 entreprises à propos de leurs initiatives d’IA pour découvrir ce qui fonctionne, ce qui ne fonctionne pas et comment progresser.

Le guide du PDG 2025 : 5 changements de mentalité pour stimuler la croissance des entreprises

Activez ces cinq changements d’état d’esprit pour éliminer l’incertitude, stimuler la réinvention de l’entreprise et dynamiser la croissance grâce à l’IA agentique.

Libérez la puissance de l’IA générative et du ML

Découvrez comment intégrer en toute confiance l’IA générative et le machine learning dans votre entreprise.

Comment prospérer en toute confiance dans cette nouvelle ère de l’IA

Explorez les trois éléments clés d’une stratégie d’IA réussie : créer un avantage concurrentiel, étendre l’IA à l’ensemble de l’entreprise et faire progresser l’IA digne de confiance.

Solutions connexes

IBM watsonx.ai

Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.

Découvrir watsonx.ai

Solutions d’intelligence artificielle

Mettez l’IA au service de votre entreprise grâce à l’expertise de pointe d’IBM en matière d’IA et à son portefeuille de solutions.

Découvrir les solutions d’IA

Conseil et services en Intelligence Artificielle (IA)

IBM Consulting et ses services d'IA accompagnent les entreprises dans la redéfinition de leurs activités avec l'intelligence artificielle pour mener leur transformation.

Découvrir les services d’IA

Passer à l’étape suivante

Bénéficiez d’un accès centralisé aux fonctionnalités couvrant le cycle de développement de l’IA. Produisez des solutions IA puissantes offrant des interfaces conviviales, des workflows et un accès à des API et SDK conformes aux normes du secteur.

Découvrir watsonx.ai

Réserver une démo en direct