L’architecture des applications a de nouveau atteint un tournant. Les agents IA se révèlent être de puissants éléments constitutifs des systèmes modernes, qui complètent, étendent, voire remplacent les microservices traditionnels.
Ce changement d’architecture maintient le modèle fondamental du composant composable tout en apportant des gains significatifs en termes de vitesse de développement, d’adaptabilité et de capacités d’intégration. Les entreprises qui créent de nouvelles applications avec un cadre agentique se positionnent de manière à bénéficier d’un avantage concurrentiel dans l’environnement technologique (informatique) en évolution rapide.
L’histoire de l’architecture des applications révèle un schéma constant de décomposition en composants de plus en plus intelligents.
Années 1990 : applications monolithiques
Les systèmes à code unique ont dominé l’informatique d’entreprise, ce qui a créé d’importants défis opérationnels :
Début des années 2000 : architecture orientée services (SOA)
L’architecture orientée services s’attaque aux limites du monolithisme en décomposant les applications en services adaptés aux besoins de l’entreprise :
Années 2010 : microservices
L’architecture de microservices divise les applications en unités plus petites, pouvant être déployées de manière indépendante :
Un microservice traditionnel de traitement des paiements nécessite des milliers de lignes de code pour gérer la validation, le traitement, les états d’erreur et les intégrations. En revanche, les agents IA haute performance combinent des composants précompilés pour des chemins critiques avec des capacités de raisonnement pour des décisions complexes. Cette approche hybride permet de garantir à la fois la fiabilité de performance et l’intelligence adaptative.
Par exemple, la mise en œuvre d’agents Semantic Kernel en C# avec compilation anticipée (AOT) démontre que les systèmes agentiques de production peuvent égaler ou dépasser les microservices traditionnels en termes de performance tout en ajoutant de précieuses capacités de raisonnement.
Tout comme les microservices nécessitent des plateformes d’orchestration sous-jacentes, les agents IA ont besoin de cadres agentiques spécialisés. Les solutions modernes telles que Semantic Kernel et LangChain Enterprise fournissent cette infrastructure nécessaire à la coordination des agents avec des performances de niveau entreprise.
Ces cadres offrent des capacités qui vont au-delà de l’orchestration traditionnelle des services, tout en maintenant des normes de performance de niveau entreprise :
Le passage à une architecture agentique présente des avantages mesurables :
Les entreprises ont besoin d’une stratégie de mise en œuvre concrète qui maintienne les normes d’entreprise tout en tirant parti des avantages de l’IA :
La mise en œuvre d’une approche axée sur la performance peut aider les entreprises à obtenir des avantages opérationnels tout en développant des capacités d’IA stratégiques.
L’ingénierie de la qualité des agents IA exige une approche fondamentalement différente de celle des tests de logiciels traditionnels. Les entreprises leaders dans le domaine de l’architecture agentique ont été les premières à développer une méthodologie basée sur l’évaluation, qui garantit que les agents répondent à la fois aux exigences fonctionnelles et aux normes de raisonnement.
Les évaluations sont des suites de tests spécialisées conçues pour évaluer le comportement des agents sous plusieurs angles :
Les données internes de certains fournisseurs de cloud, de données et d’IA montrent une réduction significative des incidents de production après la mise en œuvre d’évaluations multidimensionnelles pour leurs systèmes d’agents.
Un processus de développement mature axé sur l’évaluation inclut les éléments clés suivants :
1. Protocole de définition de l’évaluation
Commencez par définir les attentes dans toutes les dimensions. Pour chaque agent :
2. Pipelines d’évaluation continue
Créez des pipelines automatisés qui exécutent des évaluations tout au long du cycle de développement :
3. Génération de tests dynamiques
Allez au-delà des cas de test statiques avec des scénarios générés dynamiquement :
4. Évaluation collaborative entre l’homme et l’IA
Combinez les tests automatisés avec l’expertise humaine :
5. Prévention de la régression
Prévenez la régression de capacité avec :
Une étude de 2024 de l’Institut Stanford pour l’IA centrée sur l’humain (HAI) a constaté que les entreprises utilisant des cadres connaissent des cycles de développement 65 % plus rapides et 42 % de retraits en production en moins.
L’une des 10 plus grandes banques mondiales a mis en œuvre un développement axé sur les évaluations pour ses agents du service client avec des résultats impressionnants.
Son approche est centrée sur un cadre à trois niveaux : des suites pour la validation fonctionnelle, des évaluations pour les scénarios de décision complexes et des avis par des experts pour les interactions à fort enjeu.
Le cadre a révélé des problèmes subtils que les tests traditionnels pouvaient ignorer. Par exemple, un agent a correctement approuvé les applications conformément à la politique, mais a utilisé un raisonnement qui a involontairement renforcé les préjugés dans les cas limites, un problème identifié par leurs évaluations de raisonnement avant le déploiement.
En ce qui concerne les coûts, les entreprises sont confrontées à deux considérations principales :
Coût des tokens : chaque interaction avec les modèles de fondation entraîne des frais par token qui s’accumulent rapidement à l’échelle. Les réseaux d’agents complexes avec raisonnement à plusieurs étapes peuvent générer 10 à 15 fois plus de tokens que les appels API directs similaires.
Coûts de calcul : l’exécution de l’inférence, en particulier pour les raisonnements sophistiqués, nécessite des ressources informatiques substantielles. Les clusters GPU sur site pour l’inférence nécessitent généralement un investissement initial important. L’inférence basée sur le cloud peut entraîner des coûts mensuels allant de 10 000 à 50 000 USD pour les déploiements à petite et moyenne échelle.
Les principales entreprises ont développé des approches systématiques pour gérer ces coûts.
1. Optimisation architecturale
JPMorgan Chase réduit leurs coûts d’inférence de 67 % grâce à une architecture hybride qui traite 89 % des transactions par des chemins déterministes, réserver les ressources des LLM pour des scénarios complexes.
2. Prompt engineering pour une meilleure efficacité
5. Ajustement pour la spécialisation des domaines
Le rapport 2024 de l’économie de l’IA de McKinsey indique que la mise en œuvre d’au moins trois de ces stratégies réduit les coûts opérationnels de l’IA de 62 % en moyenne, tout en maintenant ou en améliorant les capacités du système.
Les architectures agentiques introduisent de nouvelles considérations de mise en œuvre.
Complexité d’orchestration
La coordination d’agents autonomes nécessite des approches différentes de l’orchestration traditionnelle de microservice :
Les cadres modernes répondent à ces défis grâce à des systèmes de priorisation et un contexte partagé. Semantic Kernel de Microsoft met en œuvre une orchestration qui équilibre l’autonomie des agents et la cohérence du système.
Observabilité et surveillance
Les approches traditionnelles de surveillance doivent évoluer :
Sécurité et gouvernance
Les architectures agentiques introduisent de nouvelles dimensions de sécurité :
Pour illustrer la différence entre microservices et architectures agentiques, considérons une plateforme de trading de services financiers.
Mise en œuvre traditionnelle de microservices :
Lorsqu’un client effectue une transaction, le système suit un chemin prédéterminé, chaque étape se produisant lorsqu’elle est explicitement déclenchée.
En pratique, la mise en œuvre par agents crée des expériences client fondamentalement différentes. Lorsque la volatilité du marché augmente, l’agent d’évaluation des risques peut ajuster de manière autonome les limites de négociation et en informer l’agent de portefeuille, qui analyse les avoirs des clients pour y déceler d’éventuelles vulnérabilités. Le système fait preuve d’une intelligence qui va au-delà de ce qui a été explicitement codé.
La progression des monolithes vers les services, les microservices et les agents suit des schémas historiques clairs. Chaque évolution apportait des composantes plus granulaires, avec une intelligence et une autonomie croissantes.
Les entreprises qui mettent en œuvre des architectures agentiques à l’échelle doivent adopter des principes d’ingénierie de plateforme afin d’obtenir une qualité, une rentabilité et une gouvernance cohérentes dans l’ensemble du portefeuille application.
Adoption pilotée par la plateforme
Les entreprises avant-gardistes utilisent des plateformes internes pour développeurs (IDP) pour accélérer l’adoption des agents.
Infrastructure d’agent standardisée
Focus sur l’expérience développeur
Le rapport 2024 de Gartner sur l’ingénierie de plateforme indique que les approches de plateformes matures permettent une mise sur le marché 3,2 fois plus rapide des nouvelles capacités des agents et une satisfaction des développeurs supérieure de 76 %.
Les entreprises sont désormais confrontées à un choix : prendre les devants en adoptant une architecture agentique pour un cas d’utilisation approprié ou suivre les concurrents qui s’emparent des avantages précoces. L’expérience montre que les pionniers qui mettent en œuvre des approches axées sur les plateformes bénéficient d’avantages concurrentiels substantiels en termes de rapidité de développement, de flexibilité des systèmes et de capacités techniques.