Des microservices aux agents IA : l’évolution de l’architecture des applications

Deux collègues partagent des idées dans un bureau moderne

L’architecture des applications a de nouveau atteint un tournant. Les agents IA se révèlent être de puissants éléments constitutifs des systèmes modernes, qui complètent, étendent, voire remplacent les microservices traditionnels.

Ce changement d’architecture maintient le modèle fondamental du composant composable tout en apportant des gains significatifs en termes de vitesse de développement, d’adaptabilité et de capacités d’intégration. Les entreprises qui créent de nouvelles applications avec un cadre agentique se positionnent de manière à bénéficier d’un avantage concurrentiel dans l’environnement technologique (informatique) en évolution rapide.

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA 


La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets. 

Vue d’ensemble de l’évolution de l’architecture

L’histoire de l’architecture des applications révèle un schéma constant de décomposition en composants de plus en plus intelligents.

Années 1990 : applications monolithiques
Les systèmes à code unique ont dominé l’informatique d’entreprise, ce qui a créé d’importants défis opérationnels :

  • Les déploiements nécessitaient des cycles de tests étendus
  • La mise à l’échelle exigeait une duplication complète du système
  • Les changements dans un domaine risquaient de perturber des fonctions non liées
  • Les cycles de développement s’étendaient sur des mois ou des années

Début des années 2000 : architecture orientée services (SOA)
L’architecture orientée services s’attaque aux limites du monolithisme en décomposant les applications en services adaptés aux besoins de l’entreprise :

  • Nouvelle architecture améliorant la réutilisation et les capacités d’intégration
  • Les services sont restés relativement lourds
  • La complexité de l’orchestration a créé des systèmes fragiles
  • Les cycles de développement étaient mesurés en mois

Années 2010 : microservices
L’architecture de microservices divise les applications en unités plus petites, pouvant être déployées de manière indépendante :

  • Chaque microservice fonctionnait de manière autonome
  • Les services étaient communiqués via des interfaces de programmation d’applications (API) bien définies
  • Composants mis à l’échelle indépendamment
  • Les technologies de conteneurisation ont simplifié le déploiement
  • Les cycles de développement ont été réduits à quelques semaines
Mixture of Experts | 12 décembre, épisode 85

Décryptage de l’IA : Tour d’horizon hebdomadaire

Rejoignez notre panel d’ingénieurs, de chercheurs, de chefs de produits et autres spécialistes de premier plan pour connaître l’essentiel de l’actualité et des dernières tendances dans le domaine de l’IA.

Agents IA : le nouveau paradigme architectural

La frontière architecturale d’aujourd’hui est constituée d’agents IA : des composants intelligents et autonomes qui améliorent les capacités des microservices traditionnels. Les principales différences sont les suivantes :

Caractéristique
 

Microservice
 

Agent IA
 

Modèle de programmation

Impose des règles et une logique explicites

Propose un modèle hybride : noyau compilé avec couche de raisonnement

Capacité d’adaptation

Nécessite des modifications de code

Combine optimisation et raisonnement dynamique

Intégration

Utilise des contrats API

Utilise un mode double : contrats d’API avec compréhension sémantique

Gestion des erreurs

Possède des réponses préprogrammées

Possède des chemins optimisés avec des solutions de repli adaptatives

Effort de développement

Nécessite un niveau d’effort élevé (code à usage unique)

Est plus stratégique (chemins critiques et interfaces de raisonnement)

 

Un microservice traditionnel de traitement des paiements nécessite des milliers de lignes de code pour gérer la validation, le traitement, les états d’erreur et les intégrations. En revanche, les agents IA haute performance combinent des composants précompilés pour des chemins critiques avec des capacités de raisonnement pour des décisions complexes. Cette approche hybride permet de garantir à la fois la fiabilité de performance et l’intelligence adaptative.

Par exemple, la mise en œuvre d’agents Semantic Kernel en C# avec compilation anticipée (AOT) démontre que les systèmes agentiques de production peuvent égaler ou dépasser les microservices traditionnels en termes de performance tout en ajoutant de précieuses capacités de raisonnement.

Cadres agentiques : orchestration moderne

Tout comme les microservices nécessitent des plateformes d’orchestration sous-jacentes, les agents IA ont besoin de cadres agentiques spécialisés. Les solutions modernes telles que Semantic Kernel et LangChain Enterprise fournissent cette infrastructure nécessaire à la coordination des agents avec des performances de niveau entreprise.

Ces cadres offrent des capacités qui vont au-delà de l’orchestration traditionnelle des services, tout en maintenant des normes de performance de niveau entreprise :

  • Fondation à haute performance : les cadres agentiques sont construits sur des langages compilés avec compilation AOT pour une exécution prévisible et à faible latence.
  • Conception efficace en termes de mémoire : les cadres agentiques sont optimisés pour les systèmes à haut débit afin de garantir une consommation minimale des ressources.
  • Traitement sémantique : les agents allouent les ressources de calcul en fonction de la complexité de la tâche.
  • Intégration d’entreprise : Les cadres agentiques fournissent des connecteurs sûrs aux systèmes existants avec une forte application des contrats.
  • Planification hybride : les chemins critiques pour les performances du cadre agentique utilisent la logique compilée tandis que les scénarios complexes utilisent l’IA pour le raisonnement.

Avantages pratiques pour les entreprises

Le passage à une architecture agentique présente des avantages mesurables :

  • L’intelligence au service de la performance : des agents IA bien conçus offrent des performances supérieures. Les agents compilés peuvent atteindre un débit plus élevé que les microservices traditionnels et ajouter un raisonnement pour la détection complexe des fraudes.
  • Fiabilité de niveau entreprise : les cadres agentiques permettent une intégration robuste. Un système de chaîne d’approvisionnement peut traiter des milliers de transactions et gérer sans problème les incohérences des données.
  • Traitement supérieur des erreurs : les agents IA combinent les voies de récupération et le raisonnement. Le système de traitement des commandes garantit une haute disponibilité grâce à des méthodes de gestion des erreurs optimisées et à un raisonnement en cas de nouvelles défaillances.
  • Architecture prête pour l’avenir : les entreprises bénéficient aujourd’hui d’un avantage tout en se positionnant pour demain. Les agents compilés avec des couches de raisonnement optimisent les performances actuelles et ouvrent la voie aux progrès futurs de l’IA.

Stratégie de mise en œuvre : une approche axée sur la performance

Les entreprises ont besoin d’une stratégie de mise en œuvre concrète qui maintienne les normes d’entreprise tout en tirant parti des avantages de l’IA :

  • Profilage des performances : identifiez les microservices présentant à la fois des chemins critiques en termes de performances et des points de décision complexes qui bénéficieraient de capacités de raisonnement.
  • Conception de l’architecture : créez des modèles d’agents qui séparent les chemins critiques pour les performances (implémentés dans du code compilé) des composants de raisonnement qui gèrent les cas edge.
  • Sélection du cadre : évaluez les cadres agentiques sur la base des références de performance, de la compatibilité linguistique avec les systèmes existants et des options de compilation.
  • Amélioration d’équipe : constituez des équipes d’ingénieurs qui combinent l’expertise traditionnelle en matière de développement de logiciels et les compétences en ingénierie de l’IA.
  • Déploiement systématique : mettez en œuvre et testez des benchmarks de performance rigoureux ainsi que des capacités de raisonnement.

La mise en œuvre d’une approche axée sur la performance peut aider les entreprises à obtenir des avantages opérationnels tout en développant des capacités d’IA stratégiques.

Évaluations et développement axé sur les évaluations

L’ingénierie de la qualité des agents IA exige une approche fondamentalement différente de celle des tests de logiciels traditionnels. Les entreprises leaders dans le domaine de l’architecture agentique ont été les premières à développer une méthodologie basée sur l’évaluation, qui garantit que les agents répondent à la fois aux exigences fonctionnelles et aux normes de raisonnement.

Le cadre d’évaluation

Les évaluations sont des suites de tests spécialisées conçues pour évaluer le comportement des agents sous plusieurs angles :

  • Évaluations fonctionnelles : vérifier les capacités du cœur de métier par le biais d’assertions d’entrée et de production.
  • Évaluations du raisonnement : évaluer la qualité des décisions et les approches de résolution de problèmes.
  • Évaluations comportementales : tester l’alignement avec les directives organisationnelles et les normes éthiques.
  • Évaluations des performances : mesurer les temps de réponse, le débit et l’utilisation des ressources.
  • Évaluations contradictoires : défier les agents avec des cas edge et des modes d’échec potentiels.

Les données internes de certains fournisseurs de cloud, de données et d’IA montrent une réduction significative des incidents de production après la mise en œuvre d’évaluations multidimensionnelles pour leurs systèmes d’agents.

Mettre en œuvre un développement axé sur les évaluations

Un processus de développement mature axé sur l’évaluation inclut les éléments clés suivants :

1. Protocole de définition de l’évaluation

Commencez par définir les attentes dans toutes les dimensions. Pour chaque agent :

  • Documentez les fonctionnalités de base attendues avec des critères de réussite clairs
  • Spécifiez les modèles de raisonnement que les agents doivent démontrer
  • Établissez des limites comportementales et des garde-fous
  • Fixez des seuils de performance en fonction des besoins de l’entreprise

2. Pipelines d’évaluation continue

Créez des pipelines automatisés qui exécutent des évaluations tout au long du cycle de développement :

  • Les évaluations préalables à la validation identifient les problèmes avant l’intégration du code
  • Les évaluations d’intégration vérifient les interactions avec les agents
  • Test d’évaluation de la mise en œuvre avec des données de production
  • La surveillance de la production valide en continu les agents déployés

3. Génération de tests dynamiques

Allez au-delà des cas de test statiques avec des scénarios générés dynamiquement :

  • Utilisez de grands modèles linguistiques (LLM) pour créer divers cas de test qui mettent l’accent sur le raisonnement des agents
  • Générez des variations de cas edge connus
  • Simulez de nouvelles entrées en fonction des modèles de production

4. Évaluation collaborative entre l’homme et l’IA

Combinez les tests automatisés avec l’expertise humaine :

  • Des experts évaluent le raisonnement des agents sur des scénarios complexes
  • Les chercheurs en UX évaluent la qualité des interactions humain-agent
  • Les spécialistes du domaine vérifient l’exactitude de la logique d’entreprise

5. Prévention de la régression

Prévenez la régression de capacité avec :

  • Des suites d’évaluation complètes qui évoluent au fur et à mesure de chaque problème découvert
  • Des comparaisons A/B entre les versions des agents
  • Une surveillance continue des indicateurs clés de performance

Une étude de 2024 de l’Institut Stanford pour l’IA centrée sur l’humain (HAI) a constaté que les entreprises utilisant des cadres connaissent des cycles de développement 65 % plus rapides et 42 % de retraits en production en moins.

Étude de cas : Mise en œuvre des services financiers

L’une des 10 plus grandes banques mondiales a mis en œuvre un développement axé sur les évaluations pour ses agents du service client avec des résultats impressionnants.

Son approche est centrée sur un cadre à trois niveaux : des suites pour la validation fonctionnelle, des évaluations pour les scénarios de décision complexes et des avis par des experts pour les interactions à fort enjeu.

Le cadre a révélé des problèmes subtils que les tests traditionnels pouvaient ignorer. Par exemple, un agent a correctement approuvé les applications conformément à la politique, mais a utilisé un raisonnement qui a involontairement renforcé les préjugés dans les cas limites, un problème identifié par leurs évaluations de raisonnement avant le déploiement.

Stratégies d’optimisation des coûts pour l’architecture agentique

La viabilité économique des architectures agentiques dépend de stratégies efficaces de gestion des coûts. Bien que les agents IA apportent une valeur commerciale significative, la gestion des dépenses opérationnelles reste un facteur de réussite critique.

Le défi économique

En ce qui concerne les coûts, les entreprises sont confrontées à deux considérations principales :

Coût des tokens : chaque interaction avec les modèles de fondation entraîne des frais par token qui s’accumulent rapidement à l’échelle. Les réseaux d’agents complexes avec raisonnement à plusieurs étapes peuvent générer 10 à 15 fois plus de tokens que les appels API directs similaires.

Coûts de calcul : l’exécution de l’inférence, en particulier pour les raisonnements sophistiqués, nécessite des ressources informatiques substantielles. Les clusters GPU sur site pour l’inférence nécessitent généralement un investissement initial important. L’inférence basée sur le cloud peut entraîner des coûts mensuels allant de 10 000 à 50 000 USD pour les déploiements à petite et moyenne échelle.

Approches d’optimisation efficaces

Les principales entreprises ont développé des approches systématiques pour gérer ces coûts.

1. Optimisation architecturale

  • Conception d’agent hybride qui oriente les décisions complexes vers des modèles de fondation
  • Quantification des modèles pour le déploiement en production
  • Mise en cache stratégique des réponses aux requêtes courantes

JPMorgan Chase réduit leurs coûts d’inférence de 67 % grâce à une architecture hybride qui traite 89 % des transactions par des chemins déterministes, réserver les ressources des LLM pour des scénarios complexes.

2. Prompt engineering pour une meilleure efficacité

  • Précision dans la conception des instructions afin de minimiser l’utilisation des tokens
  • Élagage contextuel qui élimine les informations inutiles
  • Optimisation du format de réponse pour réduire la génération de tokens

3. Optimisation par inférence

  • Mise en œuvre d’un cache clé-valeur (KV) pour les interactions répétées
  • Traitement par lots pour les opérations non sensibles au temps
  • Adapter l’infrastructure de déploiement aux modèles de charge de travail

4. Mise en œuvre du RAG

  • Génération augmentée de récupération stratégique pour réduire la taille du contexte
  • Optimisation des bases de données vectorielles pour un accès efficace à l’information
  • Techniques de distillation du contexte qui compressent les informations pertinentes

5. Ajustement pour la spécialisation des domaines

  • Création de modèles spécifiques au domaine avec un nombre réduit de paramètres
  • Distillation des modèles généraux en variantes spécialisées efficaces
  • Des approches de réglage efficaces en termes de paramètres telles que LoRA et QLoRA

Le rapport 2024 de l’économie de l’IA de McKinsey indique que la mise en œuvre d’au moins trois de ces stratégies réduit les coûts opérationnels de l’IA de 62 % en moyenne, tout en maintenant ou en améliorant les capacités du système. 

Défis de mise en œuvre

Les architectures agentiques introduisent de nouvelles considérations de mise en œuvre.

Complexité d’orchestration
La coordination d’agents autonomes nécessite des approches différentes de l’orchestration traditionnelle de microservice :

  • La prise de décision décentralisée nécessite une coordination sophistiquée
  • Plusieurs agents doivent travailler vers des objectifs communs
  • L’état du système se complexifie avec les changements asynchrones

Les cadres modernes répondent à ces défis grâce à des systèmes de priorisation et un contexte partagé. Semantic Kernel de Microsoft met en œuvre une orchestration qui équilibre l’autonomie des agents et la cohérence du système.

Observabilité et surveillance
Les approches traditionnelles de surveillance doivent évoluer :

  • Les systèmes doivent saisir les voies de raisonnement et les critères de décision
  • L’analyse analytique permet d’identifier les tendances des interactions entre les agents
  • La surveillance prédictive anticipe les états potentiels du système

Sécurité et gouvernance
Les architectures agentiques introduisent de nouvelles dimensions de sécurité :

  • Mécanismes de vérification de l’alignement des instructions des agents sur les politiques de l’organisation
  • Systèmes de validation des actions des agents avant leur exécution
  • Capacités à contrôler le raisonnement des agents en matière de conformité

Comparaison entre les microservices et les systèmes agentiques : un cas d’utilisation

Pour illustrer la différence entre microservices et architectures agentiques, considérons une plateforme de trading de services financiers.

Mise en œuvre traditionnelle de microservices :

  • Un service de compte gère les informations des clients et les soldes
  • Un service de trading gère les ordres sur la base de demandes explicites
  • Un service de données de marché fournit les prix sur demande
  • Un service de notification envoie des alertes après des événements prédéfinis
  • Un service de gestion des risques applique des contrôles basés sur des règles

Lorsqu’un client effectue une transaction, le système suit un chemin prédéterminé, chaque étape se produisant lorsqu’elle est explicitement déclenchée.

Mise en œuvre par agent :

  • Un agent de portefeuille surveille en permanence les avoirs et suggère des opportunités de rééquilibrage
  • Un agent d’exécution de trading sélectionne le timing optimal en fonction des conditions du marché
  • Un agent d’évaluation des risques évalue de manière proactive la volatilité du marché
  • Un agent de communication fournit des informations pertinentes par les canaux préférés

En pratique, la mise en œuvre par agents crée des expériences client fondamentalement différentes. Lorsque la volatilité du marché augmente, l’agent d’évaluation des risques peut ajuster de manière autonome les limites de négociation et en informer l’agent de portefeuille, qui analyse les avoirs des clients pour y déceler d’éventuelles vulnérabilités. Le système fait preuve d’une intelligence qui va au-delà de ce qui a été explicitement codé.

Un regard vers l’avenir : ingénierie de plateforme pour l’échelle agentique

La progression des monolithes vers les services, les microservices et les agents suit des schémas historiques clairs. Chaque évolution apportait des composantes plus granulaires, avec une intelligence et une autonomie croissantes.

Les entreprises qui mettent en œuvre des architectures agentiques à l’échelle doivent adopter des principes d’ingénierie de plateforme afin d’obtenir une qualité, une rentabilité et une gouvernance cohérentes dans l’ensemble du portefeuille application.

Adoption pilotée par la plateforme

Les entreprises avant-gardistes utilisent des plateformes internes pour développeurs (IDP) pour accélérer l’adoption des agents.

Infrastructure d’agent standardisée

  • Modèles d’agents préconfigurés avec surveillance intégrée
  • Modèles de mise en œuvre selon la méthode Golden Path pour les types d’agents courants
  • Déploiement en libre-service avec des barrières de qualité automatisées

Observabilité unifiée

  • Surveillance centralisée de la performance et du comportement des agents
  • Traçage et visualisation des interactions inter-agents
  • Détection automatisée des anomalies avec analyse des causes profondes

Focus sur l’expérience développeur

  • Outils en libre-service pour le développement et les tests des agents
  • Environnements de développement intégrés avec débogage d’agents spécialisés
  • Contrôles de conformité automatisés pendant le développement

Gouvernance à l’échelle

  • Gestion centralisée des politiques et application
  • Évaluation automatisée du comportement des agents par rapport aux normes
  • Des pistes d’audit complètes pour toutes les actions des agents

Le rapport 2024 de Gartner sur l’ingénierie de plateforme indique que les approches de plateformes matures permettent une mise sur le marché 3,2 fois plus rapide des nouvelles capacités des agents et une satisfaction des développeurs supérieure de 76 %. 

Les entreprises sont désormais confrontées à un choix : prendre les devants en adoptant une architecture agentique pour un cas d’utilisation approprié ou suivre les concurrents qui s’emparent des avantages précoces. L’expérience montre que les pionniers qui mettent en œuvre des approches axées sur les plateformes bénéficient d’avantages concurrentiels substantiels en termes de rapidité de développement, de flexibilité des systèmes et de capacités techniques.

Solutions connexes
IBM watsonx.ai

Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.

Découvrir watsonx.ai
Solutions d’intelligence artificielle

Mettez l’IA au service de votre entreprise grâce à l’expertise de pointe d’IBM en matière d’IA et à son portefeuille de solutions.

Découvrir les solutions d’IA
Conseil et services en Intelligence Artificielle (IA)

IBM Consulting et ses services d'IA accompagnent les entreprises dans la redéfinition de leurs activités avec l'intelligence artificielle pour mener leur transformation.

Découvrir les services d’IA
Passer à l’étape suivante

Bénéficiez d’un accès centralisé aux fonctionnalités couvrant le cycle de développement de l’IA. Produisez des solutions IA puissantes offrant des interfaces conviviales, des workflows et un accès à des API et SDK conformes aux normes du secteur.

Découvrir watsonx.ai Réserver une démo en direct