De microservicios a agentes de IA: la evolución de la arquitectura de aplicaciones

Un par de colegas compartiendo ideas en una oficina moderna

La arquitectura de aplicaciones ha vuelto a alcanzar un punto de inflexión. Los agentes de IA están emergiendo como bloques de construcción poderosos para los sistemas modernos, complementando, extendiendo o incluso reemplazando los microservicios tradicionales.

Este cambio arquitectónico mantiene el patrón fundamental de componentes componibles al tiempo que ofrece ganancias significativas en velocidad de desarrollo, adaptabilidad y capacidades de integración. Las organizaciones que desarrollan nuevas aplicaciones con marcos se posicionan para obtener ventaja competitiva en el panorama tecnológico que evoluciona rápidamente.

Diseño 3D de bolas rodando por un circuito

Las últimas noticias + conocimientos de IA 


Descubra ideas y noticias de expertos sobre IA, nube y mucho más en el boletín semanal Think. 

El viaje de la evolución arquitectónica

La historia de la arquitectura de aplicaciones revela un patrón consistente de descomposición en componentes cada vez más inteligentes.

Década de 1990: aplicaciones monolíticas
Los sistemas de código base único dominaron la informática empresarial, creando desafíos operativos importantes:

  • Las implementaciones requerían amplios ciclos de pruebas
  • El escalado exigía la duplicación completa del sistema
  • Los cambios en un área corrían el riesgo de romper funciones no relacionadas
  • Los ciclos de desarrollo se prolongaban durante meses o años

Principios de la década de 2000: arquitectura orientada a servicios (SOA)
SOA abordó las limitaciones monolíticas al descomponer las aplicaciones en servicios alineados con el negocio:

  • La nueva arquitectura mejoró las capacidades de reutilización e integración
  • Los servicios seguían siendo un peso relativamente pesado
  • La complejidad de la orquestación creaba sistemas frágiles
  • Los ciclos de desarrollo se medían en meses

Década de 2010: microservicios
La arquitectura de microservicios dividió las aplicaciones en unidades más pequeñas que se podían implementar de forma independiente:

  • Cada microservicio operaba de forma autónoma
  • Los servicios se comunicaban a través de interfaces de programación de aplicaciones (API) bien definidas
  • Los componentes se escalaban de forma independiente
  • Las tecnologías de contenerización simplificaron la implementación
  • Los ciclos de desarrollo se comprimieron a semanas
Mixture of Experts | 12 de diciembre, episodio 85

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

Agentes de IA: el nuevo paradigma arquitectónico

La frontera arquitectónica actual cuenta con agentes de IA: componentes inteligentes y autónomos que mejoran las capacidades de los microservicios tradicionales. Las diferencias clave incluyen:

Característica
 

Microservicio
 

Agente de IA
 

Modelo de programación

Obliga a reglas y lógica explícitas

Ofrece un modelo híbrido: núcleo compilado con capa de razonamiento

Adaptabilidad

Requiere cambios en el código

Combina optimización con razonamiento dinámico

Integración

Utiliza contratos API

Utiliza el modo dual: contratos de API con comprensión semántica

Manejo de errores

Tiene respuestas preprogramadas

Ha optimizado las rutas con alternativas adaptativas

Esfuerzo de desarrollo

Requiere un alto nivel de esfuerzo (código de propósito único)

Es más estratégico (rutas críticas e interfaces de razonamiento)

 

Un microservicio de procesamiento de pagos tradicional requiere miles de líneas de código para gestionar la validación, el procesamiento, los estados de error y las integraciones. Por el contrario, los agentes de IA de alto rendimiento combinan componentes precompilados para caminos críticos con capacidades de razonamiento para decisiones complejas. Este enfoque híbrido ayuda a garantizar tanto la fiabilidad del rendimiento como la inteligencia adaptativa.

Por ejemplo, la implementación de agentes Semantic Kernel en C# con compilación anticipada (AOT) demuestra que los sistemas agénticos de producción pueden igualar o superar los microservicios tradicionales en rendimiento, al tiempo que añaden valiosas capacidades de razonamiento.

Marcos agénticos: orquestación moderna

Así como los microservicios requieren plataformas de orquestación subyacentes, los agentes de IA necesitan marcos especializados. Las soluciones modernas como Semantic Kernel y LangChain Enterprise proporcionan esta infraestructura necesaria para la coordinación de agentes con un rendimiento de nivel empresarial.

Estos marcos ofrecen capacidades que van más allá de la orquestación de servicios tradicional, al tiempo que mantienen los estándares de rendimiento de nivel empresarial esperados:

  • Base de alto rendimiento: los marcos de agencia se basan en lenguajes compilados con compilación AOT para una ejecución predecible y de baja latencia.
  • Diseño que hace uso eficiente de la memoria: los marcos agénticos están optimizados para sistemas de alto rendimiento para ayudar a garantizar un consumo mínimo de recursos.
  • Procesamiento semántico: los agentes asignan recursos computacionales en función de la complejidad de la tarea.
  • Integración empresarial: los marcos agénticos proporcionan conectores de tipos seguros a los sistemas existentes con un fuerte cumplimiento de contratos.
  • Planificación híbrida: los caminos críticos de rendimiento del marco agéntico utilizan lógica compilada, mientras que los escenarios complejos emplean IA para el razonamiento.

Beneficios empresariales prácticos

El cambio a la arquitectura agéntica ofrece ventajas cuantificables, como:

  • Rendimiento con inteligencia: los agentes de IA bien diseñados ofrecen un rendimiento superior. Los agentes compilados pueden lograr un mayor rendimiento que los microservicios tradicionales y añadir razones para la detección del fraude complejo.
  • Fiabilidad de nivel empresarial: los marcos de trabajo agénticos permiten una integración sólida. Un sistema de cadena de suministro puede procesar miles de transacciones y gestionar las incoherencias de los datos sin problemas.
  • Gestión superior de errores: los agentes de IA combinan las vías de recuperación con el razonamiento. El sistema de procesamiento de pedidos mantiene una alta disponibilidad mediante rutas de gestión de errores optimizadas y el razonamiento de los nuevos fallos.
  • Arquitectura preparada para el futuro: las organizaciones obtienen un beneficio hoy mientras se posicionan para el mañana. Los agentes compilados con capas de razonamiento optimizan el rendimiento actual y allanan el camino para los futuros avances de la IA.

Estrategia de implementación: un enfoque centrado en el rendimiento

Las organizaciones necesitan una estrategia práctica que mantenga los estándares de la empresa y, al mismo tiempo, aprovechen los beneficios de la IA:

  • Perfilado de rendimiento: identifique microservicios con caminos críticos de rendimiento y puntos de decisión complejos que se beneficiarían de capacidades de razonamiento.
  • Diseño de arquitectura: cree diseños de agentes que separen los caminos críticos de rendimiento (implementados en código compilado) de los componentes de razonamiento que manejan casos límite.
  • Selección del marco: evalúe los marcos agénticos en función de puntos de referencia de rendimiento, compatibilidad del lenguaje con sistemas existentes y opciones de compilación.
  • Mejora del equipo: cree equipos de ingeniería que combinen la experiencia tradicional en desarrollo de software con habilidades de ingeniería de IA.
  • Implementación sistemática: implemente y pruebe rigurosas referencias de rendimiento junto con capacidades de razonamiento.

Implementar un enfoque que priorice el rendimiento puede ayudar a las organizaciones a lograr beneficios operativos y, al mismo tiempo, a desarrollar capacidades estratégicas de IA.

Evaluaciones y desarrollo basado en evaluaciones

La ingeniería de calidad de los agentes de IA exige un enfoque fundamentalmente diferente al de las pruebas de software tradicionales. Las empresas líderes en arquitectura de agentes han sido pioneras en el desarrollo basado en evaluaciones, una metodología que garantiza que los agentes cumplan tanto los requisitos funcionales como los estándares de razonamiento.

El marco de evaluación

Las evaluaciones son conjuntos de pruebas especializados diseñados para evaluar el comportamiento de los agentes en múltiples dimensiones:

  • Evaluaciones funcionales: verifique las capacidades de actividad principal a través de afirmaciones de entrada/output.
  • Pruebas de razonamiento: evalúe la calidad de las decisiones y los enfoques de resolución de problemas.
  • Evaluaciones conductuales: evalúe la alineación con las directrices organizativas y los estándares éticos.
  • Evaluaciones de rendimiento: mida los tiempos de respuesta, el rendimiento y el uso de recursos.
  • Evaluaciones adversariales: desafíe a los agentes con casos límite y modos de fallo potenciales.

Los datos internos de algunos proveedores de nube, datos e IA muestran una reducción significativa de los incidentes de producción tras implementar evaluaciones multidimensionales para sus sistemas de agentes.

Implementación del desarrollo basado en evaluaciones

Un proceso maduro de desarrollo basado en la evaluación incluye estos elementos clave:

1. Protocolo de definición de evaluación

Empiece definiendo expectativas en todas las dimensiones. Para cada agente:

  • Documente las características básicas esperadas con criterios de éxito claros
  • Especifique patrones de razonamiento que los agentes deben demostrar
  • Establezca límites de comportamiento y barreras de seguridad
  • Determine umbrales de rendimiento basados en los requisitos de la empresa

2. Pipelines de evaluación continua

Construya pipelines automatizados que ejecuten evaluaciones durante todo el ciclo de vida del desarrollo:

  • Las evaluaciones pre-commit identifican los problemas antes de la integración del código
  • Las evaluaciones de integración verifican las interacciones entre agentes
  • Prueba de evaluación por etapas con datos de producción
  • La monitorización de la producción valida continuamente los agentes implementados

3. Generación dinámica de pruebas

Mueva más allá de los casos de prueba estáticos con escenarios generados dinámicamente:

  • Utilice modelos lingüísticos de gran tamaño (LLM) para crear diversos casos de prueba que estresen el razonamiento de los agentes
  • Genere variaciones de casos límite conocidos
  • Simule nuevas entradas basadas en patrones de producción

4. Evaluación colaborativa humano-IA

Combine pruebas automatizadas con experiencia humana:

  • Revisores expertos evalúan el razonamiento de los agentes en escenarios complejos
  • Los investigadores de UX evalúan la calidad de la interacción humano-agente
  • Los especialistas en dominios verifican la corrección de la lógica empresarial

5. Prevención de regresión

Prevenga la regresión de capacidades con:

  • Completas suites de evaluación que crecen con cada problema descubierto
  • Comparaciones A/B entre versiones de agentes
  • Monitorización continua de los indicadores clave de rendimiento

Un estudio de 2024 de The Stanford Institute for Human-Centered AI (HAI) descubrió que las empresas que utilizan marcos de evaluación exhaustivos experimentan ciclos de desarrollo un 65 % más rápidos y un 42 % menos de retrocesos de producción.

Caso de éxito: implementación de servicios financieros

Uno de los 10 principales bancos del mundo implementó un desarrollo impulsado por la evaluación para sus agentes de servicio de atención al cliente con resultados impresionantes.

Su enfoque se centraba en un marco de evaluación de tres niveles: suites de pruebas automatizadas para validación funcional, evaluaciones de razonamiento para escenarios de decisión complejos y revisiones de expertos humanos para interacciones de alto riesgo.

El marco descubrió problemas sutiles que las pruebas tradicionales pasarían por alto. Por ejemplo, un agente aprobó correctamente las aplicaciones según la política, pero utilizó un razonamiento que, sin darse cuenta, reforzó el sesgo en los casos límite, un tema identificado por sus evaluaciones de razonamiento antes de la implementación.

Estrategias de optimización de costes para la arquitectura agéntica

La viabilidad económica de las arquitecturas agénticas depende de estrategias eficaces de gestión de costes. Aunque los agentes de IA aportan un importante valor empresarial, la gestión de los gastos operativos sigue siendo un factor crítico para el éxito.

El reto económico

En cuanto al coste, las organizaciones se enfrentan a dos consideraciones principales:

Costes de token: cada interacción con los modelos fundacionales genera cargos por token que se acumulan rápidamente a escala. Las redes de agentes complejas con razonamiento de varios pasos pueden generar entre 10 y 15 veces más tokens que las llamadas directas a la API similares.

Costes computacionales: ejecutar inferencias, especialmente para razonamientos sofisticados, demanda recursos computacionales sustanciales. Los clústeres de GPU en las instalaciones para la inferencia suelen requerir una gran inversión inicial. La inferencia basada en la nube puede generar costes mensuales que van desde 10 000 hasta 50 000 USD para implementaciones de pequeña a mediana escala.

Enfoques de optimización eficaces

Las organizaciones líderes han desarrollado enfoques sistemáticos para gestionar estos costes.

1. Optimización arquitectónica

  • Diseño de agentes híbridos que enruta decisiones complejas a modelos fundacionales
  • Cuantificación de modelos para la implementación en producción
  • Almacenamiento estratégico en caché de respuestas para consultas comunes

JPMorgan Chase redujo sus costes de inferencia en un 67 % con arquitectura híbrida que procesa el 89 % de las transacciones mediante rutas deterministas, reservando recursos de LLM para escenarios complejos.

2. Ajuste de Prompt Engineering para la eficiencia

  • Precisión en el diseño de instrucciones para minimizar el uso de token
  • Poda contextual que elimina la información innecesaria
  • Optimización del formato de respuesta para reducir la generación de token

3. Optimización por inferencia

  • Implementación de caché clave-valor (KV) para interacciones repetidas
  • Procesamiento por lotes para operaciones no sensibles al tiempo
  • Ajustar la infraestructura de implementación a los patrones de carga de trabajo

4. Implementación de RAG

  • Generación aumentada por recuperación estratégica para reducir el tamaño del contexto
  • Optimización de bases de datos vectoriales para un acceso eficiente a la información
  • Técnicas de destilación de contexto que comprimen la información relevante

5. Ajuste fino para la especialización de dominios

  • Creación de modelos específicos de dominio con recuento reducido de parámetros
  • Destilación de modelos generales en variantes especializadas eficientes
  • Enfoques de ajuste de parámetros eficientes como LoRA y QLoRA

El informe "AI economics" 2024 de McKinsey afirma que la aplicación de tres o más de estas estrategias reduce sus costes operativos de IA en una media de 62 %, al tiempo que mantiene o mejora las capacidades del sistema. 

Desafíos de implementación

Las arquitecturas agénticas introducen nuevas consideraciones de implementación.

Complejidad de la orquestación
La coordinación de agentes autónomos requiere enfoques diferentes a la orquestación de microservicio tradicional:

  • La toma de decisiones descentralizada requiere una coordinación sofisticada
  • Múltiples agentes deben trabajar hacia objetivos comunes
  • El estado del sistema se vuelve más complejo con los cambios asíncronos

Los marcos modernos abordan estos desafíos a través de sistemas de priorización y contexto compartido. El núcleo semántico de Microsoft implementa una orquestación que equilibra la autonomía de los agentes con la coherencia del sistema.

Observabilidad y monitorización
Los enfoques tradicionales de monitorización deben evolucionar:

  • Los sistemas necesitan capturar rutas de razonamiento y criterios de decisión
  • Los análisis de comportamiento ayudan a identificar patrones en las interacciones de los agentes
  • La monitorización predictiva anticipa los posibles estados del sistema

Seguridad y gobierno
Las arquitecturas agénticas introducen nuevas dimensiones de seguridad:

  • Los mecanismos para verificar las instrucciones de los agentes se alinean con las políticas de la organización
  • Sistemas para validar las acciones de los agentes antes de su ejecución
  • Capacidades para inspeccionar el razonamiento del agente para el cumplimiento

Comparación de microservicios frente a sistemas de agencia: un caso de uso práctico

Para ilustrar la diferencia entre microservicios y arquitecturas agénticas, considere una plataforma de negociación de servicios financieros.

Implementación tradicional de microservicios:

  • Un servicio de cuentas gestiona la información y los saldos de los clientes
  • Un servicio de negociación ejecuta órdenes basadas en solicitudes explícitas
  • Un servicio de datos de mercado proporciona precios cuando se le consulta
  • Un servicio de notificación envía alertas después de eventos predefinidos
  • Un servicio de gestión de riesgos aplica controles basados en reglas

Cuando un cliente hace una operación, el sistema sigue una ruta predeterminada y cada paso se produce cuando se activa explícitamente.

Implementación agéntica:

  • Un agente de portfolio supervisa continuamente las participaciones y sugiere oportunidades de reequilibrio
  • Un agente de ejecución de operaciones selecciona el momento óptimo en función de las condiciones del mercado
  • Un agente de evaluación de riesgos evalúa de forma proactiva la volatilidad del mercado
  • Un agente de comunicación proporciona información relevante a través de los canales preferidos

En la práctica, la implementación agéntica crea experiencias del cliente fundamentalmente diferentes. Cuando aumenta la volatilidad del mercado, el agente de evaluación de riesgos puede ajustar de forma autónoma los límites de negociación y notificar al agente de portfolio, que analiza las posiciones de los clientes en busca de posibles vulnerabilidades. El sistema demuestra inteligencia más allá de lo que se codificó explícitamente.

Mirando hacia el futuro: ingeniería de plataformas para la escala agéntica

La progresión de monolitos a servicios, a microservicios y luego a agentes sigue patrones históricos claros. Cada evolución aportó componentes más granulares, con mayor inteligencia y autonomía.

Las organizaciones que implementan arquitecturas agénticas a escala deben adoptar principios de ingeniería de plataformas para lograr una calidad constante, eficiencia de costes y gobierno en todo el portfolio de aplicaciones.

Adopción impulsada por plataformas

Las organizaciones con visión de futuro utilizan plataformas de desarrolladores internas (IDP) para acelerar la adopción de agentes.

Infraestructura de agentes estandarizada

  • Plantillas de agentes preconfiguradas con monitorización integrada
  • Patrones de implementación de Golden-Path para tipos de agentes comunes
  • Implementación de autoservicio con puertas de calidad automatizadas

Observabilidad unificada

  • Monitorización centralizada del rendimiento y comportamiento del agente
  • Rastreo y visualización de interacciones entre agentes
  • Detección automatizada de anomalías con análisis de causa raíz

Enfoque en la experiencia del desarrollador

  • Herramientas de autoservicio para el desarrollo y las pruebas de agentes
  • Entornos de desarrollo integrados con depuración especializada de agentes
  • Comprobaciones automatizadas de conformidad durante el desarrollo

Gobernanza a escala

  • Gestión y aplicación centralizadas de políticas
  • Evaluación automatizada del comportamiento de los agentes frente a los estándares
  • Registros de auditoría exhaustivos para todas las acciones de los agentes

El informe de ingeniería de plataformas de 2024 de Gartner afirma que los enfoques de plataformas maduras conducen a una comercialización 3,2 veces más rápida de las nuevas capacidades de los agentes y a un 76 % más de satisfacción de los desarrolladores. 

Las organizaciones se enfrentan ahora a una elección: liderar la adopción de la arquitectura agéntica para los casos de uso adecuados o seguir a los competidores que obtienen ventajas tempranas. La evidencia sugiere que los pioneros que implementan enfoques basados en plataformas obtienen importantes ventajas competitivas en cuanto a velocidad de desarrollo, flexibilidad del sistema y capacidad técnica.

Soluciones relacionadas
IBM watsonx.ai

Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Explore watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA al servicio de su negocio con la experiencia líder del sector y el portfolio de soluciones de IA de IBM.

Explore las soluciones de IA
Servicios y consultoría de inteligencia artificial (IA)

Los servicios de IA de IBM Consulting ayudan a reinventar la forma de trabajar de las empresas usando IA para la transformación.

Explore los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida de desarrollo de la IA. Produzca potentes soluciones de IA con interfaces intuitivas, flujos de trabajo y acceso a API y SDK estándar del sector.

Explore watsonx.ai Solicite una demo en directo