De los microservicios a los agentes de IA: la evolución de la arquitectura de aplicaciones

Un par de colegas compartiendo ideas en una oficina moderna

La arquitectura de aplicaciones ha vuelto a alcanzar un punto de inflexión. Los agentes de IA se están convirtiendo en potentes componentes básicos de los sistemas modernos, complementando, ampliando o incluso sustituyendo a los microservicios tradicionales.

Este cambio arquitectónico mantiene el patrón fundamental de componentes componibles, al tiempo que ofrece ganancias significativas en velocidad de desarrollo, adaptabilidad y capacidades de integración. Las organizaciones que crean nuevas aplicaciones con infraestructuras agénticas se posicionan para obtener una ventaja competitiva en el ámbito tecnológico en rápida evolución.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA

Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

El recorrido de la evolución arquitectónica

La historia de la arquitectura de aplicaciones revela un patrón constante de descomposición en componentes cada vez más inteligentes.

Década de 1990: aplicaciones monolíticas
los sistemas de código base único dominaron la informática empresarial, creando desafíos operativos importantes:

  • Los despliegues requerían extensos ciclos de prueba
  • El escalamiento exigía duplicación total del sistema
  • Los cambios en un área corrían el riesgo de estropear funciones no relacionadas
  • Ciclos de desarrollo prolongados durante meses o años

Principios de la década de 2000: arquitectura orientada a servicios (SOA)
La SOA abordaba las limitaciones monolíticas descomponiendo las aplicaciones en servicios alineados con el negocio:

  • La nueva arquitectura mejoró las capacidades de reutilización e integración
  • Los servicios seguían siendo relativamente pesados
  • La complejidad de la orquestación creó sistemas frágiles
  • Los ciclos de desarrollo se medían en meses

Década de 2010: microservicios
La arquitectura de microservicios dividió las aplicaciones en unidades más pequeñas que se podían implementar de forma independiente:

  • Cada microservicio operaba de forma autónoma
  • Los servicios se comunicaban a través de interfaces de programación de aplicaciones (API) bien definidas
  • Los componentes se escalaban de forma independiente
  • Las tecnologías de contenedorización simplificaron el despliegue
  • Los ciclos de desarrollo se redujeron a semanas.
Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Agentes de IA: el nuevo paradigma arquitectónico

La frontera arquitectónica actual presenta agentes de IA: componentes inteligentes y autónomos que mejoran las capacidades tradicionales de los microservicios. Las diferencias clave incluyen:

Característica
 

Microservicio
 

Agente de IA
 

Modelo de programación

Exige reglas explícitas y lógica

Ofrece un modelo híbrido: núcleo compilado con capa de razonamiento

Adaptabilidad

Requiere cambios en el código

Combina la optimización con el razonamiento dinámico

Integración

Utiliza contratos de API

Utiliza modo dual: contratos de API con comprensión semántica

Manejo de errores

Tiene respuestas preprogramadas

Tiene rutas optimizadas con respaldos adaptativos

Esfuerzo de desarrollo

Requiere un alto nivel de esfuerzo (código de propósito único)

Es más estratégico (rutas críticas y interfaces de razonamiento)

 

Un microservicio de procesamiento de pagos tradicional requiere miles de líneas de código para manejar la validación, el procesamiento, los estados de error y las integraciones. Por el contrario, los agentes de IA de alto rendimiento combinan componentes previamente compilados para rutas críticas con capacidades de razonamiento para decisiones complejas. Este enfoque híbrido ayuda a garantizar tanto la confiabilidad del rendimiento como la inteligencia adaptativa.

Por ejemplo, la implementación de agentes de Semantic Kernel en C# con compilación anticipada (AOT) demuestra que los sistemas de producción de agentes pueden igualar o superar los microservicios tradicionales en rendimiento, al tiempo que agregan valiosas capacidades de razonamiento.

Infraestructuras de agentes: orquestación moderna

Así como los microservicios requieren plataformas de orquestación subyacentes, los agentes de IA necesitan infraestructuras especializadas. Las soluciones modernas, como Semantic Kernel y LangChain Enterprise, proporcionan esta infraestructura necesaria para la coordinación de agentes con un rendimiento de nivel empresarial.

Estos marcos ofrecen capacidades que van más allá de la orquestación de servicios tradicional, al tiempo que mantienen los estándares de rendimiento esperados de nivel empresarial:

  • Fundamento de alto rendimiento: las infraestructuras agénticas se construyen en lenguajes compilados con AOT para una ejecución predecible y de baja latencia.
  • Diseño eficiente en memoria: los marcos agénticos están optimizados para sistemas de alto rendimiento a fin de ayudar a garantizar un consumo mínimo de recursos.
  • Procesamiento semántico: los agentes asignan recursos computacionales en función de la complejidad de la tarea.
  • Integración empresarial: las infraestructuras agénticas proporcionan conectores de tipo seguro a los sistemas existentes con una fuerte aplicación de contratos.
  • Planificación híbrida: las rutas críticas para el rendimiento de la infraestructura utilizan lógica compilada, mientras que los escenarios complejos utilizan IA para el razonamiento.

Beneficios prácticos para el negocio

El cambio a la arquitectura agéntica ofrece ventajas medibles, como:

  • Rendimiento con inteligencia: los agentes de IA bien diseñados ofrecen un rendimiento superior. Los agentes compilados pueden lograr un mayor rendimiento que los microservicios tradicionales y agregar razonamiento para la detección de fraudes complejos.
  • Confiabilidad de nivel empresarial: los marcos agénticos permiten una integración sólida. Un sistema de cadena de suministro puede procesar miles de transacciones y manejar las incongruencias de datos sin problemas.
  • Manejo superior de errores: los agentes de IA combinan rutas de recuperación con razonamiento. El sistema de procesamiento de pedidos mantiene una alta disponibilidad a través de rutas optimizadas de manejo de errores y razonamiento para fallas nuevas.
  • Arquitectura lista para el futuro: las organizaciones obtienen un beneficio hoy mientras se posicionan para el mañana. Los agentes compilados con capas de razonamiento optimizan el rendimiento actual y sientan las bases para futuros avances en la IA.

Estrategia de implementación: un enfoque centrado en el rendimiento

Las organizaciones necesitan una estrategia de implementación práctica que mantenga los estándares empresariales mientras captura los beneficios de la IA:

  • Perfilado de rendimiento: identifique los microservicios con rutas críticas de rendimiento y puntos de decisión complejos que se beneficiarían de las capacidades de razonamiento.
  • Diseño arquitectónico: cree diseños de agentes que separen las rutas críticas de rendimiento (implementadas en código compilado) de los componentes de razonamiento que gestionan los casos extremos.
  • Selección de la infraestructura: evalúe los marcos agénticos basados en puntos de referencia de rendimiento, compatibilidad del lenguaje con los sistemas existentes y opciones de compilación.
  • Mejora del equipo: cree equipos de ingeniería que combinen la experiencia tradicional en desarrollo de software con habilidades de ingeniería de IA.
  • Despliegue sistemático: implemente y pruebe rigurosos puntos de referencia de rendimiento junto con capacidades de razonamiento.

La implementación de un enfoque centrado en el rendimiento puede ayudar a las organizaciones a lograr beneficios operacionales mientras construyen capacidades estratégicas de IA.

Evaluaciones y desarrollo basado en evaluaciones

La ingeniería de calidad de los agentes de IA exige un enfoque fundamentalmente diferente al de las pruebas de software tradicionales. Las empresas líderes en arquitectura de agentes han sido pioneras en el desarrollo basado en evaluaciones, una metodología que garantiza que los agentes cumplan tanto con los requisitos funcionales como con los estándares de razonamiento.

El marco de evaluación

Las evaluaciones son suites de prueba especializadas y diseñadas para evaluar el comportamiento de los agentes en múltiples dimensiones:

  • Evaluaciones funcionales: verifique las capacidades de actividad principal mediante afirmaciones de entrada y salida.
  • Evaluaciones del razonamiento: evalúe la calidad de las decisiones y los enfoques para la resolución de problemas.
  • Evaluaciones de conducta: compruebe la adecuación a las directrices de la organización y las normas éticas.
  • Evaluaciones de rendimiento: mida los tiempos de respuesta, el rendimiento y el uso de recursos.
  • Evaluaciones adversariales: desafíe a los agentes con casos extremos y posibles modos de falla.

Los datos internos de algunos proveedores de nube, datos e IA muestran una reducción significativa de los incidentes de producción tras implementar evaluaciones multidimensionales para sus sistemas de agentes.

Implementación del desarrollo basado en evaluaciones

Un proceso maduro de desarrollo impulsado por evaluaciones incluye estos elementos clave:

1. Protocolo de definición de evaluación

Comience por definir las expectativas en todas las dimensiones. Para cada agente:

  • Documente las características principales esperadas con criterios claros de éxito
  • Especifique los patrones de razonamiento que los agentes deben demostrar
  • Establezca límites de comportamiento y medidas de seguridad
  • Establezca umbrales de rendimiento en función de los requisitos empresariales

2. Pipelines de evaluación continua

Cree pipelines automatizados que ejecuten evaluaciones a lo largo del ciclo de vida del desarrollo:

  • Las evaluaciones previas al compromiso identifican los problemas antes de la integración del código
  • Las evaluaciones de integración verifican las interacciones de los agentes
  • Las evaluaciones por etapas prueban con datos de producción
  • El monitoreo de la producción valida continuamente los agentes desplegados

3. Generación dinámica de pruebas

Más allá de los casos de prueba estáticos con escenarios generados dinámicamente:

  • Utilice modelos de lenguaje grandes (LLM) para crear diversos casos de prueba que hagan hincapié en el razonamiento de los agentes
  • Genere variaciones de casos extremos conocidos
  • Simule nuevas entradas basadas en patrones de producción

4. Evaluación colaborativa entre humanos e IA

Combine las pruebas automatizadas con la experiencia humana:

  • Revisores expertos evalúan el razonamiento de los agentes en escenarios complejos
  • Los investigadores de UX evalúan la calidad de la interacción entre humanos y agentes
  • Los especialistas en dominios verifican la corrección de la lógica del negocio

5. Prevención de la regresión

Prevenga la regresión de capacidades con:

  • Suites de evaluación integrales que crecen con cada problema detectado
  • Comparaciones A/B entre versiones de agentes
  • Monitoreo continuo de los indicadores clave de rendimiento

Un estudio de 2024 del Stanford Institute for Human-Centered AI (HAI) encontró que las empresas que utilizan marcos de evaluación integrales tienen experiencia con ciclos de desarrollo un 65 % más rápido y un 42 % menos de reversiones de producción.

Estudio de caso: implementación de servicios financieros

Uno de los 10 principales bancos del mundo implementó un desarrollo basado en evaluaciones para sus agentes de atención al cliente con resultados impresionantes.

Su enfoque se centró en un marco de evaluación de tres niveles: suites de prueba automatizadas para la validación funcional, evaluaciones de razonamiento para escenarios de decisión complejos y revisiones de expertos humanos para interacciones de alto riesgo.

La infraestructura detectó problemas sutiles que las pruebas tradicionales pasarían por alto. Por ejemplo, un agente aprobó correctamente las aplicaciones de préstamo según la política, pero utilizó un razonamiento que reforzó inadvertidamente el sesgo en los casos extremos, un problema identificado por sus evaluaciones de razonamiento antes del despliegue.

Estrategias de optimización de costos para la arquitectura agéntica

La viabilidad económica de las arquitecturas agénticas depende de estrategias eficaces de gestión de costos. Si bien los agentes de IA ofrecen un valor comercial significativo, la gestión de los gastos operativos sigue siendo un factor crítico de éxito.

El desafío económico

En cuanto al costo, las organizaciones se enfrentan a dos consideraciones principales:

Costos de token: cada interacción con los modelos fundacionales genera cargos por token que se acumulan rápidamente a escala. Las redes de agentes complejas con razonamiento de varios pasos pueden generar entre 10 y 15 veces más tokens que llamadas directas similares a la API.

Costos computacionales: ejecutar inferencias, especialmente para razonamientos sofisticados, demanda recursos computacionales sustanciales. Los clústeres de GPU on premises para inferencia suelen requerir una gran inversión inicial. La inferencia basada en la nube puede incurrir en costos mensuales que oscilan entre 10 000 y 50 000 USD para despliegues de pequeña a mediana escala.

Enfoques de optimización eficaces

Las organizaciones líderes han desarrollado enfoques sistemáticos para gestionar estos costos.

1. Optimización arquitectónica

  • Diseño de agente híbrido que enruta decisiones complejas a modelos fundacionales
  • Cuantización de modelos para el despliegue de producción
  • Almacenamiento estratégico en caché de respuestas para consultas comunes

JPMorgan Chase redujo sus costos de inferencia en un 67 % gracias a una arquitectura híbrida que procesa el 89 % de las transacciones a través de rutas determinísticas, reservando los recursos LLM para escenarios complejos.

2. Ajuste de ingeniería rápida para mayor eficiencia

  • Precisión en el diseño de instrucciones para minimizar el uso de tokens
  • Poda contextual que elimina información innecesaria
  • Optimización del formato de respuesta para reducir la generación de tokens

3. Optimización por inferencia

  • Implementación de caché clave-valor (KV) para interacciones repetidas
  • Procesamiento por lotes para operaciones no urgentes
  • Adecuación del tamaño de la infraestructura de despliegue a los patrones de carga de trabajo

4. Implementación de RAG

  • Generación estratégica aumentada por recuperación para reducir el tamaño del contexto
  • Optimización de bases de datos vectoriales para un acceso eficiente a la información
  • Técnicas de destilación de contexto que comprimen información relevante

5. Ajuste para la especialización de dominios

  • Creación de modelos específicos de dominio con recuentos de parámetros reducidos
  • Destilación de modelos generales en variantes especializadas eficientes
  • Enfoques de ajuste de parámetros eficientes, como LoRA y QLoRA

El informe económico sobre IA de McKinsey en 2024 afirma que la implementación de tres o más de estas estrategias reduce los costos operativos de la IA en un promedio del 62 %, al tiempo que se mantienen o mejoran las capacidades del sistema. 

Desafíos de implementación

Las arquitecturas agénticas introducen nuevas consideraciones de implementación.

Complejidad de la orquestación
La coordinación de agentes autónomos requiere enfoques diferentes a los de la orquestación tradicional de microservicios:

  • La toma de decisiones descentralizada requiere una coordinación sofisticada
  • Varios agentes deben trabajar para alcanzar objetivos comunes
  • El estado del sistema se vuelve más complejo con los cambios asincrónicos

Los marcos modernos abordan estos desafíos a través de sistemas de priorización y contexto compartido. Semantic Kernel de Microsoft implementa una orquestación que equilibra la autonomía de los agentes con la coherencia del sistema.

Observabilidad y monitoreo
Los enfoques tradicionales de monitoreo deben evolucionar:

  • Los sistemas necesitan capturar rutas de razonamiento y criterios de decisión
  • El analytics de comportamiento ayuda a identificar patrones en las interacciones de los agentes
  • El monitoreo predictivo anticipa posibles estados del sistema

Seguridad y gobernanza
Las arquitecturas agénticas introducen nuevas dimensiones de seguridad:

  • Mecanismos para verificar que las instrucciones de los agentes se alineen con las políticas de la organización
  • Sistemas para validar las acciones de los agentes antes de la ejecución
  • Capacidades para inspeccionar el razonamiento de los agentes para el cumplimiento

Comparación de microservicios y sistemas agénticos: un caso de uso práctico

Para ilustrar la diferencia entre microservicios y arquitecturas agénticas, considere una plataforma de comercio de servicios financieros.

Implementación tradicional de microservicios:

  • Un servicio de cuentas gestiona la información y los saldos de los clientes
  • Un servicio comercial ejecuta órdenes basadas en solicitudes explícitas
  • Un servicio de datos de mercado proporciona precios cuando se le consulta
  • Un servicio de notificación envía alertas después de eventos predefinido
  • Un servicio de gestión de riesgos aplica comprobaciones basadas en reglas

Cuando un cliente realiza una operación, el sistema sigue una ruta predeterminada y cada paso ocurre cuando se activa explícitamente.

Implementación agéntica:

  • Un agente de cartera monitorea continuamente las posiciones y sugiere oportunidades de reequilibrio
  • Un agente de ejecución de operaciones selecciona el momento óptimo en función de las condiciones del mercado
  • Un agente de evaluación de riesgos valora de forma proactiva la volatilidad del mercado
  • Un agente de comunicación ofrece información relevante a través de los canales preferidos

En la práctica, la implementación agéntica crea experiencias del cliente fundamentalmente diferentes. Cuando aumenta la volatilidad del mercado, el agente de evaluación de riesgos podría ajustar de manera autónoma los límites de negociación y notificar al agente de cartera, que analiza las posiciones de los clientes en busca de posibles vulnerabilidades. El sistema demuestra inteligencia más allá de lo que se codificó explícitamente.

De cara al futuro: ingeniería de plataformas para escala agéntica

La progresión de monolitos a servicios, a microservicios y a agentes sigue patrones históricos claros. Cada evolución aportó componentes más granulares con creciente inteligencia y autonomía.

Las organizaciones que implementan arquitecturas agénticas a escala deben adoptar principios de ingeniería de plataforma para lograr una calidad, rentabilidad y gobernanza constantes en toda la cartera de aplicaciones.

Adopción impulsada por plataformas

Las organizaciones con visión de futuro utilizan plataformas internas de desarrolladores (IDP) para acelerar la adopción agéntica.

Infraestructura de agentes estandarizada

  • Plantillas de agentes preconfiguradas con monitoreo integrado
  • Patrones de implementación de la ruta dorada para tipos comunes de agentes
  • Despliegue de autoservicio con controles de calidad automatizados

Observabilidad unificada

  • Monitoreo centralizado del rendimiento y el comportamiento de los agentes
  • Trazado y visualización de la interacción entre agentes
  • Detección automatizada de anomalías con análisis de causa principal

Enfoque en la experiencia del desarrollador

  • Herramientas de autoservicio para el desarrollo y las pruebas de agentes
  • Entornos de desarrollo integrados con depuración de agentes especializados
  • Verificaciones automatizadas de cumplimiento durante el desarrollo

Gobernanza a escala

  • Gestión y aplicación centralizadas de políticas
  • Evaluación automatizada del comportamiento de los agentes frente a los estándares
  • Pistas de auditoría integrales para todas las acciones de los agentes

El informe de ingeniería de plataforma de Gartner para 2024 afirma que los enfoques de plataformas maduras permiten acelerar 3.2 veces el tiempo de comercialización de las nuevas capacidades de los agentes y aumentar la satisfacción de los desarrolladores en un 76 %. 

Las organizaciones ahora se enfrentan a una elección: liderar la adopción de la arquitectura agéntica para los casos de uso apropiados o seguir a los competidores que obtienen ventajas tempranas. La evidencia sugiere que los pioneros que implementan enfoques basados en plataformas obtienen ventajas competitivas sustanciales en velocidad de desarrollo, flexibilidad del sistema y capacidad técnica.

Soluciones relacionadas
IBM® watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Explore watsonx.ai
Soluciones de inteligencia artificial

Ponga a trabajar la IA en su negocio con la experiencia en IA líder del sector y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Consultoría y servicios de inteligencia artificial (IA)

Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.

Explore los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai Reserve una demostración en vivo