Infraestructuras de agentes de IA: elegir la base adecuada para su negocio

Autores

Rina Diane Caballar

Staff Writer

IBM Think

Cole Stryker

Staff Editor, AI Models

IBM Think

Desde un único agente de inteligencia artificial (IA) que monitorea y señala las transacciones fraudulentas para las instituciones financieras hasta un sistema multiagente para la gestión de la cadena de suministro que rastrea los niveles de inventario y pronostica la demanda, la IA agéntica puede ser una bendición para las empresas. Entonces, ¿cómo pueden las empresas dar primeros pasos con los agentes de IA? Aquí es donde entran en juego los marcos de agentes de IA.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Estructuras de infraestructura para agentes de IA: una estructura fundamental para la IA agéntica

Los agentes de IA son programas que pueden realizar una tarea de forma autónoma en nombre de un usuario. Estos sistemas de IA primero diseñan un plan con una serie de pasos para realizar una tarea compleja.

A continuación, usan la llamada a funciones para conectarse a herramientas externas, como interfaces de programación de aplicaciones (API), fuentes de datos, búsquedas sitio web e incluso otras IA que pueden ayudar a subsanar cualquier déficit en su conocimiento.

Después de ejecutar su plan de acción, los agentes autónomos aprenden de la retroalimentación y almacenan la información aprendida en la memoria para mejorar el rendimiento futuro.

Las organizaciones pueden crear agentes de IA desde cero utilizando lenguajes de programación, como Python o JavaScript. Sin embargo, un enfoque más rápido y escalable implica el uso de infraestructuras de IA.

Las infraestructuras de agentes de IA son los componentes básicos para desarrollar, desplegar y gestionar agentes de IA. Estas plataformas de software tienen características y funciones integradas que ayudan a agilizar y acelerar el proceso, que incluyen:

  • Una arquitectura predefinida que describe la estructura, las características y las capacidades de la IA agéntica.

  • Protocolos de comunicación que facilitan la interacción entre los agentes de IA y los usuarios humanos u otros agentes.

  • Sistemas de gestión de tareas para coordinarlas.

  • Herramientas de integración para llamadas a funciones.

  • Herramientas de monitoreo para rastrear el rendimiento de la IA agéntica.

Factores a considerar al elegir una infraestructura de agente de IA

Antes de adentrarse en el mundo de los agentes de IA, piense en los objetivos y casos de uso de su organización. El marco ideal logra un equilibrio entre sus capacidades, sus requerimientos a corto plazo y sus objetivos a largo plazo.

Estos son algunos aspectos a tener en cuenta al seleccionar una infraestructura de IA:

  • Complejidad

  • Privacidad y seguridad de los datos

  • Facilidad de uso

  • Integración perfecta

  • Rendimiento y escalabilidad

Complejidad

Identifique las tareas que desea que realice un agente de IA y su complejidad. Determine si necesita una implementación sencilla con un solo agente o un ecosistema multiagente.

Para entornos multiagente, identifique las interacciones de agentes requeridas y dónde aún se necesita intervención humana.

En el ámbito de la atención al cliente, por ejemplo, un solo agente de IA puede ayudar a clasificar la gravedad de los problemas que surgen. Sin embargo, si busca un flujo de trabajo más sólido, considere la posibilidad de crear un sistema con diferentes agentes para solucionar problemas, sugerir arreglos y asignar casos complicados a otros agentes humanos o de IA.

Privacidad y seguridad de los datos

La privacidad y la seguridad de los datos deben ser una prioridad al seleccionar una infraestructura. Verifique las políticas y medidas de seguridad de la infraestructura de su elección, incluyendo el cifrado para los datos en reposo y en tránsito, los controles de acceso y la eliminación de cualquier información sensible.

Facilidad de uso

Considera el nivel de habilidad de su equipo de desarrollo. Un entorno de IA apto para principiantes, como CrewAI, por ejemplo, tiene una interfaz sin código para la creación rápida de prototipos y plantillas de agentes de IA listas para usar para un despliegue rápido.

Los desarrolladores de IA más experimentados pueden optar por infraestructuras avanzadas, como LangGraph, que ofrecen control de bajo nivel y opciones de código personalizables.

Integración perfecta

Evalúe los marcos de IA agéntica en función de su compatibilidad con su pila existente. Compruebe qué tan bien se integra su elección de marco con sus fuentes de datos, infraestructura y herramientas actuales.

Averigüe cómo se desplegará la IA agéntica en su entorno, ya sea on premises o en la nube, y si se requiere un despliegue a pequeña o gran escala.

Rendimiento y escalabilidad

Evalúe el rendimiento del marco de agente de IA elegido. Piense en el tiempo de respuesta o la latencia de las aplicaciones en tiempo real, y evalúe si el rendimiento se degrada al procesar grandes volúmenes de datos o múltiples solicitudes simultáneas. Y aunque el enfoque puede estar en el corto plazo, piense en cómo la infraestructura se escala a medida que su negocio crece.

Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones reales

Descubra cómo la IA orientada a objetivos y basada en utilidades se adapta a los flujos de trabajo y entornos complejos.

Marcos populares de agentes de IA

La IA agéntica todavía se encuentra en sus primeras etapas. A medida que la tecnología detrás de los agentes de IA evoluciona, también lo hará la infraestructura subyacente. Estos son algunos marcos de agentes de IA populares actualmente:

AutoGen

AutoGen es un marco de código abierto de Microsoft para crear aplicaciones de IA multiagente para realizar tareas complejas. Su arquitectura consta de 3 capas:

  • Core es un marco de programación para desarrollar una red de agentes escalable y distribuida, con herramientas para rastrear y depurar flujos de trabajo de agentes. Usa mensajería asíncrona, que admite interacciones de agentes tanto de solicitud-respuesta como basadas en eventos.

  • AgentChat se basa en Core y se puede utilizar para crear asistentes de IA conversacionales. Es el punto de partida propuesto para los principiantes, ya que ofrece por defecto agentes individuales y equipos multiagente con comportamientos y patrones de interacción predefinidos.

  • Extensions es un paquete que contiene implementaciones de los componentes Core y AgentChat para ampliar aún más sus capacidades e interfaz con bibliotecas externas y otros servicios. Puede emplear las extensiones integradas y las desarrolladas por la comunidad AutoGen, o incluso crear las propias.

AutoGen también proporciona 2 herramientas prácticas para desarrolladores: AutoGen Bench para evaluar y comparar el rendimiento de la IA agéntica y AutoGen Studio para una interfaz sin código para desarrollar agentes. AutoGen está disponible para su acceso en GitHub.

CrewAI

CrewAI es un marco de orquestación para soluciones de IA multiagente. Al igual que AutoGen, CrewAI es de código abierto.

La arquitectura de CrewAI basada en roles trata a la IA agéntica como un “equipo” de “trabajadores”. Estos son los componentes principales de un equipo:

  • A los agentes se les asignan roles especializados mientras siguen colaborando en flujos de trabajo complejos. Los desarrolladores pueden usar lenguaje natural para describir el rol, el objetivo y el contexto de un agente.

  • Las tareas definen las responsabilidades específicas de cada agente. Los desarrolladores también pueden emplear el lenguaje natural para describir la tarea y el resultado esperado de cada agente.

  • Un proceso identifica cómo los agentes trabajan juntos y cómo se ejecutan las tareas. Puede ser secuencial, con tareas completadas según un orden preestablecido, o jerárquico, con un agente administrador personalizado que monitorea la delegación, ejecución y finalización de tareas.

Una de las colecciones de ejemplos de CrewAI incluye un equipo de análisis del mercado de valores. Este equipo colabora de manera secuencial, con un agente analista de mercado encargado de analizar los datos de una acción en particular, un agente investigador encargado de recopilar información de apoyo que valide el análisis de datos y un agente de estrategia encargado de crear una acción paso a paso, con base en el análisis y los datos de apoyo.

CrewAI admite conexiones a varios modelos de lenguaje grandes (LLM), incluidos Claude de Anthropic, Gemini de Google, los modelos de IA de Mistral, los modelos GPT de OpenAI y los modelos fundacionales de IBM® watsonx.ai.

El marco también tiene una suite de herramientas de generación aumentada por recuperación (RAG) para buscar diferentes fuentes de datos.

CrewAI está disponible para su acceso en GitHub.

LangChain

LangChain es otro marco de código abierto para crear aplicaciones impulsadas por LLM, incluidos chatbots ,como ChatGPT y agentes de IA.

Emplea una arquitectura modular, en la que cada módulo representa abstracciones que encapsulan los conceptos complejos y los pasos necesarios para trabajar con LLM.

Estos componentes modulares se pueden encadenar para crear aplicaciones de IA.

LangChain es útil para desarrollar agentes de IA simples con flujos de trabajo sencillos. Proporciona soporte para bases de datos vectoriales y utilidades para incorporar memoria en las aplicaciones, conservando así el historial y el contexto.

Su plataforma LangSmith permite depurar, probar y monitorear el rendimiento.

LangChain está disponible para su acceso en GitHub.

LangGraph

LangGraph reside dentro del ecosistema LangChain. La infraestructura sobresale en la orquestación de flujos de trabajo complejos para sistemas multiagente.

Aplica una arquitectura de grafos, en la que las tareas o acciones específicas de los agentes de IA se representan como nodos, mientras que las transiciones entre esas acciones se representan como aristas.

Un componente de estado mantiene la lista de tareas en todas las interacciones. Este tipo de arquitectura es adecuada para flujos de trabajo cíclicos, condicionales o no lineales.

Por ejemplo, una aerolínea podría crear un agente de viajes de asistente de IA que ayude a los usuarios a encontrar y reservar vuelos. Con LangGraph, cada una de esas acciones se representará como nodos, y esos nodos pueden tener varios agentes que realizan tareas particulares.

Se puede agregar un paso human-in-the-loop para que los usuarios puedan elegir un vuelo de la lista de búsqueda, y si nada se adapta a sus preferencias, el agente asistente de viajes puede volver fácilmente al nodo "buscar vuelos" y rehacer la búsqueda.

LangGraph está disponible para su acceso en GitHub.

LlamaIndex

LlamaIndex es un marco de orquestación de datos de código abierto para crear soluciones de IA generativa (gen AI) e IA agéntica. Ofrece agentes y herramientas preempaquetados y flujos de trabajo recientemente introducidos, un mecanismo para desarrollar sistemas multiagente.

Estos son los elementos principales que componen un flujo de trabajo en LlamaIndex:

  • Los pasos son las acciones específicas de un agente. Estos son los componentes básicos de un flujo de trabajo.

  • Los eventos desencadenan pasos y son el medio por el cual los pasos se comunican.

  • El contexto se comparte a través del flujo de trabajo para que los pasos puedan almacenar, recuperar y pasar datos y mantener el estado a lo largo de su ejecución.

Esta arquitectura basada en eventos permite que los pasos del flujo de trabajo se realicen de forma asincrónica. Esto significa que, a diferencia de una arquitectura gráfica, no es necesario definir las rutas entre los pasos, lo que da como resultado transiciones más flexibles entre las acciones del agente.

Como tal, los flujos de trabajo de LlamaIndex son adecuados para aplicaciones de agentes de IA más dinámicos que necesitan volver con frecuencia a pasos anteriores o ramificarse en varios pasos.

LlamaIndex está disponible para su acceso en GitHub.

Semantic Kernel

Semantic Kernel es un kit de desarrollo de código abierto de Microsoft para crear aplicaciones de IA generativa de nivel empresarial. Su infraestructura de agentes, actualmente marcada como experimental, proporciona abstracciones básicas para crear agentes.

Tiene 2 implementaciones de agentes integradas: un agente de finalización de chat y un agente asistente más avanzado.

Se pueden orquestar múltiples agentes a través de chats grupales o mediante el uso de infraestructura de procesos de Semantic Kernel (también marcado como experimental) para flujos de trabajo más complejos.

Un proceso consta de pasos, que representan las tareas asignadas a los agentes de IA y describen cómo fluyen los datos entre los pasos.

Semantic Kernel está disponible para su acceso en GitHub.

Para una toma de decisiones más informada, considere experimentar con sus infraestructuras preferidas. Comience con una implementación simple de un solo agente para probar cómo funciona cada infraestructura y cómo se compara con otras.

La infraestructura adecuada se alinea con las necesidades de su empresa y puede ayudar a crear agentes de IA que automaticen los flujos de trabajo, lo que lleva a procesos de negocio más eficientes.

Soluciones relacionadas
Desarrollo de agentes de IA de IBM 

Permita a los desarrolladores crear, desplegar y monitorear agentes de IA con el estudio IBM watsonx.ai.

 

Explore watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA
Dé el siguiente paso

Ya sea que elija personalizar aplicaciones y habilidades predefinidas o crear y desplegar servicios agénticos personalizados utilizando un estudio de IA, la plataforma IBM watsonx responde a sus necesidades.

Explore watsonx Orchestrate Explore watsonx.ai