Marcos de agentes de IA: cómo elegir la base adecuada para su empresa

Autores

Rina Diane Caballar

Staff Writer

IBM Think

Cole Stryker

Staff Editor, AI Models

IBM Think

Desde un único agente de inteligencia artificial (IA) que monitoriza y detecta las transacciones fraudulentas para las instituciones financieras hasta un sistema multiagente para la gestión de la cadena de suministro que rastrea los niveles de inventario y prevé la demanda, la IA agentiva puede ser una bendición para las empresas. ¿Cómo pueden las empresas empezar a utilizar agentes de IA? Aquí es donde entran en juego los marcos de los agentes de IA.

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Está suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Marcos de agentes de IA: una estructura fundacional para la IA agéntica

Los agentes de IA son programas que pueden realizar una tarea de forma autónoma en nombre de un usuario. Estos sistemas de IA primero diseñan un plan con una serie de pasos para realizar una tarea compleja.

A continuación, utilizan las llamadas a funciones para conectarse a herramientas externas, como interfaces de programación de aplicaciones (API), fuentes de datos, búsquedas web e incluso otros agentes de IA, que pueden ayudar a llenar cualquier laguna en sus conocimientos.

Después de ejecutar su plan de acción, los agentes autónomos aprenden de los comentarios y almacenan la información aprendida en la memoria para mejorar el rendimiento futuro.

Las organizaciones pueden crear agentes de IA desde cero utilizando lenguajes de programación como Python o JavaScript. Sin embargo, un enfoque más rápido y escalable implica el uso de marcos de agentes de IA.

Los marcos agentivos son los componentes básicos para desarrollar, implementar y gestionar agentes de IA. Estas plataformas de software tienen características y funciones integradas que ayudan a agilizar y acelerar el proceso, entre ellas:

  • Una arquitectura predefinida que describe la estructura, las características y las capacidades de la IA agentiva.

  • Protocolos de comunicación que facilitan la interacción entre los agentes de IA y los usuarios humanos u otros agentes.

  • Sistemas de gestión de tareas para coordinar tareas.

  • Herramientas de integración para llamadas a funciones.

  • Herramientas de monitorización para realizar un seguimiento del rendimiento de la IA agentiva.

Factores a tener en cuenta al elegir un marco de agente de IA

Antes de sumergirse en el mundo de los agentes de IA, piense en los objetivos y casos de uso de su organización. El marco ideal logra un equilibrio entre sus capacidades técnicas, sus requisitos a corto plazo y sus objetivos a largo plazo.

Estos son algunos aspectos a tener en cuenta al seleccionar un marco de agente de IA:

  • Complejidad

  • Privacidad y seguridad de los datos

  • Facilidad de uso

  • Integración fluida

  • Rendimiento y escalabilidad

Complexity

Identifique las tareas que desea que realice un agente de IA y qué tan complejas son estas tareas. Determine si necesita una implementación simple con un solo agente o un ecosistema de múltiples agentes.

Para entornos multiagente, identifique las interacciones de agentes requeridas y dónde aún se necesita intervención humana.

En el ámbito de la atención al cliente, por ejemplo, un solo agente de IA puede ayudar a clasificar la gravedad de los problemas que se presentan. Sin embargo, si busca un flujo de trabajo más sólido, considere crear un sistema multiagente con diferentes agentes para solucionar problemas, sugerir correcciones y asignar casos complicados a otros agentes humanos o de IA.

Protección y seguridad de los datos

La protección de datos y la seguridad deben ser una prioridad a la hora de seleccionar un marco. Verifique las políticas y medidas de seguridad del marco de su elección, incluyendo el cifrado de datos en reposo y en tránsito, los controles de acceso y la eliminación de cualquier información confidencial.

Facilidad de uso

Considere el nivel de habilidades de su equipo de desarrollo. Un marco de IA apto para principiantes como CrewAI, por ejemplo, tiene una interfaz no-code para la creación rápida de prototipos y plantillas de agentes de IA listas para una implementación rápida.

Los desarrolladores de IA más experimentados pueden optar por marcos de agentes avanzados como LangGraph, que ofrecen un control de bajo nivel y opciones de código personalizables.

Seamless integration

Evalúe los marcos de trabajo de IA agentiva en función de su compatibilidad con su pila tecnológica existente. Compruebe lo bien que se integra su elección de marco con sus fuentes de datos, infraestructura y herramientas actuales.

Averigüe cómo se implementará la IA agentiva en su entorno, ya sea on-premises o en la nube, y si se requiere una implementación a pequeña o gran escala.

Rendimiento y escalabilidad

Evalúe el rendimiento del marco de agentes de IA elegido. Piense en el tiempo de respuesta o la latencia de las aplicaciones en tiempo real y evalúe si el rendimiento se deteriora al procesar enormes volúmenes de datos o varias solicitudes simultáneas. Y aunque el enfoque puede estar en el corto plazo, piense en cómo el marco se escala a medida que crece su negocio.

Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones del mundo real

Descubra cómo la IA basada en objetivos y servicios se adapta a flujos de trabajo y entornos complejos.

Marcos de agentes de IA populares

La IA agentiva todavía está en sus primeras etapas. A medida que evoluciona la tecnología detrás de los agentes de IA, también lo harán los marcos que los sustentan. A continuación se muestran algunos marcos de agentes de IA populares actualmente:

AutoGen

AutoGen es un marco de código abierto de Microsoft para crear aplicaciones de IA multiagente para realizar tareas complejas. Su arquitectura consta de tres capas:

  • Core es un marco de programación para desarrollar una red de agentes escalable y distribuida, con herramientas para rastrear y depurar flujos de trabajo de agentes. Emplea mensajería asíncrona, que admite interacciones de agentes tanto de solicitud-respuesta como basadas en eventos.

  • AgentChat se basa en Core y se puede utilizar para crear asistentes de IA conversacionales. Es el punto de partida propuesto para principiantes, puesto que ofrece agentes únicos predeterminados y equipos multiagente con comportamientos y patrones de interacción predefinidos.

  • Extensions es un paquete que contiene implementaciones de componentes Core y AgentChat para ampliar aún más sus capacidades e interactuar con bibliotecas externas y otros servicios. Puede utilizar las extensiones integradas y las desarrolladas por la comunidad AutoGen, o incluso crear las suyas propias.

AutoGen también proporciona dos prácticas herramientas para desarrolladores: AutoGen Bench, para evaluar y comparar el rendimiento de la IA agentiva, y AutoGen Studio, una interfaz sin código para desarrollar agentes. AutoGen está disponible para acceder en GitHub.

CrewAI

CrewAI es un marco de orquestación para soluciones de IA multiagente. Al igual que AutoGen, CrewAI es de código abierto.

La arquitectura basada en roles de CrewAI trata a la IA agentiva como un "equipo" de "trabajadores". Estos son los componentes principales de una tripulación:

  • A los agentes se les asignan roles especializados sin dejar de colaborar en flujos de trabajo complejos. Los desarrolladores pueden utilizar el lenguaje natural para describir el rol, el objetivo y la historia de fondo de un agente.

  • Las tareas definen las responsabilidades específicas de cada agente. Los desarrolladores también pueden utilizar el lenguaje natural para describir la tarea y el resultado esperado de cada agente.

  • Un proceso identifica la forma en que los agentes trabajan juntos y la forma en que se ejecutan las tareas. Puede ser secuencial, con tareas completadas según un orden preestablecido, o jerárquico, con un agente gestor personalizado que supervisa la delegación, ejecución y finalización de las tareas.

Uno de los ejemplos de la colección de CrewAI incluye un equipo de análisis del mercado de valores. Este equipo colabora de forma secuencial, con un agente analista de mercado encargado de analizar los datos de un valor concreto, un agente investigador encargado de recopilar información de apoyo que valide el análisis de los datos y un agente de estrategia encargado de crear un plan de acción paso a paso basado en el análisis y los datos de apoyo.

CrewAI admite conexiones a varios modelos de lenguaje de gran tamaño (LLM), incluidos Claude de Anthropic, Gemini de Google, los modelos deIA de Mistral, los modelos GPT de OpenAI y los modelos fundacionales de IBM watsonx.ai.

El marco también cuenta con un conjunto de generación aumentada por recuperación (RAG) para buscar en diferentes fuentes de datos.

CrewAI está disponible para acceder en GitHub.

LangChain

LangChain es otro marco de código abierto para crear aplicaciones basadas en LLM, incluidos chatbots como ChatGPT y agentes de IA.

Emplea una arquitectura modular, en la que cada módulo representa abstracciones que encapsulan los complejos conceptos y pasos necesarios para trabajar con LLM.

Estos componentes modulares se pueden encadenar para crear aplicaciones de IA.

LangChain es útil para desarrollar agentes de IA simples con flujos de trabajo sencillos. Ofrece soporte para bases de datos vectoriales y servicios para incorporar memoria a las aplicaciones, conservando así la historia y el contexto.

Su plataforma LangSmith permite la depuración, las pruebas y la monitorización del rendimiento.

LangChain está disponible para acceder en GitHub.

LangGraph

LangGraph vive dentro del ecosistema LangChain. El marco excels en la orquestación de flujos de trabajo complejos para sistemas multiagente.

Aplica una arquitectura de grafos, en la que las tareas o acciones específicas de los agentes de IA se representan como nodos, mientras que las transiciones entre esas acciones se representan como aristas.

Un componente de estado mantiene la lista de tareas en todas las interacciones. Este tipo de arquitectura es adecuada para flujos de trabajo cíclicos, condicionales o no lineales.

Por ejemplo, una aerolínea podría querer crear un agente de IA asistente de viajes que ayude a los usuarios a encontrar y reservar vuelos. Usando LangGraph, cada una de esas acciones será representada como nodos, y esos nodos pueden tener múltiples agentes realizando tareas particulares.

Se puede añadir un paso humano en el bucle para que los usuarios puedan elegir un vuelo de la lista de búsqueda, y si nada se ajusta a sus preferencias, el agente asistente de viajes puede volver fácilmente al nodo "buscar vuelos" y rehacer la búsqueda.

Se puede acceder a LangGraph en GitHub.

LlamaIndex

LlamaIndex es un marco de orquestación de datos de código abierto para crear soluciones de IA generativa (IA gen) e IA agentiva. Ofrece agentes y herramientas preempaquetados y flujos de trabajo recientemente introducidos, un mecanismo para desarrollar sistemas multiagente.

Estos son los principales elementos que componen un flujo de trabajo en LlamaIndex:

  • Los pasos son las acciones específicas de un agente. Estos son los componentes básicos de un flujo de trabajo.

  • Los eventos desencadenan pasos y son el medio por el que se comunican los pasos.

  • El contexto se comparte en todo el flujo de trabajo para que los pasos puedan almacenar, recuperar y pasar datos y mantener el estado a lo largo de su ejecución.

Esta arquitectura basada en eventos permite que los pasos del flujo de trabajo se realicen de forma asíncrona. Esto significa que, a diferencia de una arquitectura de gráficos, no es necesario definir los caminos entre los pasos, lo que da lugar a transiciones más flexibles entre las acciones de los agentes.

Como tal, los flujos de trabajo de LlamaIndex son muy adecuados para las aplicaciones de agentes de IA más dinámicas que necesitan volver a menudo a pasos anteriores o bifurcarse en varios pasos.

LlamaIndex está disponible para acceder en GitHub.

Semantic Kernel

Semantic Kernel es un kit de desarrollo de código abierto de Microsoft para crear aplicaciones de IA generativa de nivel empresarial. Su Agent Framework, actualmente marcado como experimental, proporciona abstracciones básicas para crear agentes.

Cuenta con dos implementaciones de agente integradas: un agente de finalización de chat y un agente asistente más avanzado.

Se pueden orquestar múltiples agentes a través de chats de grupo o utilizando el Process Framework de Semantic Kernel (también marcado como experimental) para flujos de trabajo más complejos.

Un proceso consta de pasos, que representan las tareas asignadas a los agentes de IA y describen cómo fluyen los datos entre pasos.

Semantic Kernel está disponible para acceder en GitHub.

Para una toma de decisiones más informada, considere experimentar con sus marcos preferidos. Comience poco a poco con una implementación sencilla de un solo agente para probar cómo funciona cada marco y cómo se compara con otros.

El marco agentivo adecuado se alinea con las necesidades de su empresa y puede ayudar a crear agentes de IA que automaticen los flujos de trabajo, lo que conduce a procesos empresariales más eficientes.

Soluciones relacionadas
Desarrollo de agentes de IA de IBM 

Permita a los desarrolladores crear, implementar y monitorizar agentes de IA con el estudio IBM watsonx.ai.

 

Explore watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.

Explore las soluciones de IA
Consultoría y servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA
Dé el siguiente paso

Tanto si opta por personalizar las aplicaciones y habilidades prediseñadas como si prefiere crear e implementar servicios agentivos personalizados mediante un estudio de IA, la plataforma IBM watsonx le ofrece todo lo que necesita.

Explore watsonx Orchestrate Explore watsonx.ai