Las últimas tendencias de IA presentadas por expertos
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Desde un único agente de inteligencia artificial (IA) que monitorea y señala las transacciones fraudulentas para las instituciones financieras hasta un sistema multiagente para la gestión de la cadena de suministro que rastrea los niveles de inventario y pronostica la demanda, la IA agéntica puede ser una bendición para las empresas. Entonces, ¿cómo pueden las empresas dar primeros pasos con los agentes de IA? Aquí es donde entran en juego los marcos de agentes de IA.
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Los agentes de IA son programas que pueden realizar una tarea de forma autónoma en nombre de un usuario. Estos sistemas de IA primero diseñan un plan con una serie de pasos para realizar una tarea compleja.
A continuación, usan la llamada a funciones para conectarse a herramientas externas, como interfaces de programación de aplicaciones (API), fuentes de datos, búsquedas sitio web e incluso otras IA que pueden ayudar a subsanar cualquier déficit en su conocimiento.
Después de ejecutar su plan de acción, los agentes autónomos aprenden de la retroalimentación y almacenan la información aprendida en la memoria para mejorar el rendimiento futuro.
Las organizaciones pueden crear agentes de IA desde cero utilizando lenguajes de programación, como Python o JavaScript. Sin embargo, un enfoque más rápido y escalable implica el uso de infraestructuras de IA.
Las infraestructuras de agentes de IA son los componentes básicos para desarrollar, desplegar y gestionar agentes de IA. Estas plataformas de software tienen características y funciones integradas que ayudan a agilizar y acelerar el proceso, que incluyen:
Una arquitectura predefinida que describe la estructura, las características y las capacidades de la IA agéntica.
Protocolos de comunicación que facilitan la interacción entre los agentes de IA y los usuarios humanos u otros agentes.
Sistemas de gestión de tareas para coordinarlas.
Herramientas de integración para llamadas a funciones.
Herramientas de monitoreo para rastrear el rendimiento de la IA agéntica.
Antes de adentrarse en el mundo de los agentes de IA, piense en los objetivos y casos de uso de su organización. El marco ideal logra un equilibrio entre sus capacidades, sus requerimientos a corto plazo y sus objetivos a largo plazo.
Estos son algunos aspectos a tener en cuenta al seleccionar una infraestructura de IA:
Complejidad
Privacidad y seguridad de los datos
Facilidad de uso
Integración perfecta
Rendimiento y escalabilidad
Identifique las tareas que desea que realice un agente de IA y su complejidad. Determine si necesita una implementación sencilla con un solo agente o un ecosistema multiagente.
Para entornos multiagente, identifique las interacciones de agentes requeridas y dónde aún se necesita intervención humana.
En el ámbito de la atención al cliente, por ejemplo, un solo agente de IA puede ayudar a clasificar la gravedad de los problemas que surgen. Sin embargo, si busca un flujo de trabajo más sólido, considere la posibilidad de crear un sistema con diferentes agentes para solucionar problemas, sugerir arreglos y asignar casos complicados a otros agentes humanos o de IA.
La privacidad y la seguridad de los datos deben ser una prioridad al seleccionar una infraestructura. Verifique las políticas y medidas de seguridad de la infraestructura de su elección, incluyendo el cifrado para los datos en reposo y en tránsito, los controles de acceso y la eliminación de cualquier información sensible.
Considera el nivel de habilidad de su equipo de desarrollo. Un entorno de IA apto para principiantes, como CrewAI, por ejemplo, tiene una interfaz sin código para la creación rápida de prototipos y plantillas de agentes de IA listas para usar para un despliegue rápido.
Los desarrolladores de IA más experimentados pueden optar por infraestructuras avanzadas, como LangGraph, que ofrecen control de bajo nivel y opciones de código personalizables.
Evalúe los marcos de IA agéntica en función de su compatibilidad con su pila existente. Compruebe qué tan bien se integra su elección de marco con sus fuentes de datos, infraestructura y herramientas actuales.
Averigüe cómo se desplegará la IA agéntica en su entorno, ya sea on premises o en la nube, y si se requiere un despliegue a pequeña o gran escala.
Evalúe el rendimiento del marco de agente de IA elegido. Piense en el tiempo de respuesta o la latencia de las aplicaciones en tiempo real, y evalúe si el rendimiento se degrada al procesar grandes volúmenes de datos o múltiples solicitudes simultáneas. Y aunque el enfoque puede estar en el corto plazo, piense en cómo la infraestructura se escala a medida que su negocio crece.
La IA agéntica todavía se encuentra en sus primeras etapas. A medida que la tecnología detrás de los agentes de IA evoluciona, también lo hará la infraestructura subyacente. Estos son algunos marcos de agentes de IA populares actualmente:
AutoGen es un marco de código abierto de Microsoft para crear aplicaciones de IA multiagente para realizar tareas complejas. Su arquitectura consta de 3 capas:
Core es un marco de programación para desarrollar una red de agentes escalable y distribuida, con herramientas para rastrear y depurar flujos de trabajo de agentes. Usa mensajería asíncrona, que admite interacciones de agentes tanto de solicitud-respuesta como basadas en eventos.
AgentChat se basa en Core y se puede utilizar para crear asistentes de IA conversacionales. Es el punto de partida propuesto para los principiantes, ya que ofrece por defecto agentes individuales y equipos multiagente con comportamientos y patrones de interacción predefinidos.
Extensions es un paquete que contiene implementaciones de los componentes Core y AgentChat para ampliar aún más sus capacidades e interfaz con bibliotecas externas y otros servicios. Puede emplear las extensiones integradas y las desarrolladas por la comunidad AutoGen, o incluso crear las propias.
AutoGen también proporciona 2 herramientas prácticas para desarrolladores: AutoGen Bench para evaluar y comparar el rendimiento de la IA agéntica y AutoGen Studio para una interfaz sin código para desarrollar agentes. AutoGen está disponible para su acceso en GitHub.
CrewAI es un marco de orquestación para soluciones de IA multiagente. Al igual que AutoGen, CrewAI es de código abierto.
La arquitectura de CrewAI basada en roles trata a la IA agéntica como un “equipo” de “trabajadores”. Estos son los componentes principales de un equipo:
A los agentes se les asignan roles especializados mientras siguen colaborando en flujos de trabajo complejos. Los desarrolladores pueden usar lenguaje natural para describir el rol, el objetivo y el contexto de un agente.
Las tareas definen las responsabilidades específicas de cada agente. Los desarrolladores también pueden emplear el lenguaje natural para describir la tarea y el resultado esperado de cada agente.
Un proceso identifica cómo los agentes trabajan juntos y cómo se ejecutan las tareas. Puede ser secuencial, con tareas completadas según un orden preestablecido, o jerárquico, con un agente administrador personalizado que monitorea la delegación, ejecución y finalización de tareas.
Una de las colecciones de ejemplos de CrewAI incluye un equipo de análisis del mercado de valores. Este equipo colabora de manera secuencial, con un agente analista de mercado encargado de analizar los datos de una acción en particular, un agente investigador encargado de recopilar información de apoyo que valide el análisis de datos y un agente de estrategia encargado de crear una acción paso a paso, con base en el análisis y los datos de apoyo.
CrewAI admite conexiones a varios modelos de lenguaje grandes (LLM), incluidos Claude de Anthropic, Gemini de Google, los modelos de IA de Mistral, los modelos GPT de OpenAI y los modelos fundacionales de IBM® watsonx.ai.
El marco también tiene una suite de herramientas de generación aumentada por recuperación (RAG) para buscar diferentes fuentes de datos.
CrewAI está disponible para su acceso en GitHub.
LangChain es otro marco de código abierto para crear aplicaciones impulsadas por LLM, incluidos chatbots ,como ChatGPT y agentes de IA.
Emplea una arquitectura modular, en la que cada módulo representa abstracciones que encapsulan los conceptos complejos y los pasos necesarios para trabajar con LLM.
Estos componentes modulares se pueden encadenar para crear aplicaciones de IA.
LangChain es útil para desarrollar agentes de IA simples con flujos de trabajo sencillos. Proporciona soporte para bases de datos vectoriales y utilidades para incorporar memoria en las aplicaciones, conservando así el historial y el contexto.
Su plataforma LangSmith permite depurar, probar y monitorear el rendimiento.
LangChain está disponible para su acceso en GitHub.
LangGraph reside dentro del ecosistema LangChain. La infraestructura sobresale en la orquestación de flujos de trabajo complejos para sistemas multiagente.
Aplica una arquitectura de grafos, en la que las tareas o acciones específicas de los agentes de IA se representan como nodos, mientras que las transiciones entre esas acciones se representan como aristas.
Un componente de estado mantiene la lista de tareas en todas las interacciones. Este tipo de arquitectura es adecuada para flujos de trabajo cíclicos, condicionales o no lineales.
Por ejemplo, una aerolínea podría crear un agente de viajes de asistente de IA que ayude a los usuarios a encontrar y reservar vuelos. Con LangGraph, cada una de esas acciones se representará como nodos, y esos nodos pueden tener varios agentes que realizan tareas particulares.
Se puede agregar un paso human-in-the-loop para que los usuarios puedan elegir un vuelo de la lista de búsqueda, y si nada se adapta a sus preferencias, el agente asistente de viajes puede volver fácilmente al nodo "buscar vuelos" y rehacer la búsqueda.
LangGraph está disponible para su acceso en GitHub.
LlamaIndex es un marco de orquestación de datos de código abierto para crear soluciones de IA generativa (gen AI) e IA agéntica. Ofrece agentes y herramientas preempaquetados y flujos de trabajo recientemente introducidos, un mecanismo para desarrollar sistemas multiagente.
Estos son los elementos principales que componen un flujo de trabajo en LlamaIndex:
Los pasos son las acciones específicas de un agente. Estos son los componentes básicos de un flujo de trabajo.
Los eventos desencadenan pasos y son el medio por el cual los pasos se comunican.
El contexto se comparte a través del flujo de trabajo para que los pasos puedan almacenar, recuperar y pasar datos y mantener el estado a lo largo de su ejecución.
Esta arquitectura basada en eventos permite que los pasos del flujo de trabajo se realicen de forma asincrónica. Esto significa que, a diferencia de una arquitectura gráfica, no es necesario definir las rutas entre los pasos, lo que da como resultado transiciones más flexibles entre las acciones del agente.
Como tal, los flujos de trabajo de LlamaIndex son adecuados para aplicaciones de agentes de IA más dinámicos que necesitan volver con frecuencia a pasos anteriores o ramificarse en varios pasos.
Semantic Kernel es un kit de desarrollo de código abierto de Microsoft para crear aplicaciones de IA generativa de nivel empresarial. Su infraestructura de agentes, actualmente marcada como experimental, proporciona abstracciones básicas para crear agentes.
Tiene 2 implementaciones de agentes integradas: un agente de finalización de chat y un agente asistente más avanzado.
Se pueden orquestar múltiples agentes a través de chats grupales o mediante el uso de infraestructura de procesos de Semantic Kernel (también marcado como experimental) para flujos de trabajo más complejos.
Un proceso consta de pasos, que representan las tareas asignadas a los agentes de IA y describen cómo fluyen los datos entre los pasos.
Semantic Kernel está disponible para su acceso en GitHub.
Para una toma de decisiones más informada, considere experimentar con sus infraestructuras preferidas. Comience con una implementación simple de un solo agente para probar cómo funciona cada infraestructura y cómo se compara con otras.
La infraestructura adecuada se alinea con las necesidades de su empresa y puede ayudar a crear agentes de IA que automaticen los flujos de trabajo, lo que lleva a procesos de negocio más eficientes.
Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.
Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.