AgentGPT es una plataforma de inteligencia artificial (IA) de código abierto basada en navegador que permite a los usuarios crear, configurar y desplegar agentes de IA.
A diferencia de las iteraciones actuales de ChatGPT de OpenAI, AgentGPT permite crear agentes de IA autónomos capaces de pensar, planear, actuar y adaptar hacia un objetivo definido por el usuario, con un mínimo de instrucciones manuales. Una característica que hace que AgentGPT sea especial es su interfaz fácil de usar, que hace que la funcionalidad del agente de IA sea accesible para todo tipo de casos de uso, como investigación y recopilación de datos, resolución exploratoria de problemas, generación de ideas, automatización de tareas repetitivas, creación de chatbots y más.
AgentGPT es una herramienta sin código, lo que significa que los usuarios no necesitan escribir software ni configurar un entorno de desarrollo para definir un objetivo, seleccionar un modelo y desplegar agentes. Se proporcionan plantillas para ayudar a los principiantes a comprender cómo enmarcar objetivos efectivos.
AgentGPT es un proyecto de código abierto desarrollado principalmente por un equipo de Reworkd AI. La startup con sede en San Francisco lanzó la herramienta en abril de 2023 y continúa manteniéndola. En términos de precios, Reworkd ofrece una versión gratuita, así como un servicio alojado con niveles de pago. El proyecto ganó atención desde el principio en parte porque era abierto y accesible, con código y documentación disponibles en Github.
Cabe destacar que las siglas “GPT” en AgentGPT significan transformador preentrenado generativo, una familia de modelos de lenguaje grandes (LLM) basados en una arquitectura de aprendizaje profundo de transformador. Se llama AgentGPT porque el GPT actúa como un agente autónomo, no solo como un chatbot, como en ChatGPT, aunque ambos se basan en los mismos modelos de OpenAI, como GPT-3.5 y GPT-4, tras bambalinas.
AgentGPT no debe confundirse con otras herramientas de IA agéntica como AutoGPT, que es una herramienta similar que se ejecuta en las máquinas personales de los usuarios en lugar de en la web. BabyAGI es otra plataforma agéntica más técnica, basada en Python, que a menudo se utiliza como herramienta fundamental para los desarrolladores.
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Un agente es un sistema impulsado por IA que realiza tareas de forma autónoma diseñando flujos de trabajo con las herramientas disponibles. Los LLM tradicionales, como los modelos IBM® Granite, producen sus respuestas con base en los datos utilizados para entrenarlos y están vinculados por limitaciones de conocimiento y razonamiento.
Los agentes, por el contrario, pueden hacer mucho más que solo hablar con los usuarios. Un LLM puede considerarse como una especie de cerebro. Un agente es un sistema que utiliza un cerebro de LLM para pensar y actuar. Los agentes utilizan su cerebro para planificar y realizar tareas complejas que requieren un razonamiento de varios pasos en la búsqueda de objetivos a largo plazo, con una entrada humana mínima.
Supongamos que quiere abrir una cafetería, pero no sabe qué características debe tener una buena ubicación. Desea identificar criterios para buenas ubicaciones, recopilar evidencia, reducir las áreas candidatas y sacar a la luz las compensaciones y los riesgos. Su agente será un analista de investigación júnior. ¿Pero qué herramienta usar? Ambos utilizan el machine learning para realizar la generación de contenido, por lo que teóricamente podría usar ChatGPT (o algún otro chatbot impulsado por LLM) para un proyecto como este.
Vale la pena señalar que la capacidad de AgentGPT para realizar búsquedas web en tiempo real y acceder a otras herramientas externas precedió a la funcionalidad similar de ChatGPT, aunque ahora ambas herramientas tienen esta capacidad. Dicho esto, AgentGPT todavía tiene sus fortalezas.
ChatGPT sobresale si desea hacer preguntas de seguimiento, cuestionar sus suposiciones y desafiar y refinar ideas de forma interactiva. Sin embargo, si la tarea consta de varios pasos, la ruta no está clara y no desea dirigirla manualmente en cada paso del camino, AgentGPT podría ser la mejor herramienta.
ChatGPT espera a que se le diga qué hacer, y tendrá que guiarlo en cada paso del camino. Por el contrario, AgentGPT toma su objetivo inicial y lo sigue, decidiendo por sí mismo los mejores pasos a seguir. Es ideal para sacar a la luz “incógnitas desconocidas” y explorar territorios sobre los que quizás ni siquiera haya pensado en preguntar.
Con ChatGPT, tendría que preguntar en cada paso:
Con AgentGPT, puede simplemente decir “Investiga qué características debe tener una buena ubicación de una cafetería” y dejar que el agente dé una respuesta exhaustivamente investigada. El agente se hará esas preguntas y las responderá de forma proactiva por usted.
Supongamos que desea crear un agente que monitoree las nuevas regulaciones, tendencias y tecnologías que afectan a las cafeterías y resuma los riesgos y oportunidades semanales, en un informe ordenado. Desea que el agente sea capaz de escanear fuentes, filtrar por relevancia para cafeterías, sintetizar riesgos y oportunidades y resumir los resultados.
Este es un mejor caso de uso, donde AgentGPT tiene más sentido que ChatGPT, porque es más abierto y podrá simplemente revisar los resúmenes terminados en lugar de volver a solicitar continuamente al agente nueva información.
Primero, nombrará a su agente (por ejemplo, “Analista de riesgos y oportunidades de la industria del café”). A continuación, escriba su objetivo:
“Escanee la web y las redes sociales en busca de nuevas regulaciones, tendencias y tecnologías que afecten a las cafeterías independientes y resuma semanalmente los riesgos, oportunidades y elementos que vale la pena monitorear. Luego edite y optimice el boletín para un lector ejecutivo de negocios”.
La expresión “cafeterías independientes” reduce su relevancia. “Riesgos, oportunidades y elementos que vale la pena monitorear” obliga a la categorización. “Editar y agilizar” reducirá la redundancia y producirá resultados del estilo deseado.
Puede agregar restricciones adicionales o reglas operativas para evitar resultados ruidosos. Así:
“Céntrate en las regulaciones regionales a menos que se especifique lo contrario”
“Ignora noticias irrelevantes sobre hotelería (como restaurantes, hoteles)”
“Prefiere fuentes de los últimos 7 días”
“Resume los impactos de forma clara y concisa”
“Indica la incertidumbre cuando la información sea incompleta”
Empieza con un resumen ejecutivo (no más de 5 viñetas)
Inserta todas las fuentes como hipervínculos
No repitas los resultados de informes anteriores
Penaliza las noticias “exageradas”
Puede guardar esta instrucción inicial y volver a ejecutarla semanalmente para obtener nuevos resultados.
AgentGPT sobresale por casos de uso tan simples que entran en la categoría “asistente personal” o “copiloto digital”. Dichos agentes se pueden escalar horizontalmente ejecutando varios agentes en paralelo para diferentes objetivos. Esta escalabilidad hace que AgentGPT sea atractivo como prototipo para sistemas de agentes de estilo empresarial, como IBM watsonx Orchestrate, donde se requieren medidas de seguridad, evaluación y monitoreo más sólidos.
Cree, implemente y gestione poderosos asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.
Construya el futuro de su empresa con soluciones de IA en las que pueda confiar.
Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.