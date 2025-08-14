Estimado en unos 5000 millones de dólares en 2024, se prevé que el mercado de agentes de IA crezca hasta unos 50 000 millones de dólares en 20301. Sin embargo, a medida que más empresas crean agentes de IA para agilizar y automatizar los flujos de trabajo, surgen nuevos retos a la hora de monitorizar el comportamiento de esos agentes, asegurándose de que funcionan según lo previsto. AgentOps es un conjunto a grandes rasgos de buenas prácticas emergentes para evaluar el rendimiento de los agentes, que se basa en preceptos establecidos en los campos relacionados de DevOps (que estandarizó la entrega de software) y MLOps (que hizo lo mismo con los modelos de machine learning).

Pero gestionar agentes no es tan sencillo como crear software tradicional o incluso modelos de IA. Los sistemas "agénticos" son complejos y dinámicos, y consisten esencialmente en un software con mente propia. Los agentes actúan de forma autónoma, encadenan tareas, toman decisiones y se comportan de forma no determinista. La idea detrás de AgentOps es llevar la observabilidad y la fiabilidad a un ámbito que podría ser caótico, permitiendo a los desarrolladores escudriñar la caja negra de las interacciones de los agentes y otros comportamientos de los agentes.

No existe una única herramienta para gestionar AgentOps, sino todo un ecosistema; un estudio reciente descubrió 17 herramientas en Github y otros repositorios de código relevantes para esta práctica, desde Agenta hasta LangSmith y Trulens (una herramienta de AgentOps con un nombre ambicioso se llama, simplemente, "AgentOps"). Estas herramientas suelen proporcionar soporte al marco de agentes elegido por los desarrolladores, ya sean los agentes watsonx de IBM o el SDK de agentes de OpenAI. En este acalorado espacio, han surgido muchas plataformas y marcos populares, como AutoGen, LangChain y CrewAI (este último optimizado para la orquestación de sistemas multiagente).