Los sistemas inteligentes de agente único interactúan con su entorno para planificar, llamar herramientas y producir respuestas de forma autónoma. Las herramientas puestas a disposición de un agente proporcionan información que, de otro modo, no estaría disponible para el agente. Como se describió anteriormente, esta información puede ser una base de datos adquirida a través de una API u otro agente. Aquí hay una distinción entre sistemas de agente único y multiagente. Al llamar a otro agente como herramienta, ese agente secundario es parte de los estímulos ambientales del agente original. Esa información se adquiere y no se lleva a cabo más cooperación. Por su parte, los sistemas multiagente difieren al involucrar a todos los agentes dentro del entorno para modelar los objetivos, la memoria y el plan de acción de cada uno.4 La comunicación entre agentes puede ser directa o indirecta mediante la alteración del entorno compartido.
Cada entidad dentro de un sistema multiagente es un agente autónomo hasta cierto punto. Esta autonomía suele verse en la planificación, la llamada de herramientas y el razonamiento general del agente. En un sistema multiagente, los agentes siguen siendo autónomos, pero también cooperan y se coordinan en estructuras de agentes.3 Para resolver problemas complejos, la comunicación entre agentes y la resolución distribuida de problemas son clave. Este tipo de interacción entre agentes puede describirse como aprendizaje por refuerzo multiagente. La información compartida a través de esta forma de aprendizaje puede incluir información instantánea adquirida a través de sensores o acciones. Además, se pueden compartir las experiencias de un agente en forma de información episódica. Estos episodios pueden ser secuencias de sensaciones, acciones y políticas aprendidas. Finalmente, los agentes pueden compartir sus experiencias en tiempo real para evitar que otros agentes aprendan repetitivamente las mismas políticas.5
Los agentes individuales son poderosos por sí mismos. Pueden crear subtareas, usar herramientas y aprender a través de sus interacciones. El comportamiento colectivo de los sistemas multiagente aumenta el potencial de precisión, adaptabilidad y escalabilidad. Los sistemas multiagente tienden a superar a los sistemas de agente único debido al mayor conjunto de recursos compartidos, optimización y automatización. En lugar de que varios agentes aprendan las mismas políticas, se pueden compartir las experiencias aprendidas para optimizar la complejidad del tiempo y la eficiencia.5