Os sistemas inteligentes de agente único interagem com o ambiente para planejar, chamar ferramentas e produzir respostas de forma autônoma. As ferramentas disponibilizadas a um agente fornecem informações que, de outra forma, estariam indisponíveis para o agente. Conforme descrito anteriormente, essas informações podem ser um banco de dados adquirido por meio de uma API ou outro agente. Há uma distinção aqui entre sistemas de agentes únicos e sistemas multiagentes. Ao chamar outro agente como uma ferramenta, esse agente secundário faz parte dos estímulos ambientais do agente original. Essas informações são adquiridas, e não ocorre nenhuma cooperação adicional. Já os sistemas multiagentes diferem ao envolver todos os agentes do ambiente para modelar os objetivos, a memória e o plano de ação uns dos outros.4 A comunicação entre agentes pode ser direta ou indireta, por meio da alteração do ambiente compartilhado.
Cada entidade dentro de um sistema multiagente é um agente autônomo até certo ponto. Essa autonomia é observada tipicamente no planejamento do agente, na chamada de ferramentas e no raciocínio geral. Em um sistema multiagentes, os agentes permanecem autônomos, mas também cooperam e coordenam as estruturas dos agentes.3 Para resolver problemas complexos, a comunicação entre os agentes e a resolução distribuída de problemas são fundamentais. Esse tipo de interação com o agente pode ser descrito como aprendizado por reforço multiagentes . As informações compartilhadas por meio dessa forma de aprendizado podem incluir informações instantâneas adquiridas por meio de sensores ou ações. Além disso, é possível compartilhar as experiências de um agente na forma de informações episódicas. Esses episódios podem ser sequências de sentimentos, ações e políticas aprendidas. Por fim, os agentes podem compartilhar suas experiências em tempo real para evitar que outros agentes aprendam repetidamente as mesmas políticas.5
Os agentes individuais são poderosos por conta própria. Eles podem criar subtarefas, usar ferramentas e aprender por meio de suas interações. O comportamento coletivo dos sistemas multiagentes aumenta o potencial de precisão, adaptabilidade e escalabilidade. Os sistemas multiagente tendem a superar o desempenho dos sistemas de agente único devido ao maior pool de recursos compartilhados, otimização e automação. Em vez de vários agentes aprenderem as mesmas políticas, é possível compartilhar experiências aprendidas para otimizar a complexidade e a eficiência do tempo.5