I sistemi intelligenti ad agente singolo interagiscono con il loro ambiente per pianificare, chiamare strumenti e produrre risposte in modo autonomo. Gli strumenti messi a disposizione di un agente forniscono informazioni altrimenti non disponibili per l'agente. Come descritto in precedenza, queste informazioni possono essere un database acquisito tramite un'API o un altro agente. Qui c'è una differenza tra sistemi singoli e multiagente. Quando si chiama un altro agente come strumento, quell'agente secondario fa parte degli stimoli ambientali dell'agente originale. Tali informazioni vengono acquisite e non ha luogo alcuna ulteriore cooperazione. Invece, i sistemi multiagente si differenziano per il coinvolgimento di tutti gli agenti all'interno dell'ambiente per la modellizzazione degli obiettivi, della memoria e del piano d'azione gli uni degli altri.4 La comunicazione tra gli agenti può essere diretta o indiretta attraverso l'alterazione dell'ambiente comune.
Ogni entità all'interno di un sistema multiagente è un agente autonomo entro certi limiti. Questa autonomia si manifesta generalmente nella pianificazione, nell'uso degli strumenti e nel ragionamento dell'agente. In un sistema multiagente, gli agenti rimangono autonomi ma cooperano e si coordinano anche all'interno di strutture di agenti.3 Per risolvere problemi complessi, la comunicazione tra agenti e la risoluzione distribuita dei problemi sono fondamentali. Questo tipo di interazione tra agenti può essere descritto come apprendimento per rinforzo multiagente. Le informazioni condivise attraverso questa forma di apprendimento possono includere informazioni istantanee acquisite tramite sensori o azioni. Inoltre, possono essere condivise le esperienze di un agente sotto forma di informazioni episodiche. Questi episodi possono essere sequenze di sensazioni, azioni e politiche apprese. Infine, gli agenti possono condividere le loro esperienze in tempo reale per evitare che altri agenti apprendano ripetutamente le stesse politiche.5
I singoli agenti offrono prestazioni efficaci. Possono creare sottoattività, utilizzare strumenti e imparare attraverso le loro interazioni. Il comportamento collettivo dei sistemi multiagente aumenta il potenziale di precisione, adattabilità e scalabilità. I sistemi multiagente tendono a superare i sistemi ad agente singolo grazie a una maggiore disponibilità di risorse condivise, ottimizzazione e automazione. Anziché far apprendere le stesse politiche a più agenti, è possibile condividere le esperienze apprese per ottimizzare la complessità temporale e l'efficienza.5