Intelligente SAS interagieren mit ihrer Umgebung, um eigenständig zu planen, Tools aufzurufen und Antworten zu erzeugen. Die Tools, die einem Agenten zur Verfügung gestellt werden, stellen Informationen bereit, die dem Agenten sonst nicht zur Verfügung stehen. Wie bereits beschrieben, kann es sich bei diesen Informationen um eine Datenbank handeln, die über eine API oder einen anderen Agenten erfasst wird. Man unterscheidet hier zwischen SAS und MAS. Wenn ein anderer Agent als Tool aufgerufen wird, ist dieser sekundäre Agent Teil der Umgebungsreize des ursprünglichen Agenten. Diese Informationen werden beschafft und es findet keine weitere Zusammenarbeit statt. MAS hingegen unterscheiden sich dadurch, dass alle Agenten innerhalb der Umgebung in die Modellierung der Ziele, des Speichers und des Aktionsplans der anderen einbezogen werden.4 Die Kommunikation zwischen Agenten kann direkt oder indirekt durch Veränderung der gemeinsamen Umgebung erfolgen.

Jede Einheit innerhalb eines MAS ist bis zu einem gewissen Grad ein autonomer Agent. Diese Autonomie zeigt sich typischerweise in der Planung des Agenten, dem Aufruf von Tools und der allgemeinen Argumentation. In einem MAS bleiben die Agenten autonom, kooperieren aber auch und koordinieren sich in Agentenstrukturen.3 Um komplexe Probleme zu lösen, sind die Kommunikation der Agenten und die verteilte Problemlösung entscheidend. Diese Art der Agenteninteraktion kann als verstärkendes Multi-Agent-Lernen beschrieben werden. Die Daten, die bei dieser Form des Lernens ausgetauscht werden, können unmittelbare Daten sein, die durch Sensoren oder Aktionen gewonnen werden. Außerdem können die Erfahrungen eines Agenten in Form von episodischen Daten geteilt werden. Diese Episoden können Sequenzen von Empfindungen, Aktionen und erlernten Strategien sein. Schließlich können Agenten ihre Erfahrungen in Echtzeit teilen, um zu verhindern, dass andere Agenten dieselben Strategien wiederholt lernen.5

Einzelne Agenten sind von sich aus leistungsstark. Sie können Teilaufgaben erstellen, Tools nutzen und durch ihre Interaktionen lernen. Das kollektive Verhalten von MAS erhöht das Potenzial für Genauigkeit, Anpassungsfähigkeit und Skalierbarkeit. MAS sind SAS in der Regel überlegen, da sie über einen größeren Pool an gemeinsam genutzten Ressourcen, Optimierung und Automatisierung verfügen. Anstatt dass mehrere Agenten dieselben Richtlinien lernen, kann man Erfahrungen teilen, um die Zeitkomplexität und Effizienz zu optimieren5