Als Menschen sind wir nicht in der Lage, KI-Systeme, die intelligenter sind als wir, zuverlässig zu überwachen. Skalierbare Aufsicht ist eine skalierbare Trainingsmethode, bei der Menschen schwächere KI-Systeme nutzen können, um komplexere KI-Systeme auszurichten.

Die Forschung, um diese Technik zu testen und zu erweitern, ist begrenzt – weil es superintelligente KI-Systeme noch nicht gibt. Forscher von Anthropic (einem KI-Sicherheits- und Forschungsunternehmen) haben jedoch ein Proof-of-Concept-Experiment durchgeführt.

In dem Experiment wurden menschliche Teilnehmer angewiesen, Fragen mit Hilfe eines LLM zu beantworten. Diese KI-unterstützten Menschen übertrafen sowohl das Modell selbst als auch die nicht unterstützten Menschen in Bezug auf die Genauigkeit. Die Forscher kamen zu den Schluss, dass diese Ergebnisse Hoffnung geben und dazu beitragen, die Idee zu bestätigen, dass LLMs „Menschen helfen können, schwierige Aufgaben in Umgebungen zu erledigen, die für eine skalierbare Aufsicht relevant sind“.3