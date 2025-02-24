Sempre più spesso, per monitorare e governare i sistemi AI è necessario utilizzare altri sistemi AI. I modelli di classificazione possono rilevare e rimuovere discorsi d'odio, linguaggio offensivo e parolacce dal testo di input e output di un modello linguistico di grandi dimensioni (LLM). Gli LLM possono essere utilizzati per verificare che l'output di un altro LLM sia conforme alle regole delineate per quel sistema.

Tali protocolli di verifica avrebbero potuto impedire gran parte della violenza nei film incentrati sull'AI, dal fermare la furia omicida di HAL in "2001: Odissea nello spazio" all'ostacolare la campagna di Skynet per eliminare l'umanità.



Forse il caso d'uso più evidente del processo di verifica si trova in "Io, robot", dove i robot sono apparentemente programmati per seguire le Tre Leggi della Robotica di Isaac Asimov, il vero autore.

Le leggi dovrebbero prevenire la violenza nei confronti degli esseri umani, ma nel film, VIKI, il leader dell'esercito di robot malvagi, reinterpreta le leggi e dichiara: "Per proteggere l'umanità, alcuni esseri umani devono essere sacrificati". Con una verifica adeguata, dice Gelman, le decisioni di VIKI "avrebbero potuto essere facilmente classificate e prevenute".