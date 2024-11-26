Il team di Rambachan ha sviluppato due nuovi metodi per misurare la capacità dei modelli AI di comprendere il proprio ambiente: la distinzione delle sequenze e la compressione delle sequenze. Hanno testato queste metriche utilizzando automi finiti deterministici (DFA) in due scenari: orientarsi a New York e giocare a Otello.

Ciò che hanno scoperto è stato sorprendente. I modelli che imparavano da mosse casuali sviluppavano una comprensione migliore rispetto a quelli addestrati nel gioco strategico. Il motivo? L'addestramento casuale esponeva i modelli a molte più situazioni possibili e transizioni, offrendo loro un quadro più completo del loro ambiente rispetto a modelli che vedevano solo spostare strategiche e "ottimali".

Quando i ricercatori hanno sottoposto questi sistemi di AI a stress test, hanno scoperto un divario preoccupante tra prestazioni e comprensione. A prima vista, i sistemi sembravano impressionanti: riuscivano a generare mosse e direzioni valide con elevata precisione. Ma sotto questa facciata, quasi tutti i modelli non hanno superato i test fondamentali della modellazione del mondo.

Un esempio significativo è venuto dai test di orientamento a New York. I modelli di navigazione crollano quando i ricercatori apportarono semplici modifiche alla mappa della città aggiungendo delle deviazioni. Ciò ha rivelato che i modelli in realtà non comprendevano affatto la geografia della città o i principi di routing: si limitavano a fornire suggerimenti superficialmente corretti, senza alcuna reale comprensione.

Ciò evidenzia una debolezza cruciale degli attuali sistemi di AI: possono essere molto bravi a fare previsioni, pur necessitando di una comprensione più autentica di ciò con cui stanno lavorando. Secondo Smolinski, i modelli linguistici di grandi dimensioni possono sembrare intelligenti, ma sono semplicemente molto bravi a trovare corrispondenze di schemi piuttosto che a svolgere un ragionamento vero e proprio (deduttivo). Ha detto che quando questi sistemi di AI sembrano risolvere problemi logici, riconoscono solo gli schemi che hanno incontrato in precedenza, senza pensare alle cose passo dopo passo.

Smolinksi sostiene che la distinzione chiave è che abbiamo bisogno di diversi tipi di tecniche di AI che lavorino insieme. Ad esempio, una può essere per riconoscere schemi, un'altra per rappresentare la conoscenza e una terza per il ragionamento logico al fine di risolvere un problema.