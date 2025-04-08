Lo studio ha rilevato che i segnali neurali e gli embedding del modello di Whisper mostravano un alto grado di allineamento, suggerendo che il cervello elabora il linguaggio non in fasi rigide e separate, ma in strati flessibili e sovrapposti, proprio come i sistemi di deep learning. Le informazioni acustiche, semantiche e grammaticali non erano confinate ad aree isolate del cervello o al modello AI, ma apparivano fuse all'interno degli stessi strati, suggerendo una strategia di ottimizzazione condivisa per il significato.

"L'idea che abbiamo un sistema ottimizzato per un compito, e che induce rappresentazioni che sono correlate ai concetti psicolinguistici, ma non esattamente, è un nuovo modo di vedere come il cervello elabora le informazioni", spiega Goldstein.

Contrariamente alle opinioni precedenti che dividevano le funzioni linguistiche del cervello in moduli distinti (alcuni per il suono, altri per la grammatica, altri ancora per il significato), i risultati del team di Goldstein suggeriscono che il cervello potrebbe elaborare tutte queste funzioni simultaneamente in regioni integrate, proprio come un modello di deep learning addestrato a completare compiti end-to-end.

Whisper, sviluppato da OpenAI, è stato scelto per la sua somiglianza strutturale con l'attività del cervello di trasformare gli input sonori in linguaggio coerente. "Il cervello non riceve le parole, riceve il suono," dice Goldstein. "Whisper lo imita convertendo l'audio grezzo in testo, livello dopo livello."

Inoltre, il team ha scoperto che, a volte, i segnali semantici possono essere rilevati prima che una persona inizi effettivamente a parlare. Questo suggerisce che il cervello possa pre-codificare l'intento o il significato prima del parlato, sfumando ulteriormente il confine tra pensiero ed espressione.