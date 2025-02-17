Il tuo gatto di casa potrebbe essere più intelligente di ChatGPT. Sebbene l'intelligenza artificiale sia ora in grado di scrivere poesie e di superare gli esami di legge, non è ancora in grado di eguagliare le capacità di ragionamento di base che permettono al tuo soriano di navigare tra i cornicioni delle finestre e di aggredire le prede.
Questo divario tra il controllo della conoscenza umana da parte dell'AI e la sua incapacità di eguagliare la comprensione animale del mondo fisico, è emerso come una sfida cruciale nella ricerca di macchine più intelligenti. Il Chief AI Scientist di Meta, Yann LeCun, ha portato alla ribalta la questione la scorsa settimana, in occasione di un summit sulla sicurezza AI a Parigi, sostenendo che i "modelli del mondo", i sistemi AI che formano rappresentazioni interne di struttura, dinamica e relazioni causali, potrebbero essere la chiave per far progredire l'intelligenza artificiale.
Tuttavia, alcuni ricercatori di spicco mettono in dubbio se questo approccio sia così rivoluzionario come potrebbe sembrare.
L'AI ha utilizzato modelli mondiali dagli anni '50 e diversi sottocampi di AI dipendono interamente da essi", ha detto a IBM Think Stuart J. Russell, professore di informatica all'Università della California, Berkeley. "È tanto nuovo e ingegnoso quanto suggerire che la matematica potrebbe essere utile alla fisica."
Il dibattito evidenzia una corsa sempre più veloce per raggiungere l'intelligenza artificiale generale (AGI), ovvero sistemi di AI che possano eguagliare o superare l'apprendimento e il ragionamento a livello umano in praticamente qualsiasi ambito. A differenza dei sistemi di AI specializzati di oggi, che eccellono in compiti ristretti come gli scacchi o l'elaborazione del linguaggio, l'AGI dovrebbe comprendere il mondo in modo più fondamentale, combinando capacità di ragionamento, comprensione fisica e adattabilità.
Le principali aziende tecnologiche hanno adottato approcci diversi a questa sfida. OpenAI, attraverso la sua serie GPT, si è concentrata sull'espansione dei modelli linguistici per ottenere un ragionamento sempre più sofisticato. Google DeepMind, con sistemi come AlphaFold e AlphaGo, ha mirato a domini specifici, lavorando verso funzionalità più generali. Nel frattempo, Meta ha sottolineato l'importanza di apprendere dall'interazione con il mondo reale piuttosto che solo dal testo.
"Non importa cercare di riprodurre l'intelligenza umana", ha affermato LeCun al summit. "Non riusciamo nemmeno a riprodurre l'intelligenza dei gatti o dei topi. Qualsiasi gatto domestico può pianificare azioni molto complesse."
Negli ultimi anni, i sistemi di AI hanno rapidamente aumentato i punteggi sui benchmark in domini specifici. Tuttavia, LeCun indica quello che i ricercatori chiamano il paradosso di Moravec: l'osservazione che le abilità che gli esseri umani trovano facili spesso si rivelano le più difficili da padroneggiare per le macchine.
"Cose che diamo per scontate perché esseri umani e animali possono farlo, pensiamo che non siano complicate, ma in realtà sono molto complicate," ha ribadito LeCun. "E le cose che pensiamo siano prettamente umane, come manipolare e generare il linguaggio, giocare a scacchi, giocare a Go... si rivelano relativamente facili."
Questo paradosso, cioè che l'AI eccelle in compiti che consideriamo intellettualmente impegnativi pur lottando con abilità fisiche e percettive apparentemente basilari, suscita scetticismo in alcuni esperti.
"Il processo di passaggio da una sequenza di immagini retiniche a, ad esempio, le equazioni di Maxwell per l'elettromagnetismo ha richiesto alla razza umana decine di migliaia di anni e ha richiesto un processo cumulativo di formazione dei concetti e matematizzazione," afferma Russell. "Non ho visto nulla di simile negli attuali sistemi di deep learning."
Per illustrare i limiti attuali, LeCun ha indicato un confronto sorprendente: gli LLM moderni si addestrano su trilioni di token, una quantità di testo che richiederebbe mezzo milione di anni a un essere umano per essere letto. Eppure un bambino di quattro anni, sveglio solo per circa 16.000 ore, elabora una quantità comparabile di dati solo attraverso la percezione visiva.
"Un bambino di quattro anni ha visto tanti dati quanti ne ha visti il più grande LLM sotto forma di percezione visiva, e per i bambini ciechi, è il tatto", ha detto LeCun. "Questo ti dice molte cose. Non raggiungeremo mai un'intelligenza umana solo allenandoci con il testo."
Questa osservazione ha spinto i ricercatori a esplorare nuovi approcci. A Meta, il team di LeCun si è spostato del tutto dal termine "intelligenza artificiale generale", preferendo quello di "intelligenza artificiale avanzata" (AMI). "Il motivo è che l'intelligenza umana è in realtà piuttosto specializzata, quindi chiamarla AGI è un termine improprio", ha affermato LeCun.
LeCun ritiene che dobbiamo ripensare completamente all'evoluzione dell'AI. Invece di cercare di copiare il cervello umano, vuole cambiare il modo in cui l'AI impara e comprende il mondo. Sostiene che l'AI debba costruire una propria immagine mentale della realtà assorbendo informazioni attraverso i suoi "sensi", come ad esempio imparare come si comportano gli oggetti fisici semplicemente guardando video. Questi sistemi di AI dovrebbero ricordare le cose in modo coerente e sapere come pianificare le azioni un passo dopo l'altro per portare a termine le cose.
Gli informatici non sono d'accordo su come i sistemi di AI potrebbero sviluppare una propria comprensione del mondo. Il professore emerito dell'Università di Washington Pedro Domingos vede il progresso come possibile ma non immediato. "È del tutto realistico costruire AI che sviluppino i propri modelli del mondo", ha dichiarato a IBM Think, "ma non sappiamo ancora come, e sono necessarie ulteriori ricerche".
Le attuali capacità attuali dell'AI non raggiungono il ragionamento a livello umano, in particolare nella gestione di compiti complessi. Come dice Russell: "Dagli anni '60, abbiamo capito che l'uso di modelli di mondi semplici e uniformi porta a problemi di ragionamento e pianificazione completamente irrisolvibili. Immagina di provare a pianificare una vacanza calcolando in anticipo l'esatta sequenza di 800 milioni di attivazioni muscolari che saranno necessarie." Gli esseri umani, osserva, elaborano le informazioni in modo diverso: "Lo strumento principale utilizzato dagli esseri umani per superare questo problema è la gerarchia: operiamo con molti modelli a molti livelli di astrazione, fino alle grandi azioni di alto livello ... fino a piccoli gesti di basso livello, come muovere un dito per digitare la prossima lettera 'i' in questa e-mail."
IBM Granite è la nostra famiglia di modelli AI aperti, efficienti e affidabili, su misura per le aziende e ottimizzati per scalare le applicazioni di AI. Esplora le opzioni di linguaggio, codice, serie temporali e guardrail.
Le aziende sanno di non poter scalare l'AI generativa con modelli di base di cui non possono fidarsi. Scarica l'estratto per scoprire perché IBM, con i suoi "Modelli Granite" di punta, è stata nominata Strong Performer.
Scopri come incoraggiare i team a migliorare sempre di più le prestazioni dei modelli e a superare la concorrenza utilizzando le tecniche e le infrastrutture AI più recenti.
Esplora il valore dei foundation model di livello aziendale che forniscono fiducia, prestazioni e benefici convenienti a tutti i settori.
Scopri come incorporare l'AI generativa, il machine learning e i foundation model nelle operazioni di business per migliorare le prestazioni.
Guarda una demo del confronto dei modelli IBM con altri modelli in diversi casi d'uso.
Esplora la libreria IBM di foundation model nel portafoglio di watsonx per scalare in sicurezza l'AI generativa per la tua azienda.
Metti l'AI al servizio della tua azienda grazie all'esperienza leader di settore e alla gamma di soluzioni di IBM nel campo dell'AI.
Reinventa i flussi di lavoro e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.
Esplora la libreria IBM dei foundation model nel portafoglio di IBM watsonx per scalare in sicurezza l'AI generativa per la tua azienda.