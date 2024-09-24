Gli ultimi modelli o1-preview di OpenAI affrontano problemi complessi suddividendoli in fasi, cambiando potenzialmente il modo in cui i settori affrontano le proprie sfide.
Questo approccio, noto come ragionamento chain-of-thought, segna un cambiamento significativo rispetto ai precedenti modelli AI che spesso producevano risposte senza spiegare il ragionamento. Questi progressi potrebbero rimodellare il modo in cui le aziende e i ricercatori affrontano i compiti complessi di risoluzione dei problemi.
"Questi modelli sono più adatti a compiti che richiedono più logica e ragionamento perché richiedono tempo per riflettere sul problema", ha affermato Chris Hay, IBM Distinguished Engineer. "È come se mostrassero il loro lavoro, passo dopo passo."
L'approccio chain of thought consente agli utenti di vedere come l'AI arriva alle sue conclusioni. Hay ha spiegato il procedimento: "Se chiedi a un bambino, ad esempio, quanto fa 25 moltiplicato per 10 più cinque, ci sono tre passaggi da seguire. Potrebbero semplicemente darti una risposta vaga. Ma hai detto, no, no, devi scomporlo... è come a scuola, devi mostrare il tuo lavoro".
Nathalie Baracaldo, IBM AI Security Senior Research Scientist, ha sottolineato l'importanza di questo sviluppo: "La principale differenza riguarda come possiamo sapere come il modello sia giunto a una decisione. Abbiamo spiegazioni su cosa ha fatto l'agente, molto utili per capire perché è successo qualcosa".
Questo livello di trasparenza potrebbe avere implicazioni di vasta portata in vari settori. Nello sviluppo software, ad esempio, i modelli mostrano capacità di codifica migliorate con meno errori. Hay ha osservato: "Stanno codificando meglio e hanno meno allucinazioni", riferendosi ai casi in cui l'AI produce informazioni plausibili ma errate.
I nuovi modelli incorporano anche l'apprendimento per rinforzo nel loro processo di formazione. Hay ha spiegato: "Hanno anche cambiato il modo in cui vengono addestrati nei modelli di base. Parlano di come utilizzano l'apprendimento per rinforzo... per insegnare e addestrare quei modelli."
L'uso più efficace di questi modelli di AI avanzati probabilmente prevederà una collaborazione tra competenze umane e capacità meccaniche. "L'umano dovrà sempre fornire input, essere d'accordo con la pianificazione e verificare queste cose", ha affermato Hay.
Hay ha messo in guardia dal sopravvalutare le capacità dei modelli: "Penso che si possano ottenere ottimi risultati. Penso che quando le persone sentono la parola AGI, pensano a questa grande testa pulsante tra le nuvole... in realtà, se ci rifletto, i modelli, così come sono, con la prossima previsione di token, buoni dati di addestramento e pianificazione, ecc., fanno un ottimo lavoro, migliore degli umani, in molte attività."
Lo sviluppo di questi modelli solleva domande sulla natura dell'intelligenza artificiale e sul suo confronto con la cognizione umana. I nuovi modelli hanno dimostrato notevoli capacità in alcuni ambiti, superando gli umani in test standardizzati come l'esame di stato e il SAT. Eppure hanno ancora difficoltà a svolgere compiti che la maggior parte degli esseri umani trova intuitivi.
Hay ha sottolineato che i modelli possono avere difficoltà con compiti che gli esseri umani ritengono semplici: "Il modello eccelle in compiti specifici e individuali. Tuttavia, attualmente ha difficoltà a distinguere le diverse parti di una conversazione, creando confusione nella capacità di gestire più concetti contemporaneamente. Il modello enfatizza troppo il contesto, spesso considerando troppe informazioni irrilevanti quando elabora le richieste."
Baracaldo ha aggiunto una nota di cautela: "Sebbene questo modello sia davvero impressionante, a volte commette errori. E se leggi il rapporto tecnico, a volte crea soluzioni che un vero esperto, un essere umano, riterrà non fattibili, ma il modello non conosce tutte le ipotesi."
Le implicazioni di questi progressi vanno oltre il settore tecnologico. Nella ricerca e nel mondo accademico, potrebbero accelerare il ritmo delle scoperte aiutando nell'analisi di dati complessi e nella generazione di ipotesi. In campi come la medicina e il diritto, potrebbero essere gli strumenti giusti per ampliare le competenze umane, portando potenzialmente a diagnosi più accurate o ad analisi legali più complete.
Hay ha riassunto il valore pratico dei nuovi modelli per le aziende: "Sono programmatori molto più bravi di prima".