I computer possono diventare autonomi? Questa è la scommessa di Simular, una startup che crea agenti AI in grado di utilizzare i computer come fanno gli esseri umani. IBM Think ha discusso di computer basati su agenti con il CEO e cofondatore di Simular, Ang Li, che ha lavorato per Google DeepMind e la guida autonoma di Baidu.
Secondo Li, quando interagiamo con un computer, gli esseri umani passano molto tempo a fare spostamenti inutili. Per esempio, secondo uno studio condotto con il suo team, l'utente medio trascorre fino a cinque ore al giorno solo muovendo il mouse.
"La tastiera e il mouse non sono naturali", ha detto in un'intervista a IBM Think. "La nostra generazione è ci è abituata, ma la precedente non lo era, e forse non lo sarà nemmeno quella futura." Invece, ha detto Li, dovremmo esaminare da vicino come operano gli umani per capire come si evolve l'AI. "La tecnologia cerca di creare qualcosa che sia facile da comunicare, come la voce, e cerca di far sì che questa macchina si comporti come gli esseri umani, così che possiamo interagire in modo più naturale."
Simular immagina un futuro in cui i computer funzioneranno come sistemi completamente autonomi. "Tutti pensano che l'AGI [intelligenza artificiale generale] agisca come i robot umanoidi, le auto a guida autonoma", ha detto Li. "Penso che sia sicuramente una delle direzioni, ma cosa succederebbe se i computer potessero fare tutto il lavoro che faccio io? Questa è già un'intelligenza a livello umano". Li ritiene che questo sia già realizzabile oggi, grazie ai progressi tecnologici come i framework open-source e i sistemi multiagente.
Simular è stato lanciato su macOS all'inizio di questa primavera come browser nativo, con l'obiettivo di occuparsi dei compiti più banali e ripetitivi che possono appesantire le persone con lavori che non sono appaganti o d'impatto. Invece di funzionare sul cloud, l'agente di Simular viene eseguito localmente tramite un browser WebKit nativo, opera autonomamente dietro le quinte e consente agli utenti di intervenire in qualsiasi momento.
Nella visione di Li, gli esseri umani rimarranno nel ciclo e coesisteranno con gli agenti. "Gli agenti commettono ancora molti errori, quindi è importante che gli esseri umani abbiano la possibilità di intervenire immediatamente", ha affermato. "È proprio come il CEO di un'azienda. Se vuole inviare una busta paga o inviare denaro a un'altra azienda, ha sempre bisogno di qualcuno che firmi, giusto?".
La navigazione basata sugli agenti è uno spazio affollato e la concorrenza si sta scaldando quest'anno. La Browser Company ha appena aperto Dia, la sua versione della navigazione agentica, agli utenti del suo precedente prodotto di punta, Arc.
"L'AI sta per cambiare il modo in cui interfacciamo con il nostro computer e le cose per cui ci rivolgiamo", ha detto Josh Miller, CEO di The Browser Company, in un recente podcast.
A gennaio, OpenAI ha lanciato Operator, un agente autonomo per attività basate sul browser. Qualche settimana dopo, Perplexity ha presentato il proprio browser AI, Comet, che non è ancora stato lanciato. "Il motivo per cui stiamo realizzando il browser è che potrebbe essere il modo migliore per creare agenti", ha affermato il CEO di Perplexity, Aravind Srinivas, in un'intervista. con The Verge lo scorso aprile.
Li, che lo scorso autunno ha pubblicato un articolo con questo team su un framework basato su agenti aperto che utilizza i computer come un essere umano, vede il ritmo dell'innovazione dell'agentic AI in rapido movimento. "Penso che sia positivo che più persone stiano lavorando su questo", ha affermato.
È convinto che gli esseri umani, nel prossimo futuro, potranno semplicemente concentrarsi sull'innovazione creativa. "Se la tecnologia sarà sufficientemente buona, tutti porteranno con sé una piccola scatola, o qualcosa di ancora più piccolo", ha affermato. "Allora [tu] parli semplicemente alla scatola e la scatola farà il lavoro per te. Non è necessario guardare gli schermi. Questo è il futuro che vedo."
