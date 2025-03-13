Sette giorni dopo il lancio, il nuovo agente tutto in uno Manus AI attira ancora l'attenzione e i titoli dei giornali. L'azienda, sviluppata dalla startup cinese Butterfly Effect, sostiene che 2 milioni di persone sono in lista d'attesa per il suo agente generico. Per aumentare l'hype, Manus è ancora accessibile solo su invito, anche se i codici invito possono essere acquistati sul mercato della rivendita e sui social media per migliaia di dollari.
E l'ambizione di Manus potrebbe essere più grande che generare hype e paragoni con un altro modello cinese, DeepSeek, che ha scosso il mondo tecnologico e finanziario all'inizio di quest'anno. Due giorni fa, Manus AI ha annunciato una partnership strategica con il team Qwen di Alibaba, una mossa che potrebbe aiutare la startup a rispondere all'aumento del traffico ed espandere la propria base utenti, in particolare in Cina.
Ma resta da vedere se Manus sarà più di una semplice demo di un modello diventato virale. "Un caso d'uso, una demo, una POC [proof of concept] è molto diverso da ciò che si può integrare in un'architettura aziendale, giusto?" afferma Vyoma Gajjar, AI Technical Solution Architect presso IBM, in un recente episodio di Mixture of Experts.
Per scalare applicazioni nel mondo reale, abbiamo bisogno di "agenti specializzati ed efficienti in termini di costi appositamente configurati per l'uso aziendale", afferma Maryam Ashoori, Direttrice della Gestione Prodotto per watsonx.ai di IBM, in un'intervista con IBM Think.
Manus ha stupito molti utenti in quanto è stato in grado di eseguire rapidamente una vasta gamma di attività complicate, dall'analisi delle scorte alla pianificazione dei viaggi alla valutazione delle assicurazioni, il tutto senza alcun input umano oltre al prompt iniziale.
"Manus è un'esperienza di automazione davvero interessante, in cui puoi chattare con il modello, che ha accesso a 29 strumenti, orchestra le tue richieste e ti fornisce un feedback progressivo davvero utile su come sta eseguendo quell'attività", spiega Chris Hay, Distinguished Engineer presso IBM, in un'intervista con Think.
Gli ultimi mesi sono stati caratterizzati dal rilascio di numerosi nuovi strumenti e funzionalità di AI, a dimostrazione di un crescente interesse per gli agenti che supportano gli utenti in varie attività (si pensi a Operator di OpenAI o alle varie funzionalità di Deep Research recentemente aggiunte a molti LLM).
"Manus è un bel mix di deep search, approfondimento e navigazione. E ha anche accesso ad altri strumenti", afferma Hay.
La vera innovazione di Manus potrebbe essere quella di riunire molti strumenti interessanti (un editor, un browser, un terminale) in un'esperienza intuitiva, che, secondo Hay, ha fatto eco alla prima versione pubblica di ChatGPT più di due anni fa. In quel momento, e per la prima volta, l'interazione con l'AI divenne accessibile a chiunque avesse una connessione Internet, senza bisogno di una laurea in informatica.
Manus utilizza diversi modelli AI, in particolare i software Claude, Qwen e Browser Use di Anthropic, che aiutano gli agenti AI ad accedere ai siti web. Browser Use sta godendo dell'alone di successo della settimana di successo di Manus, diventando a sua volta virale.
Ma qualcuno parlerà di Manus il mese prossimo? Hay prevede: "Tra una settimana, qualcuno ricreerà Manus solo con open source, il che penso sia fantastico. OpenAI risponderà e tutti avranno un'esperienza equivalente."
Mentre Manus ha catturato l'interesse dei consumatori, l'adozione di questo tipo di agente generale autonomo da parte delle aziende potrebbe essere una strada più lunga, sempre che abbia senso. Gli LLM che alimentano gli agenti che hanno attirato così tanta attenzione negli ultimi 12 mesi sono per lo più addestrati su dati pubblici disponibili. Al contrario, solo l'1% dei dati aziendali viene attualmente utilizzato in modelli linguistici di grandi dimensioni.
Il 99% dei dati non acquisiti rappresenta una miniera d'oro per le aziende che vogliono utilizzare gli LLM e gli agenti per sbloccare il valore di quei dati. Tuttavia, gli agenti AI aziendali vengono generalmente utilizzati in modo diverso rispetto agli agenti AI personali. Ad esempio, le persone potrebbero utilizzare un agente creato da un'azienda come Manus AI o OpenAI per programmare un volo o esaminare il proprio curriculum.
Tuttavia, le aziende spesso cercano un sistema di agenti costruito con strumenti chiusi o open source, personalizzato in base alle loro specifiche esigenze aziendali, per essere il più efficiente possibile in termini di costi (si pensi ad Agentforce di Salesforce o watsonx Orchestrate di IBM). Le aziende dispongono anche di una quantità enorme di dati che non vogliono spostare fuori sede per motivi di sicurezza. Questi agenti aziendali sono tipicamente alimentati da modelli linguistici più piccoli e adatti allo scopo, come la serie Granite di IBM, che conservano i dati necessari in loco.
Non è chiaro se Manus abbia ambizioni in ambito di AI aziendale; tuttavia, il suo partner appena annunciato, Alibaba, ne ha sicuramente. A gennaio, Alibaba ha annunciato un nuovo assistente, Qwen 2.5 Max, che funziona con l'architettura mixture of experts (MoE), un approccio efficiente che spesso piace alle aziende.
Con un'architettura MoE, il modello attiva solo le sottoreti specifiche necessarie per un dato compito anziché attivare l'intera rete neurale. Di conseguenza, l'architettura MoE riduce notevolmente i costi di calcolo durante il pre-addestramento e garantisce prestazioni più rapide durante il tempo di inferenza.
Resta da vedere se la vera autonomia dell'AI sarà raggiunta con un agente AI personale o con un agente AI aziendale. Manus, nel frattempo, continua per stimolare il dibattito.
«Manus sta decisamente scuotendo un po' le cose qui. Ma ci sono anche molti scettici nella comunità dell'AI", afferma Kaoutar El Maghraoui, un Principal Research Scientist e Manager presso IBM, in un recente episodio di Mixture of Experts. "La grande domanda qui è: Manus può davvero ridefinire l'autonomia dell'AI? O è solo un altro passo nella corsa all'AI tra oriente e occidente?
