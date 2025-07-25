Negli ultimi mesi, diversi attori importanti sono entrati nel settore del text-to-video. Nel dicembre 2024, OpenAI ha rilasciato Sora, il suo primo modello in grado di generare brevi videoclip a partire da testo. Nel maggio 2025, Google Gemini ha introdotto Veo 3, che si concentra sulla qualità e sulla coerenza dei video. Il settore sta crescendo rapidamente, ma i fondatori di Moonvalley ritengono che molte opzioni sul mercato trascurano una considerazione essenziale: come gli artisti percepiscono l'AI.
"La nostra prospettiva fin dal primo giorno è stata fondamentalmente costruire modelli di livello produttivo", ha detto Naeem Talukdar, co-fondatore e CEO di Moonvalley, in un'intervista con IBM Think. "Quali sono i modelli che i registi e i creatori reali devono usare e vogliono usare?" Moonvalley ha reclutato ricercatori di DeepMind e Google ed è anche partner di Asteria, uno studio cinematografico AI fondato da Bryn Mooser, un dirigente cinematografico.
Da quando la ricerca sui modelli di generazione testo-video è decollata, molti nel settore dell'AI hanno previsto una nuova rivoluzione nella produzione di film e TV. Il direttore James Cameron è entrato a far parte del consiglio di amministrazione di Stability AI quasi un anno fa, e il vincitore dell'Oscar Darren Aronofsky ha recentemente annunciato una partnership con Google DeepMind. Vale anche la pena menzionare che i film realizzati con l'AI potranno concorrere per l'Oscar, secondo The Academy. E Netflix ha rilasciato la sua prima serie realizzata usando l'AI generativa.
L'AI è stata una questione delicata a Hollywood, soprattutto durante lo sciopero degli sceneggiatori. Molti artisti hanno espresso apertamente il timore che la loro voce o la loro immagine possano essere riprodotte senza il loro consenso.
Ma secondo Talukdar, la maggior parte dei produttori non ha ancora fatto il salto all'AI. Non per quello che la tecnologia può o non può fare, ma per i timori legati al copyright. "Quello che abbiamo scoperto a livello di studio è che, per ragioni sia legali che etiche, nessuno voleva toccare questi modelli a causa dei dati su cui erano stati addestrati", ha affermato.
"Indipendentemente da come si allineeranno le diverse cause legali e da come si stabilisca il precedente, ciò che è indiscutibile è questa paura che, se si utilizza un modello addestrato su milioni e milioni di ore di filmati, si potrebbe far trapelare o generare filmati protetti da copyright, anche se non di proposito," ha aggiunto Talukdar. "E questo è un no assoluto per i registi e le aziende serie».
La creazione di uno strumento che dia potere agli artisti e allevi questa paura è l'idea alla base del modello fondante di Moonvalley, Marey, rilasciato a luglio. Il modello è stato formato su contenuti in licenza, secondo l'azienda, che è anche orgogliosa di offrire un maggiore controllo ai creatori.
"Pensiamo ai nostri clienti come professionisti in senso lato. Non ci concentriamo sul lato consumer o sui video di TikTok", ha detto Mooser in un'intervista con IBM Think. "I creativi e i registi seri hanno bisogno di avere il controllo su ciò che creano, non solo di scrivere qualche parola."
La costruzione del modello ha comportato due sfide: la prima è stata il reperimento dei dati, che l'azienda ha ottenuto contattando individualmente registi e YouTuber.
"A parte alcune aziende di filmati di repertorio, non esiste un grande mercato di persone che concedono in licenza i propri dati, e tanto meno che concedano in licenza dati video per la formazione", ha affermato Talukdar. "C'era una grande componente operativa nel reperire i dati, negoziare con i creatori, definire accordi e poi, ovviamente, ottenere le risorse come startup."
L'altra sfida è tecnica: il volume dei dati. "Stimiamo che per addestrare il nostro modello utilizziamo probabilmente cinque volte meno dati rispetto al modello comparabile più simile a noi", ha affermato Talukdar. "Pensiamo che se hai cinque volte meno dati, ti serva un'architettura cinque volte migliore. "È una parte fondamentale di tutto ciò che abbiamo fatto finora", ha affermato, riferendosi al team di ricerca da lui creato. "Abbiamo davvero creato il team di ricerca più talentuoso del settore."
Il lancio all'inizio di quest'estate ha ricevuto ampia copertura mediatica, e Moonvalley ha annunciato anche un nuovo giro di finanziamenti, insieme a progetti che includono celebrità come l'attrice e regista Natasha Lyonne (che ha co-fondato Asteria insieme a Mooser) e Jaron Lanier, veterano della Silicon Valley e informatico noto per aver aperto la strada alla realtà virtuale.
"Non avete ancora visto cosa può fare questa tecnologia nelle mani di grandi registi", ha affermato Mooser. "Ed è quello che accadrà nei prossimi sei-dodici mesi." Ha suggerito che Hollywood sta per vivere un altro "momento Toy Story", in cui diventerà improvvisamente innegabile che la creatività e la tecnologia possono lavorare fianco a fianco, stupire i critici e sbancare il botteghino.
"Questo avverrà con l'AI, ma sarà più una storia aziendale che creativa. Vedrete un film con un budget come Flow, realizzato da un piccolo team come Flow, ma che fa gli incassi di Lilo e Stitch", ha detto Mooser. "E sarà di proprietà dei registi. La gente dirà che sarà il momento in cui l'intero settore è stato trasformato perché qualcuno è riuscito a realizzare un film da grande studio con un budget da indipendente."
Con Marey, il team dietro Moonvalley ritiene che l'AI abbia una reale possibilità di trasformare non solo il settore cinematografico, ma il cinema stesso. Marey non risolve solo una sfida tecnica. "È come aspettarsi che un LLM scriva un libro, giusto?" ha chiesto Mooser. "È possibile, tecnologicamente parlando. Ma il problema è che nessuno lo leggerà. Questo è il problema, in buona sostanza: l'AI non ha gusto. E credo che sia questo che la gente non coglie."
