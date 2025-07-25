Nos últimos meses, vários dos principais participantes entraram no espaço de texto para vídeo. Em dezembro de 2024, a OpenAI lançou o Sora, seu primeiro modelo capaz de gerar videoclipes curtos a partir de texto. Em maio de 2025, o Google Gemini lançou o Veo 3, que se concentra na qualidade e coerência do vídeo. O campo está crescendo rapidamente, mas os fundadores da MOONvalley acreditam que muitas opções no mercado ignoram uma consideração essencial: como os artistas se sentem em relação à IA.
"Nossa perspectiva desde o primeiro dia foi basicamente a construção de modelos de nível de produção", disse Naeem Talukdar, cofundador e CEO da Luavalley, em entrevista ao IBM Think. “Quais são os modelos que cineastas e criadores realmente precisam e querem usar?” A Moonvalley recrutou pesquisadores da DeepMind e do Google e também é parceira da Asteria, um estúdio de cinema com inteligência artificial fundado por Bryn Mooser, um executivo da indústria cinematográfica.
Desde que as pesquisas sobre modelos de geração de texto para vídeo decolaram, muitos profissionais do setor de IA anteciparam uma nova revolução na produção de filmes e TV. O diretor James Cameron entrou para o conselho da Stability AI há quase um ano, e o vencedor do Oscar Darren Aronofsky anunciou recentemente uma parceria com o Google DeepMind. Também vale a pena mencionar que os filmes feitos com IA poderão ganhar o Oscar, de acordo com a Academia. E a Netflix acaba de lançar seu primeiro programa usando IA generativa.
A IA tem sido uma questão delicada em Hollywood, especialmente durante a greve dos roteiristas. Muitos artistas têm falado sobre seu medo de que sua voz ou imagem possa ser replicada sem seu consentimento.
Mas, de acordo com Talukdar, a maioria dos produtores ainda não deu o salto da IA. Não por causa do que a tecnologia pode ou não fazer, mas por causa dos medos em relação aos direitos autorais. "O que descobrimos no nível do estúdio é que, por razões legais e éticas, ninguém queria tocar nesses modelos por causa dos dados nos quais eles foram treinados", disse ele.
"Independentemente de como os diferentes processos se alinham e como o precedente é definido, o que é inegável é o medo de que, se você estiver usando um modelo treinado com milhões e milhões de horas de filmagens, você pode estar vazando ou gerando imagens que protegido por direitos autorais, mesmo que não seja de propósito", acrescentou Talukdar. “É completamente proibido para cineastas sérios e empresas sérias.”
Criar uma ferramenta que capacitasse os artistas e aliviasse esse medo é a ideia por trás do modelo básico da Moonvalley, Marey, lançado em julho. O modelo foi treinado em conteúdo licenciado, de acordo com a empresa, que também se orgulha de oferecer maior controle aos criadores.
"Pensamos [em nossos clientes] como profissionais de forma abrangente. Não estamos focados no lado do consumidor ou nos vídeos do TikTok", disse Mooser em uma entrevista ao IBM Think. "Criativos e cineastas sérios precisam de controle sobre o que estão criando além de apenas escrever algumas palavras."
A construção do modelo trouxe dois desafios. O primeiro foi encontrar dados, o que a empresa garantiu entrando em contato individualmente com cineastas e YouTubers.
"Fora de algumas empresas de filmagens, não há um grande mercado de pessoas licenciando seus dados, muito menos licenciando dados de vídeo para treinamento", disse Talukdar. "Havia um grande componente operacional de apenas encontrar os dados, negociar com os criadores, descobrir acordos e, obviamente, obter os recursos como uma startup."
O outro desafio é técnico: volume de dados. "Estimamos que estamos usando provavelmente cinco vezes menos dados para treinar nosso modelo do que nosso tipo mais próximo de modelo comparável", disse Talukdar. "Pensamos que, se você tem cinco vezes menos dados, precisa de uma arquitetura cinco vezes melhor. É uma parte essencial de tudo o que fizemos até agora", disse ele, referindo-se à equipe de pesquisa que ele criou. "Realmente, construímos a equipe de pesquisa com a maior densidade de talentos do setor."
O lançamento no início deste verão recebeu ampla cobertura da imprensa, e a Moonvalley anunciou desde então uma nova rodada de financiamento, juntamente com projetos que incluem nomes de peso como a atriz e diretora Natasha Lyonne (que cofundou a Asteria com Mooser) e Jaron Lanier, um veterano do Vale do Silício e cientista da computação conhecido por ser pioneiro em realidade virtual.
"Você não viu o que essa tecnologia pode fazer nas mãos de grandes cineastas", disse Mooser. “E é isso que está por vir nos próximos seis meses a um ano.” Ele sugeriu que Hollywood está prestes a ter outro momento de Toy Story—em que, de repente, torna-se inegável que a criatividade e a tecnologia podem trabalhar de mãos dadas, impressionar os críticos e ganhar muito dinheiro nas bilheterias.
“Isso vem com a IA, mas será mais uma história de negócios do que uma história criativa. "Vocês vão ver um filme com um orçamento como o de Flow , feito por uma equipe pequena como a de Flow, mas que vai ter a mesma bilheteria que Lilo & Stitch", disse Mooser. “E o proprietário será os cineastas. As pessoas dirão que foi o momento em que toda a indústria transformou-se, porque alguém poderia fazer um filme de estúdio com um orçamento independente”.
Com Marey, a equipe por trás da Moonvalley acredita que a IA tem uma chance real de transformar não apenas o setor cinematográfico, mas o próprio cinema. Marey não resolve apenas um desafio técnico. "É como esperar que um LLM escreva um livro, certo?" perguntou Mooser. “É possível, tecnologicamente falando. Mas o problema é que ninguém vai ler esse livro. Esse é o problema, em última análise, a IA não tem bom gosto. E é isso que acho que as pessoas perderam.”
