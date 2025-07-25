En los últimos meses, varios actores importantes han entrado en el espacio de la conversión de texto a vídeo. En diciembre de 2024, OpenAI lanzó Sora, su primer modelo capaz de generar videoclips cortos a partir de texto. En mayo de 2025, Google Gemini presentó Veo 3, que se centra en la calidad y coherencia del vídeo. El sector está creciendo rápidamente, pero los fundadores de Moonvalley creen que muchas de las opciones del mercado pasan por alto una consideración esencial: cómo se sienten los artistas respecto a la IA.
“Nuestra perspectiva desde el primer día fue básicamente construir modelos de nivel de producción”, dijo Naeem Talukdar, cofundador y CEO de Moonvalley, en una entrevista con IBM Think. "¿Cuáles son los modelos que los cineastas y creadores necesitan usar y quieren usar?". Moonvalley ha contratado a investigadores de DeepMind y Google y también es socio de Asteria, un estudio cinematográfico de IA fundado por Bryn Mooser, un ejecutivo cinematográfico.
Desde que despegó la investigación sobre los modelos de generación de texto a vídeo, muchos en el sector de la IA anticiparon una nueva revolución en la producción de películas y televisión. El director James Cameron se unió a la junta directiva de Stability AI hace casi un año, y el ganador del Oscar Darren Aronofsky anunció recientemente una asociación con Google DeepMind. Vale la pena mencionar, también, que las películas hechas con IA podrán ganar premios Oscar, según la Academia. Y Netflix acaba de lanzar su primera serie usando IA generativa.
La IA ha sido un tema delicado en Hollywood, especialmente durante la huelga de guionistas. Muchos artistas han expresado su miedo a que su voz o imagen puedan replicarse sin su consentimiento.
Pero según Talukdar, la mayoría de los productores aún no han dado el salto a la IA. No por lo que la tecnología puede o no puede hacer, sino por temores sobre los derechos de autor. "Lo que descubrimos a nivel de estudio es que, tanto por razones legales como éticas, nadie quería tocar estos modelos debido a los datos con los que han sido entrenados", dijo.
"Independientemente de cómo se alineen las diferentes demandas y de cómo se siente el precedente, lo que es incuestionable es el temor de que si se utiliza un modelo que se ha entrenado con millones y millones de horas de metraje, se podrían estar filtrando o generando metraje protegido por derechos de autor, incluso si no es a propósito", añadió Talukdar. “Es un completo tabú para cineastas y empresas serias”.
Crear una herramienta que empodere a los artistas y alivie este miedo es la idea detrás del modelo fundacional de Moonvalley, Marey, lanzado en julio. El modelo se entrenó con contenido con licencia, según la empresa, que también se enorgullece de ofrecer un mayor control a los creadores.
“Pensamos en [nuestros clientes] como profesionales en un sentido amplio. No nos centramos en el lado del consumidor ni en los vídeos de TikTok", dijo Mooser en una entrevista con IBM Think. "Los creativos y cineastas serios necesitan controlar lo que están creando más allá de solo escribir algunas palabras".
La construcción del modelo ha planteado dos retos: el primero ha sido encontrar datos, que la empresa consiguió poniéndose en contacto individualmente con cineastas y youtubers.
"Aparte de unas pocas empresas de material de archivo, no hay un gran mercado de personas que licencian sus datos, y mucho menos que licencian datos de vídeo para formación", afirma Talukdar. "Hubo un gran componente operativo de simplemente encontrar los datos, negociar con los creadores, llegar a acuerdos y luego, obviamente, obtener los recursos como startup".
El otro reto es técnico: el volumen de datos. "Estimamos que estamos utilizando probablemente cinco veces menos datos para entrenar nuestro modelo que nuestro tipo de modelo comparable más cercano", dijo Talukdar. “Pensamos que si tienes cinco veces menos datos, necesitas una arquitectura cinco veces mejor. Es una parte fundamental de todo lo que hemos hecho hasta ahora", dijo, refiriéndose al equipo de investigación que creó. "Realmente hemos creado el equipo de investigación con más talento del espacio".
El lanzamiento a principios de este verano recibió una amplia cobertura en la prensa y desde entonces Moonvalley también ha anunciado una nueva ronda de financiación, junto con proyectos que incluyen a estrellas como la actriz y directora Natasha Lyonne (cofundadora de Asteria con Mooser) y Jaron Lanier , un veterano de Silicon Valley e informático conocido por ser pionero en realidad virtual.
"No ha visto lo que esta tecnología puede hacer en manos de grandes cineastas", dijo Mooser. "Y eso es lo que vendrá en los próximos seis meses a un año". Sugirió que Hollywood está a punto de tener otro momento Toy Story, donde de repente se vuelve innegable que la creatividad y la tecnología pueden ir de la mano, sorprender a los críticos y ganar mucho en la taquilla.
“Eso llegará con la IA, pero será una historia de negocios más que una historia creativa. Verás una película que tiene un presupuesto como Flow y está hecha por un equipo pequeño como Flow, pero que genera la taquilla de Lilo y Stitch", dijo Mooser. “Y será propiedad de los cineastas. La gente dirá que fue el momento en el que toda la industria se transformó porque alguien podía hacer una película de estudio con un presupuesto independiente
Con Marey, el equipo detrás de Moonvalley cree que la IA tiene una verdadera oportunidad de transformar no solo la industria cinematográfica, sino el propio cine. Marey no solo resuelve un desafío técnico. "Es como esperar que un LLM escriba un libro, ¿verdad?" preguntó Mooser. “Es posible, tecnológicamente hablando. Pero el problema es que nadie va a leer ese libro. Ese es el problema en última instancia, la IA no tiene gusto. Y eso es lo que creo que la gente ha pasado por alto”.
