지난 몇 달 동안 많은 주요 업체들이 텍스트-투-비디오 분야에 진출했습니다. 2024년 12월, OpenAI는 텍스트로부터 짧은 동영상 클립을 생성할 수 있는 첫 번째 모델인 Sora를 출시했습니다. 2025년 5월, Google Gemini는 동영상 품질과 일관성에 중점을 둔 Veo 3를 출시했습니다. 이 분야는 빠르게 성장하고 있지만 Moonvalley의 창립자들은 시중에 나와 있는 많은 옵션이 아티스트가 AI에 대해 어떻게 생각하는지라는 필수적인 고려 사항을 간과하고 있다고 생각합니다.
"첫날부터 우리의 관점은 기본적으로 생산 등급 모델을 구축하는 것이었습니다."라고 Moonvalley의 공동 창립자이자 CEO인 Naeem Talukdar는 IBM Think와의 인터뷰에서 말합니다. "실제 영화 제작자와 제작자가 사용해야 하고 사용하기를 원하는 모델은 무엇인가요?" Moonvalley는 DeepMind와 Google의 연구원들을 영입했으며, 영화 임원인 Bryn Mooser가 설립한 AI 영화 스튜디오인 Asteria의 파트너이기도 합니다.
연구가 텍스트-비디오 생성 모델에 대한 것이 시작된 이래로 많은 AI 업계는 영화 및 TV 제작에 새로운 혁명을 예상했습니다. 제임스 카메론 감독은 거의 1년 전에 Stability AI의 이사회에 합류했으며, 오스카상을 수상한 대런 아로노프스키 감독은 최근 Google DeepMind와의 파트너십을 발표했습니다. 아카데미에 따르면 AI로 제작한 영화가 오스카상을 수상할 수 있을 것이라고 합니다. 그리고 Netflix는 최근 생성형 AI를 활용한 첫 번째 프로그램을 공개했습니다.
특히 작가들의 파업 기간 동안 헐리우드에서 AI는 민감한 이슈였습니다. 많은 아티스트들이 자신의 목소리나 이미지가 동의 없이 복제될 수 있다는 두려움에 대해 목소리를 높였습니다.
하지만 Talukdar에 따르면 대부분의 프로듀서들은 아직 AI를 도입하지 못했다고 합니다. 기술이 무엇을 할 수 있고 할 수 없는지가 아니라 저작권에 대한 두려움 때문입니다. "스튜디오 수준에서 발견한 것은 학습을 통해 얻은 데이터 때문에 법적, 윤리적 이유로 아무도 모델을 건드리고 싶어 하지 않는다는 것입니다."라고 그는 말합니다.
"여러 소송이 어떻게 진행되고 판례가 어떻게 정해지든, 의심할 여지가 없는 것은 수백만 시간 분량의 영상으로 학습된 모델을 사용할 경우 고의가 아니더라도 저작권이 있는 영상이 유출되거나 생성될 수 있다는 우려입니다."라고 Talukdar는 덧붙입니다. "진지한 영화 제작자와 진지한 회사에게는 완전히 허용되지 않는 일입니다."
아티스트에게 힘을 실어주고 이러한 두려움을 덜어줄 수 있는 도구를 만드는 것이 7월에 출시된 Moonvalley의 기본 모델인 Marey의 아이디어입니다. 이 모델은 라이선스 콘텐츠에 대한 교육을 받았으며, 크리에이터에게 더 큰 통제권을 제공한다는 점에서 자부심을 느낀다고 회사 측은 설명합니다.
"우리는 [고객]을 폭넓게 전문가로 생각합니다. 우리는 소비자 측면이나 TikTok 동영상에 초점을 맞추고 있지 않습니다."라고 무어는 IBM Think와의 인터뷰에서 말했습니다. "진지한 크리에이티브와 영화 제작자는 단순히 글을 쓰는 것 이상으로 제작물을 제어할 수 있어야 합니다."
모델을 구축하는 과정에서 두 가지 문제가 발생했습니다. 첫 번째는 영화 제작자와 YouTube 사용자에게 개별적으로 연락하여 확보한 데이터를 찾는 것이었습니다.
"몇몇 스톡 영상 회사를 제외하고는 데이터를 라이선싱하는 사람들이 많지 않으며, 교육용 비디오 데이터 라이선싱은 훨씬 적습니다."라고 Talukdar는 말합니다. "데이터를 찾고, 크리에이터와 협상하고, 합의점을 찾고, 스타트업으로서 당연히 리소스를 확보하는 데에는 큰 운영적 요소가 있었습니다."
또 다른 과제는 기술적인 측면, 즉 데이터 양입니다. "우리는 가장 유사한 종류의 모델보다 5배 정도 적은 데이터를 사용하여 모델을 학습시키고 있는 것으로 추정합니다."라고 Talukdar는 말합니다. "데이터가 5배 더 적으면 5배 더 나은 아키텍처가 필요하다고 생각합니다. 이는 지금까지 우리가 해온 모든 일의 핵심적인 부분입니다."라며 자신이 구축한 연구팀을 언급했습니다. "우리는 실제로 이 분야에서 가장 재능이 많은 연구팀을 구성했습니다."
올여름 초 출시 이후 언론의 대대적인 보도를 받았고, 이후 Moonvalley는 배우 겸 감독 Natasha Lyonne(Mooser와 Asteria를 공동 설립), 가상현실 개척자로 유명한 실리콘밸리의 베테랑이자 컴퓨터 과학자인 aron Lanier 등 유명 인사들이 참여한 프로젝트와 함께 새로운 펀딩 라운드를 발표하기도 했습니다.
Mooser는 "이 기술이 훌륭한 영화 제작자의 손에서 어떤 일을 할 수 있는지 보지 못했을 겁니다."라고 말합니다. "앞으로 6개월에서 1년 안에 이런 일이 일어날 것입니다." 그는 헐리우드에 또 다른 토이 스토리의 순간, 즉 창의성과 기술이 함께 작동하여 비평가들을 놀라게 하고 박스오피스에서 큰 수익을 올릴 수 있다는 사실이 갑자기 부인할 수 없게 되는 순간이 곧 올 것이라고 제안했습니다.
"AI와 함께 다가올 것이지만, 크리에이티브 스토리보다는 비즈니스 스토리가 될 것입니다. 플로우처럼 적은 예산으로 플로우처럼 소규모 팀이 만든 영화가 릴로와 스티치처럼 흥행하는 것을 보게될 것입니다."라고 Mooser는 말합니다. "그리고 영화 제작자가 소유하게 될 것입니다. 누군가가 독립적인 예산으로 스튜디오 영화를 만들 수 있게 되면서 업계 전체가 변모한 순간이라고 사람들은 말할 것입니다."
Moonvalley 팀은 Marey와 함께 AI가 영화 산업뿐만 아니라 영화 자체를 변화시킬 수 있는 진정한 기회가 될 것이라고 믿습니다. Marey는 기술적 문제만 해결하는 것이 아닙니다. "LLM이 책을 쓰기를 기대하는 것과 같죠?" Mooser가 물었습니다. "기술적으로는 가능합니다. 하지만 문제는 아무도 그 책을 읽지 않는다는 것입니다. AI에는 취향이 없다는 것이 궁극적인 문제입니다. 사람들이 놓치고 있는 부분이 바로 이 부분이라고 생각합니다."
