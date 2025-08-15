ロー・マンハッタンでの映画の現場では、女優のAudrey Corsa氏は何も抱えていませんでした。ゆりかごに見せられた赤ちゃんはセットの中にありませんでした。これは、何百もの写真と1人の女性の最初の記憶で訓練された人工知能モデルによって、後で作成されることになります。その記憶は、彼女自身の誕生の瞬間でした。
この映画は、イライザ・マクニットが監督した新作短編『Ancestra 』で、マクニット自身が生まれた日に父親が撮影した写真をモデルにしたシミュレート版が登場します。これらは、冒頭のシーンで赤ちゃんを作成するために使用されたのと同じ画像です。女優のオードリー・コーサが、最終シーンでスクリーン上で新生児を抱くとき、彼女が実際に抱いているのはデジタル的に生成された人間、つまりソフトウェアと意図によって投影された一種の幻覚的な記憶です。McNitt氏にとって、そのジェスチャーは映画的な要素にとどまりません。それは感情を掘り起こす行為です。
著名な映画会社のDarren Aronofsky氏は、McNitt社に生成AIを導入しました。その経験がAncestraのアイデアに拍車をかけたと言います。彼は彼女に、「これらの新しいツールで何ができるのか、ここに来てください」と誘い、最終的に映画を制作することになりました。この成果は、母親の緊急出産についての非常に個人的な短編であり、実写のパフォーマンスと、宇宙と肉体のトランスフォーメーションに根ざしたAI生成の画像を融合させています。
「私が生まれたとき、母は緊急帝王切開を受けなければなりませんでした」とマクニットさんはニューヨーク市の自宅で最近私に語ってくれました。「彼女が健康診断のために病院を訪れると、すべてが変わりました。その瞬間がAncestraの種になったのです。」
この映画は、緊急分娩中に、時と記憶を越えて、自分の前に来た女性たちや、自分が救いたいと思っているまだ生まれていない娘とつながる母親の物語です。Ancestraは、従来のライブ・アクションと先駆的なAIによって生成された画像を融合し、同時に深く親密で気が遠くなるようなストーリーに取り入れます。また、AIを人間の創造性に取って代わるものではなく、その上に構築するために、映画制作がどこに向かう可能性があるかも示唆しています。
McNitt氏は、これはAIに関する映画ではないことを急に強調します。「これは私の母についての映画です」とLind氏は言います。しかし、映像ジェネレーターVeoや、ImagenやLoRAのような画像モデルなど、Google DeepMindが開発したジェネレイティブ・モデルを彼女が使用することで、新しい種類の映画言語、つまりカメラのレンズやロケハンだけでなく、プロンプト、neural networks、そして個人データから構築された言語であることが証明される可能性が非常に高いものを垣間見ることができます。
Veoは、高い時間的一貫性、オブジェクトの一貫性、スタイル化されたレンダリングで1080pの短いクリップを生成できる高度なテキストからビデオへの変換システムです。しかし、そのような成果を達成するには、慎重に作成したプロンプト、複数回の反復、モデルが視覚的な指示をどのように解釈するかを理解する必要があります。McNitt氏と彼女の協力者は、Veoのアウトプットをモーション・パス・リファレンスとVRで構築されたカスタム3Dシーンを融合することで、クリップの長さ、忠実度、プロンプトの応答性といったプラットフォームの制約の中で作業を行いました。チームはまず、タイミングをマッピングするためにアニメーション事前視覚化を構築し、それらをAIが生成した映像のガイドとして使用しました。
映画の外観を一貫させるために、McNitt氏のチームはLoRAと呼ばれる独自のコンパニオン・スタイルの転送モデルを構築しました。それはGoogleのツールではなく、すべてのシーンで同じビジュアル・スタイルを伝えるためにAncestraのためだけに開発したシステムでした。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
Ancestra』のある場面では、私たちは登場人物の脳の中に飛び込み、何層もの組織を螺旋状に下っていき、胎児が空気を求めてもがきながら浮かんでいる子宮へと入っていく。その後、私たちは上から見た帝王切開を目撃します。腹部の肉が光の爆発の周りで花びらのように裂けていきます。これらの瞬間は、従来のCGIではレンダリングされていませんでした。チームは、プロンプト・作成、画像選択、モーション・トラッキング、AI 微調整という骨の折れる反復プロセスを通じて、これらを実現しました。
「使用可能な1つの画像を得るために、1,000以上の画像を生成しました」とMcNitt氏は言います。「それは激しいプロセスであり、機械との会話でした」
いくつかのシーンでは、チームはImagenを使用して高解像度の静止画を生成し、それをRunwayやGen-2などのフレーム予測ツールを使用して短いビデオ・クリップに変換しました。感情的なイメージを維持するために、一般的なプロンプトを避けました。代わりに、実際の病院環境に基づいて、詩的な言葉、VRブロック、照明の参照を使用しました。
Ancestraが特異である理由の一つは、AIの使い方が派手でも無駄でもないことです。合成俳優も人工のナレーションもありません。その代わりに、この映画は現実に基づいています。人間の出演者が主導するキャスト、エクスペリエンスに根ざした台本、そして制作のすべてのピクセルを導くアーティストのチームです。
「その一線は、私が乗り越えてはいけないものでした」と彼女は言います。「俳優たちは人間である必要がありました」McNitt氏にとって、AIはカメラに撮影できないものを示す方法でした。
その必須事項を受けて、彼女のチームは設定上で「AIユニット」と呼ぶものを開発しました。つまり、夢のようなビジュアル・シーケンスの開発を担当する別のクリエイティブな集団です。彼らの仕事には、彼女の亡き父親が海洋・航空写真家としてヘリコプターからぶら下がって撮影した写真をもとにモデルを指導することも含まれていました。彼の目は、文字通り、映画の視覚的DNAを形作るのに役立ちました。
「彼は最近、永続的になりました」とMcNitt氏は語ります。「彼の作品、レンズの選択、使用したフィルムについて、私はこれまで聞くことができなかった多くの疑問を抱いていました。彼の写真でモデルをトレーニングすることが、再び彼とコラボレーションする方法になりました。」
AIを匿名の生成器として使用するのではなく、記憶とコラボレーションのための器として使用するという考え方は、Ancestraを通じて実行されています。また、この映画が、芸術におけるAIをめぐる、しばしばディストピア的な言説とは一線を画す理由のひとつでもあります 。
McNitt氏はこの問題についてよく認識しています。映画における生成ツールの使用は、特にハリウッドストライキ、デジタルレイバー、著作権、創作著作者に対する懸念が続いた後、依然として議論の余地のあるトピックです。
「境界線を明確にしました」と同氏は言います。「私たちは合成俳優を使いませんでした。モデルに他のアーティストの作品を模倣するように依頼したわけではありません。私たちが生成したものはすべて、個人的な資料から構築されたか、ストーリーのために作られたものです。」
自身の創造プロセスについて、彼女は直接的な模倣と、何か新しいものに影響を織り込むというより微妙な行為との境界線を引きました。「参照とコピーには違いがあると考えています」と彼女は言います。「どのアーティストも他のアーティストからインスピレーションを得ていますが、そのインスピレーションをどのように使うかが重要です。」
他のアーティストのスタイルを借りる倫理は、著作権とクリエイティブの所有権に中心を置く傾向がありますが、この映画のAIをめぐる議論は、テクノロジーが人間の労働力を奪う可能性があるかどうかという別の懸念についても言及しています。
「Ancestraの制作には200人以上の人が関わっていました」と彼女は言います。「AIユニットは仕事に取って代わるものではなく、クリエイティブなツールキットにさらなる変化をもたらすことができたのです」
それでも、彼女は限界を認識しています。Veoのようなツールは、一度に数秒のビデオしか生成できません（つまり、すべてのショットを断片化して構築し、骨を折れてつなぎ合わせる必要があります）。ストーリー全体で視覚的な一貫性を維持するには、膨大な労力（慎重なプロンプト・デザイン、スタイルのマッチング、登場人物、照明、カメラの動きの一貫性を保つための繰り返しの反復など）が必要であり、モデルがそれ自体のルールを破ることがよくあります。または、少なくともAIを特定のクリエイティブ目標に導こうとするときに、予測不可能なプロンプトがいかに重要であるかを明らかにします。
「宇宙のイメージを促そうとしたとき、それはまるで科学の教科書のように見えました」と彼女は語りました。「映画的ではなく、文字通りのものです。より詩的な言葉を使って美学を導く間接的な促し方を見つけなければなりませんでした。」
時には、その成果が圧倒されるものになることもありました。あるショットでは、上空から見た帝王切開の宇宙的抽象写真があり、赤ちゃんが光の中に現れる様子が、バーチャルリアリティで作成した動きの参照をもとに訓練されたモデルから生まれ、彼女の父親の海洋写真からスタイルのヒントを取り入れています。その結果、超現実的で夢のようなものが生まれます。どんなカメラも捉えきれない瞬間ですが、感情的に真実を感じさせます。
この映画の最も強力な部分の1つは、McNitt氏が自身のストーリーとテクノロジーを融合させている様子です。AIはランダムな画像によってトレーニングされたのではなく、彼女の人生によってトレーニングされました。最後のシーンの赤ちゃんは、デジタルバージョンの彼女、新生児です。
彼女は、父親が病院で撮影した写真と、父親が数十年にわたって専門的に取り組んできた仕事の画像を使用しました。彼はキャリアの大半を、上空から海を撮影し、海を横切る光と遠近感を追いかけることに費やしてきました。その結果は、彼のスタイルは、抽象化された形であっても、映画の視覚的なトーンの多くを形作っています。
「彼を自分の映画監督として使うようなものでした」と彼女は言います。「彼がいなくなっても。」
この経験を通じて、彼女はクリエイターであることの意味を再考することにもなりました。機械があなたの過去を利用して新しいものを作り上げた場合、その機械は誰が所有するのでしょうか？指示を与える人か、機械か、それともメモリーか？
McNitt氏は答えがあるとは主張していません。奇妙で意図しないテクスチャを生成する最初のプロンプトから、 AIレンダリングされた人物の表情が誰も台本に書いていない方法で変化する瞬間まで、彼女はそのプロセスを非常に人間らしいものだと考えています。「私たちが犯す間違い、私たちが計画していなかったこと、そういったものの中にこそ芸術が宿るのです」と彼女は語りました。「そして、それらは人間なのです。」
その哲学が制作の指針となりました。チームは AI を近道として使うのではなく、ワイルドで予測不能なコラボレーターのように扱いました。ショットは手作業でストーリーボード化され、VRでモデル化され、何度も生成を繰り返して再考されました。多くの場合、失敗した何百もの試みからビジュアルが作成され、それぞれが感情に近づきました。
「私たちは完璧を求めていたわけではありません」とMcNitt氏は言います。「私たちは、生き生きと感じるものを探していました。」
彼女は、このアプローチが映画の枠を超えて拡大できることを期待しています。機械が私たちを反映するのです。私たちを模倣するのではなく、真に私たちを反映することができるのです。おそらく、より広範な人間のツールキットの一部になることができるでしょう。代替品としてではなく、増幅する手段として。それは企業的な雰囲気を感じさせないエンタープライズ用途を意味するかもしれません。感情の起伏のあるトレーニングビデオ。創業者たちの実生活から生まれたイメージで語られる会社の起源のストーリー。スライドの資料よりも短い映画のような解説。
すでにいくつかの企業がこの分野を探求しています。AIが生成する社内ビデオ 、安全ウォークスルー、あるいは顧客向けオンボーディング・ツールでさえも、映画のようなテクニックを採用し始め、トーン、音楽、物語構造を平凡な素材に重ねて重ねています。McNittが使用したのと同じツール（ビジュアル合成にはVEO、静止画生成にはImagen、アニメーション補間にはRunwayとGen-2）がエンタープライズコンテンツ向けにテストされています。
その違いは意図にある、と彼女は言います。これは、AIをランダムアウトプットの受動的ジェネレーターとして使用することと、明確な創造的なビジョンによって形成されたコラボレーションとして扱うことの違いです。「AIを使うことで、想像力を外部化することができます」と同氏は言います。「それは強力です。しかし、それは導かれる必要があります。」
彼女は、ガイダンスはストーリーテラー、つまり技術者やマーケティング担当者からではなく、構造、口調、感情を知っている人々から得られるべきだと信じています。
潜在的な落とし穴は明らかです。生成AIは、その規模と斬新さに圧倒されるだけでなく、感情に残る印象を与えないコンテンツを生成できます。ビジュアルは技術的には好印象を与えても、有意義な方法で視聴者とつながることはできません。McNitt氏は、より静かで、より応答性の高い、個人的なものを求めています。
「AIを試験的なものにしたくありません」と彼女は言います。「他の方法では成し得なかったことを言う手助けにしたいと考えています」
Ancestraの場合、その結果は、既知の要素に加え、同時に不貴なものに感じられる映画になっています。それは母と娘の物語、コードに書かれた愛のレター、やり直しされた記憶です。
画面が暗闇に見えて、合成された子どもの姿が薄れても、この技術の目新しさは残りません。それはジェスチャーの誠実さです。ある人は、部屋の中に立って空気を抱きしめ、そこに赤ちゃんがいると信じていました。しかし、今では私たちもそうです。
IBM Graniteは、ビジネス向けにカスタマイズされ、AIアプリケーションの拡張に合わせて最適化された、オープンで高性能、かつ信頼性の高いAIモデル・ファミリーです。言語、コード、時系列、ガードレールのオプションをご覧ください。
企業は、信頼できない基盤モデルでは生成AIを拡張できないことを認識しています。抜粋版をダウンロードして、主力の「Graniteモデル」を持つIBMがIStrong Performerに選ばれた理由をご覧ください。
watsonxプラットフォームにある基盤モデルのIBMライブラリーを探索し、ビジネスに合わせて自信を持って生成AIを拡張します。
業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。
AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。
ビジネスに合わせて生成AIを確実に拡張できるように、IBM watsonxプラットフォームにあるIBMライブラリーの基盤モデルの詳細を学びましょう。