في فيلم تدور أحداثه في مانهاتن السفلى، لم تحمل الممثلة Audrey Corsa شيئًا بين ذراعيها. الطفلة التي بدت وكأنها تحتضنها لم تكن موجودة في موقع التصوير. وسيتم إنشاؤه لاحقًا بواسطة نموذج ذكاء اصطناعي تم تدريبه على مئات الصور الفوتوغرافية والذاكرة الأولى لامرأة. كانت تلك الذكرى لحظة ولادتها.
الفيلم هو Ancestra، وهو فيلم قصير جديد من إخراج Eliza McNitt، ويضم نسخة محاكاة من McNitt نفسها، مستوحاة من الصور التي التقطها والدها في يوم ولادتها. هذه هي الصور نفسها التي استُخدمت لإنشاء طفلة في المشهد الافتتاحي. عندما تحمل الممثلة Audrey Corsa تلك المولودة الجديدة على الشاشة في ذروة المشهد الأخير، فهي في الواقع تحمل إنسانًا تم إنشاؤه رقميًا، وهو نوع من الذاكرة المهلوسة التي تم إسقاطها إلى الوجود بواسطة البرامج والنوايا. بالنسبة إلى McNitt، فإن هذه الإيماءة هي أكثر من مجرد حيلة سنيمائية. إنه عمل من أعمال التنقيب العاطفي.
قدم Darren Aronofsky المخرج السينمائي الشهير McNitt إلى الذكاء الاصطناعي التوليدي، وهي تجربة تقول إنها ألهمت فكرة Ancestra. ودعاها إلى استكشاف ما يمكن أن تفعله هذه الأدوات الجديدة وانتهى به الأمر بإنتاج الفيلم. النتيجة هي فيلم قصير شخصي للغاية عن ولادة طارئة لأم، يدمج بين الأداء الحي مع الصور المولدة بالذكاء الاصطناعي المتجذرة في التحول الكوني والجسدي.
"أخبرتني McNitt خلال محادثة أجريت معها مؤخرًا من منزلها في مدينة نيويورك: "أن والدتي اضطرت إلى إجراء عملية قيصرية طارئة عند ولادتي. "دخلت المستشفى لإجراء فحص طبي، وتغير كل شيء. أصبحت تلك اللحظة بذرة Ancestra ".
يروي الفيلم قصة أم، في أثناء عملية ولادة طارئة، تتواصل عبر الزمن والذاكرة مع النساء اللائي جئن قبلها ومع ابنتها التي لم تولد بعد والتي تأمل في إنقاذها. يدمج فيلم Ancestra بين الحركة الحية التقليدية والصور الرائدة المولدة بالذكاء الاصطناعي في سرد يبدو حميميًا للغاية وكونيًا بشكل مذهل في آن واحد. كما يلمح إلى ما يمكن أن تتجه إليه صناعة الأفلام، باستخدام الذكاء الاصطناعي ليس لاستبدال الإبداع البشري، بل للبناء عليه.
تسارع McNitt إلى التأكيد على أن هذا الفيلم ليس فيلمًا عن الذكاء الاصطناعي. وقالت: "إنه فيلم عن والدتي". لكن استخدامها للنماذج التوليدية التي طورتها Google DeepMind، بما في ذلك مولد الفيديو Veo ونماذج الصور مثل Imagen وLoRA، يقدم لمحة عما قد يكون نوعًا جديدًا من اللغة السينمائية—لغة لا تبني فقط من عدسات الكاميرا ومواقع التصوير، بل من التوجيهات، والشبكات العصبية، والبيانات الشخصية العميقة.
Veo هو نظام متقدم لتحويل النص إلى فيديو قادر على إنشاء مقاطع قصيرة بدقة تصل إلى 1080 بكسل مع تماسك زمني عالٍ واتساق الكائنات والعرض بأسلوب منمق. لكن تحقيق النتائج يتطلب موجهات مكتوبة بعناية، وتكرارات متعددة، وفهم كيفية تفسير النموذج للتعليمات البصرية. عملت McNitt ومعاونوها ضمن قيود المنصة—طول المقطع والدقة واستجابة الموجِّه—من خلال دمج مخرجات Veo مع مراجع مسار الحركة والمشاهد ثلاثية الأبعاد المخصصة المدمجة في الواقع الافتراضي. قام الفريق أولاً ببناء تصورات مسبقة متحركة لرسم خريطة للتوقيت، ثم استخدمها كدليل للقطات التي تم إنشاؤها بواسطة الذكاء الاصطناعي.
للحفاظ على تناسق مظهر الفيلم، بنى فريق McNitt نموذج نقل خاصًا بهم يُسمى LoRA. ولم يكن ذلك أداة من أدوات Google، بل كان نظامًا تم تطويره خصوصًا لفيلم Ancestra ليحمل نفس النمط البصري في كل مشهد.
في مرحلة ما من مراحل سلسلة Ancestra، نغوص في دماغ الشخصية وننزل عبر طبقات من الأنسجة إلى داخل الرحم، حيث يطفو الجنين الذي يصارع من أجل الحصول على الهواء. في وقت لاحق، نشهد عملية قيصرية من الأعلى، حيث ينفصل لحم البطن مثل البتلات حول ومضة من الضوء. لم تعرض هذه اللحظات باستخدام CGI التقليدية. أقنعهم الفريق بالعمل من خلال عملية متكررة دقيقة من الصياغة الموجهة واختيار الصور وتتبع الحركة وضبط الذكاء الاصطناعي بدقة.
قالت McNitt: "لقد أنشأنا أكثر من ألف صورة للحصول على صورة واحدة قابلة للاستخدام". "وكانت عملية مكثفة، محادثة مع الآلة."
بالنسبة إلى بعض المشاهد، استخدم الفريق برنامج Imagen لإنشاء صور ثابتة عالية الدقة، ثم حوّلوها إلى مقاطع فيديو قصيرة باستخدام أدوات التنبؤ بالإطارات مثل Runway وGen-2. ولبقاء الصور متزنة عاطفية، تجنبوا المحفزات العامة. وبدلاً من ذلك، استخدموا اللغة الشعرية وحجب الواقع الافتراضي ومراجع الإضاءة بناءً على بيئات المستشفى الحقيقية.
جزء مما يجعل Ancestra غير عادي هو أن استخدامه للذكاء الاصطناعي ليس مبهرجًا ولا مجانيًا. لا يوجد ممثلون اصطناعيون، ولا تعليقات صوتية اصطناعية. بدلاً من ذلك، يرتكز الفيلم على الواقع: طاقم عمل يقوده فنانون بشريون، وسيناريو متجذر في التجربة الحياتية وفريق من الفنانين يوجهون كل بكسل من الإنتاج.
وقالت: "كان هذا خطًا لن أتجاوزه." "كان لا بد أن يكون الممثلون بشرًا." وبدلاً من ذلك، كان الذكاء الاصطناعي بالنسبة إلى McNitt بمثابة وسيلة لإظهار ما لا يمكن التقاطه بالكاميرا.
وقد دفع هذا الأمر فريقها إلى تطوير ما تسميه «وحدة الذكاء الاصطناعي» في موقع التصوير، وهي مجموعة إبداعية منفصلة مكلفة بتطوير التسلسلات البصرية الشبيهة بالأحلام. وتضمن عملهم تدريب نموذج على صور والدها الراحل، والتي التُقط العديد منها في أثناء تدليه من طائرات الهليكوبتر كمصور بحري وجوي. ساعدت عينه، بالمعنى الحرفي للكلمة، في تشكيل الحمض النووي المرئي للفيلم.
قالت McNitt: "لقد وافته المنية مؤخرًا". "وكانت لديّ الكثير من الأسئلة لم يتسنَّ لي طرحها حول عمله واختياراته للعدسات ومخزون الأفلام الذي استخدمه. وأصبح تدريب النموذج على صوره وسيلة للتعاون معه مرة أخرى".
تسري هذه الفكرة—استخدام الذكاء الاصطناعي ليس كمولد مجهول، ولكن كوعاء للذاكرة والتعاون—في جميع أنحاء Ancestra. وهو أيضًا جزء من السبب الذي يجعل الفيلم يبدو مختلفًا عن الخطاب المتشائم الذي غالبًا ما يحيط بالذكاء الاصطناعي في الفنون.
وتدرك McNitt هذا الجدل جيدًا. لا يزال استخدام الأدوات التوليدية في الأفلام، خاصة بعد إضرابات هوليوود والمخاوف المستمرة بشأن العمل الرقمي وحقوق النشر والتأليف الإبداعي، موضوعًا مثيرًا للجدل.
قالت: "لقد وضعت حدودًا واضحة جدًا". "لم نستخدم ممثلين اصطناعيين. لم نطلب من النموذج محاكاة أعمال الفنانين الآخرين. كل ما أنشأناه أُنشئ من مواد شخصية أو صُمم من أجل القصة ".
عند مناقشة عمليتها الإبداعية، رسمت خطًا فاصلاً بين التقليد المباشر والعمل الأكثر دقة المتمثل في نسج التأثيرات في شيء جديد. وقالت: "أعتقد أن هناك فرقًا بين الاستشهاد والنسخ،". "يتأثر كل فنان بالآخرين، ولكن ما يهم هو كيفية استخدام هذا الإلهام".
بينما تميل أخلاقيات استعارة أسلوب فنان آخر إلى التركيز على حقوق النشر والملكية الإبداعية، فإن النقاش حول الذكاء الاصطناعي في هذا الفيلم تناول أيضًا قلقًا مختلفًا: ما إذا كانت التقنية قد تحل محل العمل البشري.
وقالت: "كان هناك أكثر من 200 شخص مشاركين في صناعة Ancestra". "لم تحل وحدة الذكاء الاصطناعي محل الوظائف. "لقد كان ذلك بمثابة إضافة إلى مجموعة الأدوات الإبداعية."
ومع ذلك، فإنها تعترف بالقيود. لا يمكن لأدوات مثل Veo إنشاء سوى بضع ثوانٍ من الفيديو في كل مرة (وهذا يعني أنه يجب بناء كل لقطة في أجزاء ثم تجميعها معًا بعناية شديدة). يتطلب الحفاظ على التماسك البصري عبر السرد جهدًا هائلاً (يتضمن تصميمًا دقيقًا للموجهات ومطابقة الأساليب وتكرارات عديدة للحفاظ على ثبات حركة الشخصيات والإضاءة والكاميرا) وغالبًا ما يخدع النموذج ليكسر قواعده، أو على الأقل يكشف مدى عدم القدرة على التنبؤ بالموجّهات عند محاولة توجيه الذكاء الاصطناعي نحو هدف إبداعي محدد.
وقالت: "عندما حاولنا استخدام موجّه الصور الفضائية، عادت إلينا وكأنها كتاب علمي". "حرفي جدًا، وليس سينمائيًا. كان علينا أن نجد طرقًا غير مباشرة لتحفيزها، باستخدام لغة أكثر شاعرية لتوجيه النواحي الجمالية".
كانت النتائج في بعض الأحيان مذهلة. في إحدى اللقطات، جاء التجريد الكوني لعملية قيصرية تُرى من الأعلى، مع ظهور الطفلة في الضوء، من نموذج تم تدريبه على مراجع الحركة التي أنشئت في الواقع الافتراضي، مع إشارات أسلوبية مستوحاة من تصوير والدها للمحيطات. والنتيجة هي شيء واقعي للغاية وأشبه بالحلم: لحظة لا يمكن لأي كاميرا أن تلتقطها، ولكنها تبدو حقيقية من الناحية العاطفية.
يعد أحد أقوى أجزاء الفيلم هو كيفية دمج McNitt لقصتها مع التقنية. لم يُدرب الذكاء الاصطناعي على الصور العشوائية، بل على حياتها. الطفلة في المشهد الأخير هي نسخة رقمية لها عندما كانت مولودة حديثة.
واستخدمت صورًا فوتوغرافية ألتقطها والدها في المستشفى، إلى جانب صور من عمله الاحترافي الذي استمر لعقود. وقد أمضى الكثير من حياته المهنية في تصوير المحيط من الأعلى، ومطاردة الضوء والمنظور عبر البحر. والنتيجة هي أن أسلوبه، حتى في شكله التجريدي، يشكل الكثير من النغمة البصرية للفيلم.
وقالت: "كان الأمر كما لو كان هو مصوري السينمائي". "على الرغم من أنه رحل".
كما جعلتها التجربة تعيد التفكير فيما يعنيه أن تكون مبدعًا. إذا كانت الآلة تستخدم ماضيك لصنع شيء جديد، فمن يمتلكه؟ الشخص الذي يعطي التعليمات، أم الآلة أم الذاكرة؟
لا تدعي McNitt أن لديها إجابة. لكنها ترى أن العملية إنسانية للغاية، بدءًا من الرسومات الأولية التي تولد أنسجة غريبة وغير مقصودة وحتى اللحظات التي يتغير فيها تعبير الشخصية المرسومة بالذكاء الاصطناعي بطريقة لم يكتبها أحد. وقالت: "الأخطاء التي نرتكبها والأشياء التي لا نخطط لها — غالبًا ما تكون تلك هي الأماكن التي يعيش فيها الفن". "وهؤلاء بشر."
وجهت تلك الفلسفة الإنتاج. فبدلاً من استخدام الذكاء الاصطناعي كطريق مختصر، تعامل الفريق معه كمتعاون جامح لا يمكن التنبؤ به. صورت اللقطات يدويًا، وصممت في الواقع الافتراضي، ثم أعيد تصورها من خلال التكرارات المتعددة للتوليد. أنشئت العناصر المرئية غالبًا على مئات المحاولات المهملة، وكل واحدة منها أقرب إلى الشعور.
قالت McNitt: "لم نكن نبحث عن الكمال". "كنا نبحث عن شيء يبدو حيًا".
وتأمل أن يتوسع هذا النهج إلى ما هو أبعد من السينما. إذا كان بإمكان الآلات أن تعكسنا — لا أن تقلدنا بل أن تعكسنا حقًا — فربما يمكنها أن تصبح جزءًا من مجموعة أدوات بشرية أوسع. ليس كبديل، ولكن كمكبر صوت. قد يعني ذلك استخدامات مؤسسية لا تبدو وكأنها خاصة بالشركات. فيديو تدريبي ذو طابع عاطفي. قصة عن أصل الشركة تُروى في صور مستمدة من الحياة الحقيقية للمؤسسين. التوضيح الذي يشبه الفيلم القصير أكثر من كونه مجموعة شرائح.
تستكشف عدة شركات هذا المجال بالفعل. بدأت مقاطع الفيديو الداخلية للشركات التي يتم إنشاؤها بالذكاء الاصطناعي، أو الإرشادات التفصيلية للسلامة أو حتى أدوات تأهيل العملاء في استعارة التقنيات السينمائية، ووضع طبقات من النغمة والموسيقى والبنية السردية على المواد الجافة. يتم اختبار الأدوات نفسها التي استخدمتها McNitt — Veo للتوليف البصري وImagen لتوليد الصور الثابتة وRunway وGen-2 لاستيفاء الرسوم المتحركة— لمحتوى المؤسسة.
وقالت إن الفرق يكمن في النية. إنه التمييز بين استخدام الذكاء الاصطناعي كمولد سلبي للمخرجات العشوائية والتعامل معه كمتعاون متشكل برؤيته الإبداعية الواضحة. وقالت: «يتيح لك الذكاء الاصطناعي إضفاء الطابع الخارجي على الخيال». "هذا أمر قوي. "ولكن لا بد من توجيهه."
وهي تعتقد أن التوجيه يجب أن يأتي من رواة القصص — وليس من التقنيين أو المسوقين، بل من أشخاص يعرفون البنية والنبرة والإحساس.
المخاطر المحتملة واضحة. يمكن للذكاء الاصطناعي التوليدي إنتاج محتوى مبهر بالحجم والحداثة ولكنه لا يترك انطباعًا عاطفيًا دائمًا. وقد تبهر المواد المرئية المشاهدين من الناحية الفنية ولكنها تفشل في التواصل مع المشاهدين بطريقة هادفة. تأمل McNitt في شيء أكثر هدوءًا وغرابة وأكثر خصوصية.
وقالت "لا أريد أن يقتصر الذكاء الاصطناعي على العرض فقط". "أريده أن يساعدنا على أن نقول شيئًا لا يمكننا أن قوله بطريقة أخرى."
في حالة Ancestra، النتيجة هي فيلم يبدو مألوفًا وغريبًا في آن واحد. إنها قصة أمهات وبناتهن، ورسالة حب مكتوبة بالرموز، وأعيد صنعها في الذاكرة.
عندما تصبح الشاشة مظلمة وتتلاشى الطفلة الاصطناعية، فإن ما يتبقى ليس هو حداثة التقنية. إنه صدق الإيماءة. وقف شخص ما في غرفة ذات مرة، واحتضن الهواء، واعتقد أن هناك طفلاً رضيعًا. بطريقة أو بأخرى، الآن أصبحنا كذلك.
