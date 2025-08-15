An einem Filmset in Lower Manhattan hielt die Schauspielerin Audrey Corsa nichts in ihren Armen. Das Baby, das sie scheinbar im Arm hielt, war nicht am Set. Sie wurde später von einem Modell der künstlichen Intelligenz erstellt, das anhand von Hunderten von Fotos und der ersten Erinnerung einer Frau trainiert wurde. Diese Erinnerung war der Moment ihrer eigenen Geburt.
Der Film ist Ancestra, ein neuer Kurzfilm unter der Regie von Eliza McNitt, und zeigt eine simulierte Version von McNitt selbst, modelliert nach Fotografien, die ihr Vater am Tag ihrer Geburt gemacht hat. Dies sind die gleichen Bilder, die auch für das Baby in der Eröffnungsszene verwendet wurden. Wenn die Schauspielerin Audrey Corsa das Neugeborene in der abschließenden Szene auf dem Bildschirm hält, hält sie tatsächlich einen digital generierten Menschen in der Hand, eine Art halluzinierte Erinnerung, die durch Software und Absicht ins Sein projiziert wird. Für McNitt ist diese Geste mehr als nur ein filmischer Taschenspielertrick. Es ist ein Akt der emotionalen Ausgrabung.
Der bekannte Filmemacher Darren Aronofsky führte McNitt in die generative KI ein, eine Erfahrung, von der sie sagt, dass sie die Idee für Ancestra ausgelöst hat. Er lud sie ein, die Möglichkeiten dieser neuen Werkzeuge zu erkunden und produzierte schließlich den Film. Das Ergebnis ist ein zutiefst persönlicher Kurzfilm über die Notgeburt einer Mutter, der Live-Action-Leistung mit KI-generierten Bildern verbindet, die auf kosmischer und körperlicher Transformation beruhen.
„Meine Mutter musste bei meiner Geburt notfallmäßig einen Kaiserschnitt über sich ergehen lassen“, erzählte mir McNitt kürzlich in einem Gespräch von ihrem Zuhause in New York City aus. „Sie ging zur Vorsorgeuntersuchung ins Krankenhaus, und alles änderte sich.“ Dieser Moment wurde zum Keim von Ancestra.“
Der Film erzählt die Geschichte einer Mutter, die während einer Notgeburt über Zeit und Erinnerung hinweg Kontakt zu den Frauen aufnimmt, die vor ihr da waren, und zu ihrer ungeborenen Tochter, die sie zu retten hofft. Ancestra verschmilzt traditionelle Live-Action und bahnbrechende KI-generierte Bilder zu einer Erzählung, die sich zugleich zutiefst intim und schwindelerregend kosmisch anfühlt. Es ist auch ein Hinweis darauf, wohin sich das Filmemachen entwickeln könnte, indem die KI nicht die menschliche Kreativität ersetzt, sondern auf ihr aufbaut.
McNitt betont umgehend, dass dies kein Film über KI sei. „Es ist ein Film über meine Mutter“, sagte sie. Doch ihr Einsatz generativer Modelle, die von Google DeepMind entwickelt wurden, darunter der Videogenerator Veo und Bildmodelle wie Imagen und LoRA, bietet einen Einblick in das, was sich sehr wohl als eine neue Art von filmischer Sprache erweisen könnte – eine, die nicht nur aus Kameralinsen und Location Scouts besteht, sondern auch aus Prompts, neuralen Netzen und personenbezogenen Daten.
Veo ist ein fortschrittliches Text-zu-Video-System, das kurze 1080p-Clips mit hoher temporaler Kohärenz, Objektkonsistenz und stilisierter Darstellung erzeugen kann. Um diese Ergebnisse zu erzielen, bedarf es jedoch sorgfältig formulierter Prompts, mehrerer Iterationen und eines Verständnisses dafür, wie das Modell visuelle Anweisungen interpretiert. McNitt und ihre Mitarbeiter arbeiteten innerhalb der Einschränkungen der Plattform – Cliplänge, Genauigkeit, Promptreaktion – indem sie Veos Output mit Bewegungspfadreferenzen und benutzerdefinierten 3D-Szenen in VR verschmolzen. Das Team erstellte zunächst animierte Vorvisualisierungen, um das Timing abzubilden, und verwendete sie dann als Leitfaden für das KI-generierte Filmmaterial.
Um den Look des Films einheitlich zu halten, entwickelte McNitts Team ein eigenes, dazugehöriges Transfermodell namens LoRA. Es handelte sich nicht um ein Google-Tool, sondern um ein System, das speziell für Ancestra entwickelt wurde, um in jeder Szene den gleichen visuellen Stil beizubehalten.
Branchen-Newsletter
Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.
Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.
An einer Stelle in Ancestra tauchen wir in das Gehirn der Figur ein und winden uns durch Gewebeschichten hinunter in die Gebärmutter, wo ein Fötus schwebt und nach Luft ringt. Später werden wir Zeuge eines Kaiserschnitts von oben, wobei sich das Fleisch des Unterleibs wie Blütenblätter um einen Lichtblitz herum löst. Diese Momente wurden nicht mit herkömmlicher CGI-Technik dargestellt. Das Team hat sie durch einen mühsamen iterativen Prozess aus Prompt-Crafting, Bildauswahl, Bewegungsverfolgung und KI-Feinabstimmung ins Leben gerufen.
„Wir haben über tausend Bilder generiert, um ein einziges brauchbares Bild zu bekommen“, sagte McNitt. „Es war ein intensiver Prozess, ein Dialog mit der Maschine.“
Für einige Szenen nutzte das Team Imagen, um hochauflösende Standbilder zu erzeugen, die sie dann mit Frame-Prediction-Tools wie Runway und Gen-2 in kurze Videoclips umwandelten. Um die Bilder emotional zu verankern, haben sie generische Aufforderungen vermieden. Stattdessen verwendeten sie poetische Sprache, VR-Blocking und Lichtreferenzen, die auf realen Krankenhausumgebungen basierten.
Was Ancestra so ungewöhnlich macht, ist die Tatsache, dass der Einsatz von KI weder auffällig noch überflüssig ist. Es gibt keine synthetischen Schauspieler, keine künstlichen Voiceovers. Stattdessen basiert der Film auf der Realität: eine Besetzung, die von menschlichen Darstellern geleitet wird, ein Drehbuch, das auf gelebter Erfahrung basiert, und ein Team von Künstlern, das jedes Pixel der Produktion steuert.
„Das war eine Grenze, die ich nicht überschreiten wollte“, sagte sie. „Die Schauspieler mussten Menschen sein.“ Für McNitt war KI hingegen ein Mittel, um das zu zeigen, was mit der Kamera nicht eingefangen werden kann.
Diese Notwendigkeit veranlasste ihr Team dazu, eine „KI-Einheit“ am Set zu entwickeln, eine separate Kreativgruppe, die für die Entwicklung der traumhaften visuellen Sequenzen zuständig ist. Zu ihrer Arbeit gehörte es, ein Model anhand der Fotos ihres verstorbenen Vaters auszubilden. Viele davon wurden aufgenommen, während sie als Marine- und Luftfotografin an Hubschraubern baumelte. Sein Auge hat buchstäblich dazu beigetragen, die visuelle DNA des Films zu formen.
„Er ist vor Kurzem verstorben“, sagte McNitt. „Und ich hatte so viele Fragen, die ich nie stellen durfte, über seine Arbeit, seine Objektivauswahl, das Filmmaterial, das er verwendet hat. Das Training des Models anhand seiner Bilder wurde zu einer Möglichkeit, wieder mit ihm zusammenzuarbeiten.“
Dieser Gedanke – KI nicht als anonymen Generator, sondern als Gefäß für Erinnerung und Zusammenarbeit zu nutzen – zieht sich wie ein roter Faden durch Ancestra. Das ist auch einer der Gründe, warum sich der Film von dem oft dystopischen Diskurs über KI in der Kunst unterscheidet.
McNitt ist sich der Kontroverse durchaus bewusst. Der Einsatz generativer Werkzeuge im Film, insbesondere nach den Streiks in Hollywood und den anhaltenden Bedenken zu digitaler Arbeit, Urheberrecht und kreativer Urheberschaft, bleibt ein kontroverses Thema.
„Ich setze ganz klare Grenzen“, sagte sie. „Wir haben keine synthetischen Schauspieler eingesetzt.“ Wir haben das Model nicht gebeten, die Werke anderer Künstler nachzuahmen. Alles, was wir erstellt haben, basierte auf persönlichem Material oder wurde speziell für die Geschichte angefertigt.“
Bei der Beschreibung ihres kreativen Prozesses zog sie eine Grenze zwischen direkter Nachahmung und dem nuancierteren Akt, Einflüsse zu etwas Neuem zu verweben. „Ich denke, es gibt einen Unterschied zwischen Referenzieren und Kopieren“, sagte sie. „Jeder Künstler lässt sich von anderen inspirieren, aber es ist wichtig, wie wir diese Inspiration nutzen.“
Während sich die Ethik des Ausleihens des Stils eines anderen Künstlers in der Regel auf das Urheberrecht und das kreative Eigentum konzentriert, berührte die Diskussion um die KI in diesem Film auch eine andere Sorge: ob die Technologie die menschliche Arbeit ersetzen könnte.
„Über 200 Personen waren an der Entstehung von Ancestra beteiligt“, sagte sie. „Die KI-Einheit hat keine Arbeitsplätze ersetzt.“ Es erweiterte das kreative Toolkit.“
Dennoch ist sie sich der Einschränkungen bewusst. Tools wie Veo können nur wenige Sekunden Videomaterial auf einmal generieren (das heißt, jede Aufnahme muss in Fragmenten erstellt und dann mühsam zusammengefügt werden). Die Aufrechterhaltung der visuellen Kohärenz einer Geschichte erfordert einen enormen Aufwand (sorgfältiges Prompt-Design, Stilanpassung und wiederholte Iterationen, um Charaktere, Beleuchtung und Kamerabewegungen konsistent zu halten) und bringt das Modell oft dazu, seine eigenen Regeln zu brechen, oder zeigt zumindest, wie unvorhersehbar Prompts sein können, wenn man versucht, die KI zu einem bestimmten kreativen Ziel zu führen.
„Als wir versuchten, einen Prompt für Weltraumbilder einzugeben, sahen die Ergebnisse aus wie ein naturwissenschaftliches Lehrbuch“, sagte sie. „Sehr wörtlich, nicht filmisch.“ Wir mussten indirekte Wege finden, um es zu prompt, indem wir eine poetischere Sprache verwendeten, um die Ästhetik zu lenken.“
Manchmal waren die Ergebnisse faszinierend. In einer Einstellung wurde eine kosmisch anmutende Abstraktion eines Kaiserschnitts von oben dargestellt, auf dem das Baby ins Licht tritt. Das Modell wurde anhand von Bewegungsreferenzen trainiert, die in der virtuellen Realität erstellt wurden, wobei sich der Stil an der Meeresbeobachtung ihres Vaters orientierte. Das Ergebnis ist sowohl hyperreal als auch verträumt: ein Moment, den keine Kamera jemals einfangen könnte, der sich aber emotional wahr anfühlt.
Einer der wirkungsvollsten Teile des Films ist, wie McNitt ihre eigene Geschichte mit der Technologie verbindet. Die KI wurde nicht an zufälligen Bildern trainiert, sondern an ihrem Leben. Das Baby in der letzten Szene ist eine digitale Version von ihr als Neugeborenes.
Sie verwendete Fotografien, die ihr Vater im Krankenhaus gemacht hatte, zusammen mit Bildern aus seiner jahrzehntelangen beruflichen Arbeit. Einen Großteil seiner Karriere hatte er damit verbracht, den Ozean von oben zu fotografieren und dabei Licht und Perspektive über das Meer zu verfolgen. Das Ergebnis ist, dass sein Stil, selbst in abstrakter Form, einen Großteil des visuellen Tons des Films prägt.
„Es war, als hätte ich ihn als meinen Kameramann gehabt“, sagte sie. „Auch wenn er nicht mehr da ist.“
Die Erfahrung brachte sie auch dazu, darüber nachzudenken, was es bedeutet, die Schöpferin zu sein. Wenn eine Maschine deine Vergangenheit nutzt, um etwas Neues zu erschaffen, wem gehört sie dann? Der Person, die die Anweisungen gibt, der Maschine oder dem Speicher?
McNitt behauptet nicht, eine Antwort zu haben. Aber sie sieht den Prozess als zutiefst menschlich an, von den ersten groben Prompts, die seltsame, unbeabsichtigte Texturen erzeugen, bis hin zu den Momenten, in denen sich der Ausdruck einer von der KI gerenderten Figur auf eine Weise verändert, die niemand geplant hat. „Die Fehler, die wir machen, die Dinge, für die wir nicht planen – dort lebt die Kunst oft“, sagte sie. „Und die sind menschlich.“
Diese Philosophie leitete die Produktion. Anstatt KI als Abkürzung zu verwenden, behandelte das Team sie wie einen wilden, unberechenbaren Mitarbeiter. Die Aufnahmen wurden von Hand storyboardet, in VR modelliert und dann durch mehrere Iterationen neu interpretiert. Die Bilder wurden oft aus Hunderten von verworfenen Versuchen zusammengesetzt, wobei jeder einzelne einem Gefühl näher kam.
„Wir haben nicht nach Perfektion gesucht“, sagte McNitt. „Wir haben nach etwas gesucht, das sich lebendig anfühlt.“
Sie hofft, dass dieser Ansatz über das Kino hinaus ausgedehnt werden kann. Wenn Maschinen uns widerspiegeln können – uns nicht imitieren, sondern uns wirklich widerspiegeln –, dann können sie vielleicht Teil eines umfassenderen menschlichen Toolkits werden. Nicht als Ersatz, sondern als Verstärker. Das könnte Unternehmensnutzungen bedeuten, die sich nicht unternehmerisch anfühlen. Ein Trainingsvideo mit emotionalem Spannungsbogen. Eine Entstehungsgeschichte des Unternehmens, erzählt in Bildern, die aus dem echten Leben der Gründer stammen. Eine Erklärung, die eher wie ein Kurzfilm als wie eine Präsentation wirkt.
Mehrere Unternehmen erkunden dieses Gebiet bereits. KI-generierte interne Unternehmensvideos, Sicherheits-Walkthroughs oder sogar Tools für das Kunden-Onboarding übernehmen allmählich filmische Techniken, indem sie Ton, Musik und Erzählstruktur auf ansonsten trockenes Material überlagern. Die gleichen Werkzeuge, die McNitt verwendet hat – Veo für visuelle Synthese, Imagen für die Standbilderzeugung, Runway und Gen-2 für Animationsinterpolation – werden für Unternehmensinhalte getestet .
Der Unterschied, sagte sie, liege in der Absicht. Es ist der Unterschied zwischen der Verwendung von KI als passivem Generator von zufälliger Ausgabe und der Behandlung von KI als Kollaborateur, der von einer klaren kreativen Vision geprägt ist. „Mit KI kann man seine Vorstellungskraft nach außen übertragen“, sagte sie. „Das ist mächtig. Aber es muss geleitet werden.“
Sie ist der Ansicht, dass die Anleitung von Geschichtenerzählern kommen muss – nicht von Technologen oder Marketingexperten, sondern von Menschen, die Struktur, Tonfall und Gefühl verstehen.
Die möglichen Fallstricke sind offensichtlich. Generative KI kann Inhalte erzeugen, die durch ihre Größe und Neuartigkeit beeindrucken, aber keinen bleibenden emotionalen Eindruck hinterlassen. Das Bildmaterial mag technisch beeindrucken, aber es gelingt nicht, den Zuschauer auf sinnvolle Weise anzusprechen. McNitt hofft auf etwas Ruhigeres, Besonderes und Persönlicheres.
„Ich möchte nicht, dass es bei KI um Spektakel geht“, sagte sie. „Ich möchte, dass sie uns hilft, etwas zu sagen, was wir sonst nicht sagen könnten.“
Im Fall von Ancestra ist das Ergebnis ein Film, der gleichzeitig vertraut und unheimlich wirkt. Es ist eine Geschichte von Müttern und Töchtern, ein verschlüsselter Liebesbrief, eine Erinnerung, die neu geschrieben wurde.
Wenn der Bildschirm dunkel wird und das synthetische Kind verblasst, bleibt nicht die Neuartigkeit der Technik übrig. Es ist die Aufrichtigkeit der Geste. Einmal stand jemand in einem Raum, hielt die Luft in den Händen und glaubte, dass dort ein Baby war. Irgendwie tun wir das jetzt auch.
IBM® Granite ist unsere Familie offener, leistungsfähiger und vertrauenswürdiger KI-Modelle, die auf Unternehmen zugeschnitten und für die Skalierung Ihrer KI-Anwendungen optimiert sind. Entdecken Sie die Optionen zu Sprache, Code, Zeitreihen und Guardrails.
Unternehmen erkennen, dass sie generative KI nicht mit Foundation Models skalieren können, denen sie nicht vertrauen können. Laden Sie den Auszug herunter, um zu erfahren, warum IBM mit seinen Vorzeigemodellen „Granite“ als „Strong Performer“ bezeichnet wird.
Erfahren Sie, wie Sie Teams durch den Einsatz neuester KI- Technologien und -Infrastrukturen zur kontinuierlichen Verbesserung der Modell-Leistung und Steigerung des Wettbewerbsvorsprungs motivieren können.
Entdecken Sie den Wert von auf Unternehmen abgestimmten Foundation Models, die allen Branchen Vertrauen, Leistung und kosteneffiziente Vorteile bieten.
Erfahren Sie, wie Sie generative KI, maschinelles Lernen und Foundation Models zur Verbesserung der Leistung in Ihre Geschäftsabläufe integrieren können.
Sehen Sie sich eine Demo zum Vergleich von IBM Modellen mit anderen Modellen für verschiedene Anwendungsfälle an.
Erkunden Sie die Foundation-Model-Bibliothek im watsonx-Portfolio von IBM zur zuverlässigen Skalierung generativer KI für Ihr Unternehmen.
Setzen Sie KI in Ihrem Unternehmen ein – mit branchenführendem Fachwissen im Bereich KI und dem Lösungsportfolio von IBM an Ihrer Seite.
Erfinden Sie kritische Workflows und Abläufe neu, indem Sie KI einsetzen, um Erfahrungen, Entscheidungsfindung in Echtzeit und den geschäftlichen Nutzen zu maximieren.
Erkunden Sie die Foundation-Model-Bibliothek im watsonx-Portfolio von IBM zur zuverlässigen Skalierung generativer KI für Ihr Unternehmen.