Was ist One-Shot-Prompting?

Autor(en):

Vrunda Gadesha

AI Advocate | Technical Content Author

Was ist One-Shot-Prompting?

One-Shot-Prompting bezieht sich auf die Methode, bei der einem Modell ein einziges Beispiel oder Prompt zur Ausführung einer Aufgabe bereitgestellt wird. Im Gegensatz zu anderen Prompt-Engineering-Techniken – dem Zero-Shot-Prompting, bei dem keine Beispiele angegeben werden, oder dem Few-Shot-Prompting, bei dem einige Beispiele genannt werden – stützt sich das One-Shot-Prompting auf einen einzigen, gut gestalteten Prompt, um den gewünschten Output zu erzielen. Diese Methode nutzt große Sprachmodelle (LLMs) wie die GPT-3/GPT-4-Modelle (Generative Pre-trained Transformer) von OpenAI oder IBM® Granite-Modelle, um menschenähnlichen Text auf der Grundlage minimaler Eingaben zu verstehen und zu generieren.

One-Shot-Prompting ist besonders nützlich in Szenarien, in denen das Sammeln großer Mengen an Trainingsdaten unpraktisch ist. Zum Beispiel bietet One-Shot-Prompting in Anwendungen wie Chain-of-Thought Prompting, Few-Shot-Prompting und Zero-Shot-Prompting, wo begrenzte oder keine gekennzeichneten Daten verfügbar sind, einen erheblichen Vorteil, da Modelle anhand eines einzigen Beispiels generalisieren können. In Abbildung 1 wird die Entstehung von One-Shot-Prompting veranschaulicht.

Im sich schnell entwickelnden Bereich der künstlichen Intelligenz (KI) und der Verarbeitung natürlicher Sprache (NLP), insbesondere in der generativen KI, ist Prompt Engineering zu einer zentralen Technik geworden. Unter den verschiedenen Arten des Prompting zeichnet sich das One-Shot-Prompting durch seine Effizienz und Effektivität aus. Dieser Artikel erkundet das Konzept des One-Shot-Prompting, seine Mechanismen, Anwendungen, Vorteile, Einschränkungen und Zukunftsaussichten.

Prompting ist eine Technik, die in der KI verwendet wird, um Sprachmodelle bei der Erzeugung der gewünschten Ausgaben zu unterstützen. Es gibt verschiedene Arten des Promptings, darunter Zero-Shot-, Few-Shot- und One-Shot-Prompting. Jeder Typ variiert in Bezug auf die Menge der Daten und Beispiele, die dem Modell zur Ausführung einer bestimmten Aufgabe zur Verfügung gestellt werden. Beim Prompt Engineering werden diese Prompts erstellt, um die Leistung des Modells zu optimieren.

Mechanismen hinter dem One-Shot-Prompting

One-Shot-Prompting nutzt die Funktionen von fortschrittlichen großen Sprachmodellen (LLMs), um aus einer einzigen Beispielaufforderung kohärente und kontextuell angemessene Antworten zu generieren. Diese Effizienz wird durch mehrere zugrunde liegende Mechanismen ermöglicht, darunter Knowledge-Prompting, visuelles kontextbezogenes Prompting und adaptive Merkmalsprojektion. Während einige dieser Mechanismen, wie z. B. Knowledge-Prompting und adaptive Merkmalsprojektion, verallgemeinert sind und auf verschiedene Datentypen wie Text, Bild und Video angewendet werden können, sind andere, wie z. B. visuelles kontextbezogenes Prompting, speziell für die Verarbeitung von Bild- oder Videodaten konzipiert.

Visuelles kontextbezogenes Prompting ermöglicht es dem Modell, auf der Grundlage von visuellen Hinweisen zu interpretieren und zu reagieren, was für Aufgaben wie Bilderkennung oder Videoanalyse entscheidend ist. Im Gegensatz dazu verbessern Knowledge-Prompting und adaptive Merkmalsprojektion die Fähigkeit des Modells, verschiedene Arten von Eingaben zu verstehen und Antworten zu generieren, wodurch es über mehrere Bereiche hinweg vielseitig einsetzbar ist.

Sie müssen beispielsweise ein französisches Dokument ins Englische zusammenfassen und die Ausgabe für eine bestimmte API formatieren. Beim One-Shot-Prompting können Sie ein einzelnes Beispiel-Prompt bereitstellen, wie etwa: „Zusammenfassen dieses französischen Textes in Englisch mit der API-Vorlage {Title}, {Key Points}, {Summary}.“ Das LLM nutzt seine mehrsprachigen Fähigkeiten und seine adaptive Merkmalsprojektion, um das gewünschte Ausgabeformat zu erzeugen. In Python kann dieser Prozess automatisiert werden, indem die Antwort des generativen KI-Modells in den API-Workflow integriert wird.

Knowledge-Prompting

Bei dieser Methode werden externe Wissensdatenbanken oder bereits vorhandene domänenspezifische Korpora genutzt, um das kontextuelle Verständnis und die Entscheidungsfindungsfunktionen des Modells zu verbessern. Durch die Integration strukturierter Wissensgraphen oder Textvorschläge, die mit aktionsbezogenen oder aufgabenspezifischen Informationen angereichert sind, kann das Modell relevante Informationen effektiv abrufen, die genauere Schlussfolgerungen ermöglichen. Durch das Einbetten von aktionsbezogenen Korpora, wie z. B. Sequenzen von domänenrelevanten Aufgaben oder Ereignissen, kann das Modell beispielsweise besser auf neue Aufgaben in One-Shot-Learning-Szenarien verallgemeinert werden. Dieser Ansatz ermöglicht es dem Modell, Wissenslücken mithilfe vordefinierter Informationsspeicher zu schließen und so seine Fähigkeit zu verbessern, sich anzupassen und kontextuell angemessenere Antworten zu generieren.[1] Diese Technik ist besonders leistungsfähig in Kombination mit großen LLMs, da sie den Bedarf an großen Mengen an aufgabenspezifischen Trainingsdaten reduziert und dennoch zuverlässige Ergebnisse liefert.

Visuelles kontextbezogenes Prompting

Diese Technik nutzt visuelle Hinweise wie Segmentierungsmasken, Begrenzungsrahmen oder Schlüsselpunkte, um Modelle dabei zu unterstützen, Bild- oder Videodaten effektiver zu verstehen und zu verarbeiten. Beim visuellen kontextbezogenen Prompting wird dem Modell ein Referenzbild oder eine Reihe von Bildsegmenten zur Verfügung gestellt, die bestimmte relevante Bereiche hervorheben, sodass es sich während der Inferenz auf wichtige visuelle Merkmale konzentrieren kann. Durch die Verwendung dieser Prompts kann das Modell räumliche Beziehungen, Objekt-Boundarys und kontextuelle Elemente innerhalb des Bildes besser verstehen und so seine Leistung bei Visions-Aufgaben erheblich verbessern. Dieser Ansatz verbessert die Zero-Shot- und One-Shot-Lernfunktionen, indem er es dem Modell ermöglicht, aus minimalen Beispielen in verschiedenen visionbasierten Anwendungen wie Objekterkennung, Bildklassifizierung und Segmentierung zu verallgemeinern.[2] Darüber hinaus ermöglicht die Technik dem Modell, seine Vorhersagen zu verfeinern, indem es sich dynamisch an neue visuelle Kontexte mit minimalen Daten anpasst, was es in Szenarien mit begrenzten gekennzeichneten Trainingsbeispielen sehr effektiv macht.

Adaptive Merkmalsprojektion

Bei der One-Shot-Aktionserkennung bewältigt die adaptive Funktionsprojektion die zeitliche Variation in den Videodaten, indem sie die extrahierten Funktionen im Laufe der Zeit ausrichtet und verfeinert. Diese Methode beinhaltet das Vortraining und die Feinabstimmung des Basisnetzwerks, um einen allgemeinen Satz von Funktionen zu erlernen, und dann die Anwendung von Techniken zur Funktionenanpassung, die es dem Modell ermöglichen, seine internen Funktionendarstellungen basierend auf dem zeitlichen Verlauf des Videos dynamisch anzupassen. Durch die Projizierung der Eingabefunktionen auf einen Raum, der sowohl räumliche als auch zeitliche Muster erfasst, kann das Modell die Variabilität der Aktionsabläufe besser bewältigen und Beispiele wie Änderungen der Bewegungsgeschwindigkeit oder der Objektinteraktion liefern. Dieser Ansatz verbessert die Fähigkeit des Modells, Aktionen aus nur einem einzigen Trainingsvideo zu erkennen, erheblich und verbessert seine Generalisierung und Genauigkeit bei der Erkennung komplexer Aktionen in neuen, unveröffentlichten Videosequenzen.[3] Die adaptive Funktionsprojektion ist besonders nützlich, wenn es darum geht, die feinkörnige zeitliche Dynamik videobasierter Aufgaben zu bewältigen, was sie zu einer kritischen Komponente für die One-Shot-Aktionserkennung mit hoher Leistung macht.

Aufmerksamkeitszoomen

Diese Strategie verbessert das One-Shot-Learning, indem sich das Modell Schritt für Schritt auf die relevantesten Bereiche der Eingabe konzentriert. Bei Aufgaben zur Aktionserkennung wird das Aufmerksamkeitszoomen durch Mechanismen wie die gegenseitige Aufmerksamkeit zwischen Unterstützungs- und Abfragesätzen eingesetzt. Dieser Ansatz ermöglicht es dem Modell, Funktionen aus einem Supportvideo (das das Aktionsbeispiel enthält) mit einem Abfragevideo (in dem die Aktion erkannt werden muss) zu vergleichen und abzugleichen. Durch die Konzentration auf bestimmte zeitliche oder räumliche Regionen, die am ehesten die relevante Aktion enthalten, generiert das Modell hochwertige Aktionsvorschläge. Dieser Mechanismus der gegenseitigen Aufmerksamkeit ermöglicht es dem Modell, wichtige Teile der Eingabe effektiv zu „vergrößern“, das Rauschen und irrelevante Informationen zu reduzieren und so seine Leistung in One-Shot-Learning-Szenarien zu verbessern.[4] Die Technik hilft dabei, komplexe Eingaberäume einzugrenzen, was eine effizientere Verarbeitung des Abfragesatzes ermöglicht, während selbst bei minimalen Trainingsbeispielen die Genauigkeit erhalten bleibt.

Diese Mechanismen veranschaulichen die Anpassungsfähigkeit und Robustheit des One-Shot-Prompting in verschiedenen Bereichen anhand konkreter Beispiele. Durch den Einsatz fortschrittlicher Prompting-Techniken und die Integration von externem Wissen und visuellen Hinweisen kann das One-Shot-Prompting bei minimaler Dateneingabe eine hohe Genauigkeit und Effizienz erreichen.

Vorteile und Einschränkungen von One-Shot-Prompting

One-Shot-Prompting bietet erhebliche Vorteile und einige Herausforderungen, was es zu einer überzeugenden und dennoch komplexen Technik im Bereich der KI und des maschinellen Lernens macht. Hier finden Sie einen detaillierten Überblick über die Vorteile und Einschränkungen:

Vorteile

  • Effizienzreduzierte Trainingsdaten: One-Shot-Prompting erfordert deutlich weniger Trainingsdaten als herkömmliche Modelle für maschinelles Lernen. Diese Effizienz reduziert die für das Training erforderlichen Rechenressourcen und den Zeitaufwand. Beispielsweise können Modelle bei Anwendungen wie der One-Shot-Aktionserkennung mit minimalen Eingabedaten eine hohe Genauigkeit erreichen.[3]
  • Geschwindigkeitschnellere Bereitstellung: One-Shot-Prompting ermöglicht die schnelle Bereitstellung von KI-Modellen. Dies ist besonders in dynamischen Umgebungen von Vorteil, in denen eine schnelle Anpassung an neue Aufgaben entscheidend ist. Die Fähigkeit, aus einem einzigen Beispiel qualitativ hochwertige Antworten zu generieren, beschleunigt die Bereitstellung.[5]
  • FlexibilitätAnpassungsfähigkeit an verschiedene Anwendungen: Das One-Shot-Prompting lässt sich in hohem Maße an eine Vielzahl von Anwendungen anpassen, von Chatbots für den Kundenservice bis hin zu personalisierten Empfehlungen. Diese Flexibilität macht es für diverse Anwendungsfälle geeignet, einschließlich Few-Shot- und Zero-Shot-Lernszenarien.[1]

Begrenzungen

  • Potenzial für VerzerrungenVerzerrungen, die aus vorab trainierten Daten übernommen wurden: Eine der größten Herausforderungen beim One-Shot-Prompting ist das Potenzial für Verzerrungen. Da sich die Modelle stark auf vorab trainierte Daten stützen, können sie in den Datensätzen vorhandene Verzerrungen übernehmen und fortsetzen. Dies kann die Fairness und Genauigkeit der Ausgaben des Modells beeinträchtigen.[6]
  • GenauigkeitVariabilität in der Leistung: Auch wenn das One-Shot-Prompting sehr effektiv sein kann, erreicht es nicht immer das gleiche Maß an Genauigkeit wie Methoden, die umfangreiche Trainingsdaten verwenden. Komplexe Aufgaben, die ein detailliertes Verständnis und einen Kontext erfordern, können für One-Shot-Prompting-Modelle eine Herausforderung darstellen und zu Leistungsschwankungen führen.[7]

Denken Sie über Prompts hinaus und erfassen Sie den gesamten Kontext 

Bleiben Sie mit dem Think-Newsletter über die neuesten Branchennachrichten, KI-Tools und aufkommende Trends im Bereich Prompt Engineering auf dem Laufenden. Außerdem erhalten Sie Zugang zu neuen Erläuterungen, Tutorials und Experteneinblicken – direkt in Ihrem Posteingang. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Anwendungsfälle

One-Shot-Prompting ist eine leistungsstarke Technik, die in einer Vielzahl von Branchen und Szenarien eine Reihe von Beispielen und Anwendungen findet. Durch die Nutzung der Funktionen fortschrittlicher großer Sprachmodelle (LLMs) und ausgeklügelter Prompting-Methoden kann das One-Shot-Prompting die Effizienz und die Leistung verschiedener Aufgaben erheblich steigern. Hier sind einige bemerkenswerte Anwendungsfälle:

1. Kundenservice und Chatbots

One-Shot-Prompting kann die Leistung von Chatbots und virtuellen Assistenten im Kundenservice erheblich verbessern. Anhand eines einzigen, gut ausgearbeiteten Beispiels können Chatbots darauf trainiert werden, komplexe Anfragen zu bearbeiten, personalisierte Antworten zu geben und die Kundenzufriedenheit insgesamt zu verbessern. Diese Methode reduziert den Bedarf an umfangreichen Trainingsdaten und ermöglicht eine schnelle Bereitstellung und Anpassung an verschiedene Kundenserviceszenarien.[6]

2. Erstellung und Automatisierung von Inhalten

Im Bereich der Inhaltserstellung und Automatisierung kann One-Shot-Prompting verwendet werden, um hochwertige Artikel, Berichte und kreative Inhalte mit minimaler Eingabe zu generieren. Dies ist besonders nützlich für Vermarkter, Autoren und Inhaltsersteller, die große Mengen an Inhalten effizient produzieren müssen. Durch die Bereitstellung eines einzelnen Prompts können Modelle vielfältige und kontextrelevante Inhalte generieren und so Zeit und Ressourcen sparen.[1]

3. Personalisierte Empfehlungen

One-Shot-Prompting verbessert Empfehlungssysteme, indem es maßgeschneiderte Vorschläge auf der Grundlage begrenzter Eingaben generiert. So können E-Commerce-Plattformen beispielsweise One-Shot-Prompting verwenden, um personalisierte Produktempfehlungen bereitzustellen, die Einkaufserfahrung zu verbessern und den Umsatz zu steigern. Diese Methode nutzt minimale Daten, um hochpräzise und relevante Empfehlungen zu erstellen.[7]

4. Aktionserkennung in Videos

Bei der Videoanalyse kann One-Shot-Prompting für die Aktionserkennung verwendet werden, z. B. um bestimmte Aktionen in Überwachungsaufnahmen oder Sportanalysen zu identifizieren. Durch die Bereitstellung eines einzigen Beispielvideos können Modelle lernen, ähnliche Aktionen in neuen Videos zu erkennen, auch unter unterschiedlichen Bedingungen. Dies ist besonders wertvoll in Anwendungen wie Sicherheit, Leistungsanalyse im Sport und automatisierte Videobearbeitung.[3]

Somit ist das One-Shot-Prompting ein bedeutender Fortschritt in der KI und bietet effiziente und flexible Lösungen in verschiedenen Bereichen. Da die Forschung weiterhin an ihren Grenzen arbeitet, werden die potenziellen Anwendungen und Nutzen dieser Technik zunehmen und zur Entwicklung intelligenter Systeme beitragen.

AI Academy

KI-Experte werden

Erlangen Sie das nötige Wissen, um KI-Investitionen zu priorisieren, die das Unternehmenswachstum vorantreiben. Starten Sie noch heute mit unserer kostenlosen AI Academy und gestalten Sie die Zukunft der KI in Ihrem Unternehmen.

Weiterführende Lösungen
IBM watsonx.ai

Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.

watsonx.ai erkunden
Lösungen im Bereich künstlicher Intelligenz

Setzen Sie KI in Ihrem Unternehmen ein
– mit branchenführendem Fachwissen im Bereich KI und dem umfassenden Lösungsportfolio von IBM an Ihrer Seite.

Erkunden Sie KI-Lösungen
Beratung und Services zu künstlicher Intelligenz (KI)

Die KI-Services von IBM Consulting unterstützen Sie dabei, die Art und Weise, wie Unternehmen mit KI arbeiten, neu zu denken.

KI-Services entdecken
Machen Sie den nächsten Schritt

Mithilfe von KI liefert IBM Concert wichtige Erkenntnisse über Ihre Abläufe und gibt anwendungsspezifische Empfehlungen zur Verbesserung. Entdecken Sie, wie Concert Ihr Unternehmen voranbringen kann.

Entdecken Sie Concert Erkunden Sie Lösungen zur Geschäftsprozessautomatisierung