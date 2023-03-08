Wie der Name schon sagt, generiert generative KI Bilder, Musik, Sprache, Code, Video oder Text, während sie bereits vorhandene Daten interpretiert und manipuliert. Generative KI ist kein neues Konzept: Die Techniken für maschinelles Lernen hinter generativer KI haben sich im letzten Jahrzehnt weiterentwickelt. Der neueste Ansatz basiert auf einer neuronalen Netzarchitektur, die als „Transformer“ bezeichnet wird. Durch die Kombination von Transformer-Architektur mit unüberwachtem Lernen entstanden große Foundation Models, die bestehende Benchmarks übertreffen, die mehrere Datenmodalitäten verarbeiten können.

Diese großen Modelle werden als Basismodelle bezeichnet, da sie als Ausgangspunkt für die Entwicklung fortgeschrittener und komplexerer Modelle dienen. Indem wir auf einem Foundation Model aufbauen, können wir spezialisiertere und anspruchsvollere Modelle erstellen, die auf bestimmte Anwendungsfälle oder Bereiche zugeschnitten sind. Frühe Beispiele von Modellen wie GPT-3, BERT, T5 oder DALL-E haben gezeigt, was möglich ist: Geben Sie einen kurzen Prompt ein und das System generiert auf der Grundlage Ihrer Parameter einen ganzen Aufsatz oder ein komplexes Bild.

Large Language Models (LLMs) wurden explizit mit großen Mengen an Textdaten für NLP-Aufgaben (Natural Language Processing, Verarbeitung natürlicher Sprache) trainiert und enthielten eine beträchtliche Anzahl von Parametern, meist über 100 Millionen. Sie erleichtern die Verarbeitung und Generierung von natürlichsprachlichem Text für verschiedene Aufgaben. Jedes Modell hat seine Stärken und Schwächen, und die Wahl des zu verwendenden Modells hängt von der spezifischen NLP-Aufgabe und den Eigenschaften der zu analysierenden Daten ab. Die Wahl des richtigen LLM für eine bestimmte Aufgabe erfordert Fachkenntnisse in LLMs.

BERT ist darauf ausgelegt, bidirektionale Beziehungen zwischen Wörtern in einem Satz zu verstehen und wird hauptsächlich für die Aufgabenklassifizierung, die Beantwortung von Fragen und die Erkennung benannter Entitäten eingesetzt. GPT hingegen ist ein unidirektionales, transformatorbasiertes Modell, das hauptsächlich für Textgenerierungsaufgaben wie Sprachübersetzung, Zusammenfassung und Inhaltserstellung verwendet wird. T5 ist ebenfalls ein transformatorbasiertes Modell, unterscheidet sich jedoch von BERT und GPT dadurch, dass es mit einem Text-zu-Text-Ansatz trainiert wird und für verschiedene Aufgaben der Verarbeitung natürlicher Sprache wie Sprachübersetzung, Zusammenfassung und Beantwortung von Fragen fein abgestimmt werden kann.