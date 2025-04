Auch als Transformator bekannt, ist ein Foundation Model ein KI-Algorithmus, der auf riesigen Datenmengen trainiert wird. Der Begriff „Foundation Model“ wurde 2021 vom Stanford Institute for Human-Centered Artificial Intelligence geprägt.

Ein Foundation Model basiert auf einer neuronalen Netzmodellarchitektur, um Informationen ähnlich wie das menschliche Gehirn zu verarbeiten. Foundation Models können darauf trainiert werden, Aufgaben wie die Datenklassifizierung, die Identifizierung von Objekten in Bildern (Computer Vision) und die Verarbeitung natürlicher Sprache (NLP) (Textverständnis und -generierung) mit einem hohen Grad an Genauigkeit auszuführen. Sie können auch selbstüberwachtes Lernen durchführen, um ihr Wissen zu verallgemeinern und auf neue Aufgaben anzuwenden.

Anstatt Zeit und Mühe in das Training eines Modells von Grund auf zu investieren, können Datenwissenschaftler vortrainierte Foundation Models als Ausgangspunkt für die Erstellung oder Anpassung generativer KI-Modelle für einen bestimmten Anwendungsfall verwenden. Ein Foundation Model könnte zum Beispiel als Grundlage für ein generatives KI-Modell verwendet werden, das dann mit weiteren Datensätzen verfeinert wird, um sicherere und schnellere Wege zur Herstellung eines Produkttyps zu finden.

Eine spezielle Art von Foundation Model, das als großes Sprachmodell (Large Language Model, LLM) bezeichnet wird, wird anhand von riesigen Mengen von Textdaten für NLP-Aufgaben trainiert. BERT (Bi-directional Encoder Representations from Transformers) ist eines der frühesten entwickelten LLM-Foundation-Models. Google hat BERT als Open-Source-Modell im Jahr 2018 entwickelt. Es wurde mit einem großen Korpus von Daten in englischer Sprache mit Selbstüberwachung vortrainiert und kann für eine Vielzahl von Aufgaben verwendet werden, wie zum Beispiel:

Analyse der Kunden-/Zielgruppenstimmung

Beantwortung von Fragen zum Kundenservice

Vorhersage von Text aus Eingabedaten

Generierung von Text basierend auf Benutzeraufforderungen

Die Zusammenfassung großer, komplexer Dokumente

Foundation Models im Vergleich zu traditionellen Modellen für maschinelles Lernen

Ein für generative KI verwendetes Foundation Model unterscheidet sich von einem herkömmlichen Modell für maschinelles Lernen dadurch, dass es auf großen Mengen von Daten ohne Kennzeichnung trainiert werden kann, um Anwendungen zu unterstützen, die Inhalte generieren oder Aufgaben ausführen.

Inzwischen wird ein traditionelles maschinelles Lernmodell typischerweise so trainiert, dass es eine einzelne Aufgabe mit gekennzeichneten Daten ausführt, z. B. anhand von gekennzeichneten Bildern von Autos, um das Modell so zu schulen, dass es dann Autos in nicht gekennzeichneten Bildern erkennt.

Foundation Models, die sich auf den Unternehmenswert konzentrieren

watsonx.ai Studio von IBM ist eine Suite von Sprach- und Code-Foundation-Models, die jeweils einen geologischen Codenamen haben und für eine Reihe von Unternehmensaufgaben angepasst werden können. Alle watsonx.ai-Modelle werden auf dem von IBM kuratierten und auf Unternehmen ausgerichteten Data Lake trainiert.

Jetzt verfügbar: Slate

Slate bezieht sich auf eine Familie von reinen Encoder-Modellen, die zwar nicht generativ sind, aber für viele NLP-Aufgaben in Unternehmen schnell und effektiv sind.

Bald verfügbar: Granite

Die Granite-Modelle basieren auf einer GPT-ähnlichen Architektur für generative Aufgaben, die nur aus Decodern besteht.

Bald verfügbar: Sandstone

Sandstone-Modelle verwenden eine Encoder-Decoder-Architektur und eignen sich gut für die Feinabstimmung für spezifische Aufgaben.

Bald verfügbar: Obsidian

Obsidian-Modelle nutzen eine neue modulare Architektur, die von IBM Research entwickelt wurde und eine hohe Inferenzleistung und ein hohes Leistungsniveau für eine Vielzahl von Aufgaben bietet.