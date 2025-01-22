Große Sprachmodelle (LLMs) haben die KI-Diskussion dominiert, angeheizt durch die Popularität von ChatGPT und ähnlichen KI-Apps. Allerdings sind kleine Sprachmodelle (Small Language Models, SLMs) auf dem Vormarsch. SLMs sind kompakter und effizienter und benötigen weniger Speicher und Rechenleistung. Dadurch eignen sie sich gut für ressourcenbeschränkte Umgebungen.
Ihre Fähigkeit, einzigartige Inhalte und Erkenntnisse aus riesigen Datensätzen zu erzeugen, hat die Welt fasziniert und neue Werkzeuge und Apps hervorgebracht, wodurch ihre kulturelle Wirkung – insbesondere im Unternehmen – weiter gefestigt wird. Gemeinsam mit Dr. Juan Bernabe Moreno, Direktor von IBM Research Europe für Großbritannien und Irland, werden wir untersuchen, wie SLMs den Vorteil von KI in Unternehmen fördern können.
Generative künstliche Intelligenz (Gen AI) birgt ein erhebliches Produktivitätspotenzial für Unternehmen. Bei der Implementierung von KI-Modellen gilt jedoch: größer ist nicht immer besser. Es gibt 2 Hauptprobleme, die die Einführung von LLM in Unternehmen verhindern.
Erstens sind viele LLMs für allgemeine Zwecke bestimmt und begrenzen ihren Wert. „Durchschnittliche“ Unternehmensmodelle sind ineffektiv, weil es kein „durchschnittliches“ Unternehmen gibt. Wirksame KI-Modelle müssen für die spezifischen Bedürfnisse des Unternehmens entwickelt, abgestimmt und eingesetzt werden.
Zweitens sind viele proprietäre LLMs „Blackboxes“ – ein geschlossenes Modell, bei dem nur das Unternehmen, dem es gehört, die Komponenten sehen kann –, wodurch die Datentransparenz fehlt und die Abstimmung mit Unternehmensdaten, in denen der wahre Wert von KI liegt, behindert wird. Dadurch haben Unternehmen, die für die Leistung des Modells verantwortlich sind, weder Einblick noch Kontrolle.
Diese Probleme verhindern Vertrauen und Verständnis für die Sicherheit von Modellen. Ohne eine effektive Auswahl von generative KI-Lösungen, die den Anforderungen der Branche, rechtlichen und behördlichen Vorschriften entsprechen, können Unternehmen die Vorteile von generative KI nicht voll ausschöpfen.
Für eine erfolgreiche generative KI-Lösung benötigen Unternehmen 3 Dinge:
Um diese Anforderungen zu erfüllen und den KI-Wert zu maximieren, wenden sich Unternehmen an SLM und entdecken die Macht des Kleinen. SLMs bieten eine überzeugende Alternative zu allgemeinen LLMs.
SLMs haben weit weniger Aufmerksamkeit und Aufsehen erregt, aber sie bieten eine überzeugende Option für Unternehmen jeder Größe. Ihre Energieeffizienz, Datentransparenz und starke Leistung – die oft mit größeren Modellen mithalten oder diese sogar übertreffen – ermöglichen die Einführung von KI, ohne Innovationen zu behindern.
Im Allgemeinen gilt alles unter 30 Milliarden Parametern als SLM. Zu den wichtigsten Vorteilen gehören niedrigere Kosten, ein geringerer Energieverbrauch und eine verbesserte Datentransparenz und -integrität. Eine neue Generation kleinerer Modelle, wie IBM® Granite, die auf bereinigten, gefilterten Datensätzen für bestimmte Aufgaben aufbauen, reduzieren Risiken wie Verzerrungen und unangemessene Ausgaben und erhöhen gleichzeitig die Datentransparenz.
Dieses vertrauenswürdige Basismodell ermöglicht die vertrauensvolle Integration eigener Daten, wodurch der wahre Wert von KI erschlossen wird. IBM bietet eine Entschädigung für geistiges Eigentum (IP) für alle Granite-Modelle, was das Vertrauen in die Zusammenführung ihrer Daten mit den Modellen weiter stärkt.
IBM ist der Ansicht, Open-Source-Basismodelle befähigen Unternehmen, spezialisierte, integrierte Modelle zu erstellen. Um dies zu unterstützen, hat IBM seine Granite-Familie von anpassbaren SLMs, die auf transparenten, gefilterten Datensätzen trainiert werden, als Open Source zur Verfügung gestellt.
Durch die Kombination eines kleinen Granite-Modells mit Unternehmensdaten kann eine aufgabenspezifische Leistung erzielt werden, die mit größeren Modellen mithalten kann, und das zu einem Bruchteil der Kosten. Frühe Proof-of-Concept-Modelle zeigen, dass IBM Granite-Modelle deutlich weniger kosten (zwischen 3- und 23-mal weniger) als große Frontier-Modelle, während sie bei wichtigen Benchmarks besser abschneiden oder mit ähnlich großen Wettbewerbern mithalten.
Außerdem vereinfachen neue Techniken wie InstructLab– eingeführt von IBM und RedHat im Mai 2024 – die Datenübertragung von Unternehmensdaten in LLMs. InstructLab ermöglicht es Unternehmen, KI-Modelle mit weit weniger von Menschen erzeugten Informationen und Rechenressourcen als bei herkömmlichen Trainingsmethoden anzupassen.
SLMs, einschließlich der Granite-Modelle, haben bereits Wirkung gezeigt. Weltweite Sportinstitutionen verwenden Granite-Modelle, die mit ihren eigenen Domain-Daten abgestimmt sind, um die Erfahrung der Fans mit KI-generierten Kommentaren zu verbessern. Intern nutzt IBM Granite-Modelle als Grundlage für seine Ressourcen (HR)-Serviceplattform: AskHR. Durch die Verwendung natürlichsprachlicher Eingabeaufforderungen können IBM-Mitarbeiter an einem Ort auf HR-Dienste zugreifen, was sowohl für Mitarbeiter als auch für HR-Fachleute Zeit spart.
Umfangreiche LLMs sind nicht die einzige Möglichkeit, von der KI zu profitieren. Kleinere, besser zugängliche, spezialisierte Modelle bieten die notwendige Effizienz, Zuverlässigkeit, Flexibilität und Leistung zu geringeren Kosten – sowohl finanziell als auch ökologisch.
