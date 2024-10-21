72 % der leistungsstärksten CEOs stimmen zu, dass die fortschrittlichsten generative KI-Tools einem Unternehmen einen Wettbewerbsvorteil verschaffen, so das IBM Institute for Business Value. Wenn diese generativen KI-Tools jedoch nicht im einzigartigen Kontext eines Unternehmens verankert sind, könnten Unternehmen nicht den vollen Nutzen daraus ziehen.
So leistungsstark die großen, universellen generativen KI-Modelle wie ChatGPT und Google Gemini auch sind, sie sind nicht auf unternehmensspezifischen Datensätzen trainiert. Wenn sie in die Prozesse eines Unternehmens eingebunden sind, fehlen ihnen möglicherweise wichtige Informationen, die sie verwirren und zu suboptimalen Ergebnissen führen können.
„Jedes Unternehmen hat seine eigene Sprache“, erklärt Michael Choie, Senior Managing Consultant, AI and Analytics, IBM Consulting. „Nehmen Sie das Wort ‚Dressing’. Für eine Supermarktkette bedeutet das „Salatdressing“. Für ein Krankenhaus bedeutet das „Wundversorgung“.“
IBM arbeitete mit The Harris Poll zusammen, um AI in Action 2024 zu veröffentlichen, eine Umfrage unter 2.000 Unternehmen weltweit. Die Umfrage ergab, dass 15 % dieser Unternehmen – die sogenannten KI-Leader – mit KI messbare Ergebnisse erzielen.
Eine Sache, die KI-Führungskräfte von anderen unterscheidet, ist das Vertrauen in ihre Fähigkeit, ihre KI-Bemühungen so anzupassen, dass sie optimalen Nutzen bringen. Das bedeutet nicht, dass ein Unternehmen seine eigenen Modelle von Grund auf neu entwickeln muss, um sich von der Masse abzuheben. Stattdessen kann es bestehende KI-Modelle anpassen, indem es das nutzt, was niemand sonst hat: proprietäre Unternehmensdaten.
„Jeder KI-Anbieter, wie beispielsweise X oder Google, hat Zugriff auf öffentliche Informationen. Sie haben außerdem Zugriff auf Daten von ihren eigenen Plattformen", erklärt Shobhit Varshney, Vice President und Senior Partner, Amerikas KI-Leader, IBM Consulting. „Worauf sie keinen Zugriff haben, sind Ihre Unternehmensdaten. Dieses Puzzleteil fehlt.“
Wie Varshney in AI in Action 2024 ausführt: „Die nächste Herausforderung besteht darin, die KI dazu zu bringen, den Abgrund zu überwinden und in das Unternehmen einzudringen, damit sie absorbieren, lernen und zu Ihrem Wettbewerbsvorteil werden kann.“
Es gibt drei Hauptmethoden, proprietäre Daten in ein KI-Modell einzuspeisen: Prompt Engineering, Retrieval Augmented Generation (RAG) und Feinabstimmung.
In diesem Zusammenhang bedeutet Prompt Engineering, proprietäre Daten in den an die KI übermittelten Prompt einzubeziehen.
Nehmen wir an, ein Benutzer möchte, dass ein KI-Modell Gespräche im Call Center zusammenfasst. Der Benutzer kann einen Prompt verfassen – „Dieses Gespräch zusammenfassen“ – und die Mitschrift des Anrufs als Teil des Prompts anhängen.
Prompt Engineering erfordert keine Änderung des Modells selbst. Es eignet sich am besten für generische Aufgaben mit geringem Volumen, bei denen es sinnvoll ist, den notwendigen Kontext in jeden Prompt aufzunehmen.
Retrieval Augmented Generation (RAG) bedeutet, ein KI-Modell an eine proprietäre Datenbank anzuschließen. Das Modell kann bei der Beantwortung von Prompts relevante Informationen aus dieser Datenbank abrufen.
Beispielsweise kann ein Unternehmen einem Chatbot für Kundenservice Zugriff auf eine Datenbank mit Produkten des Unternehmens gewähren. Wenn Nutzer dem Chatbot Fragen zu diesen Produkten stellen, kann er die entsprechende Dokumentation einsehen und die richtige Antwort finden.
RAG erfordert keine dauerhaften Änderungen am Modell. Es kann die Genauigkeit verbessern und Halluzinationen reduzieren, aber auch die Reaktionszeiten erhöhen.
Feinabstimmung bedeutet, einem KI-Modell genügend zusätzliche Daten zu geben, um einige seiner Parameter zu verändern. Die Feinabstimmung verändert das Verhalten eines Modells dauerhaft und passt es an einen bestimmten Anwendungsfall oder Kontext an. Es ist auch schneller und billiger als ein brandneues Modell zu trainieren.
„Wenn man ein neuronales Netzwerk mit 100 verschiedenen Schichten hat, bedeutet das Training, dass man alle 100 Schichten verändert“, erklärt Choie. „Feinabstimmung würde bedeuten, dass man tatsächlich die letzten paar Schichten verändert. Man ist noch dabei, das Modell zu ändern, aber man muss es nicht vollständig ändern, weil es bereits gut funktioniert.“
Die Feinabstimmung erfordert etwas mehr Vorabinvestitionen als Prompt Engineering und RAG. Sie ist nützlich, um aus einem kleineren Modell einen Experten auf einem Spezialgebiet zu machen. Zum Beispiel kann eine Versicherungsgesellschaft ein Modell optimieren, um die Kunst der Bearbeitung neuer Schadensfälle zu beherrschen.
Varshney vergleicht ein fein abgestimmtes Modell mit einem intensiv geschulten Berufsanfänger direkt nach dem Schulabschluss. Sie verfügen vielleicht nicht über das umfassende Wissen eines genialen Universalgelehrten (oder eines großen, universell einsetzbaren KI-Modells), aber sie sind viel besser im Bearbeiten von Ansprüchen, als es ein Universalgelehrter wäre.
„Es kann weder Ihre Steuererklärung machen noch einen Rechtsvertrag aufsetzen“, sagt Varshney, „aber wenn ich es bitte, einen Versicherungsanspruch zu bearbeiten, weiß es sofort, wie es geht.“
Die Verwendung geschützter Daten auf diese Weise kann einen erheblichen Wettbewerbsvorteil bieten, da KI-Modelle mit den einzigartigen Prozessen, Produkten, Kunden und anderen Nuancen eines Unternehmens vertraut gemacht werden.
„Wenn Sie eine KI haben, deren Hauptnutzer aus einem bestimmten Unternehmen stammen, ist es wichtig, dass die KI Daten aus demselben Unternehmen verwendet“, sagt Choie.
Wenn KI-Modelle Zugriff auf firmeneigene Daten haben, sind sie in einem spezifischen Geschäftskontext verankert, was bedeutet, dass auch ihre Ergebnisse in diesem Kontext verankert sind.
„Ich kann ein Open-Source-KI-Modell nehmen, es mit meinen eigenen proprietären Daten feinabstimmen und diese Kopie gehört ganz mir“, sagt Varshney. „Ich besitze die Rechte am geistigen Eigentum. Ich betreibe es auf meiner eigenen Infrastruktur.“
Dadurch können diese Modelle genauere und effektivere Ausgaben liefern als unerweiterte, fertige Modelle, die auf einen allgemeinen öffentlichen Datenbestand zurückgreifen.
Unternehmen können viele verschiedene Arten von KI-Modellen einsetzen, um Ergebnisse zu erzielen. Aber Open-Source-Modelle – wie IBM Granite™-Modelle, die unter einer Apache-2.0-Lizenz für breite, ungehinderte kommerzielle Nutzung verfügbar sind – bieten bestimmte Vorteile.
„Beim Training eines KI-Modells gibt es viele verschiedene Parameter und Techniken, die Sie anpassen müssen, um sicherzustellen, dass das Modell effektiv und effizient lernt. „Dafür braucht man spezialisierte Datenwissenschaftler und Experten für maschinelles Lernen“, erklärt Choie. „Der Nutzen der Feinabstimmung offener Modelle besteht darin, dass wir diese Modelle haben, an denen bereits einige brillante Köpfe gearbeitet haben. Wir müssen den Modellen lediglich zusätzliche aufgabenspezifische Daten zuführen und einige Schichten anpassen, was wesentlich einfacher ist als der Aufbau eines Modells.“
Mit Open-Source-Modellen können Unternehmen nicht nur von der Weisheit der Masse Nutzen ziehen, sondern auch experimentieren, ohne dass die Kosten eines Scheitern zu hoch sind. Diese Experimente wiederum helfen Unternehmen, eine Multimodellstrategie zu verfolgen, indem sie viele verschiedene – und unterschiedlich abgestimmte – Modelle für domänenspezifische Aufgaben einsetzen.
Diese Multimodellstrategie gilt als Best Practice. AI in Action 2024 fand heraus, dass 62 % der KI-Leader mehrere Modelle verwenden, verglichen mit 32 % der KI-Lernenden.
„Die Verwendung von Open-Source-Modellen ist fast schon selbstverständlich“, sagt Choie. „Sie sind kostengünstig, einige der besten Leute der Branche arbeiten daran, und wann immer es Updates oder Probleme gibt, arbeitet die Community gemeinsam daran.“
Effektives Datenmanagement ist laut AI in Action 2024 eine der wichtigsten Eigenschaften, die KI-Leader von anderen Unternehmen unterscheiden. 61 % der KI-Leader glauben an ihre Fähigkeit, auf Unternehmensdaten zuzugreifen und diese effektiv zu verwalten, um KI-Initiativen zu unterstützen, gegenüber 11 % der KI-Lernenden.
Aber die Einspeisung eigener Daten in KI-Modelle ist nicht so einfach, wie es klingt. Datensilos, Qualitätskontrolle und andere Probleme können dem im Wege stehen.
Im Großen und Ganzen besteht die Lösung darin, ein integriertes Data Fabric zu implementieren, das Silos abbaut, Interoperabilität sicherstellt und den fließenden Datenverkehr über Plattformen hinweg orchestriert.
Aber wie sieht das in der Praxis aus? Hier sind einige wichtige Überlegungen:
Die ersten Hürden für viele KI-Bemühungen sind das Sammeln und Speichern von Daten – Prozesse, die gar nicht so einfach sind, wie sie vielleicht scheinen.
Die Erfassung von Daten in traditionellen Datenbanken führt oft zu Datensilos, die ein Unternehmen daran hindern können, alle Daten zu aggregieren, die es zum Aufbau einer effektiven RAG-Datenbank oder zur Feinabstimmung von Modellen benötigt. Laut dem IBM® Data Differentiator erleben 82 % der Unternehmen Datensilos, die ihre wichtigen Workflows behindern.
Unternehmen müssen Datenpipelines implementieren, um Daten aus verteilten Quellen abzurufen, sie für die Verwendung aufzubereiten und in einem zugänglichen, zentralen Speicher zu speichern.
Zum Abrufen und Aufbereiten von Daten können Stream-Processing-Tools wie Apache Kafka oder ETL- und ELT-fähige Datenintegrations-Tools wie IBM DataStage verwendet werden. Unternehmen müssen außerdem die richtigen Daten-Repositorys auswählen, die Folgendes umfassen können:
Data Lakes, die kostengünstige Speicherumgebungen bieten und für die Verarbeitung großer Mengen strukturierter und unstrukturierter Rohdaten konzipiert sind.
Data Warehouse, die zur Unterstützung von Datenanalyse, Business Intelligence und Data Science entwickelt wurden.
Data Lakehouses, wie zum Beispiel watsonx.data, die die Funktionen von Warehouses und Lakes in einer einzigen Datenverwaltungslösung vereinen.
Eine hybride Cloud-Infrastruktur ist ebenfalls ein wichtiger Bestandteil der Datenintegrationsbemühungen. Viele Unternehmen haben heutzutage ihre Daten auf lokale Datenspeicher und mehrere Cloud-Services verteilt.
„Sie müssen sicherstellen, dass Sie all diese Informationen – egal wo sie sich befinden – aggregieren und in Ihre KI-Modelle einspeisen können“, sagt Choie. „Wer nicht auf Hybrid setzt, verpasst etwas.“
Schlechte Eingaben führen zu schlechten Ausgaben. Unternehmen müssen sicherstellen, dass die firmeneigenen Daten, die sie an KI-Modelle weitergeben, zuverlässig und genau sind.
„Sie müssen das Gold in Ihren Daten – das Unterscheidungsmerkmal – herausfinden, damit Sie es verstärken können“, sagt Varshney. „Sie möchten das Rauschen in den Daten reduzieren und qualitativ hochwertige Daten zur Feinabstimmung bereitstellen.“
Daten müssen bereinigt werden, bevor sie an eine KI weitergegeben werden. Andernfalls kann sich die Leistung des Modells verschlechtern.
Varshney nennt als Beispiel ein Call-Center-Ticket mit einer nicht ganz offensichtlichen Lösung: „Die Leute probieren vielleicht fünf verschiedene Wege aus, bevor sie den richtigen finden.“ Sie können das Ticket nicht direkt an das Modell schicken. Es wird viel Rauschen geben. Es wird all die Dinge enthalten, die die Leute versucht haben. Das Modell könnte verwirrt sein, welches Ergebnis das richtige ist. Man möchte das Rauschen entfernen, damit das Modell nur noch die tatsächliche Lösung sieht.“
Die Bereinigung, Aufbereitung und Kuratierung von Datensätzen erfordert einen gewissen manuellen Aufwand seitens der Data Scientists und Analysten, sei es intern oder bei externen Partnern. Dazu gehören auch Tools wie:
KI-gestützte Datenverwaltungs-Tools können Daten automatisch validieren, Fehler kennzeichnen und Daten in das richtige Format umwandeln.
Synthetische Datengeneratoren können dabei helfen, fehlende Werte zu ergänzen und von Menschen aufbereitete Assets mit größeren Korpora zu erweitern.
Tools zur Datenvorverarbeitung und -aufbereitung, wie beispielsweise Apache Spark und die Python-Bibliothek von pandas.
Tools zur Daten-Observability können den Datenfluss im Zeitverlauf verfolgen, die Nutzung und Datenabstammung überwachen und Anomalien erkennen.
Welche Wettbewerbsvorteile firmeneigene Daten auch immer für generative KI mit sich bringen mögen, einen dauerhaften strategischen Vorteil erzielt man durch den Einsatz der richtigen Kombination aus Technologie und Geschäftsprozessen.
„Das Geld liegt im Arbeitsablauf selbst“, erklärt Varshney. „Das Modell ist ein Massenprodukt, und wir werden immer bessere Modelle entwickeln. Was wir wirklich herausfinden müssen, ist die richtige, präzise Mischung aus traditioneller KI, Automatisierung und generativer KI in einem Arbeitsablauf.“
Mit anderen Worten: Unternehmen können keine generative KI – selbst ein fein abgestimmtes Modell, das ihren Spezifikationen entspricht – in ihre Prozesse integrieren und Ergebnisse erwarten. Vielmehr müssen sie ihre Prozesse evaluieren und ihre Arbeitsabläufe an die Modelle anpassen, genauso wie sie ihre Modelle an ihre Arbeitsabläufe anpassen.
Betrachten wir zum Beispiel den einfachen Geschirrspüler.
„Als wir Geschirrspüler entwickelten, erwarteten wir nicht, dass sie so stehen und spülen würden, wie wir es über einem Spülbecken tun“, sagt Varshney. „Wir haben das Verfahren geändert, sodass der Geschirrspüler wirklich hervorragend waschen kann. Wir haben die Aufgabe im richtigen Format formuliert. Das Gleiche müssen wir hier tun. Wir müssen Prozesse neu entwickeln und die richtige Mischung aus traditioneller KI und generativer KI finden. Dann fängt man an, Werte freizuschalten.“
