Wie Sie eine Strategie zur Unterstützung Ihrer generativen KI-Anwendungen aufbauen

Eine massive, gebogene Wand aus Bildschirmen in einem dunklen Raum

Generative KI, auch bekannt als Gen-KI, ist eine künstliche Intelligenz (KI), die Text, Bilder, Videos, Audio und sogar Softwarecode als Reaktion auf eine Benutzeranforderung erstellen kann. Heutzutage drängen Organisationen darauf, neue generative KI-Anwendungen zu entwickeln, übersehen dabei aber oft die notwendigen Schritte zur Erstellung einer effektiven Datenstrategie, die diese Anwendungen unterstützt.

Generative KI-Modelle– Computerprogramme, die darauf trainiert wurden, ähnlich wie das menschliche Gehirn zu entscheiden – benötigen enorme Datenmengen zum Training. Und obwohl Unternehmen vielleicht eine brillante Idee für eine Anwendung haben, schlägt die Anwendung fehl, wenn die zugrunde liegenden Daten nicht richtig behandelt werden.

Von den Kosten für das Sammeln und Verarbeiten von Daten über die zugrundeliegende Infrastruktur zur sicheren Speicherung bis hin zu den sich wandelnden Anforderungen der Data Governance ist es wichtig, dass Unternehmen einen strategischen Ansatz verfolgen, damit Anwendungen erfolgreich sind.

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.

ChatGPT und der Vorstoß für neue generative KI-Anwendungen

Im Jahr 2022 leitete der Start von ChatGPT eine neue Ära der Innovation im Bereich generativer KI ein und veranlasste Unternehmen, Wege zu suchen, wie sie die Technologie für Anwendungen nutzen können. ChatGPT war ein intelligenter Chatbot, der auf großen Sprachmodellen (LLMs) trainiert wurde und auf konversationelle Weise mit den Nutzern interagierte. Seit der Einführung haben Unternehmen versucht, die zugrunde liegende Technologie auf verschiedene Geschäftsprobleme anzuwenden, darunter Automatisierung, Steigerung der Produktivität und Kunden-Erkenntnisse.

Verschiedene Risiken und Herausforderungen sind ebenfalls offensichtlich geworden. Im medizinischen Bereich hat sie zum Beispiel zwar zur Automatisierung bestimmter Diagnosen beigetragen, aber auch Datenschutz- und Sicherheitsbedenken aufgeworfen.1 Darüber hinaus besteht nach wie vor ein Zustand, der als KI-Halluzinationen bekannt ist und einige generative KI-Modelle dazu veranlasst, Fakten zu „erfinden“, wenn sie die Antwort auf eine Frage nicht finden können.

Doch während diese und andere Probleme weiterhin bestehen, haben Unternehmen aller Größen und Branchen weiterhin stark in diesen Bereich investiert und nach neuen Wegen gesucht, das Potenzial des Bereichs zu nutzen. Nach Angaben von Menlo Ventures haben sich die Unternehmensinvestitionen in generative KI von 2022 bis 2023 versechsfacht, von 2,3 USD auf. 13,8 Milliarden.

AI Academy

Der Aufstieg der generativen KI für Unternehmen

Erfahren Sie mehr über den historischen Aufstieg der generativen KI sowie darüber, was sie für Unternehmen bedeutet.

Generative KI-Anwendungen stellen die KI-Infrastruktur vor neue Herausforderungen

KI-Infrastruktur ist ein Begriff, der die Hardware- und Softwarelösungen beschreibt, die zur Entwicklung von KI-Anwendungen erforderlich sind. Im Zeitalter der generativen KI muss sich die KI-Infrastruktur weiterentwickeln, um die mit der Technologie verbundenen höheren Anforderungen an Rechenressourcen, Datenspeicher und Bandbreite und mehr zu erfüllen. Unternehmen haben es jedoch so eilig, neue generative KI-Anwendungen bereitzustellen, dass sie manchmal den Bedarf an KI- und Dateninfrastruktur übersehen.

Da Unternehmen versuchen, generative KI und all ihr Potenzial für Geschäftszwecke zu nutzen, müssen sie wichtige Aspekte ihrer Dateninfrastruktur- und Strategieansätze überdenken.

Umwandlung unstrukturierter Daten in strukturierte Daten

Um eine erfolgreiche, generative KI-Geschäftsanwendung zu entwickeln, benötigen Unternehmen in der Regel eine Kombination aus strukturierten und unstrukturierten Daten. Strukturierte Daten, auch als quantitative Daten bekannt, sind Daten, die zuvor so formatiert wurden, dass sie leicht von Algorithmen des maschinellen Lernens (ML) verarbeitet werden können, die generative KI-Anwendungen antreiben.

Mit fortschrittlichen ML-Modellen simulieren Algorithmen, wie Menschen aus großen Datenmengen (Datensätzen) lernen, bis sie Fragen zu den Daten verstehen und neue Inhalte erstellen.

Während einige von Unternehmen gesammelte Daten bereits strukturiert sind (zum Beispiel Kunden- und Finanzinformationen wie Namen, Daten und Transaktionsbeträge), ist ein großer Teil unstrukturiert. Unstrukturierte Daten, auch als qualitative Daten bekannt, sind Daten, die kein vordefiniertes Format haben. Unstrukturierte Daten sind vielfältig und können Video-, Audio- und Textdateien von E-Mail, Webseiten, Social-Media-Konten und Internet der Dinge-(IoT-)Sensoren umfassen.

Mit dem Wachstum der digitalen Wirtschaft nimmt auch die Menge der von Unternehmen gesammelten unstrukturierten Daten exponentiell zu. Laut Forbes sind 80 bis 90 % der von Unternehmen gesammelten Daten unstrukturiert. Unstrukturierte Daten sind für ML-Zwecke ungeeignet und müssen transformiert werden, bevor sie zum Trainieren eines KI-Modells verwendet werden können.

Die Umwandlung unstrukturierter Daten in Daten, die von einem Computer verarbeitet und für Geschäftszwecke genutzt werden können, beinhaltet das Extrahieren relevanter Informationen und deren Organisation in einem vordefinierten Format. Das Volumen und die Komplexität der Daten stellen Herausforderungen dar, und das herausfordernde Datenmanagement-Umfeld sowie die Einhaltung von Daten-Governance-Gesetzen können kostspielig sein.

Navigieren in der komplexen Welt der Data Governance

Data Governance ist die Praxis, die Qualität, Sicherheit und Verfügbarkeit von Daten, die einem Unternehmen gehören, durch Richtlinien und Verfahren sicherzustellen. Der Aufstieg von generativer KI und Big Data hat die Daten-Governance und alle ihre Anforderungen in den Vordergrund des modernen Unternehmens gerückt.

Generative KI mit ihrer Fähigkeit, neue Inhalte auf der Grundlage von Daten zu erstellen, auf denen sie trainiert wurde, schafft neue Anforderungen an die sichere und rechtmäßige Erfassung, Speicherung und Verarbeitung von Daten.

Qualität

Da generative KI-Modelle auf riesigen Datensätzen trainiert werden, müssen die Daten in diesen Datensätzen von höchster Qualität sein und ihre Integrität muss unbestreitbar sein. Die Data Governance spielt eine wichtige Rolle dabei, sicherzustellen, dass die Datensätze, mit denen generative KI-Modelle trainieren, korrekt und vollständig sind – eine Komponente für die Generierung verlässlicher Antworten.

Konformität

Je nach Branche und Standort unterliegen generative KI-Anwendungen einer strengen Compliance-Umgebung in Bezug auf die Art und Weise, wie Daten verwendet werden können. Die DSGVO (Datenschutz-Grundverordnung) regelt beispielsweise, wie Daten von EU-Bürgern von Unternehmen verwendet werden dürfen. Verstöße ziehen hohe Geldstrafen und Bußgelder nach sich, wenn Kundendaten in irgendeiner Weise kompromittiert werden.

Im Jahr 2021 wurden Google und andere Unternehmen wegen Verstößen gegen die in der DSGVO festgelegten Datenschutzbestimmungen mit Geldstrafen von über einer Milliarde Dollar belegt .

Transparenz

Damit eine generative KI-Anwendung effektiv ist, muss die Herkunft der Daten und die Art und Weise, wie die Daten für die geschäftliche Nutzung umgewandelt wurden, klar festgelegt und sichtbar sein. Data Governance hilft sicherzustellen, dass Dokumentation in jedem Schritt des Datenlebenszyklus existiert – und für die Nutzer transparent ist – von der Sammlung über die Speicherung, Verarbeitung und Ausgabe, damit die Nutzer verstehen, wie eine Antwort generiert wurde.

Best Practices für den Aufbau einer Datenstrategie, die generative KI-Anwendungen unterstützt

Der Erfolg von generativen KI-Anwendungen hängt von der richtigen Strategie und Infrastruktur ab, die sie unterstützt. Hier sind einige Best Practices, die zum Erfolg führen.

Beginnen Sie mit einer konkreten Geschäftsfrage, die Ihr Unternehmen beantwortet haben möchte

Aufgrund der Natur unstrukturierter Daten – woher sie kommen, wie sie gesammelt und gespeichert werden – neigen Unternehmen dazu, viel zu sammeln.

Das heißt aber nicht, dass all dies auch für eine generative KI-Anwendung nützlich ist. „Beginnen Sie mit einer Frage“, rät Margaret Graves, Senior Fellow am IBM Center for the Business of Government. „Es muss nicht nur eine Frage sein, es können auch mehrere sein, aber versuchen Sie, sich auf konkrete Wege zu konzentrieren, wie die Anwendung, die Sie entwickeln möchten, Ihre Mission voranbringen und unterstützen wird.“

Seit dem Debüt von ChatGPT im Jahr 2022 haben Unternehmen sich beeilt, generative KI auf eine Reihe von Geschäftsproblemen anzuwenden, darunter die Steigerung der Produktivität, die Identifizierung von Erkenntnissen und die Beschleunigung der digitalen Transformation. Auch wenn diese Bereiche mit der Technologie abgedeckt werden können, sind sie doch sehr allgemein und könnten dazu führen, dass ein Unternehmen eine App entwickelt, der es an Spezifität mangelt.

Je spezifischer das Geschäftsproblem, desto einfacher lassen sich die relevanten Datensätze identifizieren, mit denen Sie Ihr generatives KI-Modell trainieren müssen, und die Art von KI-Infrastruktur, die Sie zur Unterstützung des Prozesses benötigen.

Entwickeln Sie eine Strategie, die sicherstellt, dass Ihre Anwendung die benötigten Daten hat

Sobald ein Unternehmen entschieden hat, auf welche geschäftlichen Fragen es sich bei einer generativen KI-Anwendung konzentrieren möchte, kann es mit der Untersuchung der Datensätze beginnen, die für das Training seiner KI-Modelle relevant sind. Graves vergleicht diesen Teil des Prozesses mit der Betrachtung eines Spektrums. „Auf der einen Seite“, sagt sie, „haben Sie streng vertrauliche, firmeneigene interne Daten, mit denen Sie Ihr Modell schulen müssen. Auf der anderen Seite verfügen Sie über allgemeinere Daten, die nicht proprietär sind, aber dazu beitragen, die Leistung Ihrer Anwendung zu verbessern.“

Die Welt der RFPs (Request for Proposals) ist ein gutes Beispiel dafür, da sie einer der überzeugendsten Anwendungsfälle für generative KI im Geschäftsleben ist, die in den letzten Jahren entstanden sind. Ein B2B-Unternehmen, das eine generative KI-Anwendung zur Automatisierung von Aspekten seines Ausschreibungsprozesses entwickeln möchte, müsste auf internen Daten trainieren, sonst wäre es nicht in der Lage, die einzigartigen Funktionen eines Unternehmens zu präsentieren. Aber dasselbe generative KI-Modell müsste auch auf allgemeineren Daten trainieren, etwa wie man einen Satz formt und seine Antworten grammatisch strukturiert, sonst würden seine Antworten keinen Sinn ergeben.

„Beide Aspekte müssen in Ihrer Strategie zusammengeführt werden – sowohl breit angelegte, allgemeine Datensätze als auch firmeneigene, interne Datensätze“, sagt Graves. „Ansonsten baut man nur ein Werkzeug, übergibt es mit Unmengen von Daten und schaut, was passiert – das ist reine Geld- und Zeitverschwendung.“

Nutzen Sie gegebenenfalls domänenspezifische Daten

Durch die Verwendung bereichsspezifischer Daten, die für eine bestimmte Branche oder einen bestimmten Bereich relevant sind, können Unternehmen KI-Modelle erstellen, die besser auf ihre jeweiligen Geschäftsanforderungen zugeschnitten sind. „Derzeit liegt der Schwerpunkt beim Training von KI-Modellen auf domänenspezifischen Daten, beispielsweise im Finanz- oder Personalwesen“, sagt Jason Prow, Senior Partner bei IBM Consulting. „Angesichts der Fülle an verfügbaren Daten wird es immer wichtiger, das Modell auf einen bestimmten Bereich auszurichten.“

Die Nutzung von Domaindaten bei der Erstellung von KI-Modellen hilft dabei, die Modelle so zuzuschneiden, dass sie besser auf einen bestimmten Geschäftsbedarf anwendbar sind. Domänenspezifische Modelle sind genauer und relevanter für die Bedürfnisse der Nutzer und können zu einer besseren Gesamtleistung der zugehörigen generativen KI-Anwendungen führen.

Bereichsspezifische Daten können technisch und komplex sein. Unternehmen, die sie nutzen wollen, müssen daher in Erwägung ziehen, später eine „semantische” Art der Daten hinzuzufügen, eine Abstraktionsebene in ihren KI-Modellen, um die Daten übersetzen zu können. „Insbesondere die Pharmaindustrie macht viel semantische Beschreibung“, sagt Anthony Vachino, Associate Partner bei IBM Consulting. „Verschiedene Unternehmen führen unterschiedliche Studien durch, und die semantische Ebene beschreibt sie so, dass die Forschung für andere Unternehmen anwendbar ist, damit diese sie nicht wiederholen müssen.

Lokalisieren Sie Ihre Dateninfrastruktur strategisch

Ob es um die Vorbereitung auf geopolitische Veränderungen geht, die Lieferketten stören können, oder auf Naturkatastrophen, die kritische Infrastrukturen bedrohen – moderne Datenverantwortliche berücksichtigen bei der Wahl des Speicherorts und des Zugriffs auf Daten, die gespeichert werden, zunehmend mehr als nur Talent und Kosten. Laut dem IBM Institute of Business Value glauben 60% der Regierungsvertreter, dass die Häufigkeit von Lieferketten- und Infrastrukturschocks in Zukunft zunehmen wird, während 70 % glauben, dass sie an Intensität zunehmen werden.

Verschiedene Regionen haben unterschiedliche Vorteile, und Aspekte wie Talente, Datenökosystem und Infrastruktur, Governance und geopolitische Faktoren müssen berücksichtigt werden. Führungskräfte nehmen es zur Kenntnis: Im vergangenen Jahr gaben laut demselben IBV-Bericht fast 70 % der befragten Führungskräfte an, dass sie erwarten, dass KI den Standort wichtiger Ressourcen verändern wird, während dieser Anteil in diesem Jahr auf 96 % gestiegen ist.

Dan Chenok, Executive Director des IBM Center for the Business of Government, interessiert sich für das Potenzial der Nutzung verteilter Daten beim Training generativer KI-Modelle, da dies die Speicherung und den Zugriff auf Daten an mehr als einem Ort ermöglicht. „Verteilte Daten ermöglichen es, das Modell mit Daten zu schulen, die sich an mehreren Standorten befinden“, sagt er, „während Sicherheit und Vorschriften durch Zugriffskontrolle gewährleistet werden.“

Die Unterstützung generativer KI-Anwendungen erfordert einen offenen, hybriden Ansatz

Moderne, hybride Lösungen helfen Unternehmen dabei, KI-Modelle zu erstellen, die besser für die Lösung spezifischer Geschäftsprobleme geeignet sind, und so Geld, Zeit und andere wichtige Ressourcen zu sparen. „Wenn Sie mehrere Plattformen integrieren, können Sie bessere Dienstleistungen anbieten, insbesondere wenn Sie ein Unternehmen mit mehreren Standorten sind“, fügt Chenok hinzu. „Und die besten Lösungen helfen Ihnen dabei, alles in Einklang zu bringen, damit Ihre Anwendung optimal funktioniert.“ 

Offene, hybride Data Lakehouses geben Benutzern die Möglichkeit, Daten sowohl über Cloud- als auch über lokale Infrastruktur zu teilen – wo immer Daten residieren – sodass sie von generativen KI-Anwendungen abgerufen werden können. Data Lakehouses sind Plattformen, die Aspekte von Data Warehouses und Data Lakes zu einer einzigen, einheitlichen Datenverwaltungslösung zusammenführen.

Data Lakes sind kostengünstige Datenspeicherlösungen, die darauf ausgelegt sind, riesige Mengen an strukturierten und unstrukturierten Daten zu verarbeiten, und Data Warehouses sind Systeme, die Daten aus mehreren Quellen an einem einzigen Ort sammeln, damit sie analysiert werden können. Obwohl sie nicht so skalierbar sind wie Lakes oder Warehouses, sind Data Lakehouses tendenziell schlanker, leistungsfähiger und können ein breiteres Spektrum an Workloads unterstützen.

Für Unternehmen, die eine umfassendere Lösung suchen, werden Plattformen wie Databricks, Snowflake und Amazon RedShift immer beliebter, da die Datenvorbereitung für generative KI sowie die Entwicklung und Bereitstellung der Anwendungen komplex ist. Umfassende Lösungen helfen bei der Datenverwaltung, dem Modelltraining und der Lösungsbereitstellung, so dass Unternehmen eine generative KI-Anwendung mit integrierter Skalierbarkeit und Governance für verschiedene Anwendungsfälle starten können.

IBM watsonx.data ist ein zweckmäßiger Datenspeicher, der auf einem offenen Data Lakehouse aufgebaut ist und die Skalierbarkeit generativer KI-Workloads erhöht. Der offene, hybride und zweckgebundene Ansatz verbessert die Integration in verschiedene Arten von Datenbanken und ermöglicht es Unternehmen, Daten zu nutzen, die über verschiedene Ökosysteme und Umgebungen verteilt sind, und sich nicht auf eine einzige Region oder einen einzigen Satz von Regeln festzulegen.

 

Weiterführende Lösungen
IBM watsonx.ai

Trainieren, validieren, optimieren und implementieren Sie generative KI, Foundation Models und maschinelle Lernfunktionen mit IBM watsonx.ai, einem Studio der nächsten Generation für AI Builder in Unternehmen. Erstellen Sie KI-Anwendungen mit einem Bruchteil der Zeit und Daten.

Entdecken sie watsonx.ai
Lösungen im Bereich künstlicher Intelligenz

Setzen Sie KI in Ihrem Unternehmen ein – mit branchenführendem Fachwissen im Bereich KI und dem Lösungsportfolio von IBM an Ihrer Seite.

Erkunden Sie KI-Lösungen
KI-Services

Erfinden Sie kritische Workflows und Abläufe neu, indem Sie KI einsetzen, um Erfahrungen, Entscheidungsfindung in Echtzeit und den geschäftlichen Nutzen zu maximieren.

KI-Services entdecken
Machen Sie den nächsten Schritt

Profitieren Sie von einem einheitlichen Zugriff auf Funktionen, die den gesamten Lebenszyklus der KI-Entwicklung abdecken. Erstellen Sie leistungsstarke KI-Lösungen mit benutzerfreundlichen Oberflächen, Workflows und Zugriff auf branchenübliche APIs und SDKs.

watsonx.ai erkunden Buchen Sie eine Live-Demo