Skalierung generativer KI mit flexibler Modellauswahl

Ein Mann, der an einem großen Fenster in einer modernen Bibliothek sitzt, während er an einem Laptop arbeitet.

Diese Blogreihe entmystifiziert generative KI für Unternehmen für Führungskräfte aus Wirtschaft und Technologie. Sie bietet einfache Frameworks und Leitprinzipien für Ihre transformative Reise zur künstlichen Intelligenz (KI). Im vorherigen Blogartikel haben wir den differenzierten Ansatz von IBM bei der Bereitstellung von Modellen der Unternehmensklasse besprochen. In diesem Blogbeitrag gehen wir der Frage nach, warum die Wahl des Foundation Models wichtig ist und wie sie Unternehmen in die Lage versetzt, generative KI mit Zuversicht zu skalieren.

Warum ist die Modellwahl wichtig?

In der dynamischen Welt der generativen KI sind Einheitsansätze unzureichend. Da Unternehmen bestrebt sind, das Potenzial der KI zu nutzen, ist es notwendig, über ein breites Spektrum an Modelloptionen zu verfügen:

  • Innovation fördern: Eine vielfältige Palette von Modellen fördert nicht nur die Innovation, indem sie unterschiedliche Stärken einbringt, um eine breite Palette von Problemen anzugehen, sondern ermöglicht es den Teams auch, sich an sich entwickelnde Geschäftsanforderungen und Kundenerwartungen anzupassen.
  • Anpassung für Wettbewerbsvorteile: Mithilfe einer Reihe von Modellen können Unternehmen KI-Anwendungen an Nischenanforderungen anpassen und so einen Wettbewerbsvorteil erzielen. Generative KI kann auf bestimmte Aufgaben abgestimmt werden, sei es die Beantwortung von Fragen in Anwendungen oder das Schreiben von Code zur Erstellung schneller Zusammenfassungen.
  • Beschleunigte Markteinführung: In der heutigen schnelllebigen Geschäftswelt ist Zeit von entscheidender Bedeutung. Ein vielfältiges Portfolio von Modellen kann den Entwicklungsprozess beschleunigen, sodass Unternehmen KI-gestützte Angebote schnell einführen können. Dies ist besonders wichtig in der generativen KI, wo der Zugang zu den neuesten Innovationen einen entscheidenden Wettbewerbsvorteil bietet.
  • Flexibilität angesichts von Veränderungen: Marktbedingungen und Strategien entwickeln sich ständig weiter. Die verschiedenen Modelloptionen ermöglichen es Unternehmen, schnell und effektiv auf Veränderungen zu reagieren. Der Zugriff auf mehrere Optionen ermöglicht eine rasche Anpassung bei neuen Trends oder strategischen Veränderungen und bewahrt Agilität und Resilienz.
  • Kosten über Anwendungsfälle hinweg optimieren: Verschiedene Modelle haben unterschiedliche Kostenimplikationen. Durch den Zugriff auf eine Reihe von Modellen können Unternehmen für jede Anwendung die kostengünstigste Option auswählen. Während manche Aufgaben die Präzision teurer Modelle erfordern, können andere mit kostengünstigeren Alternativen bewältigt werden, ohne dass die Qualität darunter leidet. Zum Beispiel können im Kundenbetreuung Durchsatz und Latenz wichtiger sein als Genauigkeit, während in Ressourcen und Entwicklung Genauigkeit eine größere Rolle spielt.
  • Risiken mindern: Es kann riskant sein, sich auf ein einzelnes Modell oder eine begrenzte Auswahl zu verlassen. Ein breit gefächertes Portfolio von Modellen hilft Konzentrationsrisiken abzumildern und trägt dazu bei, dass Unternehmen resilient gegen die Unzulänglichkeiten oder das Scheitern eines bestimmten Ansatzes bleiben. Diese Strategie ermöglicht eine Risikoverteilung und bietet alternative Lösungen, falls Herausforderungen auftreten.
  • Einhaltung von Vorschriften: Das regulatorische Umfeld für KI entwickelt sich weiterhin weiter, wobei ethische Überlegungen im Vordergrund stehen. Verschiedene Modelle können unterschiedliche Auswirkungen auf Fairness, Datenschutz und Compliance haben. Eine breite Auswahl ermöglicht es Unternehmen, sich in diesem komplexen Terrain zurechtzufinden und Modelle auszuwählen, die rechtlichen und ethischen Standards entsprechen.

Auswahl der richtigen KI-Modelle

Da wir nun wissen, wie wichtig die Modellauswahl ist, stellt sich die Frage, wie wir das Problem der Überlastung bei der Auswahl des richtigen Modells für einen bestimmten Anwendungsfall lösen können. Wir können dieses komplexe Problem in eine Reihe einfacher Schritte unterteilen, die Sie noch heute anwenden können:

  1. Einen klaren Anwendungsfall identifizieren: Ermitteln Sie die spezifischen Bedürfnisse und Anforderungen Ihrer Geschäftsanwendung. Dazu gehört die Erstellung detaillierter Prompts, die Feinheiten in Ihren Branchen und Ihrem Unternehmen berücksichtigen, um sicherzustellen, dass das Modell eng mit Ihren Zielen übereinstimmt.
  2. Alle Modelloptionen auflisten: Bewerten Sie verschiedene Modelle anhand von Größe, Genauigkeit, Latenz und damit verbundenen Risiken. Dazu gehört das Verständnis der Stärken und Schwächen jedes Modells, wie etwa der Abwägungen zwischen Genauigkeit, Latenz und Durchsatz.
  3. Modellattribute bewerten: Beurteilen Sie die Angemessenheit der Modellgröße im Verhältnis zu Ihren Bedürfnissen, wobei Sie berücksichtigen, wie die Skalierung des Modells seine Leistung beeinflussen könnte und welche Risiken damit verbunden sind. Dieser Schritt konzentriert sich darauf, das Modell optimal an den Anwendungsfall anzupassen, da größer nicht unbedingt besser ist. Kleinere Modelle können größere Modelle in bestimmten Bereichen und Anwendungsfällen übertreffen.
  4. Modelloptionen testen: Führen Sie Tests durch, um zu sehen, ob das Modell unter Bedingungen, die reale Szenarien nachahmen, wie erwartet funktioniert. Dies beinhaltet die Verwendung akademischer Benchmarks und domänenspezifischer Datensätze zur Bewertung der Ausgabequalität und die Anpassung des Modells, beispielsweise durch Prompt Engineering oder Modelltuning, um seine Leistung zu optimieren.
  5. Ihre Auswahl basierend auf Kosten und Bereitstellungsbedürfnissen verfeinern: Nach dem Test verfeinern Sie Ihre Auswahl, indem Sie Faktoren wie Kapitalertrag, Kosteneffizienz und die Praktikabilität des Modells innerhalb Ihrer bestehenden Systeme und Infrastruktur berücksichtigen. Passen Sie Ihre Auswahl anhand anderer Nutzen wie geringere Latenz oder höhere Transparenz an.
  6. Das Modell wählen, das den größten Mehrwert bietet: Wählen Sie das KI-Modell aus, das das beste Gleichgewicht zwischen Leistung, Kosten und damit verbundenen Risiken bietet und auf die spezifischen Anforderungen Ihres Anwendungsfalls zugeschnitten ist.

IBM watsonx Modellbibliothek

Durch die Verfolgung einer Multimodell-Strategie bietet die IBM watsonx-Bibliothek proprietäre, Open-Source- und Drittanbieter-Modelle, wie in der Abbildung gezeigt:

Liste der watsonx Foundation Models (Stand: 8. Mai 2024). Liste der watsonx Foundation Models (Stand: 8. Mai 2024).

Dies bietet den Kunden eine Reihe von Wahlmöglichkeiten, sodass sie das Modell auswählen können, das am besten zu ihren individuellen Geschäfts-, regionalen und Risikopräferenzen passt.

Darüber hinaus ermöglicht watsonx seinen Kunden, Modelle auf der Infrastruktur ihrer Wahl einzusetzen, mit hybrider Multicloud-Umgebung und lokal, um eine Anbieterbindung zu vermeiden und die Gesamtbetriebskosten zu senken.

IBM Granite: Unternehmensklasse-Foundation Models von IBM

Die Eigenschaften von Foundation-Modellen lassen sich in drei Hauptmerkmale einteilen. Unternehmen müssen sich darüber im Klaren sein, dass die übermäßige Betonung eines Attributs die anderen beeinträchtigen kann. Das Ausbalancieren dieser Attribute ist der Schlüssel zur Anpassung des Modells an die spezifischen Bedürfnisse eines Unternehmens:

  1. Vertrauenswürdig: Modelle, die klar, erklärbar und harmlos sind.
  2. Performant: Das richtige Leistungsniveau für bestimmte Geschäftsbereiche und Anwendungsfälle.
  3. Kosteneffektiv: Modelle, die generative KI zu niedrigeren Gesamtbetriebskosten und reduziertem Risiko bieten.

IBM Granite ist eine Flaggschiffserie von Unternehmensklasse-Modellen, die von IBM Research entwickelt wurde. Diese Modelle zeichnen sich durch eine optimale Mischung dieser Attribute aus, wobei der Schwerpunkt auf Vertrauen und Zuverlässigkeit liegt, sodass Unternehmen mit ihren generativen KI-Initiativen erfolgreich sein können. Denken Sie daran, Unternehmen können generative KI nicht mit Foundation Model skalieren, denen sie nicht vertrauen können.

IBM watsonx bietet KI-Modelle der Unternehmensklasse, die aus einem strengen Verfeinerungsprozess resultieren. Dieser Prozess beginnt mit einer Innovation unter der Leitung von IBM Research, die offene Kollaborationen und Schulungen zu unternehmensrelevanten Inhalten im Rahmen des IBM KI-Ethikkodex zur Förderung der Datentransparenz umfasst.

IBM Research hat eine Technik zur Befehlsabstimmung entwickelt, die sowohl die von IBM entwickelten als auch ausgewählte Open-Source-Modelle um Funktionen erweitert, die für den Einsatz in Unternehmen unerlässlich sind. Über akademische Benchmarks hinaus simuliert unser Datensatz „FM_EVAL“ reale KI-Anwendungen in Unternehmen. Die robustesten Modelle aus dieser Pipeline werden auf IBM watsonx.ai zur Verfügung gestellt. Sie bieten Kunden zuverlässige Foundation Models generativer KI der Unternehmensklasse, wie in der Abbildung dargestellt:

Generative KI Foundation Models auf Unternehmensklasse

Neueste Modellankündigungen:

  • Granite-Code-Modelle: Eine Familie von Modellen, die in 116 Programmiersprachen trainiert wurden und in der Größe von 3 bis 34 Milliarden Parametern reichen, sowohl in einem Basismodell als auch in instruktionsfolgenden Modellvarianten.
  • Granite-7b-lab: Unterstützt allgemeine Aufgaben und wird mithilfe der IBM Large-Scale Alignment of Chatbots (LAB)-Methodik optimiert, um neue Fähigkeiten und Kenntnisse zu integrieren.

Probieren Sie unsere Foundation Model auf watsonx mit unserer neuen watsonx.ai Chat-Demo aus. Entdecken Sie ihre Funktionen in den Bereichen Zusammenfassung, Inhaltserstellung und Dokumentenverarbeitung über eine einfache und intuitive Chat-Oberfläche.