LLMs sind die zentralen Modelle der künstlichen Intelligenz für viele Geschäftsanwendungen, wie z. B.KI-Agenten, RAG-gestützte Frage-Antwort-Funktionen oder Chatbots für den Kundenservice mit automatischer Textgenerierung. Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) ist die Verwendung von Algorithmen des maschinellen Lernens, um menschliche Sprache zu verstehen und zu erzeugen, und LLMs sind eine spezielle Art von NLP-Modell.
Zu den wichtigsten LLMs gehören die GPT-Familie von OpenAI – wie GPT-4o und GPT-3.5, einige der Modelle hinter ChatGPT – sowie Claude von Anthropic,Gemini von Google und Llama 3 von Meta. Alle LLMs sind in der Lage, komplexe Aufgaben zu bewältigen, aber durch die spezifischen Anforderungen eines maschinellen Lernprojekts kann man das richtige LLM für die jeweilige Aufgabe finden.
Die Wahl des richtigen LLM hängt von einer Reihe von Faktoren ab, darunter:
- Spezifischer Anwendungsfall: Die Herausforderung des maschinellen Lernens wirkt sich direkt auf den LLM-Auswahlprozess aus. Ein LLM könnte sich für ein langwieriges Dokumentenverständnis und eine Zusammenfassung eignen, während ein anderes sich möglicherweise einfacher für eine Feinabstimmung auf domänenspezifische Verwendungszwecke eignet.
- Leistung: Genau wie andere Modelle können LLMs miteinander verglichen werden, um ihre Leistung zu bewerten. Zu den LLM-Benchmarks gehören Metriken für Argumentation, Codierung, Mathematik, Latenz, Verständnis und Allgemeinwissen. Die Abwägung zwischen den Anforderungen eines Projekts und dem Benchmark kann dabei helfen, das beste LLM für qualitativ hochwertige Ausgaben zu finden.
- Open Source versus Closed Source: Open-Source-Modelle ermöglichen es Beobachtern, zu überwachen, wie das Modell zu seinen Entscheidungen gelangt. Verschiedene LLMs können unterschiedlich stark zu Verzerrung und Halluzinationen neigen: wenn sie Vorhersagen generieren, die nicht die Ergebnisse der realen Welt widerspiegeln. Wenn die Moderation von Inhalten und die Vermeidung von Verzerrung von größter Bedeutung sind, kann die Beschränkung der Auswahl auf Open Source den LLM-Auswahlprozess unterstützen.
- Ressourcennutzung und Kosten: LLMs sind ressourcenintensive Modelle. Viele LLMs werden von Hyperscale-Rechenzentren betrieben, die mit Hunderttausenden von Grafikprozessoren (GPUs) oder mehr ausgestattet sind. LLM-Anbieter berechnen auch die Gebühren für API-Verbindungen zu ihren Modellen unterschiedlich. Die Skalierbarkeit eines Modells und seines Preisgestaltungssystems wirkt sich direkt auf den Projektumfang aus.