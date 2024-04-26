Unternehmen, die in spezialisierten Bereichen wie Telekommunikation, Gesundheitswesen oder Öl- und Gasindustrie tätig sind, haben einen klaren Fokus. Obwohl sie Vorteile aus typischen generativen KI-Szenarien und Anwendungsfällen ziehen können und auch nutzen, wären sie mit kleineren Modellen besser bedient.

Im Fall von Telekommunikationsunternehmen sind beispielsweise KI-Assistenten in Kontaktzentren, personalisierte Angebote bei der Leistungserbringung und KI-gestützte Chatbots zur Verbesserung des Customer Experience gängige Anwendungsfälle. Anwendungsfälle, die Telekommunikationsunternehmen dabei helfen, die Leistung ihres Netzes zu verbessern, die spektrale Effizienz in 5G-Netzen zu steigern oder spezifische Engpässe in ihrem Netz zu ermitteln, werden am besten durch die eigenen Daten des Unternehmens (und nicht durch ein öffentliches LLM) bedient.

Das führt uns zu der Annahme, dass kleiner besser ist. Es gibt mittlerweile Small Language Models (SLMs), die im Vergleich zu LLMs „kleiner“ sind. SLMs werden mit zig Milliarden Parametern trainiert, LLMs hingegen mit Hunderten Milliarden Parametern. Wichtiger noch: SLMs werden mit Daten trainiert, die sich auf einen bestimmten Bereich beziehen. Sie verfügen möglicherweise nicht über umfassende Kontextinformationen, aber in ihrem gewählten Bereich erbringen sie sehr gute Leistungen.

Aufgrund ihrer geringeren Größe können diese Modelle im Rechenzentrum eines Unternehmens statt in der Cloud gehostet werden. SLMs könnten sogar in großem Maßstab auf einem einzigen GPU Chip laufen und so jährlich Tausende von Dollar an Rechenkosten einsparen. Mit den Fortschritten im Chipdesign verschwimmt jedoch die Grenze zwischen Anwendungen, die ausschließlich in der Cloud oder in einem Unternehmensrechenzentrum ausgeführt werden können.

Ob aus Kostengründen, wegen Datenschutzes oder Datensouveränität – Unternehmen könnten diese SLMs in ihrem Rechenzentrum betreiben wollen. Die meisten Unternehmen senden ihre Daten nicht gerne in die Cloud. Ein weiterer wichtiger Grund ist die Leistung. Generative KI am Netzwerkrand führt die Berechnungen und Inferenzen so nah wie möglich an den Daten durch und ist damit schneller und sicherer als über einen Cloud-Provider.

Es ist erwähnenswert, dass SLMs weniger Rechenleistung benötigen und ideal für die Bereitstellung in ressourcenbeschränkten Umgebungen und sogar auf mobilen Geräten sind.

Ein Beispiel für eine On-Premises-Lösung wäre ein IBM Cloud Satellite-Standort, der über eine sichere Hochgeschwindigkeitsverbindung zu IBM Cloud verfügt, wo die LLMs gehostet werden. Telekommunikationsunternehmen könnten diese SLMs an ihren Basisstationen hosten und diese Option auch ihren Kunden anbieten. Es ist alles eine Frage der Optimierung der Nutzung von GPUs, da die Entfernung, die Daten zurücklegen müssen, verringert wird, was zu einer verbesserten Bandbreite führt.