Große Sprachmodelle dominieren zwar die Schlagzeilen, aber eine andere Klasse von KI könnte die Art und Weise verändern, wie Unternehmen die Zukunft vorhersagen. Kompakte und effiziente Zeitreihenmodelle verändern die Vorhersage über Branchen hinweg.
IBMs TinyTimeMixer (TTM) ist ein Beispiel für diesen Trend. Mit weniger als einer Million Parametern liefert TTM robuste Vorhersagen ohne den Rechenaufwand seiner größeren Gegenstücke.
„Prognosen können bei richtiger Anwendung ein leistungsfähiges Werkzeug sein“, erklärt IBM Technical Strategist Joshua Noble. „Die Fähigkeit, Nachfrage, Umsatz, Kosten, Geräteausfälle oder Marktveränderungen vorherzusagen, sind allesamt wertvolle Assets für Unternehmen jeder Größe.“
In der KI-Branche ist das Interesse an kleineren, effizienteren Sprachmodellen in letzter Zeit stark angestiegen. Diese kompakten Modelle sollen eine vergleichbare Leistung wie die größeren Gegenstücke bieten und dabei weniger Rechenleistung und Speicher benötigen. Zum Beispiel erregte Mistral KI mit seinem Mixtral 8x7B-Modell Aufmerksamkeit, das eine Mischung von Experten verwendet, um eine hohe Leistung mit einer relativ kleinen Parameterzahl zu erzielen.
Dieser Trend hin zu „KI lite“ spiegelt einen wachsenden Fokus auf praktische Bereitstellung und Zugänglichkeit wider und hat das Potenzial, die Technologie für ein breiteres Spektrum an Anwendungen und Geräten zu demokratisieren.
TTM ersetzt die traditionelle Selbstaufmerksamkeit des maschinellen Lernens – bei der jedes Element in einer Sequenz seine Beziehung zu allen anderen abwägt – durch Gated Attention, einen Mechanismus, der einfache Perzeptronblöcke selektiv steuert, um Zeitreihenvariablen zu verknüpfen. Dieser optimierte Ansatz schärft den Fokus und reduziert die Rechenkosten beim Training und der Feinabstimmung erheblich, was zu einem schlanken, effizienten Modell führt, das sich besonders für Zeitreihenaufgaben eignet.
Der Datensatz zur Luftqualität in Peking ist ein realer Testfall, der die Fähigkeit von TTM zur Vorhersage der PM2,5-Luftverschmutzungswerte anhand historischer Daten und meteorologischer Variablen zeigt. Diese Anwendung zeigt das Potenzial des Modells in der Umweltüberwachung und Stadtplanung.
Auch wenn Zeitreihenmodelle vielversprechend sind, bleiben Herausforderungen bestehen. Noble warnt: „Forecasting, wie die meisten KI, beruht auf guten Daten und vorhersehbaren Mustern. Es gibt Phänomene, die einfach nicht gut vorhersehbar sind, und kein Modell kann das umgehen.“
Feinabstimmung handhabt Modellgrenzen durch einen optimierten Prozess: Daten vorbereiten, Modell laden, bewerten, feinjustieren und neu bewerten. Die Auswirkungen sind eindeutig: Für die Luftqualitätsprognosen in Peking hat die Feinabstimmung den Bewertungsverlust von 0,426 auf 0,253 reduziert und die Vorhersagegenauigkeit deutlich verbessert. Dieses Beispiel aus der Praxis verdeutlicht die Wirksamkeit der Feinabstimmung bei der Verbesserung der Modellleistung für spezifische Aufgaben.
Der Feinabstimmungsprozess umfasst das Aufteilen des Datensatzes, das Laden des vorab trainierten Modells, das Festlegen der Leistung, die Feinabstimmung der Trainingsdaten mit Early Stopping und die abschließende Auswertung. Dieser Ansatz verbessert die Fähigkeit des Modells, komplexe Datenmuster zu erfassen und genauere Vorhersagen zu treffen.
Die Forecasting-Pipeline von TTM verarbeitet komplexe Zeitreihendaten und berücksichtigt sowohl Zielvariablen als auch externe Faktoren. Um auf das Beispiel der PM2,5-forecasting zurückzukommen: Dieser Ansatz ermöglicht es TTM, komplexe Zusammenhänge zwischen verschiedenen Faktoren, die die Luftqualität beeinflussen, zu erfassen. Indem mehrere Variablen gleichzeitig berücksichtigt werden, liefert das Modell genauere und nuanciertere Vorhersagen und berücksichtigt das komplexe Zusammenspiel von Faktoren, die die Luftqualität im Laufe der Zeit beeinflussen.
Die IBM watsonx®-Plattform bringt diese Funktionen einer breiteren Zielgruppe näher. Die Plattform ermöglicht es den Nutzern, Modelle effizient zu trainieren, zu validieren, abzustimmen und bereitzustellen und demokratisiert so die KI-gestützte Prognose für Unternehmen jeder Größe.
Mit der Weiterentwicklung von Zeitreihenmodellen wie TTM wächst ihr Einfluss auf die Geschäftsprognose. Diese Modelle bieten leistungsstarke Werkzeuge zur Bewältigung von Unsicherheiten, von der Optimierung der Lieferkette bis zur Vorhersage von Markttrends.
Noble fasst das Potenzial dieser Modelle wie folgt zusammen: „Auf Zeitreihendaten trainierte Foundation Models können dazu beitragen, die Einstiegshürde für diese Art von Forecasting zu senken, da sie bereits einen Großteil der Trainingsdaten enthalten.“