Als Nächstes folgt die Modellauswahl: Auswahl der Modellarchitektur, die am besten zu Ihrem Anwendungsfall passt, Trainingsdaten und Rechenressourcen. Es gibt eine riesige Bandbreite an maschinellen Lernalgorithmen, die von kleinen und einfachen Regressionsmodellen bis hin zu riesigen, hochmodernen neuronalen Netzen reichen. Das größte, ausgefeilteste Modell ist nicht immer die klügste Wahl: Es gibt Aufgaben, für die riesige Deep-Learning-Modelle übertrieben sind, und sogar Aufgaben, bei denen herkömmliche Machine-Learning-Modelle ihre Deep-Learning-Pendants übertreffen.
Im Bereich der generativen KI erfordert das Training von LLMs und anderen Arten generativer Modelle von Grund auf eine enorme Investition in Zeit, Daten, Hardware und Energie. In den meisten Fällen wird der Bedarf an einem maßgeschneiderten generativen Modell besser durch die Feinabstimmung eines vorab trainierten Modells gedeckt. Aber selbst innerhalb der Welt der vorgefertigten Modelle gibt es ein riesiges Spektrum hinsichtlich Modellgröße, Architektur und Funktionen.
Benchmark-Bewertungen sind ein hilfreicher Leitfaden, um festzustellen, welche Modelle was gut können, aber sie sollten nicht als Evangelium genommen werden. Wenn Ihr Problem klar definiert ist, lohnt es sich, die Machbarkeit der Entwicklung von Benchmarks zu erkunden, die die Leistung bei den spezifischen Aufgaben, für die Sie ein Modell benötigen, direkt widerspiegeln. Dies wird auch für die spätere Modellevaluierungsphase nützlich sein.