Der Trainingsprozess ist der kritischste Schritt im Lebenszyklus von KI-Modellen, von Prognosesystemen, die auf grundlegenden linearen Regressionsalgorithmen basieren, bis hin zu komplexen neuronalen Netzen, die generative KI antreiben.
Das Modelltraining ist der Schritt des maschinellen Lernens (ML), bei dem das „Lernen“ stattfindet. Beim maschinellen Lernen werden die Parameter eines ML-Modells angepasst. Zu diesen Parametern gehören die Gewichtungen und Verzerrungen in den mathematischen Funktionen, aus denen sich ihre Algorithmen zusammensetzen. Das Ziel dieser Anpassung ist es, genauere Ergebnisse zu erzielen. Die spezifischen Werte für diese Gewichtungen und Verzerrungen, die das Endergebnis des Modelltrainings sind, sind die greifbare Manifestation des „Wissens“ eines Modells.
Mathematisch gesehen besteht das Ziel dieses Lernens darin, eine Verlustfunktion zu minimieren, die den Fehler der Modellausgaben bei Trainingsanfragen quantifiziert. Wenn die Ausgabe der Verlustfunktion unter einen vorgegebenen Schwellenwert fällt – was bedeutet, dass der Modellfehler bei Trainingsaufgaben ausreichend klein ist – gilt das Modell als „trainiert“. Beim verstärkenden Lernen ist das Ziel umgekehrt: Anstatt eine Verlustfunktion zu minimieren, werden die Modellparameter optimiert, um eine Belohnungsfunktion zu maximieren.
In der Praxis umfasst das Modelltraining einen Zyklus aus dem Sammeln und Kuratieren von Daten, dem Ausführen des Modells mit diesen Schulungsdaten, dem Messen von Verlusten, dem entsprechenden Optimieren von Parametern und dem Testen der Modellleistung anhand von Validierungsdatensätzen. Dieser Workflow wird so lange wiederholt, bis zufriedenstellende Ergebnisse erzielt wurden. Ein angemessenes Training könnte auch die Anpassung von Hyperparametern erfordern – strukturelle Entscheidungen, die den Lernprozess beeinflussen, aber selbst nicht „lernbar“ sind – in einem Prozess, der als Hyperparameter-Tuning bezeichnet wird.
Manchmal kann ein bereits trainiertes Modell durch weiteres Lernen mit neuen Trainingsdaten für spezifischere Aufgaben oder Bereiche feinabgestimmt werden. Obwohl sowohl das ursprüngliche Training von Grund auf als auch die anschließende Feinabstimmung „Training“ sind, wird Ersteres in diesem Zusammenhang in der Regel als „Vortraining“ bezeichnet (zur Klarstellung). Die Feinabstimmung ist einer von mehreren Typen des Transferlernens, einem Oberbegriff für maschinelle Lerntechniken, die vorab trainierte Modelle für neue Verwendungszwecke anpassen.