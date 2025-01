Partielle Feinabstimmungsmethoden, die auch als selektive Feinabstimmung bezeichnet werden, zielen darauf ab, den Rechenaufwand zu reduzieren, indem nur die ausgewählte Teilmenge der vortrainierten Parameter aktualisiert wird, die für die Modellleistung relevanter nachgelagerter Aufgaben am wichtigsten sind. Die restlichen Parameter werden „eingefroren“, sodass sichergestellt ist, dass sie nicht geändert werden.

Der intuitivste Ansatz zur partiellen Feinabstimmung besteht darin, nur die äußeren Schichten des neuronalen Netzes zu aktualisieren. In den meisten Modellarchitekturen erfassen die inneren Schichten des Modells (die der Eingabeschicht am nächsten liegen) nur breite, allgemeine Merkmale: In einem CNN, das zur Bildklassifizierung verwendet wird, erkennen die ersten Schichten beispielsweise typischerweise Kanten und Texturen; jede nachfolgende Schicht erkennt zunehmend feinere Merkmale, bis die endgültige Klassifizierung in der äußersten Schicht vorhergesagt wird. Im Allgemeinen gilt: Je ähnlicher die neue Aufgabe (für die das Modell feinabgestimmt wird) der ursprünglichen Aufgabe ist, desto nützlicher sind die vortrainierten Gewichtungen der inneren Schichten bereits für diese neue, verwandte Aufgabe – und desto weniger Schichten müssen aktualisiert werden.

Andere partielle Feinabstimmungsmethoden umfassen nur die Aktualisierung der schichtweiten Bias-Terme des Modells (anstatt der knotenspezifischen Gewichtungen)4 und „spärliche“ Feinabstimmungsmethoden, die nur eine ausgewählte Teilmenge der Gesamtgewichtungen im Modell aktualisieren.5