Transferlernen ist eine Technik des maschinellen Lernens, bei der das durch eine Aufgabe oder einen Datensatz gewonnene Wissen genutzt wird, um die Modellleistung bei einer anderen, verwandten Aufgabe und/oder einem anderen Datensatz zu verbessern.1 Mit anderen Worten: Transferlernen nutzt das, was in einer Umgebung gelernt wurde, um die Generalisierung in einer anderen Umgebung zu verbessern.2 Transferlernen hat viele Anwendungen, von der Lösung von Regressionsproblemen in der Data Science bis hin zum Training von Deep Learning-Modellen. Angesichts der großen Datenmengen, die für die Erstellung von tiefen neuronalen Netzwerken benötigt werden, ist sie für letztere besonders interessant.

Herkömmliche Lernprozesse erstellen für jede neue Aufgabe ein neues Modell, das auf den verfügbaren markierten Daten basiert. Das liegt daran, dass herkömmliche Algorithmen für maschinelles Lernen davon ausgehen, dass Trainings- und Testdaten aus demselben Funktionsraum stammen. Wenn sich also die Datenverteilung ändert oder das trainierte Modell auf einen neuen Datensatz angewendet wird, muss der Benutzer ein neues Modell von Grund auf neu trainieren, selbst wenn er eine ähnliche Aufgabe wie das erste Modell versucht (z. B. Stimmungsanalyse-Klassifikator für Filmkritiken im Vergleich zu Songkritiken). Algorithmen des Transferlernens hingegen nehmen bereits trainierte Modelle oder Netzwerke als Ausgangspunkt. Es wendet dann das Wissen des Modells, das in einer ursprünglichen Ausgangsaufgabe oder -daten (z. B. Klassifizierung von Filmkritiken) gewonnen wurde, auf eine neue, aber verwandte Zielaufgabe oder -daten (z. B. Klassifizierung von Songkritiken) an.3