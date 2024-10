Ein kollaboratives Filtersystem filtert Vorschläge basierend auf der Ähnlichkeit eines bestimmten Nutzers mit anderen. Kollaborative Empfehlungssysteme stützen sich auf explizite und implizite Daten und gehen davon aus, dass Nutzer mit vergleichbaren Präferenzen wahrscheinlich an denselben Artikeln interessiert sind und in Zukunft auf ähnliche Weise mit ihnen interagieren werden.

Amazon verwendet beispielsweise kollaborative Filterung für seine Produktempfehlungen, genau wie Spotify für seine Audioinhalte.



Recommender mit kollaborativer Filterung können wirksame Vorschläge machen und benötigen in der Regel keine detaillierten Artikelbeschreibungen. Allerdings ist kollaboratives Filtern auch anfällig für das Kaltstartproblem. Dieses tritt auf, wenn das System nur begrenzte historische Daten zur Verfügung hat, insbesondere bei neuen Nutzern.

Es gibt zwei Hauptarten von kollaborativen Filtersystemen: speicherbasierte und modellbasierte.

Speicherbasiert

Speicherbasierte Systeme stellen Nutzer und Elemente als Matrix dar. Sie sind eine Erweiterung des KNN-Algorithmus (K-Nearest-Neighbors), da ihr Ziel darin besteht, ihre „nächsten Nachbarn“ zu finden, bei denen es sich um ähnliche Nutzer oder ähnliche Elemente handeln kann. Speicherbasierte Systeme werden weiter in zwei Typen unterteilt:

Nutzerbasierte Filterung berechnet Ähnlichkeiten zwischen einem bestimmten Nutzer und allen anderen Nutzern in der Matrix. Nutzerbasierte Ähnlichkeitsfunktionen werden zwischen Zeilen in der Matrix Nutzer–Element berechnet.

Die artikelbasierte Filterung berechnet die Ähnlichkeit von Artikeln anhand des Nutzerverhaltens (wie Nutzer mit Artikeln interagieren und nicht anhand der Artikelmerkmale). Elementbasierte Ähnlichkeitsfunktionen werden zwischen den Spalten der Matrix Nutzer–Element berechnet.

Modellbasiert

Alternativ erstellen modellbasierte Systeme ein prädiktives maschinelles Lernmodell der Daten. Die Matrix Nutzer–Element dient als Trainingsdatensatz für das Modell, das Vorhersagen für Missing Values liefert, d. h. für Artikel, die ein Nutzer noch nicht gefunden hat und die daher empfohlen werden.

Einer der am häufigsten verwendeten modellbasierten kollaborativen Filteralgorithmen ist die Matrixfaktorisierung. Diese Methode zur Reduzierung der Dimensionalität zerlegt die oft große Matrix Nutzer–Element in zwei kleinere Matrizen – eine für Nutzer und eine weitere für Elemente – mit einigen ausgewählten Dimensionen. Die beiden Matrizen werden dann miteinander multipliziert, um die Missing Values (oder die Empfehlungen) in der größeren Matrix vorherzusagen.

Eine fortgeschrittenere Implementierung der Matrixfaktorisierung nutzt neuronale Deep-Learning Netze. Andere modellbasierte Systeme nutzen Algorithmen des maschinellen Lernens wie Bayes-Klassifikatoren, Clustering und Entscheidungsbäume.