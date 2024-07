Die meisten Algorithmen für maschinelles Lernen können nur niedrigdimensionale numerische Daten als Eingabe verwenden. Daher ist es notwendig, die Daten in ein numerisches Format zu konvertieren. Dies kann z. B. die Erstellung einer „Bag of Words“-Darstellung für Textdaten, die Konvertierung von Bildern in Pixelwerte oder die Umwandlung von Diagrammdaten in eine numerische Matrix bedeuten.

Objekte, die in ein Einbettungsmodell eingehen, werden als Einbettungen ausgegeben, die wiederum als Vektoren dargestellt werden. Ein Vektor ist eine Reihe von Zahlen (z. B. 1489, 22... 3, 777), wobei jede Zahl angibt, wo sich ein Objekt entlang einer bestimmten Dimension befindet. Die Anzahl der Dimensionen kann je nach Komplexität der Eingabedaten bis zu tausend oder mehr betragen. Je näher eine Einbettung an anderen Einbettungen in diesem n-dimensionalen Raum liegt, desto ähnlicher sind sie sich. Die Ähnlichkeit der Verteilung wird durch die Länge der Vektorpunkte von einem Objekt zum anderen bestimmt (gemessen durch Euklidisch, Cosinus oder andere).

Ein Modell, Word2Vec (Word to Vector), das 2013 von Google entwickelt wurde, ist eine Methode zur effizienten Erstellung von Worteinbettungen mithilfe eines zweischichtigen neuronalen Netzwerks. Es nimmt ein Wort als Eingabe und gibt dann eine n-dimensionale Koordinate (den Einbettungsvektor) aus. Wenn Sie diese Wortvektoren in einen dreidimensionalen Raum einzeichnen, werden Synonyme geclustert.

So würden zwei Wörter, „Papa“ und „Mama“, als Vektoren dargestellt:

„Papa“ = [0,1548, 0,4848, …, 1,864]

„Mama“ = [0,8785, 0,8974, …, 2,794]

Obwohl es eine gewisse Ähnlichkeit zwischen diesen beiden Wörtern gibt, würden wir erwarten, dass „Vater“ im Vektorraum viel näher an „Papa“ liegt, was zu einem höheren Punktprodukt führt (ein Maß für die relative Richtung zweier Vektoren und dafür, wie eng sie in der Richtung, in die sie zeigen, übereinstimmen).

Ein komplexeres Beispiel ist die Einbettung von Empfehlungen, bei der Benutzer und Artikel (z. B. Filme, Produkte, Artikel) als hochdimensionale Vektoren in einem kontinuierlichen Vektorraum dargestellt werden. Diese Einbettungen erfassen latente Merkmale, die die Vorlieben der Benutzer und die Eigenschaften der Artikel widerspiegeln. Die Idee besteht darin, eine Darstellung für jeden Benutzer und jedes Objekt so zu lernen, dass das Punktprodukt ihrer Einbettungen mit der Präferenz des Benutzers für dieses Objekt korreliert.

Jeder Benutzer und jeder Artikel ist mit einem Einbettungsvektor verbunden. Diese Vektoren werden normalerweise durch ein Empfehlungsmodell während eines Trainingsprozesses gelernt. Die Einbettungen der Benutzer und Artikel werden in Matrizen organisiert. Die Zeilen der Benutzermatrix stehen für die Benutzer und die Zeilen der Objektmatrix für die Objekte.

Der Empfehlungsscore für ein Paar aus Nutzer und Artikel kann berechnet werden, indem das Punktprodukt aus dem Einbettungsvektor des Nutzers und dem Einbettungsvektor des Artikels gebildet wird. Je höher das Punktprodukt ist, desto wahrscheinlicher ist es, dass der Benutzer an dem Artikel interessiert ist.

Empfehlungswert = Benutzereinbettung ⋅ Artikeleinbettung

Die Einbettungsmatrizen werden in einem Trainingsprozess anhand historischer Interaktionen zwischen Nutzern und Artikeln gelernt. Das Modell zielt darauf ab, die Differenz zwischen den vorhergesagten Bewertungen und den tatsächlichen Präferenzen der Nutzer (z. B. Bewertungen, Klicks, Käufe) zu minimieren.

Sobald das Modell trainiert ist, kann es zur Generierung von Top-N-Empfehlungen für Benutzer verwendet werden. Die Artikel mit den höchsten vorhergesagten Punktzahlen für einen Benutzer werden empfohlen.