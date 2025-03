Das Wort Raum hat im Kontext des maschinellen Lernens eine vielfältigere Bedeutung als im allgemeinen Sprachgebrauch. Im Großen und Ganzen bezieht sich ein „Raum“ in ML auf einen bestimmten Modus der Abbildung, des Vergleichs oder der Probenahme von Datenpunkten. Beispielsweise:

Der „Eingaberaum“ ist die Bandbreite der in den Eingabedaten enthaltenen Möglichkeiten.

Der „Ausgaberaum“ ist die Bandbreite an Möglichkeiten für die Ausgabe des Modells.

Bei Bilddaten ist der „Pixelraum“ der Bereich der Möglichkeiten für numerische Pixelwerte.

Beim verstärkenden Lernen ist der „Aktionsraum“ die Reihe möglicher Aktionen, die als nächstes ergriffen werden könnten, z. B. die legalen Züge, die zu einem bestimmten Zeitpunkt in einem Brettspiel verfügbar sind.

Mathematisch gesehen wird ein Raum in erster Linie durch das definiert, was seinen Dimensionen entspricht, d. h. welche Merkmale– also Variablen – zur Beschreibung von Datenpunkten in diesem Raum verwendet werden. Werden Datenpunkte einem bestimmten Raum zugeordnet, werden Datenpunkte mit ähnlichen Werten für die Variablen, die den Raum definieren, aufgrund einer Metrik wie Kosinusähnlichkeit, euklidischer Distanz oder Skalarprodukt einander ähnlich oder nahe beieinander sein.

Beim maschinellen Lernen müssen Datenpunkte numerisch dargestellt werden. Am häufigsten werden Datenpunkte als Vektoren dargestellt (oder „eingebettet“). Den Raum, in dem Datenpunkte durch ihre Vektordarstellungen verglichen werden, bezeichnen wir daher als den „Vektoreinbettungsraum“ (oder „Einbettungsraum“). Die numerischen Darstellungen, in denen jedes Element im Vektor einer individuellen Dimension des Einbettungsraums entspricht, werden Vektoreinbettungen genannt. Algorithmen für maschinelles Lernen verwenden in der Regel entweder Vektoreinbettungen als Eingabe oder beginnen mit der Konvertierung von Eingabedaten in Vektoreinbettungen.