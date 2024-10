Vektoren gehören zur größeren Kategorie der Tensoren. Im maschinellen Lernen (ML) wird „Tensor“ als Oberbegriff für eine Reihe von Zahlen – oder eine Reihe von Zahlenreihen – in einem n-dimensionalen Raum verwendet, der wie ein mathematisches Buchhaltungsinstrument für Daten funktioniert.

Es ist gut zu wissen, dass bestimmte Wörter im Kontext der ML anders verwendet werden als in der Alltagssprache oder in anderen mathematischen Zusammenhängen. „Vektor“ selbst hat beispielsweise in der Physik eine spezifischere Konnotation und bezieht sich in der Regel auf eine Größe mit sowohl Größe als auch Richtung als in der ML.

Ebenso hat das Wort „Dimension“ in der ML je nach Kontext unterschiedliche Bedeutungen. Bei der Beschreibung eines Tensors bezieht sich dieses auf die Anzahl der Arrays, die der Tensor enthält. Bei der Beschreibung eines Vektors bezieht sich „Dimension” auf die Anzahl der Komponenten und einzelnen Zahlen, die der Vektor enthält. Analogien wie „Ordnung“ oder „Grad“ können helfen, Unklarheiten zu reduzieren.

Ein Skalar ist ein nulldimensionaler Tensor, der eine einzelne Zahl enthält. Ein System, das Wetterdaten modelliert, könnte beispielsweise die Tageshöchsttemperatur (in Celsius) in skalarer Form als 33 darstellen.





Ein Vektor ist ein eindimensionaler (oder ersten Grades oder erster Ordnung) Tensor, der mehrere Skalare der gleichen Art von Daten enthält. Ein Wettermodell könnte zum Beispiel die Tiefst-, Mittel- und Höchsttemperaturen für einen einzigen Tag in Vektorform verwenden: 25, 30, 33. Jede skalare Komponente ist ein Merkmal, d. h. eine Dimension des Vektors, die ein Merkmal des Wetters an diesem Tag darstellt.





Ein Tupel ist ein Tensor erster Ordnung, der Skalare von mehr als einem Typ von Daten enthält. Zum Beispiel könnten der Name, das Alter und die Größe (in Zoll) einer Person in Tupelform wie folgt dargestellt werden: (Jane, Smith, 31, 65).





Eine Matrix ist ein zweidimensionaler Tensor (oder zweiter Rang oder zweite Ordnung), der mehrere Vektoren desselben Typs von Daten enthält. Sie kann intuitiv als zweidimensionales Gitter von Skalaren visualisiert werden, in dem jede Zeile oder Spalte ein Vektor ist. Zum Beispiel könnte dieses Wettermodell den gesamten Monat Juni als 3x30-Matrix darstellen, in der jede Zeile ein Merkmalsvektor ist, der die Tiefst-, Mittel- und Höchsttemperaturen eines einzelnen Tages beschreibt.





Tensoren mit drei oder mehr Dimensionen, wie die dreidimensionalen Tensoren, die zur Darstellung von Farbbildern in Algorithmen für Computer Vision verwendet werden, werden als mehrdimensionale Arrays oder N-dimensionale Tensoren bezeichnet.

Verschiedene einfache Transformationen können auch auf Matrizen oder andere n-dimensionale Tensoren angewendet werden, um die darin enthaltenen Daten in Vektorform darzustellen. Eine 4x4-Matrix kann beispielsweise in einen 16-dimensionalen Vektor umgewandelt werden. Ein 3-dimensionaler Tensor eines 4x4-Pixelbildes kann in einen 48-dimensionalen Vektor umgewandelt werden.





Vektoren vs. Einbettungen:

Obwohl die Begriffe in der ML oft synonym verwendet werden, sind „Vektoren“ und „Einbettungen“ nicht dasselbe.

Eine Einbettung ist eine beliebige numerische Darstellung von Daten, die ihre relevanten Eigenschaften so erfasst, dass ML-Algorithmen sie verarbeiten können. Die Daten sind in einem n-dimensionalen Raum eingebettet.

Theoretisch müssen Daten nicht als Vektor eingebettet werden. Zum Beispiel können einige Typen von Daten in Tupelform eingebettet werden.1 In der Praxis werden Einbettungen in der modernen ML jedoch überwiegend in Form von Vektoren vorgenommen.

Umgekehrt sind Vektoren in anderen Kontexten, wie z. B. der Physik, nicht unbedingt Einbettungen. Aber in ML sind Vektoren normalerweise Einbettungen und Einbettungen sind normalerweise Vektoren.