I vettori appartengono alla più ampia categoria dei tensori. Nel machine learning (ML), "tensore" è un termine generico usato per indicare un array di numeri, o un array di array di numeri, in uno spazio n-dimensionale, che funziona come uno strumento matematico per la registrazione e l'organizzazione dei dati.

È utile notare che alcune parole vengono utilizzate in modo diverso in un contesto di ML rispetto al linguaggio quotidiano o ad altri contesti matematici. La parola "vettore", ad esempio, ha una connotazione più specifica in fisica, in cui si riferisce solitamente a una grandezza caratterizzata sia da una direzione che da un'intensità, rispetto all'uso che ne viene fatto nel ML.

Allo stesso modo, la parola "dimensione" ha implicazioni diverse nel ML, a seconda del suo contesto. Quando si descrive un tensore, ci si riferisce al numero di array contenuti in quel tensore. Quando si descrive un vettore, ci si riferisce al numero di componenti e numeri individuali contenuti in quel vettore. Termini analoghi come "ordine" o "grado" possono aiutare a ridurre l’ambiguità.

Uno scalare è un tensore adimensionale, contenente un singolo numero. Ad esempio, un sistema di modellazione dei dati meteorologici potrebbe rappresentare la temperatura massima di un singolo giorno (in gradi Celsius) in forma scalare come 33.





Un vettore è un tensore monodimensionale (o di primo grado o primo ordine), contenente più scalari dello stesso tipo di dati. Ad esempio, il modello meteorologico potrebbe rappresentare le temperature minime, medie e massime di quella singola giornata in forma vettoriale come (25, 30, 33). Ogni componente scalare è una caratteristica, cioè una dimensione, del vettore, che corrisponde a una caratteristica del meteo di quel giorno.





Una tupla è un tensore di primo ordine che contiene scalari di più tipi di dati. Ad esempio, il nome, l'età e l'altezza di una persona (in pollici) potrebbero essere rappresentati in forma di tupla come (Jane, Smith, 31, 65).





Una matrice è un tensore bidimensionale (o di secondo rango o di secondo ordine), contenente più vettori dello stesso tipo di dati. Può essere visualizzata in modo intuitivo come una griglia bidimensionale di scalari in cui ogni riga o colonna è un vettore. Ad esempio, il modello meteorologico già citato potrebbe rappresentare l'intero mese di giugno come una matrice 3x30, in cui ogni riga è un vettore di caratteristiche che descrive le temperature minime, medie e massime di un singolo giorno.





I tensori con tre o più dimensioni, come i tensori tridimensionali usati per rappresentare le immagini a colori negli algoritmi di computer vision, sono chiamati array multidimensionali o tensori N-dimensionali .

Diverse trasformazioni semplici possono essere applicate anche alle matrici o ad altri tensori n-dimensionali per rappresentare i dati che contengono in forma vettoriale. Ad esempio, una matrice 4x4 può essere appiattita in un vettore a 16 dimensioni; un tensore tridimensionale di un'immagine di 4x4 pixel può essere appiattito in un vettore a 48 dimensioni.





Vettori vs. incorporamenti:

Sebbene questi due termini siano spesso usati in modo intercambiabile nel ML, "vettori" e "incorporamenti" non sono la stessa cosa.

Un incorporamento è qualsiasi rappresentazione numerica dei dati che cattura le loro qualità rilevanti in modo tale che gli algoritmi di machine learning possano elaborarli. I dati sono incorporati nello spazio n-dimensionale.

In teoria, non è necessario che i dati siano incorporati come vettori. Ad esempio, alcuni tipi di dati possono essere incorporati in forma di tupla.1 Ma in pratica, nel ML moderno gli incorporamenti assumono prevalentemente la forma di vettori.

Al contrario, i vettori in altri contesti, come la fisica, non sono necessariamente incorporamenti. Ma nel machine learning, i vettori sono generalmente incorporamenti e gli incorporamenti sono di solito vettori.