Analisi CSV S3

È possibile definire le definizioni CSV con la serializzazione di input utilizzando questi valori predefiniti:

Utilizzare {\n} come delimitatore di riga.
Utilizzare {“} per il preventivo.
Utilizzare {\} per i caratteri escape.

csv-header-info viene analizzato quando USE viene visualizzato in AWS-CLI; questa è la prima riga nell'oggetto di input contenente lo schema. Attualmente, la serializzazione di output e il tipo di compressione non è supportato. Il motore di selezione S3 ha un programma di analisi CSV che analizza S3-objects:

Ogni riga termina con un delimitatore di riga.
Il separatore campo separa le colonne adiacenti.
Il separatore campo successivo definisce la colonna NULL .
Il carattere virgolette sostituisce il separatore di campo; ovvero, il separatore di campo è qualsiasi carattere tra le virgolette.
Il carattere escape disabilita qualsiasi carattere speciale tranne il delimitatore di riga.

I seguenti sono esempi di regole di analisi CSV:

Tabella 1. Analisi CSV
Funzione	Descrizione	Input (token)
`NULL`	Delimitatore campo successivo	`,,1,,2, ==> {null}{null}{1}{null}{2}{null}`
`QUOTE`	Il carattere virgolette sostituisce il delimitatore di campo.	`11,22,”a,b,c,d”,last ==> {11}{22}{“a,b,c,d”}{last}`
`Escape`	Il carattere escape sovrascrive il meta - carattere.	`11,22,str=\”abcd\”\,str2=\”123\”,last ==> {11}{22}{str=”abcd”,str2=”123”}{last}`
`row delimiter`	Non ci sono apici chiusi; il delimitatore di riga è la riga di chiusura.	`11,22,a=”str,44,55,66 ==> {11}{22}{a=”str,44,55,66}`
`csv header info`	FileHeaderInfo tag	Il valore USE indica che ogni token sulla prima riga è il nome - colonna; il valore IGNORE indica di ignorare la prima riga.

Riferimenti

Modifica online

Per ulteriori dettagli, consultare l 'API di Amazon S3 Select Object Content.