Analisi CSV S3

È possibile definire le definizioni CSV con la serializzazione di input utilizzando questi valori predefiniti:

  • Utilizzare {\n} come delimitatore di riga.

  • Utilizzare {“} per il preventivo.

  • Utilizzare {\} per i caratteri escape.

csv-header-info viene analizzato quando USE viene visualizzato in AWS-CLI; questa è la prima riga nell'oggetto di input contenente lo schema. Attualmente, la serializzazione di output e il tipo di compressione non è supportato. Il motore di selezione S3 ha un programma di analisi CSV che analizza S3-objects:

  • Ogni riga termina con un delimitatore di riga.

  • Il separatore campo separa le colonne adiacenti.

  • Il separatore campo successivo definisce la colonna NULL .

  • Il carattere virgolette sostituisce il separatore di campo; ovvero, il separatore di campo è qualsiasi carattere tra le virgolette.

  • Il carattere escape disabilita qualsiasi carattere speciale tranne il delimitatore di riga.

I seguenti sono esempi di regole di analisi CSV:

Tabella 1. Analisi CSV

Funzione

Descrizione

Input (token)

NULL

Delimitatore campo successivo

,,1,,2, ==> {null}{null}{1}{null}{2}{null}

QUOTE

Il carattere virgolette sostituisce il delimitatore di campo.

11,22,”a,b,c,d”,last ==> {11}{22}{“a,b,c,d”}{last}

Escape

Il carattere escape sovrascrive il meta - carattere.

11,22,str=\”abcd\”\,str2=\”123\”,last ==> {11}{22}{str=”abcd”,str2=”123”}{last}

row delimiter

Non ci sono apici chiusi; il delimitatore di riga è la riga di chiusura.

11,22,a=”str,44,55,66 ==> {11}{22}{a=”str,44,55,66}

csv header info

FileHeaderInfo tag

Il valore USE indica che ogni token sulla prima riga è il nome - colonna; il valore IGNORE indica di ignorare la prima riga.