Riferimento alle proprietà: Connettore CloudObjectStorage
Questo argomento elenca tutte le proprietà che si possono impostare per configurare lo stage.
Connessione
- URL di accesso
- URL, per accedere a IBM Cloud Object Storage. Per trovare questo URL, andare su https://console.ng.bluemix.net/dashboard/services, fare clic sul servizio Cloud Object Storage e quindi su Endpoint nel riquadro a sinistra. Copiare il valore dell'endpoint pubblico che si desidera utilizzare.
- Tipo:stringa
- Predefinito: https://s3-api.us-geo.objectstorage.softlayer.net
- Utilizzare l'ID dell'istanza della risorsa
- Scegliere questa opzione per utilizzare l'id dell'istanza della risorsa invece della chiave di accesso
- Tipo: boolean
- Valore predefinito: FALSE
- Chiave di accesso
- La connessione al servizio IBM COS con l'API S3 richiede credenziali e un endpoint. Le credenziali sono costituite da una chiave di accesso e da una chiave segreta. Per trovare la chiave di accesso, visitate il sito https://console.ng.bluemix.net/dashboard/services fate clic sul servizio Cloud Object Storage, fate clic su Credenziali del servizio nel riquadro di sinistra e quindi su Visualizza credenziali nella colonna Azioni della tabella Credenziali del servizio. Copia il valore di access_key, escluse le virgolette.
- Tipo:stringa
- Chiave segreta
- La connessione al servizio IBM COS con l'API S3 richiede credenziali e un endpoint. Le credenziali sono costituite da una chiave di accesso e da una chiave segreta. Per trovare la chiave segreta, visitate il sito https://console.ng.bluemix.net/dashboard/services fate clic sul servizio Cloud Object Storage, fate clic su Credenziali del servizio nel riquadro di sinistra e quindi su Visualizza credenziali nella colonna Azioni della tabella Credenziali del servizio. Copia il valore di secret_key, senza includere le virgolette.
- Tipo: stringa protetta
- URL IAM
- L' URL e che l' IBM Cloud Object Storage e dovrebbe utilizzare per autenticare la chiave API con Identity and Access Management (IAM).
- Tipo:stringa
- ID istanza risorsa
- L'identificatore dell'istanza della risorsa creata quando si è ordinato IBM Cloud Object Storage. Trovate l'ID dell'istanza della risorsa andando su https://console.ng.bluemix.net/dashboard/services facendo clic sul servizio Cloud Object Storage, facendo clic su Credenziali del servizio nel riquadro di sinistra e quindi su Visualizza credenziali nella colonna Azioni della tabella Credenziali del servizio. Copia il valore di resource_instance_id, escluse le virgolette.
- Tipo:stringa
- Chiave API
- Un token utilizzato per chiamare le API Watson IoT Platform HTTP. Alle chiavi API vengono assegnati ruoli che garantiscono loro l'autorizzazione a chiamare determinati set di API di HTTP. Per trovare la chiave API, andare su https://console.ng.bluemix.net/dashboard/services, fare clic sul servizio Cloud Object Storage, fare clic su Credenziali di servizio nel riquadro a sinistra, quindi fare clic su Visualizza credenziali nella colonna Azioni della tabella Credenziali di servizio. Copia il valore di api_key, escluse le virgolette.
- Tipo: stringa protetta
- Regione
- Utilizzare questa opzione per specificare la posizione geografica dei centri dati da cui leggere i dati o dove memorizzarli.
- Tipo:stringa
Utilizzo
- Secchio
- Il nome del bucket che contiene i file da leggere o scrivere.
- Tipo:stringa
- Crea bucket
- Utilizzare questa opzione per creare il bucket con il nome indicato nella proprietà bucket.
- Tipo: boolean
- Valore predefinito: FALSE
- Classe di memoria
- Selezionare una classe di archiviazione per il bucket creato dal seguente elenco: Standard, Vault, Cold vault, Flex.
- Tipo: selezione
- Predefinito: Standard
- Valori:
- Standard
- Vault
- Cold vault
- Flex
- Modalità di lettura
- Il metodo per la lettura dei file
- Tipo: selezione
- Predefinito: Lettura di un singolo file
- Valori:
- Leggi un singolo file
- Leggi più file utilizzando caratteri jolly
- Leggi più file utilizzando l'espressione regex
- Modalità di scrittura
- Utilizzare questa proprietà per specificare il nome del file in cui scrivere o eliminare il file corrispondente al nome.
- Tipo: selezione
- Predefinito: Scrivi
- Valori:
- Scrivi
- Elimina
- Nome file
- Specificare il nome del file
- Tipo:stringa
- Schema di infer
- Utilizzare questa proprietà per dedurre lo schema (metadati) dai dati di input del file.
- Tipo: boolean
- Valore predefinito: FALSE
- Deduci come VARCHAR
- Considera i dati in tutte le colonne come VARCHAR
- Tipo: boolean
- Valore predefinito: FALSE
- Formato file
- Il formato del file
- Tipo: selezione
- Predefinito: CSV
- Valori:
- Delimitato
- CSV
- Parquet
- Avro
- JSON
- Excel
- ORC
- Partizionato
- Scrivere il file come più partizioni
- Tipo: boolean
- Valore predefinito: FALSE
- Proprietà di gestione delle onde
- Utilizzare le proprietà riportate sotto questa categoria per definire come devono essere gestiti i dati quando vengono trasmessi in streaming come onde (i.e in batch) dalla fase a monte. Di solito, ciò viene richiesto per qualsiasi fase di origine configurata per inviare i dati in onde.
- Tipo: categoria
- Aggiungi identificativo univoco
- Utilizzare questa proprietà per scegliere se un identificativo univoco deve essere aggiunto al nome del file. Quando il valore di questa proprietà è impostato su sì, allora il nome del file viene aggiunto con l'identificativo univoco e verrà scritto un nuovo file per ogni wave di dati che viene trasmessa in streaming sullo stage. Quando il valore di questa proprietà è impostato su No il file verrà sovrascritto ad ogni onda.
- Tipo: boolean
- Valore predefinito: FALSE
- Soglia dimensione file
- Specificare la soglia per la dimensione del file in megabyte. I nodi di elaborazione avvieranno un nuovo file ogni volta che la dimensione supera il valore specificato nella soglia.
- Tipo: interro
- Predefinito: 1
- Proprietà formato file
- Specificare la sintassi per i file delimitati.
- Tipo: categoria
- Intestazione
- Selezionare Sì se la prima riga del file contiene intestazioni di campo e non fa parte dei dati. Se si seleziona Sì quando il connettore scrive i dati, i nomi dei campi saranno la prima riga dell'output. Se è abilitata la propagazione colonne al runtime, è possibile ottenere i metadati dalla prima riga del file.
- Tipo: boolean
- Valore predefinito: FALSE
- Includi tipi
- Selezionare Sì per accodare il tipo di dati a ogni nome di campo che il connettore scrive nella prima riga dell'output.
- Tipo: boolean
- Valore predefinito: FALSE
- Delimitatore campo
- Il carattere che separa ciascun valore dal valore successivo, ad esempio una virgola
- Tipo: selezione
- Predefinito: virgola
- Valori:
- virgola
- scheda
- colonna
- Delimitatore riga
- Il carattere o i caratteri che separano una riga da un'altra, ad esempio ritorno a capo/avanzamento riga (CR/LF)
- Tipo: selezione
- Predefinito: Newline
- Valori:
- Avanzamento riga
- Ritorno a capo
- Avanzamento della linea di ritorno del carrello
- Nuova riga
- Valore null
- Il valore che rappresenta null (un valore mancante) nel file, ad esempio, NULL
- Tipo:stringa
- Carattere escape
- Il carattere utilizzato per eseguire l'escape di altri caratteri, ad esempio, una barra retroversa. L'escape è una tecnica di stringa che identifica i caratteri come parte di un valore stringa.
- Tipo: selezione
- Impostazione predefinita: nessuno
- Valori:
- Nessuna
- Virgolette doppie
- Virgolette singole
- Barra retroversa
- Carattere virgolette
- Il carattere utilizzato per racchiudere i valori delle stringhe, ad esempio le virgolette doppie
- Tipo: selezione
- Impostazione predefinita: nessuno
- Valori:
- Nessuna
- Virgolette doppie
- Virgolette singole
- Codifica
- La codifica dei caratteri appropriata per i dati, ad esempio UTF-8
- Tipo:stringa
- Predefinito: utf-8
- Formato decimale
- Il formato dei valori decimali, ad esempio #.###,##
- Tipo:stringa
- Formato data
- Specificare una stringa che definisce il formato per i campi con tipo di dati Data.
- Tipo:stringa
- Formato ora
- Specificare una stringa che definisce il formato per i campi con tipo di dati Ora.
- Tipo:stringa
- Formato data/ora
- Specificare una stringa che definisce il formato per i campi con tipo di dati Data/Ora.
- Tipo:stringa
- Proprietà del formato Parquet
- Proprietà del formato file Parquet
- Tipo: categoria
- Codec di compressione Parquet
- Selezionare l'algoritmo di compressione Parquet per comprimere i dati.
- Tipo: selezione
- Impostazione predefinita: nessuno
- Valori:
- Nessuna
- Snappy
- GZip
- Proprietà del formato Avro
- Proprietà del formato file Avro
- Tipo: categoria
- Codec di compressione Avro
- Selezionare l'algoritmo di compressione Avro per comprimere i dati
- Tipo: selezione
- Impostazione predefinita: nessuno
- Valori:
- Nessuna
- Deflate
- Snappy
- Bzip2
- Proprietà del formato ORC
- Proprietà del formato file ORC
- Tipo: categoria
- Codec di compressione ORC
- Selezionare il codec di compressione da utilizzare durante la scrittura
- Tipo: selezione
- Impostazione predefinita: nessuno
- Valori:
- Nessuna
- ZLib
- Snappy
- LZO
- LZ4
- Proprietà del formato Excel
- Proprietà del formato file di Excel
- Tipo: categoria
- Intervallo di celle
- L'intervallo di celle da richiamare dal foglio di lavoro Excel, ad esempio C1:F10
- Tipo:stringa
- Nome del foglio di lavoro Excel
- Utilizzare questa proprietà per specificare il nome del foglio di lavoro Excel da leggere.
- Tipo:stringa
- Gestione dati non valida
- Modalità di gestione di valori non validi: esito negativo del lavoro, colonna null o cancellazione della riga
- Tipo: selezione
- Predefinito: Fallito
- Valori:
- Non riuscito
- Colonna
- Riga
- Limite di riga
- Specificare il numero massimo di record da leggere dal file per nodo. Se non viene specificato un valore per questa proprietà, viene letto tutto il file.
- Tipo:stringa
- Limite di byte
- Specificare il numero massimo di byte da restituire. Utilizzare uno di questi suffissi: KB, MB, GB oppure TB.
- Tipo:stringa
- Impostazioni Java
- Proprietà per la specifica di opzioni JVM
- Tipo: categoria
- Dimensione heap
- Dimensione heap (MB). Questa proprietà corrisponde all'opzione della riga comandi -Xmx.
- Tipo: interro
- Predefinito: 256
- Minimo: 128
- Opzioni JVM
- Immettere argomenti aggiuntivi della riga comandi nella JVM (Java Virtual Machine).
- Tipo:stringa