Compare stage in DataStage
Compare stage esegue un confronto colonna per colonna dei record in due set di dati di input preordinati. È possibile limitare il confronto alle colonne chiave specificate.
L' Compare stage è una fase di elaborazione. Può avere due collegamenti di ingresso e un unico collegamento di uscita.
L'operazione " Compare stage " non modifica la definizione della tabella, il partizionamento o il contenuto dei record in entrambi i set di dati di input. Trasferisce entrambi i set di dati intatti in un unico set di dati di output generato dalla fase. I risultati del confronto vengono registrati anche nel set di dati di output.
In questa fase è possibile utilizzare la propagazione delle colonne in fase di esecuzione e consentire a IBM DataStage di definire lo schema delle colonne di output in fase di esecuzione. Il palco produce un set di dati con tre colonne:
- risultato. Contiene il codice che indica il risultato del confronto.
- primo. Un sottoregistro contenente le colonne del primo collegamento di input.
- secondo. Un sottoregistro contenente le colonne del secondo collegamento di input.
- Specificare la colonna padre per i dati di output corrispondenti al primo collegamento di input e impostare il tipo SQL su sconosciuto.
- Specificare le colonne effettive che contengono i dati e creare questi sottoregistri della colonna principale. Assegna un nome a ciascuna colonna first. colname, ad esempio first.col1, first.col2 e così via. Trasforma ogni colonna in un sottoregistro selezionando la colonna, selezionando Modifica riga dal menu di scelta rapida e specificando un numero di livello (ad esempio, 03) per quella colonna. (È possibile velocizzare questo processo rendendo la prima colonna un sottoregistro e utilizzando la funzione di propagazione dei valori per rendere le colonne rimanenti sottoregistri della colonna principale)
- Specificare la colonna padre per i dati di output corrispondenti al secondo collegamento di input e impostare il tipo SQL su sconosciuto.
- Specificare le colonne effettive che contengono i dati dal secondo collegamento di input, denominarle second. colname (ad esempio, second.col1, second.col2 ) e renderle sottoregistri della colonna principale.
Quando fai doppio clic su " Compare stage ", si apre il pannello delle proprietà. Il pannello delle proprietà ha tre schede:
- Palcoscenico. È sempre presente e viene utilizzato per specificare informazioni generali sullo stadio.
- Input. Qui è possibile specificare i dettagli relativi ai dati da raggruppare o aggregare.
- Output. Qui è possibile specificare i dettagli relativi ai gruppi che vengono emessi dalla fase.
Scheda input
La sezione Colonne specifica le definizioni delle colonne dei dati in entrata. La scheda Avanzate consente di modificare le impostazioni predefinite di buffering per il collegamento di ingresso.
Scheda output
La sezione Colonne specifica le definizioni delle colonne dei dati. La sezione Avanzate consente di modificare le impostazioni predefinite di buffering per il collegamento di uscita.