Étape Normaliser

Utilisez l'étape Normaliser pour rendre vos données source cohérentes, afin que chaque type de données possède le même type de contenu et de format.

L'étape Normaliser s'appuie sur l'interprétation des données pendant l'étape Investigate. L'étape Normaliser reforme les données et crée une présentation de données cohérente avec des colonnes fixes et discrètes, en fonction des exigences de votre société.

L'étape Normaliser utilise le contenu et le positionnement des données dans le contexte d'enregistrement pour déterminer la signification de chaque élément de données. Des exemples courants d'éléments de données qui peuvent être identifiés sont le nom, l'adresse, la ville, l'état et le code postal.

Pour analyser correctement et identifier chaque élément ou valeur (précédemment appelé jeton) et les placer dans la colonne appropriée du fichier de sortie, l'étape Normaliser utilise des jeux de règles conçus pour être conformes aux normes ou conventions. Par exemple, vous pouvez normaliser les noms de données (individus et entreprises) et les adresses pour se conformer aux conventions d'un pays spécifique. Les jeux de règles utilisés par l'étape Normaliser peuvent assimiler les données et ajouter des informations supplémentaires à partir des données d'entrée, telles que le sexe. Ces jeux de règles sont les mêmes que ceux utilisés dans l'étape Investigate.

Les données normalisées sont importantes pour les raisons suivantes :

  • Concorde efficacement avec les données
  • Facilite un format cohérent pour les données de sortie

L'étape Normaliser analyse les colonnes à format libre et à format fixe dans des colonnes de domaine unique afin de créer une représentation cohérente des données d'entrée.

  • Les colonnes à format libre contiennent des informations alphanumériques de n'importe quelle longueur tant qu'elles sont inférieures ou égales à la longueur maximale de colonne définie pour cette colonne.
  • Les colonnes de format fixe ne contiennent qu'un type spécifique d'informations, telles que des informations numériques, alphanumériques ou alphanumériques, et ont un format spécifique.

L'étape de normalisation prend une entrée unique, qui peut être un lien depuis n'importe quel connecteur de base de données pris en charge par DataStage®, un fichier à plat ou un jeu de données, ou n'importe quelle étape de traitement. Il n'est pas nécessaire de restreindre les données aux colonnes de longueur fixe.

L'étape Normaliser n'a qu'un seul lien de sortie. Ce lien peut envoyer une sortie standardisée et l'entrée brute à n'importe quelle autre étape.

Étape Standardize : raccourci

Voici les étapes minimales à suivre pour qu'une étape de normalisation fonctionne :
  1. Allez dans l'onglet Stage du panneau de propriétés du stage Standardize, puis ouvrez la section Processus de standardisation.
  2. Cliquez sur Ajouter une règle pour ouvrir la page de règle de normalisation.
  3. Ouvrez la section Régions de la page, ouvrez une région, puis ouvrez d'autres sous-noeuds jusqu'à ce que vous puissiez sélectionner un ensemble de règles. Cliquez sur Gestion pour modifier les propriétés des règles et les tables de consultation. Modifier la classification, les modèles et les dérogations.
  4. Sélectionnez un ensemble de règles, puis cliquez sur Sélectionner.
  5. Dans la section Processus de normalisation, sous Nom de colonne, cliquez sur Ajouter des noms +.
  6. Sur la page Normalisation des colonnes, ajoutez de nouvelles colonnes ou des littéraux ou les deux. Cliquez ensuite sur Appliquer et renvoyer.
  7. Cliquez sur Sauvegarder.