Source Fichier

L'application prend en charge plusieurs types de fichier de données. Lorsque vous entrez ou recherchez un nom de fichier, l'application détecte automatiquement le type de fichier et développe l'éditeur de source de données pour afficher d'autres champs relatifs à ce type de fichier. Si le type de fichier est incorrect ou nécessite une version spécifique (par exemple, Microsoft Excel 1997-2003), vous pouvez le remplacer par le type de fichier requis.

Vous pouvez cliquer sur Parcourir pour sélectionner un fichier dans le référentiel, ou sur Télécharger le fichier local pour sélectionner un fichier dans votre système de fichiers local (si activé).

Si vous téléchargez un fichier local, le téléchargement s'effectue dans IBM® SPSS Modeler Server. Dans la boîte de dialogue Télécharger le fichier, recherchez et sélectionnez le fichier local à télécharger, puis la destination de téléchargement IBM SPSS Modeler Server. Lorsque vous sélectionnez la destination, vous pouvez changer le nom de fichier si vous le souhaitez.

La fonction Télécharger le fichier local est désactivée par défaut. Les administrateurs peuvent utiliser l'outil basé sur navigateur, IBM SPSS Collaboration and Deployment Services Deployment Manager, pour activer ou désactiver cette fonction, ainsi que pour augmenter ou réduire la taille de fichier maximale autorisée.

Fichiers de données à base de texte

Lorsque vous sélectionnez une source de données à base de texte, vous êtes invité à entrer d'autres détails.

La première ligne a des noms de colonne. Sélectionnez cette option si le nom de chaque colonne est inclus comme ligne d'en-tête dans la source de données.

Codage. Indique la méthode de codage de texte employée. Vous pouvez sélectionner la valeur par défaut du système ou UTF-8.

Symbole décimal. Indique le mode de représentation des décimales dans les données.

  • Point (.). Le point est utilisé comme séparateur décimal.
  • Virgule (,). La virgule est utilisée comme séparateur décimal.

Délimiteurs. A l'aide des cases à cocher répertoriées pour cette commande, vous pouvez spécifier quels caractères (comme la virgule) marquent les limites des champs dans le fichier. Vous pouvez indiquer plusieurs délimiteurs(, | par exemple) pour les enregistrements qui font appel à des délimiteurs multiples. Le séparateur par défaut est la virgule.

Remarque : si la virgule est également définie en tant que séparateur décimal, les paramètres par défaut fournis ne fonctionnent pas. Si la virgule sert à la fois de séparateur de champs et de séparateur décimal, sélectionnez Autre dans la liste Séparateurs. Ensuite, ajoutez manuellement une virgule dans le champ d'entrée.

Sélectionnez Autoriser plusieurs délimiteurs vides pour considérer plusieurs délimiteurs vides adjacents comme un délimiteur unique. Par exemple, une séquence constituée d'une valeur de données suivie de quatre espaces, puis d'une autre valeur de données, sera considérée comme séquence à deux champs, et non comme une séquence à cinq champs.

Options avancées

Caractères de commentaires fin de ligne. Spécifiez quels caractères (comme # ou !) indiquent des annotations dans les données. Lorsque l'un de ces caractères apparaît dans le fichier, toutes les données situées entre ce caractère et le caractère de nouvelle ligne suivant (non inclus) sont ignorées.

Indiquer les champs d'entrée. Indiquez le nombre de champs d'entrée à extraire de chaque enregistrement.

Spécifier le format de données Pour les sources de données Fichier qui sont de type Champs de longueur variable en texte brut, vous pouvez utiliser cette section pour définir le type de stockage d'entrée et le format de chaque champ afin de vous assurer que les valeurs sont lues correctement. Cette procédure est similaire à la fonctionnalité disponible dans le client IBM SPSS Modeler. L'option Remplacer indique si la valeur par défaut est remplacée. Si vous sélectionnez Remplacer, cela active les commandes de Stockage et de Format d'entrée. Le fait de désélectionner Remplacer redéfinit les valeurs d'origine par défaut. Format d'entrée applique uniquement les types de stockage réel, date, heure et horodatage.

Ignorer les caractères des en-têtes. Indiquez le nombre de caractères à ignorer au début du premier enregistrement.

Lignes à analyser pour le noeud Typer. Indiquez le nombre de lignes à traiter pour les types de données indiqués.

Supprimer les espaces de début et de fin. Cochez cette case pour que les espaces situés en début et en fin des chaînes soient supprimés lors de l'importation. Vous pouvez sélectionner la suppression des espaces à gauche, à droite, des deux côtés ou aucun.

Caractères non valides. Sélectionnez Supprimer pour supprimer les caractères non valides de la source de données. Sélectionnez Remplacer par pour remplacer les caractères non valides par le symbole indiqué (un caractère uniquement). Les caractères non valides sont des caractères nuls (0) ou des caractères qui n'existent pas dans la méthode de codage spécifiée.

Guillemets. A l'aide des listes déroulantes, vous pouvez indiquer la façon dont les guillemets simples et doubles sont traités lors de l'importation. Vous pouvez choisir l'option Supprimer (supprime tous les guillemets), Inclure comme texte (inclut les guillemets dans la valeur de la zone) ou Apparier et supprimer (supprime des paires de guillemets). Si un guillemet n'est pas apparié, un message d'erreur apparaît. Si vous sélectionnez Supprimer ou Apparier et supprimer, la valeur de la zone (sans les guillemets) est stockée sous forme de chaîne.
Remarque : Lorsque vous utilisez Apparier et supprimer, les espaces sont conservés. Lorsque vous utilisez Supprimer, espaces en début et en fin à l'intérieur et à l'extérieur des guillemets sont supprimés (par exemple, ' " ab c" , "d ef " , " gh i " ' donnent 'ab c, d ef, gh i'). Lorsque vous utilisez Inclure comme texte, les guillemets sont considérés comme des caractères normaux ; les espaces de début et de fin sont donc supprimés.

Indiquer les champs d'entrée. Pour plus d'informations, voir la rubrique Sélection de champs d'entrée.

Fichiers de données Excel

Lorsque vous sélectionnez une source de données Excel, vous êtes invité à entrer d'autres détails :

La première ligne a des noms de colonne. Sélectionnez cette option si le nom de chaque colonne est inclus comme ligne d'en-tête dans la source de données.

Plage nommée. Permet de sélectionner une plage nommée de cellules, définie dans la feuille de calcul Excel. Si vous utilisez une plage nommée, les autres paramètres de feuille de calcul et de plage de données ne s'appliquent plus et sont désactivés en conséquence.

Choisir une feuille de calcul. Indique la feuille de calcul à importer, par son nom ou par son index.

  • Par nom. Sélectionnez le nom de la feuille de calcul à importer.
  • Par index Définit la valeur d'index de la feuille de calcul à importer, 0 désignant la première feuille de calcul, 1, la deuxième et ainsi de suite.

Intervalle sur feuille de calcul. Vous pouvez importer des données en partant de la première ligne renseignée ou en indiquant un intervalle de cellules explicite.

  • L'intervalle commence à la première ligne non renseignée. Repère la première cellule renseignée et l'utilise comme angle supérieur gauche de l'intervalle de données.
  • Intervalle de cellules explicite. Vous permet de spécifier un intervalle explicite par ligne et par colonne. Par exemple, pour spécifier l'intervalle Excel A1:D5, vous pouvez entrer A1 dans le premier champ et D5 dans le second (ou bien, R1C1 et R5C4). Toutes les lignes de l'intervalle indiqué sont renvoyées, y compris les lignes vides.

Sur les lignes vides. Si vous rencontrez une ligne vide, vous pouvez l'ignorer ou sélectionner Retourner les lignes vides pour continuer la lecture de toutes les données jusqu'à la fin de la feuille de travail, y compris les lignes vides.

Indiquer les champs d'entrée. Pour plus d'informations, voir la rubrique Sélection de champs d'entrée.

Fichiers de données IBM SPSS Statistics

Quand vous sélectionnez une source de données IBM SPSS Statistics (fichier .sav ou .zsav), vous devez, sur invite, entrer des détails supplémentaires. Si le fichier est protégé par mot de passe, vous devez également, sur invite, entrer le mot de passe.

Noms des variables. Sélectionnez une méthode de gestion des noms de variable et des libellés, applicable lors de l'importation à partir d'un fichier IBM SPSS Statistics .sav ou .zsav.

  • Lire les noms et les libellés. Sélectionnez cette option pour lire les noms de variable et les libellés ; il s'agit de l'option par défaut. Les libellés peuvent être affichés dans les graphiques, dans les explorateurs de modèles et dans d'autres types de sortie.
  • Lire les libellés sous forme de nom. Sélectionnez cette option pour lire les libellés de variable dans le fichier .sav IBM SPSS Statistics plutôt que les noms de champ courts, puis utilisez ces libellés comme noms de variable.

Valeurs. Sélectionnez une méthode de gestion des valeurs et des libellés lors de l'importation à partir d'un fichier IBM SPSS Statistics .sav ou .zsav.

  • Lire les données et les libellés. Sélectionnez cette option pour lire les valeurs réelles et les libellés de valeur ; il s'agit de l'option par défaut.
  • Lire les libellés sous forme de données. Indiquez si vous souhaitez utiliser les libellés de valeur à partir du fichier .sav ou .zsav au lieu des codes numériques ou symboliques utilisés pour représenter les valeurs. Par exemple, si vous sélectionnez cette option pour les données dont le champ indiquant le genre a pour valeur 1 et 2 (représentant respectivement masculin et féminin), le champ sera converti en chaîne, et importera masculin et féminin comme valeurs réelles.

    Il est important de prendre en compte les valeurs manquantes dans vos données IBM SPSS Statistics avant de choisir cette option. Par exemple, si un champ numérique utilise des libellés uniquement pour les valeurs manquantes (0 = Pas de réponse, 99 = Inconnu) et que vous sélectionnez l'option ci-dessus, seuls les libellés de valeurs Pas de réponse et Inconnu sont importés, et le champ est converti en chaîne. Dans ce cas, vous devez importer les valeurs elles-mêmes.

Indiquer les champs d'entrée. Pour plus d'informations, voir la rubrique Sélection de champs d'entrée.