Options avancées d'exportation de base de données

Lorsque vous cliquez sur Options avancées dans la boîte de dialogue du noeud d'exportation de base de données, une nouvelle boîte de dialogue apparaît, qui vous permet de spécifier les détails techniques d'exportation des résultats dans une base de données.

Utiliser la validation par lots. Sélectionnez cette option afin de désactiver la validation ligne à ligne dans la base de données.

Taille du lot. Indique le nombre d'enregistrements à envoyer à la base de données avant validation dans la mémoire. Si vous choisissez une valeur faible, l'intégrité des données est mieux préservée mais la vitesse de transfert moins rapide. Vous pouvez modifier cette valeur afin d'utiliser au mieux votre base de données.

Utiliser le chargement en masse. Indique une méthode de chargement en masse des données dans la base de données directement à partir de IBM® SPSS® Modeler. Vous devrez peut-être effectuer des tests pour sélectionner les options de chargement en bloc adaptées à un scénario particulier.

  • Via ODBC. Sélectionnez cette option afin d'utiliser l'API ODBC pour exécuter des insertions de plusieurs lignes. Cette méthode est plus efficace qu'une simple exportation vers la base de données. Parmi les options ci-après, optez pour un lien par ligne ou par colonne.
  • Via le module de chargement externe. Sélectionnez cette option afin d'utiliser un programme de module de chargement en bloc personnalisé propre à votre base de données. Les options ci-dessous sont alors automatiquement activées.

Options ODBC avancées. Ces options ne sont disponibles que lorsque vous sélectionnez Via ODBC. Notez que tous les pilotes ODBC ne prennent pas en charge ces fonctions.

  • Par ligne. Sélectionnez le lien par ligne afin d'utiliser SQLBulkOperations pour charger les données dans la base de données. Le lien par ligne permet d'obtenir une vitesse plus importante que les insertions configurées qui insèrent les données de chaque enregistrement séparément.
  • Par colonne. Sélectionnez cette option afin d'utiliser le lien par colonne pour charger les données dans la base de données. Le lien par colonne permet d'obtenir de meilleures performances car il relie chaque colonne de la base de données (dans une instruction INSERT configurée) à un ensemble de valeurs N. Si vous exécutez l'instruction INSERT une fois, N lignes sont insérées dans la base de données. Cette méthode permet d'obtenir de bien meilleures performances.

Options du module de chargement externe. Lorsque vous choisissez Via le module de chargement externe, de nombreuses options apparaissent : elles permettent d'exporter le jeu de données dans un fichier, et de spécifier et d'exécuter un programme de module de chargement personnalisé pour charger les données de ce fichier vers la base de données. IBM SPSS Modeler peut s'interfacer avec des chargeurs externes pour de nombreux systèmes de base de données populaires. Plusieurs scripts ont été inclus dans le logiciel ; ils se trouvent, avec la documentation technique, dans le sous-répertoire scripts. Notez que pour utiliser cette fonctionnalité, Python 2.7 doit être installé sur la même machine que IBM SPSS Modeler ou IBM SPSS Modeler Server, et le paramètre python_exe_path doit être défini dans le fichier options.cfg . Pour plus d'informations, voir la rubrique Programmation du programme de chargement en bloc .

  • Utiliser le délimiteur. Spécifie le délimiteur à utiliser dans le fichier exporté. Sélectionnez Tabulation afin d'utiliser la tabulation comme délimiteur et Espace pour choisir l'espace. Sélectionnez Autre pour choisir un autre caractère, comme une virgule (,).
  • Spécifier le fichier de données. Sélectionnez cette option afin de saisir l'emplacement de destination du fichier de données lors du chargement en bloc. Par défaut, un fichier temporaire est créé dans le répertoire temporaire du serveur.
  • Spécifier le programme du module de chargement. Sélectionnez cette option pour spécifier le programme de chargement en bloc à utiliser. Par défaut, le logiciel recherche dans le sous-répertoire scripts de l'installation IBM SPSS Modeler un script Python à exécuter pour une base de données donnée. Plusieurs scripts ont été inclus dans le logiciel ; ils se trouvent, avec la documentation technique, dans le sous-répertoire scripts.
  • Générer le fichier journal. Sélectionnez cette option afin de générer un fichier journal dans le répertoire spécifié. Ce fichier journal contient les informations relatives aux erreurs. Il est particulièrement utile en cas d'échec du chargement en bloc.
  • Vérifier la taille de la table. Sélectionnez cette option pour effectuer une vérification de table qui garantit que l'augmentation de la taille de la table correspond au nombre de lignes exportées depuis IBM SPSS Modeler.
  • Options supplémentaires du module de chargement. Spécifie les arguments supplémentaires servant au programme du module de chargement. Pour les arguments contenant des espaces, utilisez des guillemets doubles.

Pour utiliser des guillemets doubles dans les arguments facultatifs, accompagnez-les d'une barre oblique inverse. Par exemple, l'option spécifiée comme -comment “This is a \”comment\"" inclut à la fois le drapeau -comment et le commentaire lui-même rendu sous la forme This is a “comment”.

Vous pouvez utiliser une barre oblique inverse à condition de l'accompagner d'une autre barre oblique inverse. Prenons l'exemple de l'option -specialdir “C:\\Test Scripts\\” qui comprend l'indicateur -specialdir et le répertoire, à savoir C:\Test Scripts\.