Noeuds d'extension

SPSS Modeler prend en charge les langages R et Apache Spark (avec Python ).

Plusieurs nœuds d'extension sont disponibles pour permettre aux utilisateurs experts de saisir leurs propres scripts R ou d' Python er des scripts Spark pour effectuer le traitement des données, la création de modèles et la notation des modèles. Ces nœuds d'extension complètent SPSS Modeler et ses capacités d'exploration de données.
  • Le noeud Importation d'extension est disponible dans la partie Importation de la palette de noeuds. Voir le nœud Extension Import.
  • Le noeud Transformation d'extension est disponible dans la partie Opérations sur les lignes de la palette de noeuds. Voir le nœud Extension Transform.
  • Le noeud Modèle d'extension est disponible dans la partie Modélisation de la palette de noeuds. Voir le nœud Modèle d'extension.
  • Le noeud Sortie d'extension est disponible dans la partie Outputs de la palette de noeuds. Voir le nœud Extension Output.
  • Le noeud Exportation d'extension est disponible dans la partie Exportation de la palette de noeuds. Voir le nœud Extension Export.

Avant de commencer

Vous pouvez charger des bibliothèques R et Python à utiliser avec les noeuds d'extension. Pour exécuter des scripts R ou Python, vous devez d'abord installer les packages requis par vos scripts. Pour installer des packages, vous devez inclure les scripts suivants dans un noeud Sortie d'extension, le connecter à un noeud d'entrée utilisateur, puis exécuter le noeud Sortie d'extension pour démarrer le processus d'installation.
Astuce : vous pouvez également insérer ces scripts avant d'autres scripts si vous souhaitez que l'installation et vos scripts liés à la tâche s'exécutent ensemble.
Pour installer les packages R :
  1. Exécutez la commande suivante :
    install.packages("$PACAGE_NAME", quiet=TRUE, repos="$REPO_URL")
    Exemple :
    install.packages("Sequential", quiet=TRUE, repos="https://cloud.r-project.org")
  2. Pour vérifier que le module a été correctement installé, exécutez la commande suivante :
    packageVersion("$PACKAGE_NAME")
    Exemple :
    packageVersion("Sequential")
Remarque : si le package R n'est pas disponible dans votre référentiel, l'installation peut échouer. Dans ce cas, vous pouvez essayer la même commande d'installation à partir de l'environnement de ligne de commande R (pas de R Studio).
Pour installer des packages Python :
  1. Exécutez la commande suivante :
    import sys
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'install', '$PACKAGE_NAME', '--quiet', '--no-input'])
    Par exemple, la commande suivante installe numpy :
    import sys
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'install', 'numpy', '--quiet', '--no-input'])
  2. Pour vérifier que le module a été correctement installé, exécutez la commande suivante :
    import pkgutil
    pkgutil.ModuleInfo('$PACKAGE_NAME')
    Par exemple, la commande suivante vérifie si numpy est installé avec succès:
    import pkgutil
    pkgutil.ModuleInfo('numpy')