扩展节点

SPSS Modeler 支持R和 Apache Spark (通过 Python )语言。

为了补充 SPSS Modeler 及其数据挖掘能力,还提供了多个扩展节点,以便专家用户输入自己的R脚本或 Python ,用于Spark脚本,以进行数据处理、模型构建和模型评分。
  • 在节点选用板上的导入下,提供有“扩展导入”节点。 参见扩展导入节点
  • 在节点选用板上的建模下,提供有“扩展模型”节点。 参见扩展模型节点
  • 在节点选用板上的输出下,提供有“扩展输出”节点。 参见扩展输出节点
  • 在节点选用板上的导出下,提供有“扩展导出”节点。 参见扩展导出节点

准备工作

您可以装入 R 和 Python 库以与扩展节点配合使用。 要运行 R 或 Python 脚本,必须首先安装脚本所需的任何软件包。 要安装软件包,必须在“扩展输出”节点中包含以下脚本,将其连接到“用户输入”节点,然后运行“扩展输出”节点以启动安装过程。
提示: 如果您希望安装脚本和与任务相关的脚本同时运行,也可以将这些脚本插入到其他脚本之前。
要安装 R 软件包:
  1. 运行以下命令:
    install.packages("$PACAGE_NAME", quiet=TRUE, repos="$REPO_URL")
    例如:
    install.packages("Sequential", quiet=TRUE, repos="https://cloud.r-project.org")
  2. 要验证软件包是否已成功安装,请运行以下命令:
    packageVersion("$PACKAGE_NAME")
    例如:
    packageVersion("Sequential")
注意 :如果您的软件库中没有R软件包,安装可能会失败。 在这种情况下,您可以从 R 命令行环境(而不是从 R Studio)尝试相同的安装命令。
要安装 Python 软件包:
  1. 运行以下命令:
    import sys
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'install', '$PACKAGE_NAME', '--quiet', '--no-input'])
    例如,以下命令将安装 numpy:
    import sys
    import subprocess
    subprocess.check_call([sys.executable, '-m', 'pip', 'install', 'numpy', '--quiet', '--no-input'])
  2. 要验证软件包是否已成功安装,请运行以下命令:
    import pkgutil
    pkgutil.ModuleInfo('$PACKAGE_NAME')
    例如,以下命令验证是否成功安装了 numpy:
    import pkgutil
    pkgutil.ModuleInfo('numpy')