扩展节点
SPSS Modeler 支持R和 Apache Spark (通过 Python )语言。
为了补充 SPSS Modeler 及其数据挖掘能力,还提供了多个扩展节点,以便专家用户输入自己的R脚本或 Python ,用于Spark脚本,以进行数据处理、模型构建和模型评分。
准备工作
您可以装入 R 和 Python 库以与扩展节点配合使用。 要运行 R 或 Python 脚本,必须首先安装脚本所需的任何软件包。 要安装软件包,必须在“扩展输出”节点中包含以下脚本,将其连接到“用户输入”节点,然后运行“扩展输出”节点以启动安装过程。
提示: 如果您希望安装脚本和与任务相关的脚本同时运行,也可以将这些脚本插入到其他脚本之前。
要安装 R 软件包:
- 运行以下命令:
install.packages("$PACAGE_NAME", quiet=TRUE, repos="$REPO_URL")例如:install.packages("Sequential", quiet=TRUE, repos="https://cloud.r-project.org") - 要验证软件包是否已成功安装,请运行以下命令:
packageVersion("$PACKAGE_NAME")例如:packageVersion("Sequential")
注意 :如果您的软件库中没有R软件包,安装可能会失败。 在这种情况下,您可以从 R 命令行环境(而不是从 R Studio)尝试相同的安装命令。
要安装 Python 软件包:
- 运行以下命令:
import sys import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'install', '$PACKAGE_NAME', '--quiet', '--no-input'])例如,以下命令将安装 numpy:import sys import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'install', 'numpy', '--quiet', '--no-input']) - 要验证软件包是否已成功安装,请运行以下命令:
import pkgutil pkgutil.ModuleInfo('$PACKAGE_NAME')例如,以下命令验证是否成功安装了 numpy:import pkgutil pkgutil.ModuleInfo('numpy')