拡張ノード
SPSS Modeler は、言語 R および Apache Spark ( Pythonを使用) をサポートしています。
エキスパート・ユーザーが独自の R スクリプトまたは Python for Spark スクリプトを入力して、データ処理、モデル作成、およびモデル・スコアリングを実行できるようにするために、いくつかの拡張ノードを使用できます。 これらの拡張ノードは、 SPSS Modeler とそのデータ・マイニング機能を補完します。
- 「拡張のインポート・ノード」は、ノード・パレットの「インポート」で使用できます。 拡張のインポート・ノードを参照してください。
- 「拡張の変換ノード」は、ノード・パレットの「レコード設定」で使用できます。 拡張変換ノードを参照してください。
- 「拡張モデル・ノード」は、ノード・パレットの「モデリング」で使用できます。 拡張モデルノードを参照してください。
- 「拡張の出力ノード」は、ノード・パレットの「出力」で使用できます。 拡張出力ノードを参照してください。
- 「拡張のエクスポート・ノード」は、ノード・パレットの「エクスポート」で使用できます。 拡張エクスポートノードを参照してください。
始める前に
R および Python ライブラリーをロードして、拡張ノードで使用することができます。 R スクリプトまたは Python スクリプトを実行するには、まずスクリプトに必要なパッケージをインストールする必要があります。 パッケージをインストールするには、以下のスクリプトを拡張出力ノードに組み込み、それをユーザー入力ノードに接続してから、拡張出力ノードを実行してインストール・プロセスを開始する必要があります。
ヒント: インストールとタスク関連スクリプトを一緒に実行する場合は、これらのスクリプトを他のスクリプトの前に挿入することもできます。
R パッケージをインストールするには:
- 以下のコマンドを実行します。
install.packages("$PACAGE_NAME", quiet=TRUE, repos="$REPO_URL")例:install.packages("Sequential", quiet=TRUE, repos="https://cloud.r-project.org") - パッケージが正常にインストールされたことを確認するには、以下のコマンドを実行します。
packageVersion("$PACKAGE_NAME")例:packageVersion("Sequential")
注: R パッケージがリポジトリーで使用できない場合、インストールが失敗する可能性があります。 このような場合は、(R Studio からではなく) R コマンド行環境から同じインストール・コマンドを試すことができます。
Python パッケージをインストールするには、以下のようにします。
- 以下のコマンドを実行します。
import sys import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'install', '$PACKAGE_NAME', '--quiet', '--no-input'])例えば、以下のコマンドは numpy をインストールします。import sys import subprocess subprocess.check_call([sys.executable, '-m', 'pip', 'install', 'numpy', '--quiet', '--no-input']) - パッケージが正常にインストールされたことを確認するには、以下のコマンドを実行します。
import pkgutil pkgutil.ModuleInfo('$PACKAGE_NAME')例えば、以下のコマンドは、numpy が正常にインストールされたかどうかを検証します。import pkgutil pkgutil.ModuleInfo('numpy')