SPSS Modeler でサポートされるデータ・ソース
SPSS Modeler では、データがどこにあっても、そのデータに接続できます。
コネクター
次の表に、 SPSS Modeler から接続できるデータ・ソースをリストします。
SQL プッシュバックについて詳しくは、ノード、 CLEM 式、および SQL プッシュバックをサポートする演算子のリストなど、 SQL 最適化 を参照してください。
データをプルするためのカスタム SQL 照会をサポートするデータベースのリストについては、 データ資産 ・ノード を参照してください。
データ・ ファイル
リモート・データ・ソースまたは統合データベースからのデータの使用に加え、ファイルのデータを使用することもできます。 SPSS Modeler では、以下のタイプのファイルからのデータを処理できます。
| コネクター | 読み取り専用 | 読み取り & 書き込み | メモ |
|---|---|---|---|
| Avro | ✓ | ||
| CSV 、区切り文字で区切られている | ✓ | 注意: .csv ファイルの入力フィールド (数式など) に悪意のあるペイロードが含まれている場合、それらのペイロードが実行される可能性があります。
|
|
| JSON | ✓ | ||
| ORC | |||
| Parquet | ✓ | ||
| SAS | ✓ | ||
| SAV ()SPSS Statistics | ✓ | ||
| SHP | |||
| XLS 、 XLSX (Excel) | ✓ | ||
| XML | ✓ |
ODBC ドライバー
Cloud Pak for Data 接続は、 JDBC ドライバーを使用します。 ODBC ドライバーを使用して、 SQL の最適化とプッシュバックを利用することもできます。
注: ODBC ドライバーは、データの精度に影響を与える可能性があります。 SPSS Modeler は、 JDBC ドライバーを使用する場合、通常、 16 桁の有効数字の精度を維持します。 ただし、 ODBC ドライバーは、データを丸めたり切り捨てたりする可能性があります。 これらの変更により、これら 2 つの方法の間に相違が生じる可能性があります。
以下の ODBC ドライバーは、 SPSS Modeler とともにプリインストールされています。
- SPSS Data Access Pack 8.1.1.0
- Netezza ネイティブ・ドライバー 7.2.1.10
- Db2 ネイティブ・ドライバー 11.5.4
以下の ODBC ドライバーは、カスタム・ SPSS Modeler ・イメージを使用してインストールできます。
- SAP HANA ドライバー (hanaclient-2.7.26-linux-x64.tar.gz)
- Exasol ドライバー (EXASOL_ODBC-7.1.4.tar.gz)
- Teradata ドライバー (TeradataToolsAndUtilitiesBase__linux_x8664.17.20.05.00-1.tar.gz)
詳しくは、 カスタム・イメージの作成と ODBC ドライバーのインストール を参照してください。