SPSS Modeler でサポートされるデータ・ソース

SPSS Modeler では、データがどこにあっても、そのデータに接続できます。

コネクター

次の表に、 SPSS Modeler から接続できるデータ・ソースをリストします。

SQL プッシュバックについて詳しくは、ノード、 CLEM 式、および SQL プッシュバックをサポートする演算子のリストなど、 SQL 最適化 を参照してください。

データをプルするためのカスタム SQL 照会をサポートするデータベースのリストについては、 データ資産 ・ノード を参照してください。

コネクター 読み取り専用 読み取り & 書き込み SQL プッシュバック メモ
Amazon RDS for MySQL 「データ・セットの置換」オプションは、この接続ではサポートされません。
Amazon RDS for Oracle  
Amazon RDS for PostgreSQL 「データ・セットの置換」オプションは、この接続ではサポートされません。
Amazon Redshift  
Amazon S3    
Apache Cassandra    
Apache Derby    
Apache HDFS (以前の名前は「 Hortonworks HDFS」)      
Apache Hive    
Apache Impala  
Box    
Cloud Object Storage  
Cloud Object Storage (infrastructure)  
Cloudant
Cognos Analytics  
コネクター 読み取り専用 読み取り & 書き込み SQL プッシュバック 注記
DataStax Enterprise      
Db2    
Db2 Big SQL    
Db2 for i    
Db2 for z/OS    
Db2 on Cloud    
Db2 Warehouse    
Dremio      
Dropbox  
Exasol    
FTP (リモート・ファイル・システム転送)  
汎用 JDBC     Cloud Pak for Data 用に定義された接続がないデータ・ソースに接続するには、汎用 JDBC 接続を使用します。
Google BigQuery Google BigQuery では、 SQL プッシュバックが有効になっている場合、以下の制限があります。
  • データ・ストリーミングは、 データ資産 エクスポート・ノードにデータを挿入するためには使用されません
  • 列名に特殊文字を使用することはできません

詳しくは、 SPSS Modeler の既知の問題と制限事項を参照してください。

Google Cloud Storage      
コネクター 読み取り専用 読み取り & 書き込み SQL プッシュバック 注記
Greenplum    
HDFS via Execution Engine for Hadoop     既存の データ資産 に書き込むことはできますが、新しい 資産 への書き込みは現在サポートされていません。
Hive via Execution Engine for Hadoop  
HTTP      
IBM Cloud Databases for MySQL    
IBM Cloud Data Engine      
IBM Cloud Databases for MongoDB      
IBM Cloud Databases for PostgreSQL    
IBM Data Virtualization      
IBM watsonx.data Presto    
Impala via Execution Engine for Hadoop      
Informix      
Looker      
MariaDB    
Microsoft Azure Blob Storage      
Microsoft Azure Cosmos DB    
コネクター 読み取り専用 読み取り & 書き込み SQL プッシュバック 注記
Microsoft Azure Databricks    
Microsoft Azure Data Lake Storage  
Microsoft Azure File Storage      
Microsoft Azure SQL Database  
Microsoft Azure Synapse Analytics    
Microsoft SQL Server    
MinIO      
MongoDB      
MySQL    
Netezza Performance Server    
OData      
Oracle    
Planning Analytics (以前は「IBM TM1」として知られていました )     「データ・セットの置換」オプションのみがサポートされます。
Presto    
コネクター 読み取り専用 読み取り & 書き込み SQL プッシュバック 注記
PostgreSQL    
Salesforce.com      
SAP ASE      
SAP HANA    
SAP IQ      
SAP OData      
SingleStoreDB      
Snowflake    
SPSS Analytic Server      
ストレージ・ボリューム (以前の名前はマウント済みボリューム)   データにコンマ (,) などの列または行の区切り文字が含まれている場合、ストレージ・ボリュームに書き込もうとすると、フローが失敗する可能性があります。 回避策として、最初にフィルター・ノードを使用して区切り文字を置き換えます。
Tableau      
Teradata    
Vertica  

データ・ ファイル

リモート・データ・ソースまたは統合データベースからのデータの使用に加え、ファイルのデータを使用することもできます。 SPSS Modeler では、以下のタイプのファイルからのデータを処理できます。

コネクター 読み取り専用 読み取り & 書き込み メモ
Avro  
CSV 、区切り文字で区切られている
注意: .csv ファイルの入力フィールド (数式など) に悪意のあるペイロードが含まれている場合、それらのペイロードが実行される可能性があります。
JSON  
ORC  
Parquet  
SAS  
SAV ()SPSS Statistics    
SHP  
XLS 、 XLSX (Excel)    
XML  

ODBC ドライバー

Cloud Pak for Data 接続は、 JDBC ドライバーを使用します。 ODBC ドライバーを使用して、 SQL の最適化とプッシュバックを利用することもできます。

注: ODBC ドライバーは、データの精度に影響を与える可能性があります。 SPSS Modeler は、 JDBC ドライバーを使用する場合、通常、 16 桁の有効数字の精度を維持します。 ただし、 ODBC ドライバーは、データを丸めたり切り捨てたりする可能性があります。 これらの変更により、これら 2 つの方法の間に相違が生じる可能性があります。
以下の ODBC ドライバーは、 SPSS Modeler とともにプリインストールされています。
  • SPSS Data Access Pack 8.1.1.0
  • Netezza ネイティブ・ドライバー 7.2.1.10
  • Db2 ネイティブ・ドライバー 11.5.4
以下の ODBC ドライバーは、カスタム・ SPSS Modeler ・イメージを使用してインストールできます。
  • SAP HANA ドライバー (hanaclient-2.7.26-linux-x64.tar.gz)
  • Exasol ドライバー (EXASOL_ODBC-7.1.4.tar.gz)
  • Teradata ドライバー (TeradataToolsAndUtilitiesBase__linux_x8664.17.20.05.00-1.tar.gz)

詳しくは、 カスタム・イメージの作成と ODBC ドライバーのインストール を参照してください。