SPSS Modeler 支持的数据源

SPSS Modeler中,无论数据位于何处,都可以连接到数据。

连接器

下表列出了可以从 SPSS Modeler连接到的数据源。

有关 SQL 推回(如节点列表、CLEM 表达式和支持 SQL 推回的操作符)的更多信息,请参阅 SQL 优化

要获取支持定制 SQL 查询以拉取数据的数据库列表,请参阅 数据资产节点

连接器 只读 读/写 SQL 回送 (SQL pushback) 注意
Amazon RDS for MySQL 此连接不支持 替换数据集 选项。
Amazon RDS for Oracle  
Amazon RDS for PostgreSQL 此连接不支持 替换数据集 选项。
Amazon Redshift  
Amazon S3    
Apache Cassandra    
Apache Derby    
Apache HDFS(先前称为“Hortonworks HDFS”)      
Apache Hive    
Apache Impala  
   
Cloud Object Storage  
Cloud Object Storage (infrastructure)  
Cloudant
Cognos Analytics  
连接器 只读 读和写 SQL 回送 (SQL pushback) 注意
DataStax Enterprise      
Db2    
Db2 Big SQL    
Db2 for i    
Db2 for z/OS    
Db2 on Cloud    
Db2 Warehouse    
Dremio      
Dropbox  
Exasol    
FTP(远程文件系统传输)  
通用 JDBC     使用通用JDBC连接连接到没有为 "watsonx.ai定义连接的数据源。
Google BigQuery Google BigQuery 在启用 SQL 回推时有这些限制:
  • 数据流不用于在数据资产导出节点中插入数据
  • 列名中不允许使用特殊字符

更多信息,请参阅 SPSS Modeler 的已知问题和限制

Google Cloud Storage      
连接器 只读 读和写 SQL 回送 (SQL pushback) 注意
Greenplum    
HDFS via Execution Engine for Hadoop     您可以写入现有数据资产,但当前不支持写入新资产。
Hive via Execution Engine for Hadoop  
HTTP      
IBM Cloud Databases for MySQL    
IBM Cloud Data Engine      
IBM Cloud Databases for MongoDB      
IBM Cloud Databases for PostgreSQL    
IBM watsonx.data Presto    
Impala via Execution Engine for Hadoop      
Informix      
Looker      
MariaDB    
Microsoft Azure Blob Storage      
Microsoft Azure 宇宙 DB    
连接器 只读 读和写 SQL 回送 (SQL pushback) 注意
Microsoft Azure数据桥    
Microsoft Azure Data Lake Storage  
微软 Azure File Storage      
Microsoft Azure SQL Database  
Microsoft Azure突触分析    
Microsoft SQL Server    
MinIO      
MongoDB      
MySQL    
Netezza Performance Server    
OData      
Oracle    
Planning Analytics (以前称为 "IBM TM1")     仅支持 替换数据集 选项。
Presto    
连接器 只读 读和写 SQL 回送 (SQL pushback) 注意
PostgreSQL    
Salesforce.com      
SAP ASE      
SAP HANA    
SAP IQ      
SAP OData      
SingleStoreDB      
Snowflake    
SPSS Analytic Server      
存储卷 (以前称为 "已安装的卷")   如果数据包含列或行定界符 (例如逗号 (,)) ,那么流在尝试写入存储卷时可能会失败。 作为变通方法,您可以首先使用 Filler 节点来替换定界符。
Tableau      
Teradata    
Vertica  

数据文件

除了使用来自远程数据源或集成数据库的数据外,您还可以使用来自文件的数据。 您可以在 SPSS Modeler中处理以下类型的文件中的数据。

连接器 只读 读/写 注意
阿夫罗  
CSV ,定界
注意:如果您的 .csv 文件在输入字段(例如公式中)中包含任何恶意有效载荷,这些有效载荷可能会被执行。
JSON  
ORC  
Parquet  
SAS  
SAV ( SPSS Statistics )    
SHP  
XLS 和 XLSX (Excel)    
XML  

ODBC 驱动程序

Watsonx.ai连接使用JDBC驱动程序。 您还可以使用 ODBC 驱动程序来利用 SQL 优化和回送。

注: ODBC 驱动程序可能会影响数据的精度。 SPSS Modeler 在使用 JDBC 驱动程序时,通常保持 16 个有效位数的精度。 不过, ODBC 驱动程序可能会导致数据四舍五入或截断。 这些变化会造成这两种方法之间的差异。
以下 ODBC 驱动程序与 SPSS Modeler一起预安装:
  • SPSS Data Access Pack 8.1.1.0
  • Netezza 本机驱动程序 7.2.1.10
  • Db2 本机驱动程序 11.5.4
可通过自定义SPSS Modeler映像安装以下ODBC驱动程序:
  • SAP HANA 驱动程序 (hanaclient-2.7.26-linux-x64.tar.gz)
  • Exasol 驱动程序 (EXASOL_ODBC-7.1.4.tar.gz)
  • Teradata 驱动程序 (TeradataToolsAndUtilitiesBase__linux_x8664.17.20.05.00-1.tar.gz)

更多信息,请参阅构建自定义镜像以安装 ODBC 驱动程序