SPSS Modeler 支持的数据源
在 SPSS Modeler中,无论数据位于何处,都可以连接到数据。
连接器
下表列出了可以从 SPSS Modeler连接到的数据源。
有关 SQL 推回(如节点列表、CLEM 表达式和支持 SQL 推回的操作符)的更多信息,请参阅 SQL 优化。
要获取支持定制 SQL 查询以拉取数据的数据库列表,请参阅 数据资产节点。
数据文件
除了使用来自远程数据源或集成数据库的数据外,您还可以使用来自文件的数据。 您可以在 SPSS Modeler中处理以下类型的文件中的数据。
| 连接器 | 只读 | 读/写 | 注意 |
|---|---|---|---|
| 阿夫罗 | ✓ | ||
| CSV ,定界 | ✓ | 注意:如果您的 .csv 文件在输入字段(例如公式中)中包含任何恶意有效载荷,这些有效载荷可能会被执行。
|
|
| JSON | ✓ | ||
| ORC | |||
| Parquet | ✓ | ||
| SAS | ✓ | ||
| SAV ( SPSS Statistics ) | ✓ | ||
| SHP | |||
| XLS 和 XLSX (Excel) | ✓ | ||
| XML | ✓ |
ODBC 驱动程序
Watsonx.ai连接使用JDBC驱动程序。 您还可以使用 ODBC 驱动程序来利用 SQL 优化和回送。
注: ODBC 驱动程序可能会影响数据的精度。 SPSS Modeler 在使用 JDBC 驱动程序时,通常保持 16 个有效位数的精度。 不过, ODBC 驱动程序可能会导致数据四舍五入或截断。 这些变化会造成这两种方法之间的差异。
以下 ODBC 驱动程序与 SPSS Modeler一起预安装:
- SPSS Data Access Pack 8.1.1.0
- Netezza 本机驱动程序 7.2.1.10
- Db2 本机驱动程序 11.5.4
可通过自定义SPSS Modeler映像安装以下ODBC驱动程序:
- SAP HANA 驱动程序 (hanaclient-2.7.26-linux-x64.tar.gz)
- Exasol 驱动程序 (EXASOL_ODBC-7.1.4.tar.gz)
- Teradata 驱动程序 (TeradataToolsAndUtilitiesBase__linux_x8664.17.20.05.00-1.tar.gz)
更多信息,请参阅构建自定义镜像以安装 ODBC 驱动程序。