重要说明:

IBM Cloud Pak® for Data 4.8 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告
在 版本支持结束之前,升级到 版本。 IBM Cloud Pak for Data 4.8 IBM Software Hub 5.1 有关更多信息,请参阅从 IBM Cloud Pak for Data 版本 4.8 升级到 IBM Software Hub 版本 5.1

Watson Machine Learning 中 R 脚本的批处理部署输入详细信息

为 R 脚本的批量部署指定输入详细信息时,请遵循以下规则。

数据类型摘要表:

数据 描述
类型 数据引用
文件格式 所有

数据源

输入或输出数据引用:

  • 空间中的本地资产或受管资产
  • 已连接 (远程) 资产: Cloud Object Storage 和存储卷

注:

如果要以编程方式指定输入/输出数据引用:

  • 数据源引用 type 取决于资产类型。 请参阅 将数据资产添加到部署空间中的 数据源引用类型 部分。
  • 您可以将运行 R 脚本所需的环境变量指定为 scoring.environment_variables中的 'key': 'value' 对。 key 必须是环境变量的名称,而 value 必须是环境变量的相应值。
  • 部署作业的有效内容将作为 JSON 文件保存在运行 R 脚本的部署容器中。 R 脚本可以使用 JOBS_PAYLOAD_FILE 环境变量访问 JSON 文件的完整路径文件名。
  • 如果将输入数据作为本地或受管数据资产引用,那么部署服务会下载输入数据并将其放置在 R 脚本运行所在的部署容器中。 您可以通过 BATCH_INPUT_DIR 环境变量访问下载的输入数据的位置 (路径)。
  • 对于输入数据引用 (数据资产或连接资产) ,必须由 R 脚本处理数据的下载。 如果已连接的数据资产或连接资产存在于部署作业有效内容中,那么您可以使用 JOBS_PAYLOAD_FILE 环境变量来访问该数据资产,该环境变量包含保存为 JSON 文件的部署作业有效内容的完整路径。
  • 如果输出数据必须以本地或受管数据资产的形式持久存储在空间中,您可以在 scoring.output_data_reference.location.name 中指定要创建的资产名称。 作为 R 脚本的一部分,可以将输出数据放在 BATCH_OUTPUT_DIR 环境变量指定的路径中。 部署服务将数据压缩为 .zip 格式,并将其上载到 BATCH_OUTPUT_DIR中指定的位置。
  • 如果必须将输出数据保存在远程数据存储器中,那么必须在 output_data_reference.location.href中指定输出数据引用 (例如,数据资产或已连接的数据资产) 的引用。 该 R 脚本必须负责将输出数据上载到远程数据源。 如果已连接的数据资产或连接资产引用存在于部署作业有效内容中,那么您可以使用 JOBS_PAYLOAD_FILE 环境变量来访问该数据资产,该环境变量包含保存为 JSON 文件的部署作业有效内容的完整路径。
  • 如果 R 脚本不需要在部署作业有效内容中指定任何输入或输出数据引用,那么请勿在有效内容中提供 scoring.input_data_referencesscoring.output_data_references 对象。
  • 目前,仅可通过缺省软件规范 default_r3.6 支持 R 脚本;不支持指定定制软件规范。
  • 不支持部署脚本以在 Hadoop 环境上运行。

父主题: 批处理部署输入详细信息 (按框架排列)