装入样本 Spark 应用程序代码
Apache Spark 应用程序代码示例以文件形式提供,您可将这些文件装入到 $HOME/spark/apps 目录,并将其用作模板以编写您自己的代码。
注: 当前示例基于 Spark R2.3.0。这些示例的早期版本基于早期 Spark 发行版,可能无法使用当前 Spark 发行版正确运行。因此,请务必装入最新示例。
以下条件适用于样本文件:
- Python 示例是单独的文件,每个文件的文件扩展名都是 .py。
- Scala 示例的文件扩展名为 .scala,并分组到名为 idax_examples.jar 的单个归档文件中。
- R 示例是单独的文件,每个文件的文件扩展名都是 .R。
要将这些文件装入到 $HOME/spark/apps 目录,请发出以下命令:
spark-submit.sh --load-samples这将在 Db2® Warehouse 主目录中创建 /spark/apps 目录(如果尚未存在),并将 Python 示例、R 示例和 idax_examples.jar 文件复制到该目录中。您可能希望将一个或多个示例从 $HOME/spark/apps 目录下载到客户机系统,以便将样本代码用作您自己的应用程序的基础。
要列出可用的样本,请发出以下命令:
spark-submit.sh --list-files apps
针对要下载的每个文件发出以下命令:
spark-submit.sh --download-file apps file_name使用 REST API 调用
另外,也可以使用 IBM® Db2 Warehouse Analytics API 来提交调用 /dashdb-api/analytics/public/samples/load 端点的 HTTP POST 请求。例如,发出以下 cURL 命令(替换用户标识、密码和主机名):
curl --user "userid:password"
-X POST "https://hostname:8443/dashdb-api/analytics/public/samples/load"要将文件从 $HOME/spark/apps 目录下载到客户机系统,请使用 IBM Db2 Warehouse API 来提交调用 /dashdb-api/home 端点的 HTTP GET 请求。请添加所要下载的文件的路径作为 URL 的后缀。
例如,发出以下 cURL 命令以列出可用的样本(替换用户标识、密码和主机名):
curl --user "userid:password"
-X GET "https://hostname:8443/dashdb-api/home/spark/apps"
发出以下 cURL 命令以下载 idax_examples.jar(替换用户标识、密码和主机名):
curl --user "userid:password"
-X GET "https://hostname:8443/dashdb-api/home/spark/apps/idax_examples.jar" > idax_examples-copy.jar