サンプル Spark アプリケーション・コードのロード
Apache Spark アプリケーション・コードのサンプルがファイルとして用意されています。それらのファイルを $HOME/spark/apps ディレクトリーにロードして、独自のコードを作成するためのテンプレートとして使用できます。
注: 現在の各サンプルは、Spark Release 2.3.0 に基づいています。
旧バージョンの各サンプルは、旧リリースの Spark に基づいているので、現在の Spark リリースでは正しく動作しない可能性があります。
そのため、必ず、最新のサンプルをロードしてください。
サンプル・ファイルには以下の条件が適用されます。
- Python のサンプルは、個々のファイルに分かれています。いずれもファイル拡張子は .py です。
- Scala のサンプルは、.scala というファイル拡張子で、idax_examples.jar という名前の 1 つのアーカイブ・ファイルにまとめられています。
- R のサンプルは、個々のファイルに分かれています。いずれもファイル拡張子は .R です。
これらのファイルを $HOME/spark/apps ディレクトリーにロードするには、以下のコマンドを実行します。
spark-submit.sh --load-samplesこれにより、Db2® Warehouse のホーム・ディレクトリーに /spark/apps ディレクトリーが作成され (まだ存在していなかった場合)、Python のサンプル、R のサンプル、 idax_examples.jar ファイルがそのディレクトリーにコピーされます。$HOME/spark/apps ディレクトリーからクライアント・システムに 1 つ以上のサンプルをダウンロードして、独自のアプリケーションの基礎としてそのサンプル・コードを利用することもできます。
存在するサンプルのリストを表示するには、以下のコマンドを実行します。
spark-submit.sh --list-files apps
ダウンロードするファイルごとに以下のコマンドを実行します。
spark-submit.sh --download-file apps file_nameREST API 呼び出しの使用
あるいは、IBM® Db2 Warehouse Analytics API を使用して、/dashdb-api/analytics/public/samples/load エンドポイントを呼び出す HTTP POST 要求を実行依頼することもできます。例えば、次の cURL コマンドを発行します (ユーザー ID、パスワード、およびホスト名は置き換えてください)。
curl --user "userid:password"
-X POST "https://hostname:8443/dashdb-api/analytics/public/samples/load"$HOME/spark/apps ディレクトリーからクライアント・システムにファイルをダウンロードするには、IBM Db2 Warehouse API を使用して、/dashdb-api/home エンドポイントを呼び出す HTTP GET 要求を実行依頼します。ダウンロードするファイルのパスを URL の接尾部として追加してください。
例えば、存在するサンプルのリストを表示するには、以下の cURL コマンドを実行します (ユーザー ID、パスワード、ホスト名を置き換えてください)。
curl --user "userid:password"
-X GET "https://hostname:8443/dashdb-api/home/spark/apps"
idax_examples.jar をダウンロードするには、以下の cURL コマンドを実行します (ユーザー ID、パスワード、ホスト名を置き換えてください)。
curl --user "userid:password"
-X GET "https://hostname:8443/dashdb-api/home/spark/apps/idax_examples.jar" > idax_examples-copy.jar