SPSS モデルのバッチデプロイメントに関する詳細情報
SPSS モデルのバッチ・ デプロイメント の入力の詳細を指定する場合は、以下のルールに従ってください。
データ型の概要表:
| データ | 説明 |
|---|---|
| タイプ | データ参照、インライン |
| ファイル形式 | CSV |
データ・ソース
入力または出力データ参照:
- スペースからのローカルまたは マネージド 資産
- 以下のソースから接続された(リモート)資産:
注:
- Cloud Object Storageなどのクラウド・ストレージ接続の場合は、 アクセス・キーと 秘密鍵 (HMAC 資格情報とも呼ばれる) を構成する必要があります。
- SPSS デプロイメント では、これらのデータ・ソースは連邦情報処理標準 (FIPS) に準拠していません。
- Cloud Object Storage
- Cloud Object Storage (infrastructure)
- ストレージ・ボリューム
- 入力データ参照および出力データ参照で指定された表名は無視されます。 SPSS モデルで参照される表名は、バッチ・ デプロイメント 中に使用されます。
- SQL PushBack を使用して、パフォーマンスを向上させるためにデータベースに「プッシュ・バック」またはデータベースで実行できる IBM SPSS Modeler 操作の SQL ステートメント を生成します。 SQL プッシュバックは、以下でのみサポートされます。
- Db2
- SQL Server
- Netezza Performance Server
- PosgreSQL
- Oracle
- Snowflake
- Exasol
バッチ・ デプロイメント に接続済みデータまたは接続済み 資産 を使用する
SPSS Modeler ・フローには、データ用のインポート・ノードとエクスポート・ノードをいくつでも含めることができます。 ノードがデータベース接続を使用する場合、データ・ソースおよびターゲット内の表名を使用してノードを構成する必要があります。 これらの表名は、後でバッチ・ジョブに使用されます。 データのインポートには データ資産 ノードを使用し、データのエクスポートには データ資産 エクスポート・ノードを使用します。 ノードを構成する場合は、「接続」から表名を選択します。プロジェクト内の データ資産 は選択しないでください。 モデルを Watson Machine Learning に保存してデプロイする前に、ノード名とテーブル名を設定します。
デプロイメント・スペース にモデルをデプロイする場合は、 デプロイメント・スペース 内のサポートされるデータベースにノードが接続していることを確認してください。 モデルのバッチ・ デプロイメント では、接続の詳細は入力データ参照と出力データ参照から選択されますが、入力表名と出力表名は SPSS Modeler モデルから選択されます。 接続されたデータ参照で指定された入力表名と出力表名は無視されます。
Cloud Object Storage 接続を使用する SPSS モデルのバッチ・ デプロイメント の場合は、 SPSS モデルに単一の入力および出力 データ資産 ノードがあることを確認してください。
対応している入力および出力ソースの組み合わせ
バッチ・ ジョブ の入力と出力に、互換性のあるデータ・ソースとターゲットを指定する必要があります。 互換性のないデータ・ソースとターゲットを指定すると、バッチ・ ジョブ の実行時にエラーが発生します。
バッチジョブでは、以下の組み合わせがサポートされています:
| SPSS モデルの入出力 | バッチデプロイジョブの入力 | バッチデプロイジョブの出力 |
|---|---|---|
| ファイル | ローカル、 マネージド 、または参照される データ資産 または接続 資産 (ファイル) | リモートデータ資産、接続資産(ファイル)、または名前 |
| データベース | リモートデータ資産または接続資産(データベース) | リモートデータ資産または接続資産(データベース) |
詳しくは、 プロジェクトへのデータの追加 を参照してください。
複数の入力の指定
スキーマのない SPSS モデル・ デプロイメント に複数の入力を指定する場合は、 input_data_references 内の各エレメントの ID を指定します。
詳しくは、 SPSS ジョブ に複数のデータ・ソースを使用する を参照してください。
この例では、 ジョブ の作成時に、 ID を持つ 3 つの入力項目を指定します。 sample_db2_conn 、 sample_teradata_conn 、および sample_googlequery_conn を選択し、各入力に必要な接続済みデータを選択します。
{
"deployment": {
"href": "/v4/deployments/<deploymentID>"
},
"scoring": {
"input_data_references": [{
"id": "sample_db2_conn",
"name": "DB2 connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
},
{
"id": "sample_teradata_conn",
"name": "Teradata connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
},
{
"id": "sample_googlequery_conn",
"name": "Google bigquery connection",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
}],
"output_data_references": {
"id": "sample_db2_conn",
"type": "data_asset",
"connection": {},
"location": {
"href": "/v2/assets/<asset_id>?space_id=<space_id>"
},
}
}
データ参照のプログラマチックな指定
入力データ参照と出力データ参照をプログラマチックに指定する場合:
- データソースの参照先は、アセットの種類
typeによって異なります。 「 デプロイメントスペースへのデータアセットの追加」 の 「データソース参照タイプ 」のセクションを参照してください。 - SPSS 各ジョブは、複数のデータソースからの入力と単一の出力をサポートしています。 モデルの保存時にスキーマがメタデータに含まれていない場合は、
idを手動で入力し、各接続の データ資産 を選択する必要があります。 モデルのメタデータにスキーマが指定されている場合、メタデータを使用して自動的に名前が設定されます。idWatson Studio の対応するidの データ資産 を選択します。 詳しくは、 SPSS ジョブ に複数のデータ・ソースを使用する を参照してください。 - ローカルまたは マネージド 資産 を出力データ参照として作成するには、
output_data_referenceのnameフィールドを指定して、指定した名前で データ資産 が作成されるようにする必要があります。 既存のローカル・ データ資産 を参照するhrefを指定することはできません。
output_data_references で input_data_references もこれらのソースのいずれかを参照している場合にのみ、 データ資産 が接続され、サポートされるデータベースを参照できるようになります。
Python クライアントを使用して ジョブ を作成する場合は、
idフィールドで SPSS モデルのデータ・ノードで参照される接続名と、location.hrefの データ資産 href を デプロイメント・ジョブ ペイロードの入出力データ参照に指定する必要があります。 例えば、 ジョブ ペイロードを次のように構成できます。job_payload_ref = { client.deployments.ScoringMetaNames.INPUT_DATA_REFERENCES: [{ "id": "DB2Connection", "name": "drug_ref_input1", "type": "data_asset", "connection": {}, "location": { "href": <input_asset_href1> } },{ "id": "Db2 WarehouseConn", "name": "drug_ref_input2", "type": "data_asset", "connection": {}, "location": { "href": <input_asset_href2> } }], client.deployments.ScoringMetaNames.OUTPUT_DATA_REFERENCE: { "type": "data_asset", "connection": {}, "location": { "href": <output_asset_href> } } }