Azure Machine Learning の監視
Azure Machine Learning 機械学習モデルの構築、デプロイ、管理を行うクラウドサービスです。 Instana Azure Machine Learning センサーを使用して、 Azure Machine Learning サービスを監視します。 Instana Azure Machine Learning サービスを包括的に監視し、環境全体を可視化します。
Azure Machine Learning センサーの設定
Azure Machine Learning センサーを設定するには、以下の手順を実行してください:
Instana で「 Azure 」サブスクリプションを有効にしてください。 以下の例に示すように、
<agentinstall_dir>/etc/instana/configuration.yamlエージェント構成ファイルを更新します。com.instana.plugin.azure: enabled: true subscription: "[Your-Subscription-Id]" tenant: "[Your-Tenant-Id]" principals: - id: "[Your-Service-Principal-Account-Id]" secret: "[Your-Service-Principal-Secret]"Azure エージェントのインストールについて詳しくは、 インストールを参照してください。
エージェントの設定ファイルで、 Azure Machine Learning センサーが有効になっているか確認してください。 「 タグおよびリソース・グループの定義によるサービスのフィルタリング 」セクションの説明に従って、タグおよびリソース・グループを構成することもできます。
com.instana.plugin.azure.machinelearning: enabled: true # Valid values: true, false. Enabled (true) by default include_tags: # Comma separated list of tags in key:value format (e.g. env:prod,env:staging) exclude_tags: # Comma separated list of tags in key:value format (e.g. env:dev,env:test) include_resource_groups: # Comma separated list of resource groups (e.g. rg_prod,rg_staging) exclude_resource_groups: # Comma separated list of resource groups (e.g. rg_dev,rg_test)
Azure Machine Learning センサーを無効にする
Azure Machine Learning センサーを無効にするには、次の例に示すようにエージェントの設定 <agentinstall_dir>/etc/instana/configuration.yaml ファイルを更新してください
com.instana.plugin.azure.machinelearning:
enabled: false
タグとリソースグループを定義してサービスをフィルタリングする
複数のタグとリソース・グループを定義するには、それらをコンマで区切ります。 タグは、コロン (:) で区切ったキーと値のペアとして定義します。
configuration.yaml ファイルには、複数のタグとリソース・グループを定義できます。 複数のタグまたはリソース・グループを区切るには、コンマを使用します。 両方のリスト (包含および除外) でタグまたはリソース・グループを定義すると、除外リストの優先順位が高くなります。 フィルタリングせずにすべてのサービスを含める場合は、構成を定義しないでください。
組み込みリストのタグを設定するには、以下の例に示すように
configuration.yamlファイルを更新します。com.instana.plugin.azure.machinelearning: include_tags: # Comma separated list of tags in key:value format (e.g. env:prod,env:staging)除外リストのタグを設定するには、以下の例に示すように
configuration.yamlファイルを更新します。com.instana.plugin.azure.machinelearning: exclude_tags: # Comma separated list of tags in key:value format (e.g. env:dev,env:test)組み込みリストのリソース・グループを設定するには、以下の例に示すように
configuration.yamlファイルを更新します。com.instana.plugin.azure.machinelearning: include_resource_groups: # Comma separated list of resource groups (e.g. rg_prod,rg_staging)除外リストのリソース・グループを設定するには、以下の例に示すように
configuration.yamlファイルを更新します。com.instana.plugin.azure.machinelearning: exclude_resource_groups: # Comma separated list of resource groups (e.g. rg_dev,rg_test)
メトリックの表示
メトリックを表示するには、以下のステップを実行します。
- Instana のUIにあるナビゲーションメニューから、 「インフラストラクチャ」 をクリックします。
- モニター対象ホストをクリックします。
収集されたすべてのメトリックとモニター対象プロセスを含むホスト・ダッシュボードを表示できます。
メトリックは 1 分ごとにプルされます。これは、これらのサービスをモニターするために Azure が提供する解決策です。
機械学習ワークスペースの設定データ
| 名前空間の詳細 | 説明 |
|---|---|
| 名前 | Azure Machine Learning ワークスペースの名前 |
| リソース・グループ | ワークスペースが配置されているリソース・グループの名前 |
| Location | リソースのロケーション。 |
| サブスクリプション ID | Azure サブスクリプション ID |
| createdAt | リソース作成のタイム・スタンプ (UTC) |
パフォーマンス指標の機械学習ワークスペース
| メトリック | 名前 | ユニット | 集約 | 説明 |
|---|---|---|---|---|
| プロセッサー使用率 | ||||
| 数 | CpuUtilizationPercentage | 数 | 平均 | CPU ノードの使用率の 1 分間の平均値 |
| 数 | GpuUtilizationPercentage | 数 | 平均 | 1 分間の GPU ノードの平均使用率 (%) |
| ノード | ||||
| 数 | アクティブ・ノード | 数 | 平均 | 1 分以内にジョブをアクティブに実行しているノード |
| 数 | 合計ノード数 | 数 | 平均 | 1 分間の時間間隔でのアクティブ・ノード、アイドル・ノード、使用不可ノード、事前設定ノード、および離脱ノードの平均の合計 |
| コア数 | ||||
| 数 | アクティブ・コア | 数 | 平均 | 1 分間の平均アクティブ・コア数 |
| 数 | 合計コア数 | 数 | 平均 | 1 分間の平均合計コア数 |
| 実行 | ||||
| 数 | 開始された実行 | 数 | 合計 | このワークスペースで 1 分間に実行された実行の総数 |
| 数 | 完了した実行数 | 数 | 合計 | このワークスペースで 1 分間に正常に完了した実行の総数 |
| 数 | キャンセルされた実行 | 数 | 合計 | 1 分間にこのワークスペースでキャンセルされた実行の総数 |
| 数 | エラー | 数 | 合計 | 1 分以内にこのワークスペースで発生した実行エラーの総数 |
| 数 | 失敗した実行 | 数 | 合計 | 1 分間にこのワークスペースで失敗した実行の総数 |
| ディスク | ||||
| 数 | DiskUsedMegabytes | 数 | 平均 | 1 分間の平均ディスク・スペース使用率 (メガバイト単位) |
| 数 | DiskReadMegabytes | 数 | 平均 | 1 分間にディスクから読み取られたデータの平均 (メガバイト単位) |
| 数 | DiskWriteMegabytes | 数 | 平均 | ディスクに 1 分間に書き込まれたデータの平均 (メガバイト単位) |