Azure Machine Learning の監視

Azure Machine Learning 機械学習モデルの構築、デプロイ、管理を行うクラウドサービスです。 Instana Azure Machine Learning センサーを使用して、 Azure Machine Learning サービスを監視します。 Instana Azure Machine Learning サービスを包括的に監視し、環境全体を可視化します。

注: Instana ホストエージェントをインストールすると、 Azure Machine Learning センサーが自動的にインストールされ、有効化されます。 「 Instana 」UIでは、「 Azure Machine Learning 」に関連するインフラストラクチャのメトリクスを確認できます。 その他のサポート対象の Azure サービスに関する詳細については、 Azure のドキュメントを参照してください。

Azure Machine Learning センサーの設定

Azure Machine Learning センサーを設定するには、以下の手順を実行してください:

  1. Instana で「 Azure 」サブスクリプションを有効にしてください。 以下の例に示すように、 <agentinstall_dir>/etc/instana/configuration.yaml エージェント構成ファイルを更新します。

    com.instana.plugin.azure:
      enabled: true
      subscription: "[Your-Subscription-Id]"
      tenant: "[Your-Tenant-Id]"
      principals:
        - id: "[Your-Service-Principal-Account-Id]"
          secret: "[Your-Service-Principal-Secret]"
    

    Azure エージェントのインストールについて詳しくは、 インストールを参照してください。

  2. エージェントの設定ファイルで、 Azure Machine Learning センサーが有効になっているか確認してください。 「 タグおよびリソース・グループの定義によるサービスのフィルタリング 」セクションの説明に従って、タグおよびリソース・グループを構成することもできます。

    com.instana.plugin.azure.machinelearning:
      enabled: true # Valid values: true, false. Enabled (true) by default
      include_tags: # Comma separated list of tags in key:value format (e.g. env:prod,env:staging)
      exclude_tags: # Comma separated list of tags in key:value format (e.g. env:dev,env:test)
      include_resource_groups: # Comma separated list of resource groups (e.g. rg_prod,rg_staging)
      exclude_resource_groups: # Comma separated list of resource groups (e.g. rg_dev,rg_test)
    
    

Azure Machine Learning センサーを無効にする

Azure Machine Learning センサーを無効にするには、次の例に示すようにエージェントの設定 <agentinstall_dir>/etc/instana/configuration.yaml ファイルを更新してください

com.instana.plugin.azure.machinelearning:
  enabled: false

タグとリソースグループを定義してサービスをフィルタリングする

複数のタグとリソース・グループを定義するには、それらをコンマで区切ります。 タグは、コロン (:) で区切ったキーと値のペアとして定義します。

configuration.yaml ファイルには、複数のタグとリソース・グループを定義できます。 複数のタグまたはリソース・グループを区切るには、コンマを使用します。 両方のリスト (包含および除外) でタグまたはリソース・グループを定義すると、除外リストの優先順位が高くなります。 フィルタリングせずにすべてのサービスを含める場合は、構成を定義しないでください。

  • 組み込みリストのタグを設定するには、以下の例に示すように configuration.yaml ファイルを更新します。

    com.instana.plugin.azure.machinelearning:
      include_tags: # Comma separated list of tags in key:value format (e.g. env:prod,env:staging)
    
  • 除外リストのタグを設定するには、以下の例に示すように configuration.yaml ファイルを更新します。

    com.instana.plugin.azure.machinelearning:
      exclude_tags: # Comma separated list of tags in key:value format (e.g. env:dev,env:test)
    
  • 組み込みリストのリソース・グループを設定するには、以下の例に示すように configuration.yaml ファイルを更新します。

    com.instana.plugin.azure.machinelearning:
      include_resource_groups: # Comma separated list of resource groups (e.g. rg_prod,rg_staging)
    
  • 除外リストのリソース・グループを設定するには、以下の例に示すように configuration.yaml ファイルを更新します。

    com.instana.plugin.azure.machinelearning:
      exclude_resource_groups: # Comma separated list of resource groups (e.g. rg_dev,rg_test)
    
注:Azure Machine Learning サービスに対してフィルタを設定した場合、その設定はすべての Azure サービスに共通するフィルタよりも優先されます。 詳細については、 「設定」 を参照してください。

メトリックの表示

メトリックを表示するには、以下のステップを実行します。

  1. Instana のUIにあるナビゲーションメニューから、 「インフラストラクチャ」 をクリックします。
  2. モニター対象ホストをクリックします。

収集されたすべてのメトリックとモニター対象プロセスを含むホスト・ダッシュボードを表示できます。

メトリックは 1 分ごとにプルされます。これは、これらのサービスをモニターするために Azure が提供する解決策です。

機械学習ワークスペースの設定データ

名前空間の詳細 説明
名前 Azure Machine Learning ワークスペースの名前
リソース・グループ ワークスペースが配置されているリソース・グループの名前
Location リソースのロケーション。
サブスクリプション ID Azure サブスクリプション ID
createdAt リソース作成のタイム・スタンプ (UTC)

パフォーマンス指標の機械学習ワークスペース

メトリック 名前 ユニット 集約 説明
プロセッサー使用率
CpuUtilizationPercentage 平均 CPU ノードの使用率の 1 分間の平均値
GpuUtilizationPercentage 平均 1 分間の GPU ノードの平均使用率 (%)
ノード
アクティブ・ノード 平均 1 分以内にジョブをアクティブに実行しているノード
合計ノード数 平均 1 分間の時間間隔でのアクティブ・ノード、アイドル・ノード、使用不可ノード、事前設定ノード、および離脱ノードの平均の合計
コア数
アクティブ・コア 平均 1 分間の平均アクティブ・コア数
合計コア数 平均 1 分間の平均合計コア数
実行
開始された実行 合計 このワークスペースで 1 分間に実行された実行の総数
完了した実行数 合計 このワークスペースで 1 分間に正常に完了した実行の総数
キャンセルされた実行 合計 1 分間にこのワークスペースでキャンセルされた実行の総数
エラー 合計 1 分以内にこのワークスペースで発生した実行エラーの総数
失敗した実行 合計 1 分間にこのワークスペースで失敗した実行の総数
ディスク
DiskUsedMegabytes 平均 1 分間の平均ディスク・スペース使用率 (メガバイト単位)
DiskReadMegabytes 平均 1 分間にディスクから読み取られたデータの平均 (メガバイト単位)
DiskWriteMegabytes 平均 ディスクに 1 分間に書き込まれたデータの平均 (メガバイト単位)