Azure Machine Learning de surveillance

Azure Machine Learning est un service cloud permettant de créer, de déployer et de gérer des modèles d'apprentissage automatique. Instana utilise le capteur « Azure Machine Learning » pour surveiller le service « Azure Machine Learning ». Instana surveille de manière exhaustive le service Azure Machine Learning en offrant une visibilité de bout en bout sur votre environnement.

Remarque : une fois l 'agent hôte « Instana » installé, le capteur « Azure Machine Learning » est automatiquement installé et activé. Vous pouvez consulter les indicateurs d'infrastructure liés à l' Azure Machine Learning e dans l'interface utilisateur d' Instana. Pour plus d'informations sur les autres services pris en charge par l' Azure, consultez la documentation disponible à l'adresse Azure.

Configuration du capteur « Azure Machine Learning »

Pour configurer le capteur « Azure Machine Learning », procédez comme suit :

  1. Activez l'abonnement « Azure » sur Instana. Mettez à jour le fichier de configuration de l'agent <agentinstall_dir>/etc/instana/configuration.yaml comme illustré dans l'exemple suivant:

    com.instana.plugin.azure:
      enabled: true
      subscription: "[Your-Subscription-Id]"
      tenant: "[Your-Tenant-Id]"
      principals:
        - id: "[Your-Service-Principal-Account-Id]"
          secret: "[Your-Service-Principal-Secret]"
    

    Pour plus d'informations sur l'installation de l'agent Azure , voir Installation.

  2. Vérifiez si le capteur « Azure Machine Learning » est activé dans le fichier de configuration de l'agent. Vous pouvez également configurer des balises et des groupes de ressources comme décrit dans la section Filtrage des services en définissant des balises et des groupes de ressources .

    com.instana.plugin.azure.machinelearning:
      enabled: true # Valid values: true, false. Enabled (true) by default
      include_tags: # Comma separated list of tags in key:value format (e.g. env:prod,env:staging)
      exclude_tags: # Comma separated list of tags in key:value format (e.g. env:dev,env:test)
      include_resource_groups: # Comma separated list of resource groups (e.g. rg_prod,rg_staging)
      exclude_resource_groups: # Comma separated list of resource groups (e.g. rg_dev,rg_test)
    
    

Désactivation du capteur « Azure Machine Learning »

Pour désactiver le capteur « Azure Machine Learning », modifiez le fichier de configuration <agentinstall_dir>/etc/instana/configuration.yaml de l'agent comme indiqué dans l'exemple suivant :

com.instana.plugin.azure.machinelearning:
  enabled: false

Filtrer les services en définissant des balises et des groupes de ressources

Pour définir plusieurs balises et groupes de ressources, séparez-les par des virgules. Définissez les balises sous la forme d'une paire clé-valeur séparée par un signe deux-points (:).

Vous pouvez définir plusieurs balises et groupes de ressources dans le fichier configuration.yaml . Utilisez des virgules pour séparer plusieurs balises ou groupes de ressources. Si vous définissez une balise ou un groupe de ressources dans les deux listes (inclusion et exclusion), la liste d'exclusion a une priorité plus élevée. Si vous souhaitez inclure tous les services sans filtrage, évitez de définir une configuration.

  • Pour définir des balises pour la liste d'inclusion, mettez à jour le fichier configuration.yaml comme illustré dans l'exemple suivant:

    com.instana.plugin.azure.machinelearning:
      include_tags: # Comma separated list of tags in key:value format (e.g. env:prod,env:staging)
    
  • Pour définir des balises pour la liste d'exclusion, mettez à jour le fichier configuration.yaml comme illustré dans l'exemple suivant:

    com.instana.plugin.azure.machinelearning:
      exclude_tags: # Comma separated list of tags in key:value format (e.g. env:dev,env:test)
    
  • Pour définir des groupes de ressources pour la liste d'inclusion, mettez à jour le fichier configuration.yaml comme illustré dans l'exemple suivant:

    com.instana.plugin.azure.machinelearning:
      include_resource_groups: # Comma separated list of resource groups (e.g. rg_prod,rg_staging)
    
  • Pour définir des groupes de ressources pour la liste d'exclusion, mettez à jour le fichier configuration.yaml comme illustré dans l'exemple suivant:

    com.instana.plugin.azure.machinelearning:
      exclude_resource_groups: # Comma separated list of resource groups (e.g. rg_dev,rg_test)
    
Remarque : lorsque vous définissez des filtres pour le service Azure Machine Learning, ceux-ci ont priorité sur le filtre commun à tous les services Azure. Pour plus d'informations, consultez la section Configuration.

Affichage des mesures

Pour afficher les métriques, procédez comme suit:

  1. Dans le menu de navigation de l'interface utilisateur d' Instana, cliquez sur Infrastructure.
  2. Cliquez sur un hôte surveillé.

Vous pouvez voir un tableau de bord hôte avec toutes les métriques collectées et les processus surveillés.

Les métriques sont extraites toutes les minutes, ce qui correspond à la résolution fournie par Azure pour la surveillance de ces services.

Données de configuration de l'espace de travail d'apprentissage automatique

Détails de l'espace de nom Description
Nom Nom de l'espace de travail d' Azure Machine Learning
Groupe de ressources Nom du groupe de ressources dans lequel se trouve l'espace de travail
Emplacement Emplacement de la ressource
ID abonnement Identificateur d'abonnement Azure
createdAt Horodatage de la création de la ressource (UTC)

Espace de travail dédié à l'apprentissage automatique et aux indicateurs de performance

Métrique Nom Unité Agrégation Description
Utilisation des processeurs
Nombre CpuUtilizationPercentage Nombre Moyenne Moyenne du pourcentage d'utilisation d'un noeud d'UC en une minute
Nombre GpuUtilizationPercentage Nombre Moyenne Moyenne du pourcentage d'utilisation d'un noeud de processeur graphique en une minute
Noeuds
Nombre Noeuds actifs Nombre Moyenne Noeuds qui exécutent activement un travail dans un délai d'une minute
Nombre Nombre total de noeuds Nombre Moyenne Moyenne de la somme des noeuds actifs, des noeuds inactifs, des noeuds inutilisables, des noeuds prémétriés et des noeuds de départ sur une période d'une minute
Cœurs
Nombre Coeur actif Nombre Moyenne Moyenne du nombre de coeurs actifs en une minute
Nombre Nombre total de coeurs Nombre Moyenne Moyenne du nombre total de coeurs en une minute
Exécutions
Nombre Exécutions démarrées Nombre Total Nombre total d'exécutions en cours pour cet espace de travail en une minute
Nombre Exécutions terminées Nombre Total Nombre total d'exécutions réussies pour cet espace de travail en une minute
Nombre Exécutions annulées Nombre Total Nombre total d'exécutions annulées pour cet espace de travail en une minute
Nombre Erreurs Nombre Total Nombre total d'erreurs d'exécution dans cet espace de travail en une minute
Nombre Exécutions ayant échoué Nombre Total Nombre total d'exécutions ayant échoué pour cet espace de travail en une minute
Disque
Nombre DiskUsedMegabytes Nombre Moyenne Utilisation moyenne de l'espace disque en mégaoctets par minute
Nombre DiskReadMegabytes Nombre Moyenne Moyenne des données lues à partir du disque en mégaoctets par minute
Nombre DiskWriteMegabytes Nombre Moyenne Moyenne des données écrites sur le disque en mégaoctets par minute