Azure Machine Learning de surveillance
Azure Machine Learning est un service cloud permettant de créer, de déployer et de gérer des modèles d'apprentissage automatique. Instana utilise le capteur « Azure Machine Learning » pour surveiller le service « Azure Machine Learning ». Instana surveille de manière exhaustive le service Azure Machine Learning en offrant une visibilité de bout en bout sur votre environnement.
Configuration du capteur « Azure Machine Learning »
Pour configurer le capteur « Azure Machine Learning », procédez comme suit :
Activez l'abonnement « Azure » sur Instana. Mettez à jour le fichier de configuration de l'agent
<agentinstall_dir>/etc/instana/configuration.yamlcomme illustré dans l'exemple suivant:com.instana.plugin.azure: enabled: true subscription: "[Your-Subscription-Id]" tenant: "[Your-Tenant-Id]" principals: - id: "[Your-Service-Principal-Account-Id]" secret: "[Your-Service-Principal-Secret]"Pour plus d'informations sur l'installation de l'agent Azure , voir Installation.
Vérifiez si le capteur « Azure Machine Learning » est activé dans le fichier de configuration de l'agent. Vous pouvez également configurer des balises et des groupes de ressources comme décrit dans la section Filtrage des services en définissant des balises et des groupes de ressources .
com.instana.plugin.azure.machinelearning: enabled: true # Valid values: true, false. Enabled (true) by default include_tags: # Comma separated list of tags in key:value format (e.g. env:prod,env:staging) exclude_tags: # Comma separated list of tags in key:value format (e.g. env:dev,env:test) include_resource_groups: # Comma separated list of resource groups (e.g. rg_prod,rg_staging) exclude_resource_groups: # Comma separated list of resource groups (e.g. rg_dev,rg_test)
Désactivation du capteur « Azure Machine Learning »
Pour désactiver le capteur « Azure Machine Learning », modifiez le fichier de configuration <agentinstall_dir>/etc/instana/configuration.yaml de l'agent comme indiqué dans l'exemple suivant :
com.instana.plugin.azure.machinelearning:
enabled: false
Filtrer les services en définissant des balises et des groupes de ressources
Pour définir plusieurs balises et groupes de ressources, séparez-les par des virgules. Définissez les balises sous la forme d'une paire clé-valeur séparée par un signe deux-points (:).
Vous pouvez définir plusieurs balises et groupes de ressources dans le fichier configuration.yaml . Utilisez des virgules pour séparer plusieurs balises ou groupes de ressources. Si vous définissez une balise ou un groupe de ressources dans les deux listes (inclusion et exclusion), la liste d'exclusion a une priorité plus élevée. Si vous souhaitez inclure tous les services sans filtrage, évitez de définir une configuration.
Pour définir des balises pour la liste d'inclusion, mettez à jour le fichier
configuration.yamlcomme illustré dans l'exemple suivant:com.instana.plugin.azure.machinelearning: include_tags: # Comma separated list of tags in key:value format (e.g. env:prod,env:staging)Pour définir des balises pour la liste d'exclusion, mettez à jour le fichier
configuration.yamlcomme illustré dans l'exemple suivant:com.instana.plugin.azure.machinelearning: exclude_tags: # Comma separated list of tags in key:value format (e.g. env:dev,env:test)Pour définir des groupes de ressources pour la liste d'inclusion, mettez à jour le fichier
configuration.yamlcomme illustré dans l'exemple suivant:com.instana.plugin.azure.machinelearning: include_resource_groups: # Comma separated list of resource groups (e.g. rg_prod,rg_staging)Pour définir des groupes de ressources pour la liste d'exclusion, mettez à jour le fichier
configuration.yamlcomme illustré dans l'exemple suivant:com.instana.plugin.azure.machinelearning: exclude_resource_groups: # Comma separated list of resource groups (e.g. rg_dev,rg_test)
Affichage des mesures
Pour afficher les métriques, procédez comme suit:
- Dans le menu de navigation de l'interface utilisateur d' Instana, cliquez sur Infrastructure.
- Cliquez sur un hôte surveillé.
Vous pouvez voir un tableau de bord hôte avec toutes les métriques collectées et les processus surveillés.
Les métriques sont extraites toutes les minutes, ce qui correspond à la résolution fournie par Azure pour la surveillance de ces services.
Données de configuration de l'espace de travail d'apprentissage automatique
| Détails de l'espace de nom | Description |
|---|---|
| Nom | Nom de l'espace de travail d' Azure Machine Learning |
| Groupe de ressources | Nom du groupe de ressources dans lequel se trouve l'espace de travail |
| Emplacement | Emplacement de la ressource |
| ID abonnement | Identificateur d'abonnement Azure |
| createdAt | Horodatage de la création de la ressource (UTC) |
Espace de travail dédié à l'apprentissage automatique et aux indicateurs de performance
| Métrique | Nom | Unité | Agrégation | Description |
|---|---|---|---|---|
| Utilisation des processeurs | ||||
| Nombre | CpuUtilizationPercentage | Nombre | Moyenne | Moyenne du pourcentage d'utilisation d'un noeud d'UC en une minute |
| Nombre | GpuUtilizationPercentage | Nombre | Moyenne | Moyenne du pourcentage d'utilisation d'un noeud de processeur graphique en une minute |
| Noeuds | ||||
| Nombre | Noeuds actifs | Nombre | Moyenne | Noeuds qui exécutent activement un travail dans un délai d'une minute |
| Nombre | Nombre total de noeuds | Nombre | Moyenne | Moyenne de la somme des noeuds actifs, des noeuds inactifs, des noeuds inutilisables, des noeuds prémétriés et des noeuds de départ sur une période d'une minute |
| Cœurs | ||||
| Nombre | Coeur actif | Nombre | Moyenne | Moyenne du nombre de coeurs actifs en une minute |
| Nombre | Nombre total de coeurs | Nombre | Moyenne | Moyenne du nombre total de coeurs en une minute |
| Exécutions | ||||
| Nombre | Exécutions démarrées | Nombre | Total | Nombre total d'exécutions en cours pour cet espace de travail en une minute |
| Nombre | Exécutions terminées | Nombre | Total | Nombre total d'exécutions réussies pour cet espace de travail en une minute |
| Nombre | Exécutions annulées | Nombre | Total | Nombre total d'exécutions annulées pour cet espace de travail en une minute |
| Nombre | Erreurs | Nombre | Total | Nombre total d'erreurs d'exécution dans cet espace de travail en une minute |
| Nombre | Exécutions ayant échoué | Nombre | Total | Nombre total d'exécutions ayant échoué pour cet espace de travail en une minute |
| Disque | ||||
| Nombre | DiskUsedMegabytes | Nombre | Moyenne | Utilisation moyenne de l'espace disque en mégaoctets par minute |
| Nombre | DiskReadMegabytes | Nombre | Moyenne | Moyenne des données lues à partir du disque en mégaoctets par minute |
| Nombre | DiskWriteMegabytes | Nombre | Moyenne | Moyenne des données écrites sur le disque en mégaoctets par minute |