Azure Databricks de surveillance
Instana offre une visibilité de bout en bout sur votre environnement et prend en charge la surveillance d' Azure Databricks. Une fois l'agent hôte d' Instana s installé, le capteur d' Azure Databricks est automatiquement installé et activé. Vous pouvez consulter les indicateurs d'infrastructure liés à l' Azure Databricks ation dans l'interface utilisateur d' Instana.
Pour plus d'informations, consultez la page Instana host agent.
Informations complémentaires
Instana prend en charge les métriques et les données de configuration pour toutes les versions prises en charge d' Azure Databricks Runtime.
Configuration du capteur « Azure Databricks »
Pour configurer l' Azure Databricks, activez le capteur « Azure » dans le fichier de configuration configuration.yaml de l'agent, comme indiqué dans l'exemple suivant :
com.instana.plugin.azure:
enabled: true
subscription: "[Your-Subscription-Id]"
tenant: "[Your-Tenant-Id]"
principals:
- id: "[Your-Service-Principal-Account-Id]"
secret: "[Your-Service-Principal-Secret]"
Pour plus d'informations, voir Installation de l'agent Azure.
Pour configurer le capteur Azure Databricks, modifiez le fichier de configuration <agentinstall_dir>/etc/instana/configuration.yaml de l'agent comme indiqué dans l'exemple suivant :
com.instana.plugin.azure.databricks:
enabled: false # Enabled (true) by default. Valid values: true, false
unity_catalog_pollRate: 60 # Optional field. Unit is minute. This indicates the poll rate of Unity Catalog related data in minutes for all workspaces. The default poll rate is 60 minutes.
workspaces:
workspaceName1: # Your Azure Databricks workspace name
databricks_workspace_access_token: '[Your-Databricks-Workspace-Access-Token]' # Required field.
log_analytics_workspace_id: '[Your-Log-Analytics-Workspace-Id]' # Optional field.
unity_catalog_pollRate: 60 # Optional field. Unit is minute. This indicates the poll rate of Unity Catalog related data in minutes for this workspace. The default poll rate is 60 minutes.
workspaceName2: # Your Azure Databricks workspace name
databricks_workspace_access_token: '[Your-Databricks-Workspace-Access-Token]' # Required field.
log_analytics_workspace_id: '[Your-Log-Analytics-Workspace-Id]' # Optional field.
unity_catalog_pollRate: 60 # Optional field. Unit is minute. This indicates the poll rate of Unity Catalog related data in minutes for this workspace. The default poll rate is 60 minutes.
- Vous pouvez générer un jeton d'accès pour l'espace de travail Azure Databricks. Pour plus d'informations sur la génération du jeton d'accès, voir Authentification par jeton d'accès personnel Databricks.
- L'ID de l'espace de travail est une zone facultative. Si la zone ID de l'espace de travail est renseignée, vous pouvez extraire d'autres indicateurs.
- Vous pouvez consulter les indicateurs liés à Unity Catalog si vous activez Unity Catalog dans votre espace de travail. Pour plus d'informations, consultez la section « Activer un espace de travail pour le catalogue d' Unity ». Certaines des métriques du catalogue « Unity » sont extraites des journaux de diagnostic. Pour consulter ces indicateurs, activez les journaux de diagnostic pour la catégorie « Databricks Unity Catalog » et configurez l'option « Envoyer vers Log Analytics » dans le portail Azure pour l'espace de travail « Azure Databricks », puis configurez l'option
log_analytics_workspace_idcorrespondante pour votre espace de travail dans le fichier deconfiguration.yamll'agent. Pour plus d'informations, voir Configuration de la distribution des journaux de diagnostic.
Désactivation du capteur « Azure Databricks »
Pour désactiver la surveillance du capteur « Azure Databricks », modifiez le fichier de configuration <agentinstall_dir>/etc/instana/configuration.yaml de l'agent comme indiqué dans l'exemple suivant :
com.instana.plugin.azure.databricks:
enabled: false
Affichage des mesures
Pour afficher les métriques, procédez comme suit:
- Dans le menu de navigation de l'interface utilisateur d' Instana, sélectionnez « Infrastructure ».
- Cliquez sur le bloc « Azure Databricks », regroupé sous la rubrique «
Location», dans l'espace de travail « Azure Databricks ».
Vous pouvez consulter toutes les métriques collectées sur le tableau de bord « Azure Databricks ».
Les métriques sont extraites toutes les minutes, ce qui correspond à la résolution fournie par Azure pour la surveillance de ces services.
Données de configuration
| Détails de l'espace de travail | Description |
|---|---|
| Nom | Nom de l'espace de travail |
| Groupe de ressources | Groupes de ressources de l'espace de travail |
| Emplacement | Emplacement de l'espace de travail |
| ID d'abonnement | ID abonnement de l'espace de travail |
| Type | Type de l'espace de travail Databricks |
| Nom du cluster | Nom du cluster |
| ID cluster | ID du cluster |
| Version de Spark | Version de Spark imbriquée dans le cluster |
| Source de cluster | Type de source du cluster |
| Coeur de cluster | Numéro de coeur d'UC du cluster |
| Nom du programme d'exécution | Nom de l'exécuteur |
| Unity Catalog | |
| Metastore | Nom du métamagasin affecté à l'espace de travail |
| Nom du catalogue | nom du catalogue |
| Catégorie | Type de catalogue sécurisable |
| Nom d'actif | Nom de l'actif de données |
| Type | Type de l'actif de données: Table, Volume, Functionou Model |
| Nom d'action | Nom de l'action dans le journal de diagnostic |
| Message d'erreur | Message d'erreur dans la réponse de l'action |
Métriques de performance
| Métrique | Unité | Agrégation | Description |
|---|---|---|---|
| Métriques de l'espace de travail | |||
| Programmes d'exécution | Nombre | Moyenne | Nombre total de programmes d'exécution dans l'espace de travail |
| Travaux en cours d'exécution | Nombre | Moyenne | Nombre total de travaux en cours d'exécution dans l'espace de travail |
| Mémoire | Mégaoctets | Moyenne | Somme de la mémoire totale utilisée dans l'espace de travail |
| Métriques du cluster | |||
| Nombre d'exécutions | Nombre | Moyenne | Nombre total de programmes d'exécution sur le cluster |
| Nombre de travaux | Nombre | Moyenne | Nombre total de travaux en cours d'exécution sur le cluster |
| Mémoire | Mégaoctets | Moyenne | Mémoire utilisée par le cluster |
| Durée d'exécution [1] (Obsolète) | Seconde | Moyenne | Métrique de diffusion en flux pour la durée du processus du cluster |
| Débit en lignes par seconde [1:1] (Obsolète) | Seconde | Moyenne | Métrique de débit de diffusion en flux indiquant les lignes d'entrée par seconde dans le cluster |
| Nombre d'octets réorganisés par cluster [1:2] (Obsolète) | Octet | Moyenne | Somme du nombre total d'octets de lecture / écriture aléatoire dans le cluster |
| Octets écrits en mode aléatoire [1:3] (Obsolète) | Octet | Moyenne | Nombre d'octets écrits dans des opérations de mélange |
| Métriques de l'exécuteur | |||
| Durée de désérialisation (rapport par rapport au temps d'exécution de l'exécuteur) [1:4] (Obsolète) | Pourcentage | Moyenne | Rapport entre le temps écoulé pour désérialiser la tâche et le temps écoulé passé par le programme d'exécution pour exécuter la tâche |
| Temps de sérialisation (rapport par rapport au temps d'exécution de l'exécuteur) [1:5] (Obsolète) | Pourcentage | Moyenne | Rapport entre le temps écoulé pour sérialiser le résultat de la tâche et le temps écoulé passé par le programme d'exécution pour exécuter la tâche |
| CPU de l'exécuteur (rapport avec le temps d'exécution de l'exécuteur) [1:6] (Obsolète) | Pourcentage | Moyenne | Rapport entre le temps UC passé par le programme d'exécution pour exécuter la tâche et le temps écoulé passé par le programme d'exécution pour exécuter la tâche |
| Mélanger la mémoire directe du client [1:7] (Obsolète) | Octet | Moyenne | Mémoire directe utilisée pour mélanger les données |
| Mémoire de pile aléatoire [1:8] (Obsolète) | Octet | Moyenne | Segment de mémoire utilisé pour la réorganisation des données |
| CPU JVM (rapport avec le temps d'exécution de l'exécuteur) [1:9] (Obsolète) | Pourcentage | Moyenne | Le rapport entre le temps écoulé que l' JVM e a consacré au ramassage des ordures pendant l'exécution de la tâche et le temps écoulé que l'exécuteur a consacré à l'exécution de la tâche |
| Unity Indicateurs du catalogue | |||
| Catalogues | Nombre | Moyenne | Nombre total de catalogues |
| Schémas | Nombre | Moyenne | Nombre total de schémas |
| Tableaux | Nombre | Moyenne | Nombre total de tables |
| Vues | Nombre | Moyenne | Nombre total de vues |
| Volumes | Nombre | Moyenne | Nombre total de volumes |
| Tables créées par type | Nombre | Moyenne | Nombre de tables créées pour un type de table spécifique |
| Volumes créés par type | Nombre | Moyenne | Nombre de volumes créés pour un type de volume spécifique |
| Métriques par catalogue | |||
| Schémas | Nombre | Moyenne | Nombre total de schémas pour un catalogue spécifique |
| Tableaux | Nombre | Moyenne | Nombre total de tables pour un catalogue spécifique |
| Vues | Nombre | Moyenne | Nombre total de vues pour un catalogue spécifique |
| Volumes | Nombre | Moyenne | Nombre total de volumes pour un catalogue spécifique |
| Modèles ML | Nombre | Moyenne | Nombre total de modèles d'apprentissage automatique pour un catalogue spécifique |
| Fonctions | Nombre | Moyenne | Nombre total de fonctions pour un catalogue spécifique |
| Nombre d'accès à la ressource [1:10] [2] | Nombre | Moyenne | Nombre d'accès à un actif spécifique au cours des dernières 24 heures |
| Nombre d'accès non autorisés [1:11] [2:1] | Nombre | Moyenne | Nombre d'accès non autorisés à une action spécifique au cours des dernières 24 heures |
Vous pouvez extraire les métriques à partir de Log Analytics. Vous ne pouvez pas consulter les métriques dans l'interface utilisateur d' Instana si Log Analytics n'est pas configuré. ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
Cet indicateur est disponible lorsque vous activez les journaux de diagnostic et que vous configurez l'option « Envoyer vers Log Analytics » dans votre espace de travail d' Azure Databricks. ↩︎ ↩︎