Surveillance d'un hôte Linux

Informations système

Instana recueille automatiquement des informations complètes sur le système à partir de votre hôte Linux. Consultez ces informations dans le volet Système du tableau de bord d' Instana :

Paramètre Description
OS Détails du système d'exploitation, y compris la version du noyau et l'architecture.
UC Modèle de processeur et nombre de cœurs.
Mémoire Mémoire système totale en gibioctets ( GiB ).
Nombre max de fichiers ouverts Nombre maximal d'opérations simultanées sur les fichiers prises en charge par le système.
Nom d'hôte Nom d'hôte réseau de l'hôte Linux.
Nom de domaine complet Nom de domaine complet, y compris le sous-domaine et le domaine de premier niveau.
ID de machine Identifiant unique généré lors de l'installation de la distribution de l' Linux.
ID d'amorçage Identifiant unique pour la session de démarrage actuelle.
ID de système Identifiant personnalisé utilisé par Instana pour la gestion des hôtes et la corrélation avec les systèmes de gestion des actifs. Collectées automatiquement par l'agent Instana pour les systèmes d'exploitation Linux.
ID hôte Adresse MAC de l'interface réseau principale.
Démarrage Horodatage du démarrage du système.
Version du système BIOS Numéro de version du BIOS (Basic Input/Output System) ou du micrologiciel UEFI (Unified Extensible Firmware Interface) du système.
Date d'édition du BIOS Date de sortie de la version du BIOS installée.
Nom du fournisseur du système d'exploitation Nom de l'organisation ou du distributeur qui a fourni le système d'exploitation.
ID du fournisseur du système d'exploitation Identifiant court pour l'identification programmatique des fournisseurs de systèmes d'exploitation.
Modèle matériel Nom ou numéro spécifique du modèle du système ou de la carte mère.
Marque du matériel Nom du fabricant du matériel.
Remarque : les informations relatives au BIOS et au matériel (version, date de sortie, modèle et marque) sont collectées à partir du /sys/class/dmi/id/ répertoire via l'interface sysfs Linux. Ces données proviennent des interfaces DMI (Desktop Management Interface) et SMBIOS (System Management BIOS) fournies par le micrologiciel du système.

d'interfaces

Vous trouverez les informations suivantes :

  • Interfaces : liste des interfaces réseau et des adresses IP.
  • Instana agent : L'agent d' Instana s pour l'hôte.
  • Processus : nombre et détails des processus en cours d'exécution sur l'hôte.

Statut de rapport

La disponibilité historique d'un hôte Linux est indiquée dans le graphique Reporting Status (État des rapports) du tableau de bord de l'hôte Linux. Vous pouvez voir trois indicateurs de couleur qui identifient l'état d'un hôte signalant à Instana.

Statut Description Indicateur de couleur
Génération de rapports L'hôte a signalé à Instana sans aucune interruption. Vert
Rapports - suivi des problèmes L'hôte a signalé à Instana quelques interruptions (telles que des interruptions réseau ou des problèmes de surveillance des agents) et n'était pas entièrement disponible. Orange
N'envoie pas de rapport L'hôte n'a pas envoyé de rapport à Instana pendant toute cette période. Rouge

La métrique utilisée pour afficher ces données sur le tableau de bord de l'hôte est basée sur l'agrégation des messages reçus de l'agent surveillant l'hôte. Un hôte est classé comme « Reporting » si Instana reçoit au moins 98 % des messages attendus dans un délai donné.

Par exemple, si la fenêtre temporelle d'agrégation des métriques est de 5 minutes et que la fréquence d'interrogation de l'hôte est d'une fois par seconde, Instana s'attend à recevoir 300 messages de l'hôte pendant cette période.

  • Si au moins 294 messages sont reçus (98 % de 300), le statut de l'hôte est affiché comme Reporting.
  • Si moins de 294 messages mais plus de 0 messages sont reçus, l'état de l'hôte s'affiche comme suit : Rapport – Problèmes de surveillance.
  • Si aucun message n'est reçu, l'état de l'hôte est affiché comme « Ne rapporte pas ».

Métriques de performance

Les indicateurs de performances suivants sont affichés pour l'hôte Linux.

Utilisation du processeur : globale

Les valeurs d'utilisation du processeur, lorsqu'elles sont combinées, fournissent une vue détaillée de la manière dont les ressources du processeur sont utilisées sur un hôte d' Linux.

Métrique Description Granularité
Utilisation de l'UC Utilisation totale du processeur en pourcentage pour la période que vous avez définie. 1 seconde

Utilisation de la mémoire : globale

Métrique Description Granularité
Utilisation de la mémoire Utilisation totale de la mémoire en pourcentage 1 seconde

Vous pouvez mesurer la used valeur en pourcentage à l'aide de la formule (total - actualFree) ÷ total. Le capteur utilise la actualFree valeur qui correspond à la mémoire réelle contrainte, qui comprend la mémoire libre et la mémoire cache, au lieu de free, qui est une valeur faible (utilisée pour la mise en cache ou la mise en mémoire tampon).

Charge CPU : Pic

Métrique Description Granularité
Charger La charge maximale du processeur. Le nombre maximal de processus exécutés pendant la période que vous avez définie. 1 seconde

État bloqué des processus

Métrique Description Granularité
État bloqué des processus Nombre de processus en état bloqué qui attendent que des ressources d'E/S soient disponibles. 1 minute

Environnement d'exécution en attente des processus

Métrique Description Granularité
Environnement d'exécution en attente des processus Nombre de processus en attente dans la file d'attente d'exécution pour obtenir du temps CPU. 1 minute

Sessions utilisateur

Métrique Description Granularité
Sessions utilisateur Nombre de sessions utilisateur simultanées sur l'hôte. 1 minute

Utilisation du processeur : Total

Métrique Description Granularité
Utilisateur Pourcentage du temps CPU consacré à l'exécution des processus de l'espace utilisateur, y compris les applications et les services lancés par l'utilisateur. 1 seconde
Système Pourcentage du temps CPU consacré à l'exécution des opérations du noyau, y compris les appels système, les pilotes de périphériques et les fonctions essentielles du système d'exploitation. 1 seconde
Wait Pourcentage du temps CPU consacré à attendre la fin des opérations d'E/S, indiquant d'éventuels goulots d'étranglement au niveau du disque ou du réseau. 1 seconde
Priorité modérée Pourcentage du temps CPU consacré à l'exécution de processus à priorité réduite (valeurs nice positives), permettant aux tâches à priorité plus élevée de s'exécuter en premier. 1 seconde
Vol Pourcentage du temps CPU volé par l'hyperviseur pour servir d'autres machines virtuelles sur le même hôte physique. 1 seconde
En veille Pourcentage du temps CPU pendant lequel le processeur était inactif et n'attendait pas d'opérations d'E/S, indiquant la capacité CPU disponible. 1 seconde

Changements de contexte

Métrique Description Granularité
Changements de contexte Nombre total de changements de contexte sur un graphique pour une période donnée. 1 seconde

Charge CPU : moyenne

La CPU load métrique suit le nombre moyen de processus en concurrence pour les ressources CPU, affiché sous forme de graphique chronologique.

Métrique Description Granularité
Charge UC Nombre moyen de processus dans la file d'attente d'exécution (en cours d'exécution sur le processeur ou en attente de temps processeur) au cours de la période sélectionnée, fournissant des informations sur la charge de travail du système et la demande en ressources. 1 seconde

Utilisation de l'UC individuelle

La métrique d'utilisation du processeur affiche les métriques suivantes en pourcentage sur un graphique pour une période sélectionnée pour chaque processeur :

Métrique Description Granularité
Utilisateur Le temps CPU consacré à l'exécution des processus de l'espace utilisateur (applications et services). 1 seconde
Système La quantité de temps CPU consacrée à l'exécution des processus de l'espace noyau (fonctions essentielles du système d'exploitation). 1 seconde
Wait Le temps CPU passé à attendre la fin des opérations d'entrée ou de sortie. 1 seconde
Priorité modérée La quantité de temps CPU consacrée à l'exécution de processus ayant une priorité inférieure (valeur nice). 1 seconde
Vol Le temps CPU perdu en raison de la gestion par l'hyperviseur d'autres machines virtuelles ou conteneurs sur le même hôte physique. 1 seconde
En veille Pourcentage du temps CPU pendant lequel le processeur était inactif. 1 seconde

Utilisation d'un GPU individuel

Le tableau suivant présente les Individual GPU usage valeurs :

Métrique Description Granularité Unité
Utilisation du processeur graphique Pourcentage d'utilisation du GPU 1 seconde %
Température Température du GPU en degrés Celsius 1 seconde °C
Codeur Utilisation de l'encodeur 1 seconde %
Décodeur Utilisation du décodeur 1 seconde %
Mémoire utilisée Utilisation de la mémoire 1 seconde %
Mémoire totale Mémoire GPU totale 1 seconde octets
Débit transmis Débit de données transmis 1 seconde octets/s
Débit reçu Débit de données reçues 1 seconde octets/s

La métrique est collectée à partir de nvidia-smi. Le tableau suivant présente les versions prises en charge des cartes graphiques Nvidia :

Marque Modèle
Tesla S1070, S2050, C1060, C2050/70, M2050/70/90, X2070/90, K10, K20, K20X, K40, K80, M40, P40, P100, V100
Quadro 4000, 5000, 6000, 7000, M2070-Q, K-series, M-series, P-series, RTX-series
GeForce plusieurs niveaux de prise en charge, avec moins de métriques disponibles par rapport aux produits Tesla et Quadro

Prérequis

Vous devez installer les derniers pilotes officiels Nvidia.

Pour plus d'informations sur le démarrage d'un conteneur Docker pour l'agent Instana avec prise en charge GPU, consultez Activer la surveillance GPU via le conteneur de l'agent Instana.

La collecte des données relatives aux métriques GPU est soigneusement conçue pour avoir un impact minimal, en séparant le sondage et l'interrogation en deux processus à l'aide de nvidia-smi. Le processus d'arrière-plan est lancé en mode boucle et conservé en mémoire. Ce processus améliore considérablement les performances de la collecte des métriques et évite toute surcharge potentielle.

Le capteur interroge les métriques GPU en fonction du taux d'interrogation configuré (toutes les secondes par défaut). Cette solution permet au capteur de collecter chaque seconde des mesures précises et actualisées pour plusieurs GPU sans surcharge.

Mémoire/Processus GPU

La liste suivante répertorie les processus qui utilisent le GPU :

Point de données Collecté à partir de Granularité
Process Name nvidia-smi 1 seconde
PID nvidia-smi 1 seconde
GPU nvidia-smi 1 seconde
Memory nvidia-smi 1 seconde

Le tableau suivant présente les versions prises en charge des cartes graphiques Nvidia pour la mémoire GPU :

Marque Modèle
Tesla S1070, S2050, C1060, C2050/70, M2050/70/90, X2070/90, K10, K20, K20X, K40, K80, M40, P40, P100, V100
Quadro 4000, 5000, 6000, 7000, M2070-Q, K-series, M-series, P-series, RTX-series
GeForce plusieurs niveaux de prise en charge, avec moins de métriques disponibles par rapport aux produits Tesla et Quadro

Mémoire

Le tableau suivant présente les unités de mesure de la mémoire :

Métrique Unité Description Granularité
Total Octet La quantité totale de mémoire 1 seconde
Partagée Octet Mémoire utilisée par les segments de mémoire partagée et les systèmes de fichiers tmpfs sur les systèmes Linux 1 seconde
Utilisé Pourcentage Quantité de mémoire utilisée 1 seconde
Mémoires tampon Octet Mémoire utilisée pour les tampons 1 seconde
Mis en cache Octet Mémoire utilisée pour la mise en cache 1 seconde
Disponible Octet Mémoire disponible pour utilisation 1 seconde
Mémoire totale d'échange Octet Espace d'échange total disponible 1 seconde
Mémoire d'échange disponible Octet Espace d'échange disponible 1 seconde
Mémoire d'échange utilisée Pourcentage Quantité d'espace d'échange utilisée 1 seconde
Virtuel total Octet Capacité totale de la mémoire virtuelle (mémoire physique et espace d'échange). 1 seconde
Virtuel utilisé Octet Mémoire utilisée activement par les applications, à l'exclusion des tampons récupérables et du cache 1 seconde
Virtuel libre Octet Quantité de mémoire virtuelle disponible pour l'allocation. 1 seconde

Les valeurs sont affichées sur un graphique pour une période sélectionnée.

Activité de pagination

Métrique Description Granularité
Nombre total d'erreurs Nombre total de défauts de page, y compris les défauts mineurs et majeurs, lorsque les processus accèdent à la mémoire qui ne se trouve pas dans la RAM. 1 seconde
Erreurs majeures Nombre d'erreurs de page majeures nécessitant le chargement de données du disque vers la mémoire. 1 seconde
Paginé en entrée Nombre de pages mémoire transférées du disque vers la mémoire RAM physique. 1 seconde
Paginé en sortie Nombre de pages mémoire transférées de la mémoire RAM physique vers le disque. 1 seconde
Entré dans la mémoire Nombre de pages mémoire transférées depuis l'espace d'échange sur disque vers la mémoire RAM physique. 1 seconde
Sorti de la mémoire Nombre de pages mémoire transférées de la mémoire RAM physique vers l'espace d'échange sur le disque. 1 seconde

Par défaut, les mesures d'activité de pagination ne sont pas collectées. Vous pouvez activer la collecte des métriques d'activité de pagination en définissant le paramètre collectPagingActivity sur true dans le configuration.yaml fichier.

com.instana.plugin.host:
  collectPagingActivity: true # [true, false]

Open Files

Utilisation des fichiers ouverts lorsqu'ils sont disponibles sur le système d'exploitation; current vs max. Les valeurs sont affichées sur un graphique pour une période sélectionnée.

Métrique Unité Description Granularité
En cours Octet Mémoire totale disponible pour le système, y compris la mémoire active et inactive. 1 seconde
Utilisé Pourcentage La mémoire utilisée par les processus. 1 seconde

Statistiques de processus

Par défaut, les mesures statistiques des processus ne sont pas collectées. Vous pouvez activer la collecte des métriques statistiques des processus en définissant le paramètre collectSystemProcess sur true dans le fichier de configuration.yaml l'agent.

com.instana.plugin.host:
  collectSystemProcess: true # [true, false]
Métrique Description Granularité
Nombre total de processus Nombre total de processus actuellement en cours d'exécution sur le système, y compris tous les processus actifs, en veille, arrêtés et zombies. 1 minute
État bloqué Nombre de processus en état bloqué qui attendent la fin d'opérations d'E/S, telles que des lectures sur disque, des réponses réseau ou la disponibilité d'autres ressources. 1 minute
Temps d'attente Nombre de processus dans la file d'attente d'exécution qui attendent l'allocation de temps CPU, indiquant les processus prêts à être exécutés mais qui ne sont pas actuellement en cours d'exécution sur le CPU. 1 minute
Zombie Nombre de processus zombies qui ont terminé leur exécution mais qui figurent toujours dans la table des processus, en attente que leur processus parent lise leur statut. 1 minute

Processus zombies

Les processus zombies sont des processus exécutés dont l'état de sortie n'a pas encore été collecté par leur processus parent. Ces processus ne consomment ni CPU ni mémoire.

Les processus zombies sont affichés sous forme de liste dans le tableau de bord avec les détails suivants :

Métrique Description Granularité
PID L'ID du processus zombie. 1 minute
ID du processus parent L'ID du processus parent. 1 minute
Utilisateur L'utilisateur propriétaire du processus zombie. 1 minute
Etat État actuel du processus zombie. 1 minute
Heure de début L'heure ou la date à laquelle le processus zombie a démarré. 1 minute
Temps UC Temps CPU total consommé par le processus zombie. 1 minute
Priorité Priorité d'ordonnancement attribuée au processus (une valeur plus faible indique une priorité plus élevée). 1 minute

RPC activité client et serveur

Tableau 1. RPC activité client
Métrique Description Granularité
Appels clients Nombre d'appels d' RPC s initiés par le client vers des serveurs distants. 1 minute
Appels retransmis Nombre d'appels d' RPC s qui ont été retransmis en raison d'un délai d'attente expiré ou de problèmes réseau. 1 minute
Authentification actualisée Nombre de fois où le client a actualisé les informations d'authentification lors des opérations d' RPC. 1 minute
Tableau 2. RPC activité du serveur
Métrique Description Granularité
Appels du serveur Nombre d'appels d' RPC s reçus et traités par le serveur. 1 minute
Appels rejetés Nombre d'appels d' RPC s qui ont été rejetés par le serveur pour diverses raisons. 1 minute
Echecs d'authentification Nombre d'appels d' RPC s ayant échoué à la vérification d'authentification. 1 minute
En-têtes de paquets incorrectement formés Nombre de paquets d' RPC s reçus avec des en-têtes mal formés ou corrompus. 1 minute
Demandes non valides Nombre de requêtes d' RPC s invalides ou mal formatées. 1 minute

Par défaut, les mesures d'activité du client et du serveur d' RPC s ne sont pas collectées. Vous pouvez activer la collecte des indicateurs d'activité d' RPC en définissant le paramètre collectRpcActivity sur true dans le fichier de configuration.yaml l'agent.

com.instana.plugin.host:
  collectRpcActivity: true # [true, false]

Système de fichiers

Ces indicateurs fournissent des informations sur les performances, la capacité et l'utilisation du système de fichiers, permettant ainsi aux administrateurs de surveiller et d'optimiser efficacement leurs systèmes de stockage.

Métrique Description Granularité
Espace disque libre Quantité d'espace libre disponible sur le système de fichiers. 1 seconde
Fuité Espace alloué mais non utilisé, considéré comme perdu ou gaspillé. 1 seconde
Capacité Capacité totale du système de fichiers. 1 seconde
Pourcentage d'utilisation du disque Pourcentage d'espace utilisé sur le système de fichiers. 1 seconde
Utilisation d'inode Pourcentage d'inodes (structures de données décrivant les fichiers et les répertoires) utilisés. 1 seconde
Inode disponible Nombre d'inodes libres disponibles sur le système de fichiers. 1 seconde
Octets lus/s L'utilisation des opérations de lecture. 1 seconde
Octets écrits/s L'utilisation des opérations d'écriture. 1 seconde
Lectures/s Nombre d'octets lus à partir du système de fichiers. 1 seconde
Ecritures/s Nombre d'octets écrits dans le système de fichiers. 1 seconde
Utilisation en lecture Pourcentage de temps consacré à l'exécution d'opérations de lecture. 1 seconde
Utilisation en écriture Pourcentage de temps consacré à l'exécution d'opérations d'écriture. 1 seconde
Utilisation totale L'utilisation globale du système de fichiers, qui englobe les opérations de lecture, d'écriture et l'utilisation des inodes. 1 seconde
Balise Description
Appareil Nom du périphérique.
Montage Point de montage où le périphérique est connecté dans la hiérarchie du système de fichiers.
Options Les options ou paramètres utilisés lors du montage du système de fichiers.
Type Le type de système de fichiers.

* Les métriques relatives à l'utilisation totale, en lecture et en écriture affichent l'utilisation des E/S disque sous forme de pourcentage.

* Leaked (fait référence aux fichiers supprimés qui sont en cours d'utilisation et équivaut à capacity - used - free. Vous pouvez trouver ces fichiers avec lsof | grep deleted).

** Les points de données Write Utilization Total Utilization, Read Utilization et ne sont pas pris en charge pour les systèmes de fichiers réseau ( NFS ).

Par défaut, Instana surveille uniquement les systèmes de fichiers locaux. Vous pouvez répertorier les systèmes de fichiers surveillés ou exclus dans le configuration.yaml fichier.

Le nom du paramètre de configuration est le nom du périphérique, que vous pouvez obtenir dans la première colonne du mtab fichier ou dans la df sortie de la commande.

Vous devez spécifier les systèmes de fichiers temporaires dans le format suivant : tmpfs:/mount/point.

L'exemple suivant montre la liste des systèmes de fichiers surveillés :

com.instana.plugin.host:
  filesystems:
    - '/dev/sda1'
    - 'tmpfs:/sys/fs/cgroup'
    - 'server:/usr/local/pub'
 

L'exemple suivant montre les systèmes de fichiers qui sont inclus ou exclus :

com.instana.plugin.host:
  filesystems:
    include:
      - '/dev/xvdd'
      - 'tmpfs:/tmp'
      - 'server:/usr/local/pub'
    exclude:
      - '/dev/xvda2'
 

Systèmes de fichiers réseau ( NFS )

Pour surveiller toutes les NFS, utilisez le nfs_all: true paramètre de configuration comme indiqué dans l'exemple suivant :

com.instana.plugin.host:
  nfs_all: true
 

Disque

Le tableau suivant présente les indicateurs liés au disque

Métrique Description Granularité Unité
Appareil Le nom du disque ou de la partition. 1 seconde Millisecondes
Temps de lecture Temps moyen nécessaire pour traiter les demandes de lecture. 1 seconde Millisecondes
Temps d'écriture Temps moyen nécessaire pour traiter les demandes d'écriture. 1 seconde Millisecondes
Délai de rejet des demandes Délai moyen nécessaire pour traiter les demandes de suppression. 1 seconde Millisecondes
Délai de vidage des demandes Temps moyen nécessaire pour traiter les demandes de vidange. 1 seconde Millisecondes
Taux de lecture d'octets Nombre d'octets lus par seconde. 1 seconde Octets/secondes
Taux d'écriture d'octets Nombre d'octets écrits par seconde. 1 seconde Octets/secondes
Temps d'attente Durée moyenne par opération d'E/S. 1 seconde Millisecondes
Débit Nombre total d'opérations de lecture et d'écriture effectuées par seconde. 1 seconde IOPS
Vitesse de transfert La quantité de données lues et écrites par seconde. 1 seconde Octets/secondes
Lire % Pourcentage des opérations d'E/S disque totales qui sont des opérations de lecture. 1 seconde Pourcentage
Ecriture (%) Pourcentage des opérations d'E/S disque totales qui sont des opérations d'écriture. 1 seconde Pourcentage
Demandes de lecture Nombre d'opérations de lecture effectuées divisé par la durée de la période. 1 seconde Demandes par seconde
Demandes d'écriture Le nombre d'opérations d'écriture effectuées divisé par la durée de la période. 1 seconde Demandes par seconde
Longueur moyenne de la file d'attente des requêtes La quantité de données lues et écrites par seconde. 1 seconde Nombre

Interfaces réseau

Le tableau suivant présente le trafic réseau et les erreurs par interface.

Métrique Description Granularité
Interface L'interface réseau utilisée pour la communication. 60 secondes
Mac Adresse MAC (Media Access Control) de l'interface réseau. 60 secondes
Adresses IP Les adresses IP attribuées à l'interface réseau. 60 secondes
Octets RX Nombre total d'octets reçus par l'interface réseau par seconde. 1 seconde
Erreurs RX Nombre d'erreurs rencontrées lors de la réception de données sur l'interface réseau. 1 seconde
Octets TX Nombre total d'octets transmis par l'interface réseau par seconde. 1 seconde
Erreurs TX Nombre total d'erreurs rencontrées lors de la transmission de paquets sur l'interface réseau. 1 seconde
Reçu/s Nombre de paquets reçus par l'interface réseau par seconde. 1 seconde
Transmis/s Nombre de paquets transmis par l'interface réseau par seconde. 1 seconde

Activité TCP

Ces indicateurs fournissent des informations sur l'activité de connexion d' TCP, notamment les connexions établies, les taux de transmission par segment et les occurrences d'erreurs.

Métrique Description Granularité
Établi Nombre de connexions établies à l'adresse TCP. 1 seconde
Ouverture/s Le nombre de nouvelles connexions TCP ouvertes par seconde. 1 seconde
Segments entrants/s Nombre de segments d' TCP s entrants par seconde. 1 seconde
Segments sortants/s Nombre de segments d' TCP s sortants par seconde. 1 seconde
Réinitialisations établies Nombre de connexions TCP établies qui ont été réinitialisées par seconde. 1 seconde
Réinitialisations en sortie Nombre de connexions sortantes TCP réinitialisées par seconde. 1 seconde
Échec Nombre de tentatives de connexion à l' TCP qui ont échoué par seconde. 1 seconde
Erreur Nombre d'erreurs d' TCP s par seconde. 1 seconde
Retransmission Nombre de retransmissions d' TCP s par seconde. 1 seconde

Liste des premiers processus

La liste des processus principaux fournit des informations complètes sur les processus en cours d'exécution, notamment les identifiants de processus, les noms, les mesures de consommation des ressources et les informations relatives à la propriété. Cette liste est mise à jour toutes les 30 secondes et affiche uniquement les processus qui atteignent des seuils spécifiques d'utilisation des ressources : les processus qui ont consommé plus de 10 % du CPU au cours des 30 dernières secondes ou les processus dont l'utilisation de la mémoire (RSS) dépasse 512 Mo.

Pour générer une vue unifiée combinant les 10 processus les plus gourmands en ressources CPU et les 10 processus les plus gourmands en ressources mémoire, configurez combineTopProcesses sur true. Cette configuration inclut les processus dans la liste combinée, qu'ils respectent ou non les seuils standard. Lorsqu'un processus apparaît à la fois dans les 10 premiers classements CPU et mémoire, il n'est répertorié qu'une seule fois, ce qui donne une liste combinée pouvant contenir jusqu'à 20 entrées uniques.

com.instana.plugin.host:
  combineTopProcesses: true # [true, false]
 

Linuxtop la sémantique est utilisée. 100 % CPU signifie utilisation complète d'un seul cœur de processeur. Vous pouvez rechercher l'historique des instantanés du mois précédent. Le CPU normalisé est calculé en divisant le CPU par le nombre de processeurs logiques.

Métrique Description Granularité
PID Identifiant unique attribué à chaque processus par le système d'exploitation. 30 secondes
Nom de processus Nom du processus tel que défini par l'application ou le service. 30 secondes
ID du processus parent ID du processus parent qui a créé ce processus. 30 secondes
UID Identifiant numérique du compte utilisateur qui possède et exécute le processus. 30 secondes
ID GROUPE Identifiant numérique associé au propriétaire du processus. 30 secondes
Temps écoulé Le temps total écoulé depuis le début du processus. 30 secondes
UC La quantité de ressources CPU consommées par le processus. 30 secondes
UC (normalisée) Utilisation du processeur par le processus, normalisée à une échelle. 30 secondes
Mémoire La quantité de mémoire consommée par le processus. 30 secondes

Extraire la liste des paquets

Vous pouvez extraire les paquets installés sur un système d'exploitation une fois par jour en définissant la valeur collectInstalledSoftware sur true dans le configuration.yaml fichier.

Les distributions Linux suivantes sont prises en charge actuellement :

  • Debian (dpkg)
  • Red Hat -basé (rpm et yum)
com.instana.plugin.host:
  collectInstalledSoftware: true # [true, false]
 

Attributs d'informations de fichier

Vous pouvez obtenir les attributs suivants pour les 10 fichiers ou répertoires les plus volumineux à partir du répertoire racine (/), en définissant la valeur getFileInfo sur true dans le configuration.yaml fichier.

Métrique Description
Nom de fichier Nom du fichier ou du répertoire.
Date/Heure du dernier accès Date et heure du dernier accès au fichier.
Date/Heure de la dernière modification Date et heure de la dernière modification apportée au fichier.
Accès Cet attribut définit les droits d'accès à un fichier.
Type Le type de fichier (fichier ou répertoire).
Taille La taille d'un fichier, en octets.
Contenu modifié Indique si le contenu du fichier change (Oui ou Non).
Propriétaire Nom du propriétaire du fichier.
Groupe Nom du groupe logique auquel le propriétaire du fichier appartient.
com.instana.plugin.host:
  getFileInfo: true # [true, false]
 

Pour chaque capteur, une base de connaissances des signatures de santé est évaluée en continu par rapport aux mesures entrantes et signale les problèmes ou incidents en fonction de leur impact sur les utilisateurs.

Les événements intégrés déclenchent des problèmes ou des incidents en fonction de signatures de santé défaillantes sur des entités, tandis que les événements personnalisés déclenchent des problèmes ou des incidents en fonction des seuils d'une métrique spécifique d'une entité.

Pour plus d'informations sur les événements intégrés pour le capteur hôte, consultez la référence sur les événements intégrés.