Surveillance d'un hôte Linux
Vous pouvez surveiller votre hôte Linux avec Instana. Instana fournit des informations complètes sur les performances, l'état et l'utilisation des ressources de l'hôte de l' Linux, permettant ainsi un dépannage efficace, une optimisation des performances et une détection proactive des problèmes.
- Informations système
- INTERFACES
- Statut de rapport
- Métriques de performance
- Utilisation du processeur : globale
- Utilisation de la mémoire : globale
- Charge CPU : Pic
- État bloqué des processus
- Environnement d'exécution en attente des processus
- Sessions de l'utilisateur
- Utilisation du processeur : Total
- Changements de contexte
- Charge CPU : moyenne
- Utilisation de l'UC individuelle
- Utilisation d'un GPU individuel
- Mémoire/Processus GPU
- Mémoire
- Activité de pagination
- Open Files
- Statistiques de processus
- RPC activité client et serveur
- Système de fichiers
- Disque
- Interfaces réseau
- Activité TCP
- Liste des premiers processus
- Extraire la liste des paquets
- Attributs Informations sur le fichier
Informations système
Instana recueille automatiquement des informations complètes sur le système à partir de votre hôte Linux. Consultez ces informations dans le volet Système du tableau de bord d' Instana :
| Paramètre | Description |
|---|---|
| OS | Détails du système d'exploitation, y compris la version du noyau et l'architecture. |
| UC | Modèle de processeur et nombre de cœurs. |
| Mémoire | Mémoire système totale en gibioctets ( GiB ). |
| Nombre max de fichiers ouverts | Nombre maximal d'opérations simultanées sur les fichiers prises en charge par le système. |
| Nom d'hôte | Nom d'hôte réseau de l'hôte Linux. |
| Nom de domaine complet | Nom de domaine complet, y compris le sous-domaine et le domaine de premier niveau. |
| ID de machine | Identifiant unique généré lors de l'installation de la distribution de l' Linux. |
| ID d'amorçage | Identifiant unique pour la session de démarrage actuelle. |
| ID de système | Identifiant personnalisé utilisé par Instana pour la gestion des hôtes et la corrélation avec les systèmes de gestion des actifs. Collectées automatiquement par l'agent Instana pour les systèmes d'exploitation Linux. |
| ID hôte | Adresse MAC de l'interface réseau principale. |
| Démarrage | Horodatage du démarrage du système. |
| Version du système BIOS | Numéro de version du BIOS (Basic Input/Output System) ou du micrologiciel UEFI (Unified Extensible Firmware Interface) du système. |
| Date d'édition du BIOS | Date de sortie de la version du BIOS installée. |
| Nom du fournisseur du système d'exploitation | Nom de l'organisation ou du distributeur qui a fourni le système d'exploitation. |
| ID du fournisseur du système d'exploitation | Identifiant court pour l'identification programmatique des fournisseurs de systèmes d'exploitation. |
| Modèle matériel | Nom ou numéro spécifique du modèle du système ou de la carte mère. |
| Marque du matériel | Nom du fabricant du matériel. |
/sys/class/dmi/id/ répertoire via l'interface sysfs Linux. Ces données proviennent des interfaces DMI (Desktop Management Interface) et SMBIOS (System Management BIOS) fournies par le micrologiciel du système.d'interfaces
Vous trouverez les informations suivantes :
- Interfaces : liste des interfaces réseau et des adresses IP.
- Instana agent : L'agent d' Instana s pour l'hôte.
- Processus : nombre et détails des processus en cours d'exécution sur l'hôte.
Statut de rapport
La disponibilité historique d'un hôte Linux est indiquée dans le graphique Reporting Status (État des rapports) du tableau de bord de l'hôte Linux. Vous pouvez voir trois indicateurs de couleur qui identifient l'état d'un hôte signalant à Instana.
| Statut | Description | Indicateur de couleur |
|---|---|---|
| Génération de rapports | L'hôte a signalé à Instana sans aucune interruption. | Vert |
| Rapports - suivi des problèmes | L'hôte a signalé à Instana quelques interruptions (telles que des interruptions réseau ou des problèmes de surveillance des agents) et n'était pas entièrement disponible. | Orange |
| N'envoie pas de rapport | L'hôte n'a pas envoyé de rapport à Instana pendant toute cette période. | Rouge |
La métrique utilisée pour afficher ces données sur le tableau de bord de l'hôte est basée sur l'agrégation des messages reçus de l'agent surveillant l'hôte. Un hôte est classé comme « Reporting » si Instana reçoit au moins 98 % des messages attendus dans un délai donné.
Par exemple, si la fenêtre temporelle d'agrégation des métriques est de 5 minutes et que la fréquence d'interrogation de l'hôte est d'une fois par seconde, Instana s'attend à recevoir 300 messages de l'hôte pendant cette période.
- Si au moins 294 messages sont reçus (98 % de 300), le statut de l'hôte est affiché comme Reporting.
- Si moins de 294 messages mais plus de 0 messages sont reçus, l'état de l'hôte s'affiche comme suit : Rapport – Problèmes de surveillance.
- Si aucun message n'est reçu, l'état de l'hôte est affiché comme « Ne rapporte pas ».
Métriques de performance
Les indicateurs de performances suivants sont affichés pour l'hôte Linux.
Utilisation du processeur : globale
Les valeurs d'utilisation du processeur, lorsqu'elles sont combinées, fournissent une vue détaillée de la manière dont les ressources du processeur sont utilisées sur un hôte d' Linux.
| Métrique | Description | Granularité |
|---|---|---|
| Utilisation de l'UC | Utilisation totale du processeur en pourcentage pour la période que vous avez définie. | 1 seconde |
Utilisation de la mémoire : globale
| Métrique | Description | Granularité |
|---|---|---|
| Utilisation de la mémoire | Utilisation totale de la mémoire en pourcentage | 1 seconde |
Vous pouvez mesurer la used valeur en pourcentage à l'aide de la formule (total - actualFree) ÷ total. Le capteur utilise la actualFree valeur qui correspond à la mémoire réelle contrainte, qui comprend la mémoire libre et la mémoire cache, au lieu de free, qui est une valeur faible (utilisée pour la mise en cache ou la mise en mémoire tampon).
Charge CPU : Pic
| Métrique | Description | Granularité |
|---|---|---|
| Charger | La charge maximale du processeur. Le nombre maximal de processus exécutés pendant la période que vous avez définie. | 1 seconde |
État bloqué des processus
| Métrique | Description | Granularité |
|---|---|---|
| État bloqué des processus | Nombre de processus en état bloqué qui attendent que des ressources d'E/S soient disponibles. | 1 minute |
Environnement d'exécution en attente des processus
| Métrique | Description | Granularité |
|---|---|---|
| Environnement d'exécution en attente des processus | Nombre de processus en attente dans la file d'attente d'exécution pour obtenir du temps CPU. | 1 minute |
Sessions utilisateur
| Métrique | Description | Granularité |
|---|---|---|
| Sessions utilisateur | Nombre de sessions utilisateur simultanées sur l'hôte. | 1 minute |
Utilisation du processeur : Total
| Métrique | Description | Granularité |
|---|---|---|
| Utilisateur | Pourcentage du temps CPU consacré à l'exécution des processus de l'espace utilisateur, y compris les applications et les services lancés par l'utilisateur. | 1 seconde |
| Système | Pourcentage du temps CPU consacré à l'exécution des opérations du noyau, y compris les appels système, les pilotes de périphériques et les fonctions essentielles du système d'exploitation. | 1 seconde |
| Wait | Pourcentage du temps CPU consacré à attendre la fin des opérations d'E/S, indiquant d'éventuels goulots d'étranglement au niveau du disque ou du réseau. | 1 seconde |
| Priorité modérée | Pourcentage du temps CPU consacré à l'exécution de processus à priorité réduite (valeurs nice positives), permettant aux tâches à priorité plus élevée de s'exécuter en premier. | 1 seconde |
| Vol | Pourcentage du temps CPU volé par l'hyperviseur pour servir d'autres machines virtuelles sur le même hôte physique. | 1 seconde |
| En veille | Pourcentage du temps CPU pendant lequel le processeur était inactif et n'attendait pas d'opérations d'E/S, indiquant la capacité CPU disponible. | 1 seconde |
Changements de contexte
| Métrique | Description | Granularité |
|---|---|---|
| Changements de contexte | Nombre total de changements de contexte sur un graphique pour une période donnée. | 1 seconde |
Charge CPU : moyenne
La CPU load métrique suit le nombre moyen de processus en concurrence pour les ressources CPU, affiché sous forme de graphique chronologique.
| Métrique | Description | Granularité |
|---|---|---|
| Charge UC | Nombre moyen de processus dans la file d'attente d'exécution (en cours d'exécution sur le processeur ou en attente de temps processeur) au cours de la période sélectionnée, fournissant des informations sur la charge de travail du système et la demande en ressources. | 1 seconde |
Utilisation de l'UC individuelle
La métrique d'utilisation du processeur affiche les métriques suivantes en pourcentage sur un graphique pour une période sélectionnée pour chaque processeur :
| Métrique | Description | Granularité |
|---|---|---|
| Utilisateur | Le temps CPU consacré à l'exécution des processus de l'espace utilisateur (applications et services). | 1 seconde |
| Système | La quantité de temps CPU consacrée à l'exécution des processus de l'espace noyau (fonctions essentielles du système d'exploitation). | 1 seconde |
| Wait | Le temps CPU passé à attendre la fin des opérations d'entrée ou de sortie. | 1 seconde |
| Priorité modérée | La quantité de temps CPU consacrée à l'exécution de processus ayant une priorité inférieure (valeur nice). | 1 seconde |
| Vol | Le temps CPU perdu en raison de la gestion par l'hyperviseur d'autres machines virtuelles ou conteneurs sur le même hôte physique. | 1 seconde |
| En veille | Pourcentage du temps CPU pendant lequel le processeur était inactif. | 1 seconde |
Utilisation d'un GPU individuel
Le tableau suivant présente les Individual GPU usage valeurs :
| Métrique | Description | Granularité | Unité |
|---|---|---|---|
| Utilisation du processeur graphique | Pourcentage d'utilisation du GPU | 1 seconde | % |
| Température | Température du GPU en degrés Celsius | 1 seconde | °C |
| Codeur | Utilisation de l'encodeur | 1 seconde | % |
| Décodeur | Utilisation du décodeur | 1 seconde | % |
| Mémoire utilisée | Utilisation de la mémoire | 1 seconde | % |
| Mémoire totale | Mémoire GPU totale | 1 seconde | octets |
| Débit transmis | Débit de données transmis | 1 seconde | octets/s |
| Débit reçu | Débit de données reçues | 1 seconde | octets/s |
La métrique est collectée à partir de nvidia-smi. Le tableau suivant présente les versions prises en charge des cartes graphiques Nvidia :
| Marque | Modèle |
|---|---|
| Tesla | S1070, S2050, C1060, C2050/70, M2050/70/90, X2070/90, K10, K20, K20X, K40, K80, M40, P40, P100, V100 |
| Quadro | 4000, 5000, 6000, 7000, M2070-Q, K-series, M-series, P-series, RTX-series |
| GeForce | plusieurs niveaux de prise en charge, avec moins de métriques disponibles par rapport aux produits Tesla et Quadro |
Prérequis
Vous devez installer les derniers pilotes officiels Nvidia.
Pour plus d'informations sur le démarrage d'un conteneur Docker pour l'agent Instana avec prise en charge GPU, consultez Activer la surveillance GPU via le conteneur de l'agent Instana.
La collecte des données relatives aux métriques GPU est soigneusement conçue pour avoir un impact minimal, en séparant le sondage et l'interrogation en deux processus à l'aide de nvidia-smi. Le processus d'arrière-plan est lancé en mode boucle et conservé en mémoire. Ce processus améliore considérablement les performances de la collecte des métriques et évite toute surcharge potentielle.
Le capteur interroge les métriques GPU en fonction du taux d'interrogation configuré (toutes les secondes par défaut). Cette solution permet au capteur de collecter chaque seconde des mesures précises et actualisées pour plusieurs GPU sans surcharge.
Mémoire/Processus GPU
La liste suivante répertorie les processus qui utilisent le GPU :
| Point de données | Collecté à partir de | Granularité |
|---|---|---|
Process Name |
nvidia-smi |
1 seconde |
PID |
nvidia-smi |
1 seconde |
GPU |
nvidia-smi |
1 seconde |
Memory |
nvidia-smi |
1 seconde |
Le tableau suivant présente les versions prises en charge des cartes graphiques Nvidia pour la mémoire GPU :
| Marque | Modèle |
|---|---|
| Tesla | S1070, S2050, C1060, C2050/70, M2050/70/90, X2070/90, K10, K20, K20X, K40, K80, M40, P40, P100, V100 |
| Quadro | 4000, 5000, 6000, 7000, M2070-Q, K-series, M-series, P-series, RTX-series |
| GeForce | plusieurs niveaux de prise en charge, avec moins de métriques disponibles par rapport aux produits Tesla et Quadro |
Mémoire
Le tableau suivant présente les unités de mesure de la mémoire :
| Métrique | Unité | Description | Granularité |
|---|---|---|---|
| Total | Octet | La quantité totale de mémoire | 1 seconde |
| Partagée | Octet | Mémoire utilisée par les segments de mémoire partagée et les systèmes de fichiers tmpfs sur les systèmes Linux | 1 seconde |
| Utilisé | Pourcentage | Quantité de mémoire utilisée | 1 seconde |
| Mémoires tampon | Octet | Mémoire utilisée pour les tampons | 1 seconde |
| Mis en cache | Octet | Mémoire utilisée pour la mise en cache | 1 seconde |
| Disponible | Octet | Mémoire disponible pour utilisation | 1 seconde |
| Mémoire totale d'échange | Octet | Espace d'échange total disponible | 1 seconde |
| Mémoire d'échange disponible | Octet | Espace d'échange disponible | 1 seconde |
| Mémoire d'échange utilisée | Pourcentage | Quantité d'espace d'échange utilisée | 1 seconde |
| Virtuel total | Octet | Capacité totale de la mémoire virtuelle (mémoire physique et espace d'échange). | 1 seconde |
| Virtuel utilisé | Octet | Mémoire utilisée activement par les applications, à l'exclusion des tampons récupérables et du cache | 1 seconde |
| Virtuel libre | Octet | Quantité de mémoire virtuelle disponible pour l'allocation. | 1 seconde |
Les valeurs sont affichées sur un graphique pour une période sélectionnée.
Activité de pagination
| Métrique | Description | Granularité |
|---|---|---|
| Nombre total d'erreurs | Nombre total de défauts de page, y compris les défauts mineurs et majeurs, lorsque les processus accèdent à la mémoire qui ne se trouve pas dans la RAM. | 1 seconde |
| Erreurs majeures | Nombre d'erreurs de page majeures nécessitant le chargement de données du disque vers la mémoire. | 1 seconde |
| Paginé en entrée | Nombre de pages mémoire transférées du disque vers la mémoire RAM physique. | 1 seconde |
| Paginé en sortie | Nombre de pages mémoire transférées de la mémoire RAM physique vers le disque. | 1 seconde |
| Entré dans la mémoire | Nombre de pages mémoire transférées depuis l'espace d'échange sur disque vers la mémoire RAM physique. | 1 seconde |
| Sorti de la mémoire | Nombre de pages mémoire transférées de la mémoire RAM physique vers l'espace d'échange sur le disque. | 1 seconde |
Par défaut, les mesures d'activité de pagination ne sont pas collectées. Vous pouvez activer la collecte des métriques d'activité de pagination en définissant le paramètre collectPagingActivity sur true dans le configuration.yaml fichier.
com.instana.plugin.host:
collectPagingActivity: true # [true, false]
Open Files
Utilisation des fichiers ouverts lorsqu'ils sont disponibles sur le système d'exploitation; current vs max. Les valeurs sont affichées sur un graphique pour une période sélectionnée.
| Métrique | Unité | Description | Granularité |
|---|---|---|---|
| En cours | Octet | Mémoire totale disponible pour le système, y compris la mémoire active et inactive. | 1 seconde |
| Utilisé | Pourcentage | La mémoire utilisée par les processus. | 1 seconde |
Statistiques de processus
Par défaut, les mesures statistiques des processus ne sont pas collectées. Vous pouvez activer la collecte des métriques statistiques des processus en définissant le paramètre collectSystemProcess sur true dans le fichier de configuration.yaml l'agent.
com.instana.plugin.host:
collectSystemProcess: true # [true, false]
| Métrique | Description | Granularité |
|---|---|---|
| Nombre total de processus | Nombre total de processus actuellement en cours d'exécution sur le système, y compris tous les processus actifs, en veille, arrêtés et zombies. | 1 minute |
| État bloqué | Nombre de processus en état bloqué qui attendent la fin d'opérations d'E/S, telles que des lectures sur disque, des réponses réseau ou la disponibilité d'autres ressources. | 1 minute |
| Temps d'attente | Nombre de processus dans la file d'attente d'exécution qui attendent l'allocation de temps CPU, indiquant les processus prêts à être exécutés mais qui ne sont pas actuellement en cours d'exécution sur le CPU. | 1 minute |
| Zombie | Nombre de processus zombies qui ont terminé leur exécution mais qui figurent toujours dans la table des processus, en attente que leur processus parent lise leur statut. | 1 minute |
Processus zombies
Les processus zombies sont des processus exécutés dont l'état de sortie n'a pas encore été collecté par leur processus parent. Ces processus ne consomment ni CPU ni mémoire.
Les processus zombies sont affichés sous forme de liste dans le tableau de bord avec les détails suivants :
| Métrique | Description | Granularité |
|---|---|---|
| PID | L'ID du processus zombie. | 1 minute |
| ID du processus parent | L'ID du processus parent. | 1 minute |
| Utilisateur | L'utilisateur propriétaire du processus zombie. | 1 minute |
| Etat | État actuel du processus zombie. | 1 minute |
| Heure de début | L'heure ou la date à laquelle le processus zombie a démarré. | 1 minute |
| Temps UC | Temps CPU total consommé par le processus zombie. | 1 minute |
| Priorité | Priorité d'ordonnancement attribuée au processus (une valeur plus faible indique une priorité plus élevée). | 1 minute |
RPC activité client et serveur
| Métrique | Description | Granularité |
|---|---|---|
| Appels clients | Nombre d'appels d' RPC s initiés par le client vers des serveurs distants. | 1 minute |
| Appels retransmis | Nombre d'appels d' RPC s qui ont été retransmis en raison d'un délai d'attente expiré ou de problèmes réseau. | 1 minute |
| Authentification actualisée | Nombre de fois où le client a actualisé les informations d'authentification lors des opérations d' RPC. | 1 minute |
| Métrique | Description | Granularité |
|---|---|---|
| Appels du serveur | Nombre d'appels d' RPC s reçus et traités par le serveur. | 1 minute |
| Appels rejetés | Nombre d'appels d' RPC s qui ont été rejetés par le serveur pour diverses raisons. | 1 minute |
| Echecs d'authentification | Nombre d'appels d' RPC s ayant échoué à la vérification d'authentification. | 1 minute |
| En-têtes de paquets incorrectement formés | Nombre de paquets d' RPC s reçus avec des en-têtes mal formés ou corrompus. | 1 minute |
| Demandes non valides | Nombre de requêtes d' RPC s invalides ou mal formatées. | 1 minute |
Par défaut, les mesures d'activité du client et du serveur d' RPC s ne sont pas collectées. Vous pouvez activer la collecte des indicateurs d'activité d' RPC en définissant le paramètre collectRpcActivity sur true dans le fichier de configuration.yaml l'agent.
com.instana.plugin.host:
collectRpcActivity: true # [true, false]
Système de fichiers
Ces indicateurs fournissent des informations sur les performances, la capacité et l'utilisation du système de fichiers, permettant ainsi aux administrateurs de surveiller et d'optimiser efficacement leurs systèmes de stockage.
| Métrique | Description | Granularité |
|---|---|---|
| Espace disque libre | Quantité d'espace libre disponible sur le système de fichiers. | 1 seconde |
| Fuité | Espace alloué mais non utilisé, considéré comme perdu ou gaspillé. | 1 seconde |
| Capacité | Capacité totale du système de fichiers. | 1 seconde |
| Pourcentage d'utilisation du disque | Pourcentage d'espace utilisé sur le système de fichiers. | 1 seconde |
| Utilisation d'inode | Pourcentage d'inodes (structures de données décrivant les fichiers et les répertoires) utilisés. | 1 seconde |
| Inode disponible | Nombre d'inodes libres disponibles sur le système de fichiers. | 1 seconde |
| Octets lus/s | L'utilisation des opérations de lecture. | 1 seconde |
| Octets écrits/s | L'utilisation des opérations d'écriture. | 1 seconde |
| Lectures/s | Nombre d'octets lus à partir du système de fichiers. | 1 seconde |
| Ecritures/s | Nombre d'octets écrits dans le système de fichiers. | 1 seconde |
| Utilisation en lecture | Pourcentage de temps consacré à l'exécution d'opérations de lecture. | 1 seconde |
| Utilisation en écriture | Pourcentage de temps consacré à l'exécution d'opérations d'écriture. | 1 seconde |
| Utilisation totale | L'utilisation globale du système de fichiers, qui englobe les opérations de lecture, d'écriture et l'utilisation des inodes. | 1 seconde |
| Balise | Description |
|---|---|
| Appareil | Nom du périphérique. |
| Montage | Point de montage où le périphérique est connecté dans la hiérarchie du système de fichiers. |
| Options | Les options ou paramètres utilisés lors du montage du système de fichiers. |
| Type | Le type de système de fichiers. |
* Les métriques relatives à l'utilisation totale, en lecture et en écriture affichent l'utilisation des E/S disque sous forme de pourcentage.
* Leaked (fait référence aux fichiers supprimés qui sont en cours d'utilisation et équivaut à capacity - used - free. Vous pouvez trouver ces fichiers avec lsof | grep deleted).
** Les points de données Write Utilization Total Utilization, Read Utilization et ne sont pas pris en charge pour les systèmes de fichiers réseau ( NFS ).
Par défaut, Instana surveille uniquement les systèmes de fichiers locaux. Vous pouvez répertorier les systèmes de fichiers surveillés ou exclus dans le configuration.yaml fichier.
Le nom du paramètre de configuration est le nom du périphérique, que vous pouvez obtenir dans la première colonne du mtab fichier ou dans la df sortie de la commande.
Vous devez spécifier les systèmes de fichiers temporaires dans le format suivant : tmpfs:/mount/point.
L'exemple suivant montre la liste des systèmes de fichiers surveillés :
com.instana.plugin.host:
filesystems:
- '/dev/sda1'
- 'tmpfs:/sys/fs/cgroup'
- 'server:/usr/local/pub'
L'exemple suivant montre les systèmes de fichiers qui sont inclus ou exclus :
com.instana.plugin.host:
filesystems:
include:
- '/dev/xvdd'
- 'tmpfs:/tmp'
- 'server:/usr/local/pub'
exclude:
- '/dev/xvda2'
Systèmes de fichiers réseau ( NFS )
Pour surveiller toutes les NFS, utilisez le nfs_all: true paramètre de configuration comme indiqué dans l'exemple suivant :
com.instana.plugin.host:
nfs_all: true
Disque
Le tableau suivant présente les indicateurs liés au disque
| Métrique | Description | Granularité | Unité |
|---|---|---|---|
| Appareil | Le nom du disque ou de la partition. | 1 seconde | Millisecondes |
| Temps de lecture | Temps moyen nécessaire pour traiter les demandes de lecture. | 1 seconde | Millisecondes |
| Temps d'écriture | Temps moyen nécessaire pour traiter les demandes d'écriture. | 1 seconde | Millisecondes |
| Délai de rejet des demandes | Délai moyen nécessaire pour traiter les demandes de suppression. | 1 seconde | Millisecondes |
| Délai de vidage des demandes | Temps moyen nécessaire pour traiter les demandes de vidange. | 1 seconde | Millisecondes |
| Taux de lecture d'octets | Nombre d'octets lus par seconde. | 1 seconde | Octets/secondes |
| Taux d'écriture d'octets | Nombre d'octets écrits par seconde. | 1 seconde | Octets/secondes |
| Temps d'attente | Durée moyenne par opération d'E/S. | 1 seconde | Millisecondes |
| Débit | Nombre total d'opérations de lecture et d'écriture effectuées par seconde. | 1 seconde | IOPS |
| Vitesse de transfert | La quantité de données lues et écrites par seconde. | 1 seconde | Octets/secondes |
| Lire % | Pourcentage des opérations d'E/S disque totales qui sont des opérations de lecture. | 1 seconde | Pourcentage |
| Ecriture (%) | Pourcentage des opérations d'E/S disque totales qui sont des opérations d'écriture. | 1 seconde | Pourcentage |
| Demandes de lecture | Nombre d'opérations de lecture effectuées divisé par la durée de la période. | 1 seconde | Demandes par seconde |
| Demandes d'écriture | Le nombre d'opérations d'écriture effectuées divisé par la durée de la période. | 1 seconde | Demandes par seconde |
| Longueur moyenne de la file d'attente des requêtes | La quantité de données lues et écrites par seconde. | 1 seconde | Nombre |
Interfaces réseau
Le tableau suivant présente le trafic réseau et les erreurs par interface.
| Métrique | Description | Granularité |
|---|---|---|
| Interface | L'interface réseau utilisée pour la communication. | 60 secondes |
| Mac | Adresse MAC (Media Access Control) de l'interface réseau. | 60 secondes |
| Adresses IP | Les adresses IP attribuées à l'interface réseau. | 60 secondes |
| Octets RX | Nombre total d'octets reçus par l'interface réseau par seconde. | 1 seconde |
| Erreurs RX | Nombre d'erreurs rencontrées lors de la réception de données sur l'interface réseau. | 1 seconde |
| Octets TX | Nombre total d'octets transmis par l'interface réseau par seconde. | 1 seconde |
| Erreurs TX | Nombre total d'erreurs rencontrées lors de la transmission de paquets sur l'interface réseau. | 1 seconde |
| Reçu/s | Nombre de paquets reçus par l'interface réseau par seconde. | 1 seconde |
| Transmis/s | Nombre de paquets transmis par l'interface réseau par seconde. | 1 seconde |
Activité TCP
Ces indicateurs fournissent des informations sur l'activité de connexion d' TCP, notamment les connexions établies, les taux de transmission par segment et les occurrences d'erreurs.
| Métrique | Description | Granularité |
|---|---|---|
| Établi | Nombre de connexions établies à l'adresse TCP. | 1 seconde |
| Ouverture/s | Le nombre de nouvelles connexions TCP ouvertes par seconde. | 1 seconde |
| Segments entrants/s | Nombre de segments d' TCP s entrants par seconde. | 1 seconde |
| Segments sortants/s | Nombre de segments d' TCP s sortants par seconde. | 1 seconde |
| Réinitialisations établies | Nombre de connexions TCP établies qui ont été réinitialisées par seconde. | 1 seconde |
| Réinitialisations en sortie | Nombre de connexions sortantes TCP réinitialisées par seconde. | 1 seconde |
| Échec | Nombre de tentatives de connexion à l' TCP qui ont échoué par seconde. | 1 seconde |
| Erreur | Nombre d'erreurs d' TCP s par seconde. | 1 seconde |
| Retransmission | Nombre de retransmissions d' TCP s par seconde. | 1 seconde |
Liste des premiers processus
La liste des processus principaux fournit des informations complètes sur les processus en cours d'exécution, notamment les identifiants de processus, les noms, les mesures de consommation des ressources et les informations relatives à la propriété. Cette liste est mise à jour toutes les 30 secondes et affiche uniquement les processus qui atteignent des seuils spécifiques d'utilisation des ressources : les processus qui ont consommé plus de 10 % du CPU au cours des 30 dernières secondes ou les processus dont l'utilisation de la mémoire (RSS) dépasse 512 Mo.
Pour générer une vue unifiée combinant les 10 processus les plus gourmands en ressources CPU et les 10 processus les plus gourmands en ressources mémoire, configurez combineTopProcesses sur true. Cette configuration inclut les processus dans la liste combinée, qu'ils respectent ou non les seuils standard. Lorsqu'un processus apparaît à la fois dans les 10 premiers classements CPU et mémoire, il n'est répertorié qu'une seule fois, ce qui donne une liste combinée pouvant contenir jusqu'à 20 entrées uniques.
com.instana.plugin.host:
combineTopProcesses: true # [true, false]
Linuxtop la sémantique est utilisée. 100 % CPU signifie utilisation complète d'un seul cœur de processeur. Vous pouvez rechercher l'historique des instantanés du mois précédent. Le CPU normalisé est calculé en divisant le CPU par le nombre de processeurs logiques.
| Métrique | Description | Granularité |
|---|---|---|
| PID | Identifiant unique attribué à chaque processus par le système d'exploitation. | 30 secondes |
| Nom de processus | Nom du processus tel que défini par l'application ou le service. | 30 secondes |
| ID du processus parent | ID du processus parent qui a créé ce processus. | 30 secondes |
| UID | Identifiant numérique du compte utilisateur qui possède et exécute le processus. | 30 secondes |
| ID GROUPE | Identifiant numérique associé au propriétaire du processus. | 30 secondes |
| Temps écoulé | Le temps total écoulé depuis le début du processus. | 30 secondes |
| UC | La quantité de ressources CPU consommées par le processus. | 30 secondes |
| UC (normalisée) | Utilisation du processeur par le processus, normalisée à une échelle. | 30 secondes |
| Mémoire | La quantité de mémoire consommée par le processus. | 30 secondes |
Extraire la liste des paquets
Vous pouvez extraire les paquets installés sur un système d'exploitation une fois par jour en définissant la valeur collectInstalledSoftware sur true dans le configuration.yaml fichier.
Les distributions Linux suivantes sont prises en charge actuellement :
- Debian (
dpkg) - Red Hat -basé (
rpmetyum)
com.instana.plugin.host:
collectInstalledSoftware: true # [true, false]
Attributs d'informations de fichier
Vous pouvez obtenir les attributs suivants pour les 10 fichiers ou répertoires les plus volumineux à partir du répertoire racine (/), en définissant la valeur getFileInfo sur true dans le configuration.yaml fichier.
| Métrique | Description |
|---|---|
| Nom de fichier | Nom du fichier ou du répertoire. |
| Date/Heure du dernier accès | Date et heure du dernier accès au fichier. |
| Date/Heure de la dernière modification | Date et heure de la dernière modification apportée au fichier. |
| Accès | Cet attribut définit les droits d'accès à un fichier. |
| Type | Le type de fichier (fichier ou répertoire). |
| Taille | La taille d'un fichier, en octets. |
| Contenu modifié | Indique si le contenu du fichier change (Oui ou Non). |
| Propriétaire | Nom du propriétaire du fichier. |
| Groupe | Nom du groupe logique auquel le propriétaire du fichier appartient. |
com.instana.plugin.host:
getFileInfo: true # [true, false]
Pour chaque capteur, une base de connaissances des signatures de santé est évaluée en continu par rapport aux mesures entrantes et signale les problèmes ou incidents en fonction de leur impact sur les utilisateurs.
Les événements intégrés déclenchent des problèmes ou des incidents en fonction de signatures de santé défaillantes sur des entités, tandis que les événements personnalisés déclenchent des problèmes ou des incidents en fonction des seuils d'une métrique spécifique d'une entité.
Pour plus d'informations sur les événements intégrés pour le capteur hôte, consultez la référence sur les événements intégrés.