Surveillance d'un hôte Linux

Modifier en ligne

Vous pouvez surveiller votre hôte Linux avec Instana. Instana fournit des informations complètes sur les performances, l'état et l'utilisation des ressources de l'hôte de l' Linux, permettant ainsi un dépannage efficace, une optimisation des performances et une détection proactive des problèmes.

Informations système
INTERFACES
Statut de rapport
Métriques de performance
Extraire la liste des paquets
Attributs Informations sur le fichier

Informations système

Modifier en ligne

Instana recueille automatiquement des informations complètes sur le système à partir de votre hôte Linux. Consultez ces informations dans le volet Système du tableau de bord d' Instana :

Paramètre	Description
OS	Détails du système d'exploitation, y compris la version du noyau et l'architecture.
UC	Modèle de processeur et nombre de cœurs.
Mémoire	Mémoire système totale en gibioctets ( GiB ).
Nombre max de fichiers ouverts	Nombre maximal d'opérations simultanées sur les fichiers prises en charge par le système.
Nom d'hôte	Nom d'hôte réseau de l'hôte Linux.
Nom de domaine complet	Nom de domaine complet, y compris le sous-domaine et le domaine de premier niveau.
ID de machine	Identifiant unique généré lors de l'installation de la distribution de l' Linux.
ID d'amorçage	Identifiant unique pour la session de démarrage actuelle.
ID de système	Identifiant personnalisé utilisé par Instana pour la gestion des hôtes et la corrélation avec les systèmes de gestion des actifs. Collectées automatiquement par l'agent Instana pour les systèmes d'exploitation Linux.
ID hôte	Adresse MAC de l'interface réseau principale.
Démarrage	Horodatage du démarrage du système.
Version du système BIOS	Numéro de version du BIOS (Basic Input/Output System) ou du micrologiciel UEFI (Unified Extensible Firmware Interface) du système.
Date d'édition du BIOS	Date de sortie de la version du BIOS installée.
Nom du fournisseur du système d'exploitation	Nom de l'organisation ou du distributeur qui a fourni le système d'exploitation.
ID du fournisseur du système d'exploitation	Identifiant court pour l'identification programmatique des fournisseurs de systèmes d'exploitation.
Modèle matériel	Nom ou numéro spécifique du modèle du système ou de la carte mère.
Marque du matériel	Nom du fabricant du matériel.

Remarque : les informations relatives au BIOS et au matériel (version, date de sortie, modèle et marque) sont collectées à partir du /sys/class/dmi/id/ répertoire via l'interface sysfs Linux. Ces données proviennent des interfaces DMI (Desktop Management Interface) et SMBIOS (System Management BIOS) fournies par le micrologiciel du système.

d'interfaces

Modifier en ligne

Vous trouverez les informations suivantes :

Interfaces : liste des interfaces réseau et des adresses IP.
Instana agent : L'agent d' Instana s pour l'hôte.
Processus : nombre et détails des processus en cours d'exécution sur l'hôte.

Statut de rapport

Modifier en ligne

La disponibilité historique d'un hôte Linux est indiquée dans le graphique Reporting Status (État des rapports) du tableau de bord de l'hôte Linux. Vous pouvez voir trois indicateurs de couleur qui identifient l'état d'un hôte signalant à Instana.


Statut	Description	Indicateur de couleur
Génération de rapports	L'hôte a signalé à Instana sans aucune interruption.	Vert
Rapports - suivi des problèmes	L'hôte a signalé à Instana quelques interruptions (telles que des interruptions réseau ou des problèmes de surveillance des agents) et n'était pas entièrement disponible.	Orange
N'envoie pas de rapport	L'hôte n'a pas envoyé de rapport à Instana pendant toute cette période.	Rouge

La métrique utilisée pour afficher ces données sur le tableau de bord de l'hôte est basée sur l'agrégation des messages reçus de l'agent surveillant l'hôte. Un hôte est classé comme « Reporting » si Instana reçoit au moins 98 % des messages attendus dans un délai donné.

Par exemple, si la fenêtre temporelle d'agrégation des métriques est de 5 minutes et que la fréquence d'interrogation de l'hôte est d'une fois par seconde, Instana s'attend à recevoir 300 messages de l'hôte pendant cette période.

Si au moins 294 messages sont reçus (98 % de 300), le statut de l'hôte est affiché comme Reporting.
Si moins de 294 messages mais plus de 0 messages sont reçus, l'état de l'hôte s'affiche comme suit : Rapport – Problèmes de surveillance.
Si aucun message n'est reçu, l'état de l'hôte est affiché comme « Ne rapporte pas ».

Métriques de performance

Modifier en ligne

Les indicateurs de performances suivants sont affichés pour l'hôte Linux.

Utilisation du processeur : globale

Modifier en ligne

Les valeurs d'utilisation du processeur, lorsqu'elles sont combinées, fournissent une vue détaillée de la manière dont les ressources du processeur sont utilisées sur un hôte d' Linux.


Métrique	Description	Granularité
Utilisation de l'UC	Utilisation totale du processeur en pourcentage pour la période que vous avez définie.	1 seconde

Utilisation de la mémoire : globale

Modifier en ligne


Métrique	Description	Granularité
Utilisation de la mémoire	Utilisation totale de la mémoire en pourcentage	1 seconde

Vous pouvez mesurer la used valeur en pourcentage à l'aide de la formule (total - actualFree) ÷ total. Le capteur utilise la actualFree valeur qui correspond à la mémoire réelle contrainte, qui comprend la mémoire libre et la mémoire cache, au lieu de free, qui est une valeur faible (utilisée pour la mise en cache ou la mise en mémoire tampon).

Charge CPU : Pic

Modifier en ligne

Métrique	Description	Granularité
Charger	La charge maximale du processeur. Le nombre maximal de processus exécutés pendant la période que vous avez définie.	1 seconde

État bloqué des processus

Modifier en ligne

Métrique	Description	Granularité
État bloqué des processus	Nombre de processus en état bloqué qui attendent que des ressources d'E/S soient disponibles.	1 minute

Environnement d'exécution en attente des processus

Modifier en ligne

Métrique	Description	Granularité
Environnement d'exécution en attente des processus	Nombre de processus en attente dans la file d'attente d'exécution pour obtenir du temps CPU.	1 minute

Sessions utilisateur

Modifier en ligne

Métrique	Description	Granularité
Sessions utilisateur	Nombre de sessions utilisateur simultanées sur l'hôte.	1 minute

Utilisation du processeur : Total

Modifier en ligne

Métrique	Description	Granularité
Utilisateur	Pourcentage du temps CPU consacré à l'exécution des processus de l'espace utilisateur, y compris les applications et les services lancés par l'utilisateur.	1 seconde
Système	Pourcentage du temps CPU consacré à l'exécution des opérations du noyau, y compris les appels système, les pilotes de périphériques et les fonctions essentielles du système d'exploitation.	1 seconde
Wait	Pourcentage du temps CPU consacré à attendre la fin des opérations d'E/S, indiquant d'éventuels goulots d'étranglement au niveau du disque ou du réseau.	1 seconde
Priorité modérée	Pourcentage du temps CPU consacré à l'exécution de processus à priorité réduite (valeurs nice positives), permettant aux tâches à priorité plus élevée de s'exécuter en premier.	1 seconde
Vol	Pourcentage du temps CPU volé par l'hyperviseur pour servir d'autres machines virtuelles sur le même hôte physique.	1 seconde
En veille	Pourcentage du temps CPU pendant lequel le processeur était inactif et n'attendait pas d'opérations d'E/S, indiquant la capacité CPU disponible.	1 seconde

Changements de contexte

Modifier en ligne

Métrique	Description	Granularité
Changements de contexte	Nombre total de changements de contexte sur un graphique pour une période donnée.	1 seconde

Charge CPU : moyenne

Modifier en ligne

La CPU load métrique suit le nombre moyen de processus en concurrence pour les ressources CPU, affiché sous forme de graphique chronologique.

Métrique	Description	Granularité
Charge UC	Nombre moyen de processus dans la file d'attente d'exécution (en cours d'exécution sur le processeur ou en attente de temps processeur) au cours de la période sélectionnée, fournissant des informations sur la charge de travail du système et la demande en ressources.	1 seconde

Utilisation de l'UC individuelle

Modifier en ligne

La métrique d'utilisation du processeur affiche les métriques suivantes en pourcentage sur un graphique pour une période sélectionnée pour chaque processeur :

Métrique	Description	Granularité
Utilisateur	Le temps CPU consacré à l'exécution des processus de l'espace utilisateur (applications et services).	1 seconde
Système	La quantité de temps CPU consacrée à l'exécution des processus de l'espace noyau (fonctions essentielles du système d'exploitation).	1 seconde
Wait	Le temps CPU passé à attendre la fin des opérations d'entrée ou de sortie.	1 seconde
Priorité modérée	La quantité de temps CPU consacrée à l'exécution de processus ayant une priorité inférieure (valeur nice).	1 seconde
Vol	Le temps CPU perdu en raison de la gestion par l'hyperviseur d'autres machines virtuelles ou conteneurs sur le même hôte physique.	1 seconde
En veille	Pourcentage du temps CPU pendant lequel le processeur était inactif.	1 seconde

Utilisation d'un GPU individuel

Modifier en ligne

Le tableau suivant présente les Individual GPU usage valeurs :

Métrique	Description	Granularité	Unité
Utilisation du processeur graphique	Pourcentage d'utilisation du GPU	1 seconde	%
Température	Température du GPU en degrés Celsius	1 seconde	°C
Codeur	Utilisation de l'encodeur	1 seconde	%
Décodeur	Utilisation du décodeur	1 seconde	%
Mémoire utilisée	Utilisation de la mémoire	1 seconde	%
Mémoire totale	Mémoire GPU totale	1 seconde	octets
Débit transmis	Débit de données transmis	1 seconde	octets/s
Débit reçu	Débit de données reçues	1 seconde	octets/s

La métrique est collectée à partir de nvidia-smi. Le tableau suivant présente les versions prises en charge des cartes graphiques Nvidia :

Marque	Modèle
Tesla	S1070, S2050, C1060, C2050/70, M2050/70/90, X2070/90, K10, K20, K20X, K40, K80, M40, P40, P100, V100
Quadro	4000, 5000, 6000, 7000, M2070-Q, K-series, M-series, P-series, RTX-series
GeForce	plusieurs niveaux de prise en charge, avec moins de métriques disponibles par rapport aux produits Tesla et Quadro

Prérequis

Modifier en ligne

Vous devez installer les derniers pilotes officiels Nvidia.

Pour plus d'informations sur le démarrage d'un conteneur Docker pour l'agent Instana avec prise en charge GPU, consultez Activer la surveillance GPU via le conteneur de l'agent Instana.

La collecte des données relatives aux métriques GPU est soigneusement conçue pour avoir un impact minimal, en séparant le sondage et l'interrogation en deux processus à l'aide de nvidia-smi. Le processus d'arrière-plan est lancé en mode boucle et conservé en mémoire. Ce processus améliore considérablement les performances de la collecte des métriques et évite toute surcharge potentielle.

Le capteur interroge les métriques GPU en fonction du taux d'interrogation configuré (toutes les secondes par défaut). Cette solution permet au capteur de collecter chaque seconde des mesures précises et actualisées pour plusieurs GPU sans surcharge.

Mémoire/Processus GPU

Modifier en ligne

La liste suivante répertorie les processus qui utilisent le GPU :


Point de données	Collecté à partir de	Granularité
`Process Name`	`nvidia-smi`	1 seconde
`PID`	`nvidia-smi`	1 seconde
`GPU`	`nvidia-smi`	1 seconde
`Memory`	`nvidia-smi`	1 seconde

Le tableau suivant présente les versions prises en charge des cartes graphiques Nvidia pour la mémoire GPU :


Marque	Modèle
Tesla	S1070, S2050, C1060, C2050/70, M2050/70/90, X2070/90, K10, K20, K20X, K40, K80, M40, P40, P100, V100
Quadro	4000, 5000, 6000, 7000, M2070-Q, K-series, M-series, P-series, RTX-series
GeForce	plusieurs niveaux de prise en charge, avec moins de métriques disponibles par rapport aux produits Tesla et Quadro

Mémoire

Modifier en ligne

Le tableau suivant présente les unités de mesure de la mémoire :


Métrique	Unité	Description	Granularité
Total	Octet	La quantité totale de mémoire	1 seconde
Partagée	Octet	Mémoire utilisée par les segments de mémoire partagée et les systèmes de fichiers tmpfs sur les systèmes Linux	1 seconde
Utilisé	Pourcentage	Quantité de mémoire utilisée	1 seconde
Mémoires tampon	Octet	Mémoire utilisée pour les tampons	1 seconde
Mis en cache	Octet	Mémoire utilisée pour la mise en cache	1 seconde
Disponible	Octet	Mémoire disponible pour utilisation	1 seconde
Mémoire totale d'échange	Octet	Espace d'échange total disponible	1 seconde
Mémoire d'échange disponible	Octet	Espace d'échange disponible	1 seconde
Mémoire d'échange utilisée	Pourcentage	Quantité d'espace d'échange utilisée	1 seconde
Virtuel total	Octet	Capacité totale de la mémoire virtuelle (mémoire physique et espace d'échange).	1 seconde
Virtuel utilisé	Octet	Mémoire utilisée activement par les applications, à l'exclusion des tampons récupérables et du cache	1 seconde
Virtuel libre	Octet	Quantité de mémoire virtuelle disponible pour l'allocation.	1 seconde

Les valeurs sont affichées sur un graphique pour une période sélectionnée.

Activité de pagination

Modifier en ligne

Métrique	Description	Granularité
Nombre total d'erreurs	Nombre total de défauts de page, y compris les défauts mineurs et majeurs, lorsque les processus accèdent à la mémoire qui ne se trouve pas dans la RAM.	1 seconde
Erreurs majeures	Nombre d'erreurs de page majeures nécessitant le chargement de données du disque vers la mémoire.	1 seconde
Paginé en entrée	Nombre de pages mémoire transférées du disque vers la mémoire RAM physique.	1 seconde
Paginé en sortie	Nombre de pages mémoire transférées de la mémoire RAM physique vers le disque.	1 seconde
Entré dans la mémoire	Nombre de pages mémoire transférées depuis l'espace d'échange sur disque vers la mémoire RAM physique.	1 seconde
Sorti de la mémoire	Nombre de pages mémoire transférées de la mémoire RAM physique vers l'espace d'échange sur le disque.	1 seconde

Par défaut, les mesures d'activité de pagination ne sont pas collectées. Vous pouvez activer la collecte des métriques d'activité de pagination en définissant le paramètre collectPagingActivity sur true dans le configuration.yaml fichier.

com.instana.plugin.host:
  collectPagingActivity: true # [true, false]

Open Files

Modifier en ligne

Utilisation des fichiers ouverts lorsqu'ils sont disponibles sur le système d'exploitation; current vs max. Les valeurs sont affichées sur un graphique pour une période sélectionnée.

Métrique	Unité	Description	Granularité
En cours	Octet	Mémoire totale disponible pour le système, y compris la mémoire active et inactive.	1 seconde
Utilisé	Pourcentage	La mémoire utilisée par les processus.	1 seconde

Statistiques de processus

Modifier en ligne

Par défaut, les mesures statistiques des processus ne sont pas collectées. Vous pouvez activer la collecte des métriques statistiques des processus en définissant le paramètre collectSystemProcess sur true dans le fichier de configuration.yaml l'agent.

com.instana.plugin.host:
  collectSystemProcess: true # [true, false]

Métrique	Description	Granularité
Nombre total de processus	Nombre total de processus actuellement en cours d'exécution sur le système, y compris tous les processus actifs, en veille, arrêtés et zombies.	1 minute
État bloqué	Nombre de processus en état bloqué qui attendent la fin d'opérations d'E/S, telles que des lectures sur disque, des réponses réseau ou la disponibilité d'autres ressources.	1 minute
Temps d'attente	Nombre de processus dans la file d'attente d'exécution qui attendent l'allocation de temps CPU, indiquant les processus prêts à être exécutés mais qui ne sont pas actuellement en cours d'exécution sur le CPU.	1 minute
Zombie	Nombre de processus zombies qui ont terminé leur exécution mais qui figurent toujours dans la table des processus, en attente que leur processus parent lise leur statut.	1 minute

Processus zombies

Les processus zombies sont des processus exécutés dont l'état de sortie n'a pas encore été collecté par leur processus parent. Ces processus ne consomment ni CPU ni mémoire.

Les processus zombies sont affichés sous forme de liste dans le tableau de bord avec les détails suivants :

Métrique	Description	Granularité
PID	L'ID du processus zombie.	1 minute
ID du processus parent	L'ID du processus parent.	1 minute
Utilisateur	L'utilisateur propriétaire du processus zombie.	1 minute
Etat	État actuel du processus zombie.	1 minute
Heure de début	L'heure ou la date à laquelle le processus zombie a démarré.	1 minute
Temps UC	Temps CPU total consommé par le processus zombie.	1 minute
Priorité	Priorité d'ordonnancement attribuée au processus (une valeur plus faible indique une priorité plus élevée).	1 minute

RPC activité client et serveur

Modifier en ligne

Tableau 1. RPC activité client
Métrique	Description	Granularité
Appels clients	Nombre d'appels d' RPC s initiés par le client vers des serveurs distants.	1 minute
Appels retransmis	Nombre d'appels d' RPC s qui ont été retransmis en raison d'un délai d'attente expiré ou de problèmes réseau.	1 minute
Authentification actualisée	Nombre de fois où le client a actualisé les informations d'authentification lors des opérations d' RPC.	1 minute

Tableau 2. RPC activité du serveur
Métrique	Description	Granularité
Appels du serveur	Nombre d'appels d' RPC s reçus et traités par le serveur.	1 minute
Appels rejetés	Nombre d'appels d' RPC s qui ont été rejetés par le serveur pour diverses raisons.	1 minute
Echecs d'authentification	Nombre d'appels d' RPC s ayant échoué à la vérification d'authentification.	1 minute
En-têtes de paquets incorrectement formés	Nombre de paquets d' RPC s reçus avec des en-têtes mal formés ou corrompus.	1 minute
Demandes non valides	Nombre de requêtes d' RPC s invalides ou mal formatées.	1 minute

Par défaut, les mesures d'activité du client et du serveur d' RPC s ne sont pas collectées. Vous pouvez activer la collecte des indicateurs d'activité d' RPC en définissant le paramètre collectRpcActivity sur true dans le fichier de configuration.yaml l'agent.

com.instana.plugin.host:
  collectRpcActivity: true # [true, false]

Système de fichiers

Modifier en ligne

Ces indicateurs fournissent des informations sur les performances, la capacité et l'utilisation du système de fichiers, permettant ainsi aux administrateurs de surveiller et d'optimiser efficacement leurs systèmes de stockage.


Métrique	Description	Granularité
Espace disque libre	Quantité d'espace libre disponible sur le système de fichiers.	1 seconde
Fuité	Espace alloué mais non utilisé, considéré comme perdu ou gaspillé.	1 seconde
Capacité	Capacité totale du système de fichiers.	1 seconde
Pourcentage d'utilisation du disque	Pourcentage d'espace utilisé sur le système de fichiers.	1 seconde
Utilisation d'inode	Pourcentage d'inodes (structures de données décrivant les fichiers et les répertoires) utilisés.	1 seconde
Inode disponible	Nombre d'inodes libres disponibles sur le système de fichiers.	1 seconde
Octets lus/s	L'utilisation des opérations de lecture.	1 seconde
Octets écrits/s	L'utilisation des opérations d'écriture.	1 seconde
Lectures/s	Nombre d'octets lus à partir du système de fichiers.	1 seconde
Ecritures/s	Nombre d'octets écrits dans le système de fichiers.	1 seconde
Utilisation en lecture	Pourcentage de temps consacré à l'exécution d'opérations de lecture.	1 seconde
Utilisation en écriture	Pourcentage de temps consacré à l'exécution d'opérations d'écriture.	1 seconde
Utilisation totale	L'utilisation globale du système de fichiers, qui englobe les opérations de lecture, d'écriture et l'utilisation des inodes.	1 seconde


Balise	Description
Appareil	Nom du périphérique.
Montage	Point de montage où le périphérique est connecté dans la hiérarchie du système de fichiers.
Options	Les options ou paramètres utilisés lors du montage du système de fichiers.
Type	Le type de système de fichiers.

* Les métriques relatives à l'utilisation totale, en lecture et en écriture affichent l'utilisation des E/S disque sous forme de pourcentage.

* Leaked (fait référence aux fichiers supprimés qui sont en cours d'utilisation et équivaut à capacity - used - free. Vous pouvez trouver ces fichiers avec lsof | grep deleted).

** Les points de données Write Utilization Total Utilization, Read Utilization et ne sont pas pris en charge pour les systèmes de fichiers réseau ( NFS ).

Par défaut, Instana surveille uniquement les systèmes de fichiers locaux. Vous pouvez répertorier les systèmes de fichiers surveillés ou exclus dans le configuration.yaml fichier.

Le nom du paramètre de configuration est le nom du périphérique, que vous pouvez obtenir dans la première colonne du mtab fichier ou dans la df sortie de la commande.

Vous devez spécifier les systèmes de fichiers temporaires dans le format suivant : tmpfs:/mount/point.

L'exemple suivant montre la liste des systèmes de fichiers surveillés :

com.instana.plugin.host:
  filesystems:
    - '/dev/sda1'
    - 'tmpfs:/sys/fs/cgroup'
    - 'server:/usr/local/pub'

L'exemple suivant montre les systèmes de fichiers qui sont inclus ou exclus :

com.instana.plugin.host:
  filesystems:
    include:
      - '/dev/xvdd'
      - 'tmpfs:/tmp'
      - 'server:/usr/local/pub'
    exclude:
      - '/dev/xvda2'

Systèmes de fichiers réseau ( NFS )

Modifier en ligne

Pour surveiller toutes les NFS, utilisez le nfs_all: true paramètre de configuration comme indiqué dans l'exemple suivant :

com.instana.plugin.host:
  nfs_all: true

Disque

Modifier en ligne

Le tableau suivant présente les indicateurs liés au disque


Métrique	Description	Granularité	Unité
Appareil	Le nom du disque ou de la partition.	1 seconde	Millisecondes
Temps de lecture	Temps moyen nécessaire pour traiter les demandes de lecture.	1 seconde	Millisecondes
Temps d'écriture	Temps moyen nécessaire pour traiter les demandes d'écriture.	1 seconde	Millisecondes
Délai de rejet des demandes	Délai moyen nécessaire pour traiter les demandes de suppression.	1 seconde	Millisecondes
Délai de vidage des demandes	Temps moyen nécessaire pour traiter les demandes de vidange.	1 seconde	Millisecondes
Taux de lecture d'octets	Nombre d'octets lus par seconde.	1 seconde	Octets/secondes
Taux d'écriture d'octets	Nombre d'octets écrits par seconde.	1 seconde	Octets/secondes
Temps d'attente	Durée moyenne par opération d'E/S.	1 seconde	Millisecondes
Débit	Nombre total d'opérations de lecture et d'écriture effectuées par seconde.	1 seconde	IOPS
Vitesse de transfert	La quantité de données lues et écrites par seconde.	1 seconde	Octets/secondes
Lire %	Pourcentage des opérations d'E/S disque totales qui sont des opérations de lecture.	1 seconde	Pourcentage
Ecriture (%)	Pourcentage des opérations d'E/S disque totales qui sont des opérations d'écriture.	1 seconde	Pourcentage
Demandes de lecture	Nombre d'opérations de lecture effectuées divisé par la durée de la période.	1 seconde	Demandes par seconde
Demandes d'écriture	Le nombre d'opérations d'écriture effectuées divisé par la durée de la période.	1 seconde	Demandes par seconde
Longueur moyenne de la file d'attente des requêtes	La quantité de données lues et écrites par seconde.	1 seconde	Nombre

Interfaces réseau

Modifier en ligne

Le tableau suivant présente le trafic réseau et les erreurs par interface.

Métrique	Description	Granularité
Interface	L'interface réseau utilisée pour la communication.	60 secondes
Mac	Adresse MAC (Media Access Control) de l'interface réseau.	60 secondes
Adresses IP	Les adresses IP attribuées à l'interface réseau.	60 secondes
Octets RX	Nombre total d'octets reçus par l'interface réseau par seconde.	1 seconde
Erreurs RX	Nombre d'erreurs rencontrées lors de la réception de données sur l'interface réseau.	1 seconde
Octets TX	Nombre total d'octets transmis par l'interface réseau par seconde.	1 seconde
Erreurs TX	Nombre total d'erreurs rencontrées lors de la transmission de paquets sur l'interface réseau.	1 seconde
Reçu/s	Nombre de paquets reçus par l'interface réseau par seconde.	1 seconde
Transmis/s	Nombre de paquets transmis par l'interface réseau par seconde.	1 seconde

Activité TCP

Modifier en ligne

Ces indicateurs fournissent des informations sur l'activité de connexion d' TCP, notamment les connexions établies, les taux de transmission par segment et les occurrences d'erreurs.


Métrique	Description	Granularité
Établi	Nombre de connexions établies à l'adresse TCP.	1 seconde
Ouverture/s	Le nombre de nouvelles connexions TCP ouvertes par seconde.	1 seconde
Segments entrants/s	Nombre de segments d' TCP s entrants par seconde.	1 seconde
Segments sortants/s	Nombre de segments d' TCP s sortants par seconde.	1 seconde
Réinitialisations établies	Nombre de connexions TCP établies qui ont été réinitialisées par seconde.	1 seconde
Réinitialisations en sortie	Nombre de connexions sortantes TCP réinitialisées par seconde.	1 seconde
Échec	Nombre de tentatives de connexion à l' TCP qui ont échoué par seconde.	1 seconde
Erreur	Nombre d'erreurs d' TCP s par seconde.	1 seconde
Retransmission	Nombre de retransmissions d' TCP s par seconde.	1 seconde

Liste des premiers processus

Modifier en ligne

La liste des processus principaux fournit des informations complètes sur les processus en cours d'exécution, notamment les identifiants de processus, les noms, les mesures de consommation des ressources et les informations relatives à la propriété. Cette liste est mise à jour toutes les 30 secondes et affiche uniquement les processus qui atteignent des seuils spécifiques d'utilisation des ressources : les processus qui ont consommé plus de 10 % du CPU au cours des 30 dernières secondes ou les processus dont l'utilisation de la mémoire (RSS) dépasse 512 Mo.

Pour générer une vue unifiée combinant les 10 processus les plus gourmands en ressources CPU et les 10 processus les plus gourmands en ressources mémoire, configurez combineTopProcesses sur true. Cette configuration inclut les processus dans la liste combinée, qu'ils respectent ou non les seuils standard. Lorsqu'un processus apparaît à la fois dans les 10 premiers classements CPU et mémoire, il n'est répertorié qu'une seule fois, ce qui donne une liste combinée pouvant contenir jusqu'à 20 entrées uniques.

com.instana.plugin.host:
  combineTopProcesses: true # [true, false]

Linuxtop la sémantique est utilisée. 100 % CPU signifie utilisation complète d'un seul cœur de processeur. Vous pouvez rechercher l'historique des instantanés du mois précédent. Le CPU normalisé est calculé en divisant le CPU par le nombre de processeurs logiques.

Métrique	Description	Granularité
PID	Identifiant unique attribué à chaque processus par le système d'exploitation.	30 secondes
Nom de processus	Nom du processus tel que défini par l'application ou le service.	30 secondes
ID du processus parent	ID du processus parent qui a créé ce processus.	30 secondes
UID	Identifiant numérique du compte utilisateur qui possède et exécute le processus.	30 secondes
ID GROUPE	Identifiant numérique associé au propriétaire du processus.	30 secondes
Temps écoulé	Le temps total écoulé depuis le début du processus.	30 secondes
UC	La quantité de ressources CPU consommées par le processus.	30 secondes
UC (normalisée)	Utilisation du processeur par le processus, normalisée à une échelle.	30 secondes
Mémoire	La quantité de mémoire consommée par le processus.	30 secondes

Extraire la liste des paquets

Modifier en ligne

Vous pouvez extraire les paquets installés sur un système d'exploitation une fois par jour en définissant la valeur collectInstalledSoftware sur true dans le configuration.yaml fichier.

Les distributions Linux suivantes sont prises en charge actuellement :

Debian (dpkg)
Red Hat -basé (rpm et yum)

com.instana.plugin.host:
  collectInstalledSoftware: true # [true, false]

Attributs d'informations de fichier

Modifier en ligne

Vous pouvez obtenir les attributs suivants pour les 10 fichiers ou répertoires les plus volumineux à partir du répertoire racine (/), en définissant la valeur getFileInfo sur true dans le configuration.yaml fichier.


Métrique	Description
Nom de fichier	Nom du fichier ou du répertoire.
Date/Heure du dernier accès	Date et heure du dernier accès au fichier.
Date/Heure de la dernière modification	Date et heure de la dernière modification apportée au fichier.
Accès	Cet attribut définit les droits d'accès à un fichier.
Type	Le type de fichier (fichier ou répertoire).
Taille	La taille d'un fichier, en octets.
Contenu modifié	Indique si le contenu du fichier change (Oui ou Non).
Propriétaire	Nom du propriétaire du fichier.
Groupe	Nom du groupe logique auquel le propriétaire du fichier appartient.

com.instana.plugin.host:
  getFileInfo: true # [true, false]

Pour chaque capteur, une base de connaissances des signatures de santé est évaluée en continu par rapport aux mesures entrantes et signale les problèmes ou incidents en fonction de leur impact sur les utilisateurs.

Les événements intégrés déclenchent des problèmes ou des incidents en fonction de signatures de santé défaillantes sur des entités, tandis que les événements personnalisés déclenchent des problèmes ou des incidents en fonction des seuils d'une métrique spécifique d'une entité.

Pour plus d'informations sur les événements intégrés pour le capteur hôte, consultez la référence sur les événements intégrés.