Surveillance d'un hôte d' Solaris
Vous pouvez surveiller votre hôte Solaris avec Instana. Instana fournit des informations complètes sur les performances, l'état et l'utilisation des ressources de l'hôte de l' Solaris, permettant ainsi un dépannage efficace, une optimisation des performances et une détection proactive des problèmes.
Informations système
Instana récupère diverses informations système à partir d'un hôte. Vous pouvez afficher les détails suivants d'un hôte dans l'interface graphique d' Instana, dans le volet Système :
| Paramètre | Description |
|---|---|
| OS | Les détails du système d'exploitation. |
| UC | Les détails du processeur et le nombre. |
| Mémoire | Quantité de mémoire système disponible dans l' GiB s (gigaoctets). |
| Nom d'hôte | Le nom d'hôte de la machine. |
| Nom de domaine complet | Nom de domaine complet. Il s'agit du nom de domaine complet de l'hôte, y compris le sous-domaine et le domaine de premier niveau. |
| Identifiant système* | Identifiant personnalisé utilisé par Instana pour représenter et gérer de manière unique l'hôte surveillé dans le cadre de sa surveillance. System ID est utilisé pour la corrélation avec les systèmes de gestion des actifs. |
| ID hôte | L'adresse MAC de l'interface réseau de l'hôte, qui est un identifiant unique pour la carte réseau. |
| Démarrage | L'heure à laquelle la machine a démarré. |
*Pour l' Solaris, vous devez activer l'ID système à l'aide du fichier de configuration de l'agent YAML, comme indiqué dans l'exemple suivant :
"com.instana.plugin.host":
"collectSystemId": true
d'interfaces
Vous trouverez les informations suivantes :
- Interfaces : liste des interfaces réseau et des adresses IP.
- Instana agent : L'agent d' Instana s pour l'hôte.
- Processus : nombre et détails des processus en cours d'exécution sur l'hôte.
Statut de rapport
La disponibilité historique d'un hôte Solaris est indiquée dans le graphique Reporting Status (État des rapports) du tableau de bord de l'hôte Solaris. Vous pouvez voir trois indicateurs de couleur qui identifient l'état d'un hôte signalant à Instana.
| Statut | Description | Indicateur de couleur |
|---|---|---|
| Génération de rapports | L'hôte a signalé à Instana sans aucune interruption. | Vert |
| Rapports - suivi des problèmes | L'hôte a signalé à Instana quelques interruptions (telles que des interruptions réseau ou des problèmes de surveillance des agents) et n'était pas entièrement disponible. | Orange |
| N'envoie pas de rapport | L'hôte n'a pas envoyé de rapport à Instana pendant toute cette période. | Rouge |
La métrique utilisée pour afficher ces données sur le tableau de bord de l'hôte est basée sur l'agrégation des messages reçus de l'agent surveillant l'hôte. Un hôte est classé comme « Reporting » si Instana reçoit au moins 98 % des messages attendus dans un délai donné.
Par exemple, si la fenêtre temporelle d'agrégation des métriques est de 5 minutes et que la fréquence d'interrogation de l'hôte est d'une fois par seconde, Instana s'attend à recevoir 300 messages de l'hôte pendant cette période.
- Si au moins 294 messages sont reçus (98 % de 300), le statut de l'hôte est affiché comme Reporting.
- Si moins de 294 messages mais plus de 0 messages sont reçus, l'état de l'hôte s'affiche comme suit : Rapport – Problèmes de surveillance.
- Si aucun message n'est reçu, l'état de l'hôte est affiché comme « Ne rapporte pas ».
Métriques de performance
Les indicateurs de performance suivants sont affichés pour l'hôte.
Utilisation du processeur - pourcentage
Les valeurs d'utilisation du processeur, lorsqu'elles sont combinées, fournissent une vue détaillée de la manière dont les ressources du processeur sont utilisées sur un hôte.
| Métrique | Description | Granularité |
|---|---|---|
| Utilisation de l'UC | Utilisation totale du processeur en pourcentage pour la période que vous avez définie. | 1 seconde |
Utilisation du processeur - total
| Métrique | Description | Granularité |
|---|---|---|
| Utilisateur | Quantité de temps CPU consacrée à l'exécution des processus de l'espace utilisateur (applications et services). | 1 seconde |
| Système | Quantité de temps CPU consacrée à l'exécution des processus de l'espace noyau (fonctions principales du système d'exploitation). | 1 seconde |
| Wait | Temps CPU passé à attendre la fin des opérations d'entrée/sortie. | 1 seconde |
| Priorité modérée | Quantité de temps CPU consacrée à l'exécution de processus ayant une priorité inférieure (valeur nice). | 1 seconde |
| Vol | Le temps CPU perdu lorsque l'hyperviseur gère d'autres machines virtuelles ou conteneurs sur le même hôte physique. | 1 seconde |
Charge CPU - moyenne
La CPU load métrique affiche la valeur sur un graphique pour une période sélectionnée.
Point de données : Filesystem
| Métrique | Description | Granularité |
|---|---|---|
| Charge UC | Nombre moyen de processus exécutés pendant la période que vous avez définie. | 1 seconde |
Charge CPU - pic
| Métrique | Description | Granularité |
|---|---|---|
| Charger | La charge maximale du processeur. Le nombre maximal de processus exécutés pendant la période que vous avez définie. | 1 seconde |
Utilisation de l'UC individuelle
La CPU usage métrique affiche les métriques suivantes en pourcentage sur un graphique pour une période sélectionnée pour chaque CPU :
| Métrique | Description | Granularité |
|---|---|---|
| Utilisateur | Quantité de temps CPU consacrée à l'exécution des processus de l'espace utilisateur (applications et services). | 1 seconde |
| Système | Quantité de temps CPU consacrée à l'exécution des processus de l'espace noyau (fonctions principales du système d'exploitation). | 1 seconde |
| Wait | Temps CPU passé à attendre la fin des opérations d'entrée/sortie. | 1 seconde |
| Priorité modérée | Quantité de temps CPU consacrée à l'exécution de processus ayant une priorité inférieure (valeur nice). | 1 seconde |
| Vol | Le temps CPU perdu en raison de la gestion par l'hyperviseur d'autres machines virtuelles ou conteneurs sur le même hôte physique. | 1 seconde |
Point de données : Filesystem
Utilisation de la mémoire
| Métrique | Description | Granularité |
|---|---|---|
| Utilisation de la mémoire | Utilisation totale de la mémoire en pourcentage | 1 seconde |
Vous pouvez mesurer la used valeur en pourcentage à l'aide de la formule (total - actualFree) ÷ total. Le capteur utilise la actualFree valeur qui correspond à la mémoire réelle contrainte, qui comprend la mémoire libre et la mémoire cache, au lieu de free, qui est une valeur faible (utilisée pour la mise en cache ou la mise en mémoire tampon).
Mémoire
Le tableau suivant présente les unités de mesure de la mémoire :
| Métrique | Unité | Description | Granularité |
|---|---|---|---|
| Utilisé | Pourcentage | Quantité de mémoire utilisée | 1 seconde |
Les valeurs sont affichées sur un graphique pour une période sélectionnée.
Point de données : Filesystem
Open Files
Utilisation des fichiers ouverts lorsqu'ils sont disponibles sur le système d'exploitation; current vs max. Les valeurs sont affichées sur un graphique pour une période sélectionnée. Le système d'exploitation Solaris bénéficie d'une prise en charge limitée. La zone globale ne prend en charge que la métrique actuelle et la zone non globale ne prend en charge aucune métrique.
| Métrique | Unité | Description | Granularité |
|---|---|---|---|
| En cours | Octet | Mémoire totale disponible pour le système, y compris la mémoire active et inactive. | 1 seconde |
| Utilisé | Pourcentage | La mémoire utilisée par les processus. | 1 seconde |
Point de données : Filesystem
Système de fichiers
Ces indicateurs fournissent des informations sur les performances, la capacité et l'utilisation du système de fichiers, permettant ainsi aux administrateurs de surveiller et d'optimiser efficacement leurs systèmes de stockage.
| Métrique | Description | Granularité |
|---|---|---|
| Appareil | Nom du périphérique. | 60 secondes |
| Montages | Emplacement de montage du système de fichiers | 60 secondes |
| Options | Les options ou paramètres utilisés lors du montage du système de fichiers. | 60 secondes |
| Libre | Quantité d'espace libre disponible sur le système de fichiers. | 1 seconde |
| Fuité | Espace qui a été alloué mais qui n'est pas utilisé, considéré comme « perdu » ou gaspillé. | 1 seconde |
| Lectures/s | Nombre d'opérations de lecture par seconde. | 1 seconde |
| Ecritures/s | Nombre d'opérations d'écriture par seconde. | 1 seconde |
| Type | Le type de système de fichiers. | 60 secondes |
| Capacité | Capacité totale du système de fichiers. | 60 secondes |
| Utilisé | Quantité d'espace utilisé sur le système de fichiers. | 1 seconde |
| Utilisation d'inode | Pourcentage d'inodes (structures de données décrivant les fichiers et répertoires) utilisés. | 1 seconde |
| Octets lus/s | Nombre d'octets lus à partir du système de fichiers. | 1 seconde |
| Octets écrits/s | Nombre d'octets écrits dans le système de fichiers. | 1 seconde |
Point de données : Filesystem
* Les métriques relatives à l'utilisation totale, en lecture et en écriture affichent l'utilisation des E/S disque sous forme de pourcentage.
* Leaked (fait référence aux fichiers supprimés qui sont en cours d'utilisation et équivaut à capacity - used - free. Vous pouvez trouver ces fichiers avec lsof | grep deleted).
Par défaut, Instana surveille uniquement les systèmes de fichiers locaux. Vous pouvez répertorier les systèmes de fichiers surveillés ou exclus dans le configuration.yaml fichier.
Le nom du paramètre de configuration correspond au nom de l'appareil, que vous pouvez trouver dans la première colonne du mnttab fichier ou dans la sortie de df la commande.
L'exemple suivant montre la liste des systèmes de fichiers surveillés :
com.instana.plugin.host:
filesystems:
- 'rpool/export/home'
- 'rpool/VARSHARE'
- 'rpool/ROOT/11.4.90.214.1'
- 'rpool/VARSHARE/sstore'
L'exemple suivant montre les systèmes de fichiers qui sont inclus ou exclus :
com.instana.plugin.host:
filesystems:
include:
- 'rpool/export/home'
- 'rpool/VARSHARE'
exclude:
- 'rpool/ROOT/11.4.90.214.1'
- 'rpool/VARSHARE/sstore'
Interfaces réseau
Le tableau suivant présente le trafic réseau et les erreurs par interface.
| Métrique | Description | Granularité |
|---|---|---|
| Interface | L'interface réseau utilisée pour la communication. | 60 secondes |
| Mac | Adresse MAC (Media Access Control) de l'interface réseau. | 60 secondes |
| Adresses IP | Les adresses IP attribuées à l'interface réseau. | 60 secondes |
| Octets RX | Nombre total d'octets reçus par l'interface réseau par seconde. | 1 seconde |
| Erreurs RX | Erreurs rencontrées lors de la réception de données sur l'interface réseau. | 1 seconde |
| Octets TX | Nombre total d'octets transmis par l'interface réseau par seconde. | 1 seconde |
| Erreurs TX | Erreurs rencontrées lors de la transmission de paquets sur l'interface réseau. | 1 seconde |
| Reçu/s | Nombre de paquets reçus par l'interface réseau par seconde. | 1 seconde |
| Transmis/s | Nombre de paquets transmis par l'interface réseau par seconde. | 1 seconde |
Point de données : Filesystem
Activité TCP
Les indicateurs suivants fournissent des informations sur l'activité de connexion d' TCP, notamment le nombre de connexions établies, les débits de transmission par segment et le nombre d'erreurs :
| Métrique | Description | Granularité |
|---|---|---|
| Établi | Le nombre de connexions « TCP » établies. | 1 seconde |
| Ouverture/s | Le nombre de nouvelles connexions TCP établies par seconde. | 1 seconde |
| Segments entrants/s | Le nombre de segments d' TCP s entrants par seconde. | 1 seconde |
| Segments sortants/s | Le nombre de segments d' TCP s sortants par seconde. | 1 seconde |
| Réinitialisations établies | Le nombre de connexions « TCP » établies qui ont été réinitialisées par seconde. | 1 seconde |
| Réinitialisations en sortie | Nombre de connexions sortantes TCP réinitialisées par seconde. | 1 seconde |
| Échec | Le nombre de tentatives de connexion à TCP ayant échoué par seconde. | 1 seconde |
| Erreur | Le nombre d'erreurs d' TCP s par seconde. | 1 seconde |
| Retransmission | Le nombre de retransmissions d' TCP s par seconde. | 1 seconde |
Liste des premiers processus
Ces indicateurs fournissent des informations sur les processus en cours d'exécution, notamment leur ID, leur nom, leur utilisation du processeur, leur utilisation normalisée du processeur et leur consommation de mémoire. La liste des processus les plus importants est mise à jour toutes les 30 secondes et ne contient que les processus qui utilisent le système. Par exemple, les processus ayant utilisé plus de 10 % du CPU au cours des 30 dernières secondes ou ceux ayant utilisé plus de 512 Mo de mémoire (RSS) sont affichés dans la liste des processus les plus importants.
Pour créer une liste combinée des processus à partir des 10 listes d'utilisation maximale du processeur et de la mémoire, définissez combineTopProcesses sur true. Les processus sont inclus dans la liste combinée même si leur utilisation du processeur est inférieure à 10 % ou leur utilisation de la mémoire inférieure à 512 Mo. Si le même processus figure dans les listes des 10 principaux processus utilisant le plus de ressources CPU et les 10 principaux processus utilisant le plus de mémoire, il n'apparaît qu'une seule fois dans la liste combinée, qui peut contenir jusqu'à 20 entrées.
com.instana.plugin.host:
combineTopProcesses: true
Le CPU normalisé est calculé en divisant le CPU par le nombre de processeurs logiques.
| Métrique | Description | Granularité |
|---|---|---|
| PID | Identifiant unique attribué à chaque processus par le système d'exploitation. | 30 secondes |
| Nom de processus | Nom du processus tel que défini par l'application ou le service. | 30 secondes |
| UC | La quantité de ressources CPU consommées par le processus. | 30 secondes |
| UC (normalisée) | Utilisation du processeur par le processus, normalisée à une échelle. | 30 secondes |
| Mémoire | La quantité de mémoire consommée par le processus. | 30 secondes |
Point de données : Filesystem
Signatures d'intégrité
Pour chaque capteur, une base de connaissances des signatures de santé est évaluée en continu par rapport aux mesures entrantes. Ils sont utilisés pour signaler des problèmes ou des incidents en fonction de leur impact sur les utilisateurs.
Les événements intégrés déclenchent des problèmes ou des incidents en fonction de signatures de santé défaillantes sur des entités, tandis que les événements personnalisés déclenchent des problèmes ou des incidents en fonction des seuils d'une métrique spécifique d'une entité.
Pour plus d'informations sur les événements intégrés pour le capteur hôte, consultez la référence sur les événements intégrés.