Surveillance d'IBM Power HMC

En savoir plus sur la surveillance de l' IBM Power t HMC.

Il s'agit d'une fonctionnalité facultative, désactivée par défaut dans le backend d' Instana. Pour activer cette fonctionnalité facultative, consultez la page correspondant à votre déploiement d' Instana : SaaS, Édition personnalisée auto-hébergée ( Kubernetes ou Red Hat OpenShift Container Platform ) ou Édition classique auto-hébergée ( Docker )

Si cette fonctionnalité est activée, l'HMC d' IBM Power apparaît dans le menu « Platforms » du menu de navigation de l'interface utilisateur d' Instana, comme le montre l'image suivante :

pHMC Vue de la plateforme

Informations de support

Pour vous assurer que le capteur HMC d' IBM Power est compatible avec votre configuration actuelle, consultez les sections d'informations d'assistance suivantes :

Versions prises en charge et politique d'assistance

Le capteur prend en charge API Power HMC version V11 avec les systèmes Power9, HMC V10 avec les systèmes Power10, Power9 et Power8, et HMC V9 avec les systèmes Power9.

Le tableau suivant présente les dernières versions prises en charge ainsi que la politique d'assistance :

Technologie Politique de support Dernière version technologique Dernière version prise en charge
IBM Power HMC A la demande 11.1 10.0

Pour plus d'informations sur la politique d'assistance, consultez la section « Stratégie d'assistance pour les capteurs ».

Accéder aux informations Power HMC

Lorsque l'agent est configuré et déployé sur un serveur distant pour la collecte des métriques Power HMC, le détecteur Power HMC signale des données détaillées sur le système et d'autres ressources.

Vue de la plateforme

Dans l'interface utilisateur d' Instana, vous pouvez accéder à « IBM Power HMC » dans le menu « Platform », qui vous permet d'accéder à la console et aux systèmes Power HMC.

Vue de l'infrastructure

Dans le menu « Infrastructure » de l'interface utilisateur d' Instana, vous pouvez consulter la carte des entités Power HMC dans l'onglet « Carte ». Pour afficher les métriques, procédez comme suit:

  1. Dans la barre latérale de l'interface utilisateur d' Instana, sélectionnez « Infrastructure ».
  2. Cliquez sur un hôte surveillé spécifique. Vous pouvez voir un tableau de bord hôte avec toutes les métriques collectées et les processus surveillés.

Configuration

Activer la collecte de données

Pour activer la collecte de données pour les systèmes que vous souhaitez surveiller à l'aide d' Instana, procédez comme suit :

  1. Ouvrez la console HMC.
  2. Go dans l'onglet « Systèmes » depuis la barre de navigation.
  3. Cliquez sur les systèmes hôte à surveiller, accédez à l'onglet Performances et cliquez sur Activer / Désactiver la collecte des données de performances.
  4. Activez la collecte des performances en basculant le bouton vert sur on et en cliquant sur Ok.
  5. Définissez la fréquence d'échantillonnage en cliquant sur Performance > Modifier la fréquence d'échantillonnage des données d'utilisation et définissez la fréquence souhaitée. Il est recommandé d'utiliser 5 minutes comme fréquence d'échantillonnage.

Pour plus d'informations sur la collecte des indicateurs liés à la consommation d'énergie, consultez la section « Comment activer la surveillance de la consommation d'énergie pour les systèmes d' IBM Power ». En outre, pour les systèmes Power9 et Denali Power10 (FSP-based), activez l'interface IPMI (Intelligent Platform Management Interface) à partir de l'interface ASMI (Advanced System Management Interface).

  • Dans l'interface ASMI, accédez à Configuration du système > Sécurité > Gestion des services externes, puis activez IPMI.

Droits requis

Pour que le détecteur se connecte à Power HMC et surveille les métriques, vous devez disposer du rôle hmcviewer et activer les préférences PCM (Performance and Capacity Monitoring) pour les systèmes gérés. Pour agréger les données PCM, vous devez activer la surveillance à long terme (LTM). Activez également les indicateurs suivants:

  • LongTermMonitorEnabled: Valeur de configuration de la surveillance à long terme

  • AggregationEnabled: Valeur de configuration de l'agrégation des données d'utilisation

  • EnergyMonitorEnabled: État de la surveillance de l'énergie

Configuration du capteur

Pour vous connecter au serveur Power HMC, vous devez configurer les propriétés suivantes dans la configuration d'agent <agent_install_dir>/etc/instana/configuration.yaml:

Remarque : seule la surveillance à distance est prise en charge pour le capteur HMC Instana d' IBM Power.
com.instana.plugin.powerhmc:
  remote: # multiple hosts supported
    - host: ''# hostname or IP of Power HMC server
      port: ''# default port is '443' of Power HMC API Server
      user: '' # username to access the Power HMC server api
      password: '' # password to access the Power HMC server api
      availabilityZone: 'PowerHMC Remote Monitoring'
      poll_rate: 300 # Poll rate in seconds. Poll rate cannot be lesser than 300 seconds. If it is configured below 300 seconds then default value (300 seconds) will be set.
      eventsPollRate: 900 # Poll rate in seconds. Poll rate cannot be lesser than 900 seconds. If it is configured below 900 seconds then default value (900 seconds) will be set.

 
Remarque : si la fréquence d'interrogation que vous avez définie sur Instana est inférieure à la fréquence d'interrogation minimale sur le serveur Power HMC, c'est cette dernière qui s'applique.

Collecte des métriques

À l'heure actuelle, Instana prend en charge les indicateurs suivants :

  • Métriques de processeur, de mémoire et de réseau pour les systèmes gérés par l'alimentation.
  • Métriques processeur et mémoire de l'hyperviseur.
  • Métriques de processeur, de mémoire, de réseau et de stockage pour les partitions logiques (LPAR) et les serveurs d'E-S virtuels (VIOS).

Métriques de performance

Console HMC (Hardware management console)

Le tableau suivant répertorie toutes les consoles HMC qui font partie de la configuration:

Métrique Description Granularité
Nom d'hôte Nom d'hôte ou adresse IP de la console HMC. 300 secondes
Systèmes Nombre total de systèmes gérés par cette console HMC. 300 secondes
Partitions Nombre total de partitions logiques gérées par cette console HMC. 300 secondes
Serveurs d'E-S virtuels Nombre total de VIOS gérés par cette console HMC. 300 secondes

Liste des systèmes gérés

Les systèmes sont classés selon les deux méthodes suivantes :
  • Vue d'ensemble de tous les systèmes gérés : affiche tous les systèmes gérés détectés sur l'ensemble des HMC configurés. Si un même système est géré par plusieurs HMC, il n'apparaît qu'une seule fois dans cette vue consolidée afin d'éviter les doublons.

  • Vue par HMC : affiche les systèmes gérés détectés via une connexion HMC spécifique. Si un même système est géré par plusieurs HMC, les systèmes correspondants et les ressources associées peuvent apparaître plusieurs fois sous différents HMC.

Métrique Description Granularité
Nom Nom d'hôte ou adresse IP de la console HMC. 300 secondes
Systèmes Nombre total de systèmes gérés par cette console HMC. 300 secondes
Partitions Nombre total de partitions logiques gérées par cette console HMC. 300 secondes
Serveurs d'E-S virtuels Nombre total de VIOS gérés par cette console HMC. 300 secondes
Unités de traitement utilisées Nombre d'unités de traitement utilisées par les partitions du pool pour un intervalle de temps donné. 300 secondes
Unités de traitement utilisées (%) Pourcentage d'unités de traitement utilisées par les partitions du pool pour un intervalle de temps donné. (Unités de traitement utilisées / Unités de traitement affectées) × 100. 300 secondes
Mémoire disponible (Mo) Mémoire disponible (en mégaoctets) pour l'affectation. 300 secondes
Mémoire disponible (%) (Mémoire disponible / Mémoire configurable) × 100. 300 secondes
Type machine-Modèle Type et modèle de machine du système géré. 300 secondes
Machine série Numéro de série du système géré. 300 secondes

Système géré

Utilisation de processeur système

Les métriques suivantes sont fournies pour les processeurs associés à chaque système géré:

Métrique Description Granularité
Unités de traitement utilisées Nombre d'unités de traitement utilisées dans l'intervalle spécifique. 300 secondes
Unités de traitement disponibles Nombre d'unités de traitement disponibles pour être affectées. 300 secondes
Unités de traitement configurables Nombre d'unités de traitement configurables. 300 secondes
Unités de traitement utilisées (%) (Unités de traitement utilisées / Unités de traitement configurables) × 100. 300 secondes
Unités de traitement disponibles (%) (Unités de traitement configurables / Nombre total d'unités de traitement) × 100. 300 secondes
Unités de traitement configurables (%) (Unités de traitement disponibles / Unités de traitement configurables) × 100. 300 secondes
Mémoire système

Les métriques suivantes sont fournies pour la mémoire liée à chaque système géré:

Métrique Description Granularité
Mémoire disponible Mémoire disponible (en mégaoctets) pour l'affectation. 300 secondes
Mémoire configurable Mémoire (en mégaoctets) configurable. 300 secondes
Mémoire affectée aux partitions logiques Mémoire allouée aux LPAR. 300 secondes
Mémoire disponible (%) (Mémoire disponible / Mémoire configurable) × 100. 300 secondes
Mémoire configurable (%) (Mémoire configurable / Mémoire totale) × 100. 300 secondes
Mémoire affectée aux partitions logiques (%) (Mémoire affectée aux partitions logiques / mémoire configurable) × 100. 300 secondes
Microprogramme du système

Les métriques suivantes sont fournies pour le microprogramme:

Métrique Description Granularité
Unités de traitement utilisées Nombre d'unités de traitement utilisées par l'hyperviseur pour l'intervalle de temps spécifique. 300 secondes
Mémoire affectée (Mo) Quantité de mémoire (en mégaoctets) sur le système géré affectée au microprogramme du système pour l'intervalle de temps. 300 secondes
Pool de processeurs partagés (SPP)

Les métriques suivantes sont fournies pour le pool de traitement partagé associé à chaque système géré:

Métrique Description Granularité
Nom Nom du pool. 300 secondes
Unités de traitement autorisées La capacité de pool autorisée est la somme des capacités d'autorisation des partitions du pool de traitement partagé et de la capacité de pool réservée. 300 secondes
Unités de traitement affectées Nombre d'unités de traitement affectées au pool pour un intervalle de temps spécifique. 300 secondes
Unités de traitement utilisées (%) Pourcentage d'unités de traitement utilisées par les partitions du pool pour un intervalle de temps spécifique. (Unités de traitement utilisées / Unités de traitement affectées) × 100. 300 secondes
Unités de traitement disponibles (%) Pourcentage d'unités de traitement disponibles pour affectation pour l'intervalle de temps. (Unités de traitement disponibles / Unités de traitement affectées) × 100. 300 secondes
Unités de traitement utilisées Nombre d'unités de traitement utilisées par les partitions du pool pour un intervalle de temps donné. 300 secondes
Unités de traitement disponibles Nombre d'unités de traitement disponibles pour l'affectation pour l'intervalle de temps. 300 secondes
Unités de traitement réservées actuelles Nombre d'unités de traitement réservées à une utilisation temporaire par les partitions non bridées du pool de traitement partagé. 300 secondes
Unités de traitement autorisées utilisées (%) Valeur calculée. Par exemple, pour le pool de traitement partagé avec l'ID pool 0: [ ((Somme des unités de traitement utilisées pour toutes les machines virtuelles avec l'ID pool 0 )/ (Somme des unités de traitement autorisés de toutes les machines virtuelles avec l'ID pool 0 + Unités de traitement réservées en cours pour l'ID pool 0)) × 100 ]. 300 secondes
Pool de traitement partagé

Vous trouverez plus de détails sur chaque pool de processeurs partagés dans les tableaux de bord correspondants.

Taux d'utilisation du processeur SPP

Les métriques suivantes sont fournies pour les processeurs de chaque pool de traitement partagé:

Métrique Description Granularité
Unités de traitement autorisées La capacité de pool autorisée est la somme des capacités d'autorisation des partitions du pool de traitement partagé et de la capacité de pool réservée. 300 secondes
Unités de traitement utilisées Nombre d'unités de traitement utilisées par les partitions du pool pour un intervalle de temps donné. 300 secondes
Unités de traitement disponibles Nombre d'unités de traitement disponibles pour l'affectation pour l'intervalle de temps. 300 secondes
Unités de traitement réservées actuelles Nombre d'unités de traitement réservées à une utilisation temporaire par les partitions non bridées du pool de traitement partagé. 300 secondes
Unités de traitement utilisées (%) Pourcentage d'unités de traitement utilisées par les partitions du pool pour un intervalle de temps donné. (Unités de traitement utilisées / Unités de traitement affectées) × 100. 300 secondes
Unités de traitement disponibles (%) Pourcentage d'unités de traitement disponibles pour affectation pour l'intervalle de temps. (Unités de traitement disponibles / Unités de traitement affectées) × 100. 300 secondes
Unités de traitement autorisées utilisées (%) Valeur calculée. Par exemple, pour le pool de traitement partagé avec l'ID pool 0: [ ((somme des unités de traitement utilisées pour toutes les machines virtuelles avec l'ID pool 0 )/ (somme des unités de traitement autorisé de toutes les machines virtuelles avec l'ID pool 0 + unités de traitement actuellement réservées pour l'ID pool 0)) × 100 ]. 300 secondes
Partitions logiques pour chaque SPP

La liste des partitions logiques de chaque SPP s'affiche. Pour plus de détails, accédez au tableau de bord des LPAR en cliquant sur l'une d'entre elles.

Partitions logiques (LPAR)

Partitions logiques

La liste des partitions logiques de chaque système géré s'affiche. Pour plus de détails, accédez au tableau de bord des LPAR en cliquant sur l'une d'entre elles.

Les indicateurs clés de performance suivants sont fournis pour chaque partition logique:

Métrique Description Granularité
ID de partition Identifiant de partition de la LPAR concernée. 300 secondes
Nom Nom de la partition. 300 secondes
Etat Etat de la partition. 300 secondes
Mode Mode du processeur. Pour les processeurs dédiés, la valeur est spécifiée; pour les processeurs partagés, elle peut être plafonnée ou illimitée. 300 secondes
Mémoire logique Taille actuelle de la mémoire en mégaoctets. 300 secondes
Nombre maximal de processeurs virtuels Nombre maximal de processeurs virtuels attribués à la partition logique pendant un intervalle de temps donné. 300 secondes
Unités de traitement autorisées (%) (Unités de traitement utilisées / Unités de traitement attribuées) × 100. 300 secondes
Pondération de la capacité Indicateurs de capacité et de poids pour le processeur. Ne s'applique pas en mode plafonné. 300 secondes
Mettre à jour la date d'expiration de la clé d'accès Date d'expiration de la clé d'accès aux mises à jour d' AIX, en UTC. 300 secondes
Remarque : la date d'expiration de la clé d'accès de mise à jour sur HMC est exprimée en temps de l'époque de l' Unix e (en millisecondes) dans le fuseau horaire UTC. Lors de la création d'un événement pour cet indicateur, la condition d'alerte doit être définie à l'aide de la valeur de temps d'époque (UTC) Unix correspondant à la date et à l'heure auxquelles l'alerte doit se déclencher. Pour obtenir la valeur correcte, convertissez la date et l'heure au format lisible par l'utilisateur en heure de l'époque de l' Unix, en UTC, à l'aide d'un convertisseur fiable. Par exemple, un convertisseur en ligne est disponible à l'adresse suivante : https://www.epochconverter.com/.
Utilisation du processeur de partition logique

Les métriques suivantes sont fournies pour le processeur lié à chaque partition:

Métrique Description Granularité
Unités de traitement utilisées Nombre total d'unités de traitement utilisées pour un intervalle de temps donné. 300 secondes
Nombre maximal d'unités de traitement Nombre maximal d'unités de traitement affectées à la partition pour un intervalle de temps spécifique. 300 secondes
Unités de traitement autorisées Unités de traitement autorisées pour une partition pendant un intervalle de temps spécifique. 300 secondes
Unités de traitement autorisées utilisées (%) (Unités de traitement utilisées / Unités de traitement autorisé) × 100. 300 secondes
Capacité maximale du processeur pour une LPAR

La mesure suivante est fournie pour déterminer la capacité d'UC maximale utilisée.

Métrique Description Granularité
Utilisation de la capacité d'UC maximale (%) (Unités de traitement utilisées / Unités de traitement virtuelles en cours) × 100. 300 secondes
Mémoire de partition logique

Les métriques suivantes sont fournies pour la mémoire liée à chaque partition:

Métrique Description Granularité
Mémoire logique Mémoire logique en mégaoctets de la partition pendant cette période. 300 secondes
Physique sauvegardé Mémoire physique du pool de mémoire partagée qui sauvegarde l'espace adresse logique de la partition. 300 secondes
Total des E-S Taille de la mémoire autorisée par la partition pour la mappe d'E-S (en mégaoctets). 300 secondes
E-S mappées Taille de la mémoire sur laquelle la partition a des E-S mappées (en mégaoctets). 300 secondes
Réseau LPAR
Adaptateur Ethernet virtuel

Les métriques suivantes sont fournies pour les cartes Ethernet virtuelles associées à chaque partition:

Métrique Description Granularité
ID VLAN ID VLAN de la carte Ethernet virtuelle. 300 secondes
ID d'adaptateur ID de la carte Ethernet partagée. 300 secondes
ID VIOS ID du serveur VIOS auquel l'adaptateur est connecté. 300 secondes
ID VSwitch ID de commutateur virtuel de la carte Ethernet virtuelle. 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Paquets envoyés par seconde Nombre de paquets physiques envoyés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets reçus / s Nombre de paquets physiques reçus par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets supprimés par seconde Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Octets envoyés par seconde Nombre d'octets envoyés à l'adaptateur physique associé à un adaptateur virtuel. Il est par seconde pour un intervalle de temps spécifique. 300 secondes
Octets reçus / s Nombre d'octets reçus par l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps spécifique. 300 secondes
Octets transférés par seconde Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Octets physiques transférés par seconde Nombre d'octets transférés par l'adaptateur physique pour un intervalle de temps spécifique. 300 secondes
Ports logiques SR-IOV

Les métriques suivantes sont fournies pour les ports logiques SR-IOV associés à chaque partition:

Métrique Description Granularité
Index DRC Index DRC du port logique SR-IOV. 300 secondes
Mode d'unité VNIC Mode d'unité du contrôleur VNIC (Virtual Network Interface Controller). Les valeurs valides sont NonVNIC, SharedVNIC, et DedicatedVNIC. 300 secondes
Type de configuration Type de configuration du port logique SR-IOV : Non configuré, Ethernet, FC, FCoE, et RoCE. 300 secondes
ID du port physique ID du port physique de l'adaptateur physique associé pour le port logique SR-IOV. 300 secondes
Emplacement physique Code d'emplacement physique du port. 300 secondes
Paquets envoyés par seconde Nombre de paquets physiques envoyés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets reçus / s Nombre de paquets physiques reçus par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets supprimés par seconde Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Octets envoyés par seconde Nombre d'octets envoyés à l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets reçus / s Nombre d'octets reçus par l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets transférés par seconde Nombre d'octets transférés par seconde pour un intervalle de temps particulier via l'adaptateur physique associé à l'adaptateur virtuel. 300 secondes
Erreur en entrée par seconde Nombre d'erreurs reçues par seconde pour un intervalle de temps donné. 300 secondes
Erreur en sortie par seconde Nombre d'erreurs transmises par seconde pour un intervalle de temps donné. 300 secondes
Stockage LPAR
Adaptateurs virtuels génériques

Les métriques suivantes sont fournies pour les adaptateurs virtuels génériques associés à chaque partition:

Métrique Description Granularité
ID ID de l'adaptateur. 300 secondes
Type Type d'adaptateur. 300 secondes
ID VIOS ID du serveur VIOS auquel l'adaptateur est connecté. 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Non. De lectures / s Nombre de demandes de lecture transmises à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Non. Des écritures / s Nombre de demandes d'écriture envoyées à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets lus/s Nombre d'octets lus via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets écrits/s Nombre d'octets écrits via l'adaptateur par seconde pour un intervalle de temps donné. 300 secondes
Octets transmis par seconde Nombre d'octets transmis via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Adaptateur Fibre Channel virtuel

Les métriques suivantes sont fournies pour les adaptateurs Fibre Channel associés à chaque partition:

Métrique Description Granularité
Nom de port universel WWPN de l'adaptateur Fibre Channel. 300 secondes
WWPN2 WWPN2 de l'adaptateur Fibre Channel. 300 secondes
Nom de port universel de port physique WWPN du port physique. 300 secondes
ID VIOS ID du serveur VIOS auquel l'adaptateur est connecté. 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Non. De lectures / s Nombre de demandes de lecture transmises à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Non. Des écritures / s Nombre de demandes d'écriture envoyées à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets lus/s Nombre d'octets lus via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets écrits/s Nombre d'octets écrits via l'adaptateur par seconde pour un intervalle de temps donné. 300 secondes
Octets transmis par seconde Nombre d'octets transmis via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Vitesse d'exécution (en Gbit / s) Vitesse de fonctionnement de l'adaptateur Fibre Channel en GBPS. 300 secondes

Serveur d'E/S virtuelles (VIOS)

Serveurs d'E-S virtuels

La liste des VIOS pour chaque système géré s'affiche. Pour plus de détails, accédez au tableau de bord VIOS en cliquant sur l'un des VIOS.

Les indicateurs clés de performance suivants sont fournis pour chaque VIOS:

Métrique Description Granularité
ID de partition ID partition du serveur VIOS spécifique. 300 secondes
Nom Nom du serveur VIOS. 300 secondes
Etat Etat du serveur VIOS. 300 secondes
Mode Mode du processeur. La valeur du processeur dédié est donnée et les valeurs des processeurs partagés sont bridées ou non bridées. 300 secondes
Mémoire utilisée (%) (Mémoire utilisée en Mo / Mémoire affectée en Mo) × 100. 300 secondes
Unités de traitement autorisées (%) (Unités de traitement utilisées / Unités de traitement autorisé) × 100. 300 secondes
Utilisation du processeur VIOS

Les métriques suivantes sont fournies pour le processeur associé à chaque Virtual I/O Server:

Métrique Description Granularité
Unités de traitement utilisées Nombre total d'unités de traitement utilisées pour un intervalle de temps donné. 300 secondes
Nombre maximal d'unités de traitement Nombre maximal d'unités de traitement affectées à la partition pour un intervalle de temps donné. 300 secondes
Unités de traitement autorisées Unités de traitement autorisées pour une partition pendant un intervalle de temps spécifique. 300 secondes
Unités de traitement autorisées utilisées (%) (Unités de traitement utilisées / Unités de traitement autorisé) × 100. 300 secondes
Capacité maximale du processeur VIOS

Pourcentage de l'UC physique maximale disponible pour ce serveur VIOS qui est réellement utilisée.

Métrique Description Granularité
Utilisation de la capacité d'UC maximale (%) (Unités de traitement utilisées / Unités de traitement virtuelles en cours) × 100. 300 secondes
Mémoire VIOS

Les métriques suivantes sont fournies pour la mémoire liée à chaque serveur VIOS:

Métrique Description Granularité
Mémoire utilisée Utilisation globale de la mémoire (en mégaoctets) pour l'intervalle de temps. 300 secondes
Mémoire affectée Mémoire affectée au serveur VIOS. 300 secondes
Mémoire utilisée (%) (Mémoire utilisée en Mo / Mémoire affectée en Mo) × 100. 300 secondes
Réseau VIOS
Adaptateurs génériques

Les métriques suivantes sont fournies pour les adaptateurs génériques associés à chaque serveur VIOS:

Métrique Description Granularité
ID ID adaptateur. 300 secondes
Type Type de l'adaptateur. 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Paquets envoyés par seconde Nombre de paquets physiques envoyés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets reçus / s Nombre de paquets physiques reçus par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets supprimés par seconde Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Octets envoyés / s Nombre d'octets envoyés à l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets reçus / s Nombre d'octets reçus par l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets transférés / s Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Adaptateurs partagés

Les métriques suivantes sont fournies pour les adaptateurs partagés liés à chaque serveur VIOS:

Métrique Description Granularité
ID ID adaptateur. 300 secondes
Type Type de l'adaptateur. 300 secondes
Adaptateurs pontés Liste des ID des cartes génériques connectées à une carte Ethernet partagée (SEA). 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Paquets envoyés par seconde Nombre de paquets physiques envoyés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets reçus / s Nombre de paquets physiques reçus par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets supprimés par seconde Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Octets envoyés / s Nombre d'octets envoyés à l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets reçus / s Nombre d'octets reçus par l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets transférés / s Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Adaptateur Ethernet virtuel

Les métriques suivantes sont fournies pour les cartes Ethernet virtuelles associées à chaque serveur VIOS:

Métrique Description Granularité
ID VLAN ID VLAN. 300 secondes
ID VSwitch ID de commutateur virtuel. 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Paquets envoyés par seconde Nombre de paquets physiques envoyés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets reçus / s Nombre de paquets physiques reçus par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets supprimés par seconde Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Octets envoyés par seconde Nombre d'octets envoyés à l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets reçus / s Nombre d'octets reçus par l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets transférés par seconde Nombre de paquets physiques supprimés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Octets physiques transférés par seconde Nombre d'octets transférés par l'adaptateur physique pour un intervalle de temps donné. 300 secondes
Port logique SR-IOV

Les métriques suivantes sont fournies pour le port logique SR-IOV associé à chaque serveur VIOS:

Métrique Description Granularité
Index DRC Index DRC du port logique SR-IOV. 300 secondes
Emplacement physique Code d'emplacement physique du port. 300 secondes
Paquets envoyés par seconde Nombre de paquets physiques envoyés par l'adaptateur pendant l'intervalle de temps. 300 secondes
Paquets reçus / s Nombre de paquets physiques reçus par l'adaptateur pendant l'intervalle de temps. 300 secondes
Octets envoyés par seconde Nombre d'octets envoyés à l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets reçus / s Nombre d'octets reçus par l'adaptateur physique associé à l'adaptateur virtuel. Il est par seconde pour un intervalle de temps particulier. 300 secondes
Octets transférés par seconde Nombre d'octets transférés par seconde pour un intervalle de temps particulier via l'adaptateur physique associé à l'adaptateur virtuel. 300 secondes
Erreur en entrée par seconde Nombre d'erreurs reçues par seconde pour un intervalle de temps donné. 300 secondes
Erreur en sortie par seconde Nombre d'erreurs transmises par seconde pour un intervalle de temps donné. 300 secondes
Stockage VIOS
Adaptateurs physiques génériques

Les métriques suivantes sont fournies pour les adaptateurs physiques génériques liés à chaque serveur VIOS:

Métrique Description Granularité
ID ID de l'adaptateur. 300 secondes
Type Type d'adaptateur. 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Non. De lectures / s Nombre de demandes de lecture transmises à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Non. Des écritures / s Nombre de demandes d'écriture envoyées à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets lus/s Nombre d'octets lus via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets écrits/s Nombre d'octets écrits via l'adaptateur par seconde pour un intervalle de temps donné. 300 secondes
Octets transmis par seconde Nombre d'octets transmis via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Adaptateurs virtuels génériques

Les métriques suivantes sont fournies pour les adaptateurs virtuels génériques associés à chaque serveur VIOS:

Métrique Description Granularité
ID ID de l'adaptateur. 300 secondes
Type Type d'adaptateur. 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Non. De lectures / s Nombre de demandes de lecture transmises à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Non. Des écritures / s Nombre de demandes d'écriture envoyées à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets lus/s Nombre d'octets lus via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets écrits/s Nombre d'octets écrits via l'adaptateur par seconde pour un intervalle de temps donné. 300 secondes
Octets transmis par seconde Nombre d'octets transmis via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Adaptateurs Fibre Channel

Les métriques suivantes sont fournies pour les adaptateurs Fibre Channel associés à chaque serveur VIOS:

Métrique Description Granularité
ID ID de l'adaptateur. 300 secondes
Nom de port universel Nom WWPN (World Wide Port Name) de l'adaptateur Fibre Channel. 300 secondes
Nombre de ports Nombre de ports configurés dans chaque adaptateur Fibre Channel. 300 secondes
Emplacement physique Emplacement physique de la carte. 300 secondes
Non. De lectures / s Nombre de demandes de lecture transmises à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Non. Des écritures / s Nombre de demandes d'écriture envoyées à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets lus/s Nombre d'octets lus via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets écrits/s Nombre d'octets écrits via l'adaptateur par seconde pour un intervalle de temps donné. 300 secondes
Octets transmis par seconde Nombre d'octets transmis via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Vitesse d'exécution (en Gbit / s) Vitesse de fonctionnement de l'adaptateur Fibre Channel en GBPS. 300 secondes
Pool de stockage partagé

Les métriques suivantes sont fournies pour le pool de stockage partagé associé à chaque serveur VIOS:

Métrique Description Granularité
ID ID de l'adaptateur. 300 secondes
Non. De lectures / s Nombre de demandes de lecture transmises à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Non. Des écritures / s Nombre de demandes d'écriture envoyées à l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets lus/s Nombre d'octets lus via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Octets écrits/s Nombre d'octets écrits via l'adaptateur par seconde pour un intervalle de temps donné. 300 secondes
Octets transmis par seconde Nombre d'octets transmis via l'adaptateur par seconde pendant un intervalle de temps donné. 300 secondes
Espace total Espace total du pool de stockage partagé à la fin de l'intervalle de temps. 300 secondes
Espace utilisé Espace utilisé du pool de stockage partagé à la fin de l'intervalle de temps. 300 secondes

Réseau de systèmes gérés

Adaptateurs SR-IOV

Les métriques suivantes sont fournies pour les adaptateurs SR-IOV associés à chaque système géré:

Métrique Description Granularité
Index DRC Index DRC de l'adaptateur SR-IOV. 300 secondes
ID du port physique ID affecté au port physique. 300 secondes
Emplacement physique Code d'emplacement physique du port. 300 secondes
Paquets envoyés par seconde Nombre de paquets envoyés à l'adaptateur physique associé à la partition logique ou à l'adaptateur virtuel VIOS par seconde pendant un intervalle de temps donné. 300 secondes
Paquets reçus / s Nombre de paquets reçus par l'adaptateur physique associé à la partition logique ou à l'adaptateur virtuel VIOS par seconde pendant un intervalle de temps donné. 300 secondes
Paquets supprimés par seconde Nombre de paquets supprimés par l'adaptateur physique associé à la partition logique ou à l'adaptateur virtuel VIOS par seconde pendant un intervalle de temps donné. 300 secondes
Octets envoyés par seconde Nombre d'octets envoyés à l'adaptateur physique associé à la partition logique ou à l'adaptateur virtuel VIOS par seconde pendant un intervalle de temps donné. 300 secondes
Octets reçus / s Nombre d'octets reçus par l'adaptateur physique associé à la partition logique ou à l'adaptateur virtuel VIOS par seconde pour un intervalle de temps donné. 300 secondes
Octets transférés par seconde Nombre total d'octets transférés par seconde pour un intervalle de temps donné. Il s'agit de la somme de sentBytes et de receivedBytes. 300 secondes
Erreur en entrée par seconde Nombre d'erreurs reçues par seconde pour un intervalle de temps donné. 300 secondes
Erreur en sortie par seconde Nombre d'erreurs transmises par seconde pour un intervalle de temps donné. 300 secondes
Détails de la carte réseau virtuelle

Les métriques suivantes sont fournies pour les adaptateurs vNIC associés à chaque système géré:

Métrique Description Granularité
Numéro d'emplacement virtuel Numéro d'emplacement virtuel de l'adaptateur vNIC . 300 secondes
ID LPAR ID partition logique associé à l'adaptateur vNIC . 300 secondes
ID de reconfiguration dynamique ID de connecteur de reconfiguration dynamique de l'adaptateur vNIC . 300 secondes
ID VLAN du port ID VLAN de port associé à l'adaptateur vNIC . 300 secondes
Adresse MAC Adresse MAC associée à l'adaptateur vNIC . 300 secondes
Périphérique du système d'exploitation Nom d'unité du système d'exploitation associé à l'adaptateur vNIC . 300 secondes
Mode souhaité Mode de fonctionnement préféré de l'adaptateur vNIC . 300 secondes
partition logique Partition logique associée à l'adaptateur vNIC . 300 secondes
Device Type Type d'unité associé à l'unité de support. 300 secondes
Statut Statut de l'unité de support. 300 secondes
Priorité de reprise Priorité de basculement de l'unité de support. 300 secondes
ID d'adaptateur SRIOV associé ID adaptateur SR-IOV sauvegardé associé à l'adaptateur vNIC . 300 secondes
ID de port physique SRIOV ID port physique SR-IOV associé à l'adaptateur vNIC . 300 secondes

Surveillance énergétique des systèmes gérés

La surveillance de l'énergie fournit des informations sur les données de consommation d'énergie d'un système géré, ainsi que la chaleur générée par l'entrée, l'unité centrale et les cartes de base. Assurez-vous que le paramètre EnergyMonitorEnabled est activé pour le système géré.

Métrique Description Granularité
identificateur unique universel Identificateur unique universel (UUID) du système géré. 300 secondes
Nom Nom du système géré. 300 secondes
Consommation électrique (Watts) Puissance consommée par le système pour l'intervalle spécifique, en watts. 300 secondes
Type machine-Modèle Type et modèle de machine du système géré. 300 secondes
Numéro de série Numéro de série du système géré. 300 secondes
Type d'échantillon Type de l'exemple. 300 secondes
ID entité ID de l'entité. La valeur peut être entrée, unité centrale ou carte mère. 300 secondes
Instance d'entité Nom d'instance de l'entité. La valeur peut être entrée, unité centrale ou carte mère. 300 secondes
Relevé de température Chaleur générée par les entités pour l'intervalle de temps, en degrés Celsius. 300 secondes

Pour définir des alertes pour les métriques de température d'entrée, procédez comme suit:

  1. Dans le menu de navigation de l'interface utilisateur d' Instana, sélectionnez Paramètres > Paramètres généraux > Alertes.

  2. Créez une alerte. Pour plus d'informations sur la création d'une alerte, consultez la section « Configurer une alerte ».

  3. Cliquez sur « Événements » dans la section « Paramètres généraux », puis cliquez sur « Nouvel événement ». La boîte de dialogue « Créer un nouvel événement » s'ouvre.

  4. Dans la boîte de dialogue « Créer un nouvel événement », saisissez les valeurs suivantes :

    Détails de l'événement :

    • Nom: pHMC System
    • Description : Inlet Temperature Reading > inletTemperatures.{entityid}.temperatureReading
    • Gravité du problème : contains
    • Incident : <_Entity ID in Inlet Temperatures Table_>
    • Délai de grâce : _min_

    État :

    • Source : Built-in metrics
    • Type d'entité : pHMC System
    • Métrique: Inlet Temperature Reading (inletTemperatures.{entityid}.temperatureReading)
    • Opérateur de correspondance : : contains
    • Identité : <_Entity ID in Inlet Temperatures Table_>
    • Agrégation: min
    • Opérateur:
    • Nombre :<_threshold count_>

Pour définir l'alerte de relevé de température de l'unité centrale et de la carte mère, suivez les étapes précédentes et entrez les valeurs suivantes dans la section Condition :

  • Métrique: CPU Temperature Reading > cpuTemperatures.{entityid}.temperatureReading

  • Identité : <_Entity ID in CPU Temperatures Table_>

  • Métrique: Baseboard Temperature Reading > baseBoardTemperatures.{entityid}.temperatureReading

  • Identité : <_Entity ID in Baseboard Temperatures Table_>

Figure 1. Créer un événement HMC « IBM Power »
Créer un événement HMC « IBM Power ».

Gérer les événements à partir du système géré et de la console HMC

Des événements sont déclenchés par les systèmes gérés et les HMC en cas de défaillance ou d'incident. Les types d'événements suivants sont envoyés à Instana :

  • Messages matériels provenant des systèmes gérés
  • Événements de console provenant des HMC

Ces événements s'affichent sur la page Événements du site Instana avec le niveau de gravité « Critique ».

Traitement des incidents

  • 403 Accès interdit Le code d'état de réponse « 403 Accès interdit » ( HTTP ) indique que le serveur comprend la requête mais refuse de l'autoriser.

    Solution: Vérifiez les données d'identification fournies dans le fichier configuration.yaml avec tous les droits requis pour l'utilisateur.

  • 204 Aucun contenu Le code de réponse « 204 Aucun contenu » ( HTTP ) indique qu'une requête a abouti, mais que le serveur ne renvoie aucun contenu.

    Solution : Le capteur Power HMC utilise les métriques agrégées et les données de requêtes d' API s des 5 dernières minutes (voir la fréquence d'interrogation dans la configuration) provenant de Power HMC. Il arrive parfois que le décalage horaire du serveur HMC entraîne une divergence dans l'horodatage. Par conséquent, API renvoie le 204code d'erreur, car aucun contenu n'est disponible. Pour contourner ce problème, définissez le fuseau horaire du serveur Power HMC sur UTC.

  • Importer les certificats auto-signés utilisés par le serveur Power HMC. Si le serveur Power HMC utilise un certificat auto-signé, assurez-vous qu'il est bien importé dans le fichier cacert de la JVM. Par ailleurs, si vous constatez l'exception suivante dans le journal, cela signifie que le serveur Power HMC utilise un certificat auto-signé, et qu'il doit être importé dans le fichier cacert de la JVM. sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target. PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target.

    Solution : Importez un certificat auto-signé en suivant les instructions fournies dans la section « Certificat auto-signé ».

  • Le certificat auto-signé comporte un nom alternatif du sujet (SAN) non valide. Le certificat de serveur n'est pas valide si le SAN ne contient pas l'adresse IP attendue.

    Solution: Corrigez le certificat serveur et importez-le à nouveau.