Surveillance de Ceph

Le capteur « Ceph » est automatiquement déployé et installé une fois que vous avez installé l'agent « Instana ».

Informations de support

Pour vous assurer que le capteur d' Ceph s est compatible avec votre configuration actuelle, consultez les sections d'informations d'assistance suivantes :

Versions prises en charge et politique d'assistance

Le capteur prend en charge les versions suivantes d' Ceph :

  • Squid (19)
  • Reef (18 ans)
  • Quincy (17 ans)
  • Pacifique (16)
  • Pieuvre (15)
  • Nautilus (14)
  • Mimique (13)
  • Lumineux (12)
  • Kraken (11)

Le tableau suivant présente la dernière version prise en charge et la politique d'assistance :

Technologie Politique de support Dernière version technologique Dernière version prise en charge
Ceph A la demande 19.2.2 19.2.2

Pour plus d'informations sur la politique d'assistance, consultez la section « Stratégie d'assistance pour les capteurs ».

Configuration

Pour activer la surveillance approfondie des métriques, l'agent requiert le chemin d'accès de l'exécutable Ceph. Vous pouvez le configurer ici <agent_install_dir>/etc/instana/configuration.yaml:

com.instana.plugin.ceph:
  enabled: true # enabled (true) by default.
  ceph-executable-path: '/usr/bin/ceph'
  poll_rate: 10 # values are in seconds. Default value is 5 seconds.
Remarque : si l'intervalle d'interrogation n'est pas spécifié, la valeur par défaut est de 5 secondes.

Collecte des métriques

Pour consulter les métriques, sélectionnez « Infrastructure » dans la barre latérale de l'interface utilisateur d' Instana, cliquez sur un hôte surveillé spécifique, puis vous verrez s'afficher un tableau de bord de l'hôte contenant toutes les métriques collectées et les processus surveillés.

Données de configuration

Ces données de configuration incluent :

  • ID système de fichiers (fsid)-identificateur unique du cluster
  • Nom du cluster
  • Version
  • Statut global du cluster
  • Pools

Métriques de performance

Cluster

Métrique Description
Temps d'attente de validation Temps nécessaire pour valider une opération dans le journal (en millisecondes)
Temps d'attente d'application Temps nécessaire pour répercuter une mise à jour sur les disques (en millisecondes)
Tous les OSD Nombre de démons de stockage connus
Jusqu'aux OSD Quantité de messages qui ont été reconnus dans toutes les files d'attente
Dans les OSD Nombre de démons de stockage en ligne
ODS presque pleins Nombre de démons de stockage presque pleins
Démons de stockage complets Nombre de démons de stockage en ligne pleins
Tous les moniteurs Nombre de démons de moniteur
Moniteurs sains Nombre de démons de moniteur sains
Lecture (octets/s) Nombre d'octets par seconde lus
Ecriture (octets/s) Octets par seconde écrits
Opérations de lecture Opérations de lecture par seconde pour le pool donné
Opérations d'écriture Opérations d'écriture par seconde pour le pool donné
Capacité utilisée Utilisation globale de la capacité du cluster
Tous les pools Nombre de pools
Tous les objets Nombre d'objets
Tous les PG Nombre de groupes de placement (PG)
PG à l'état active+clean Nombre de groupes de placement (PG) à l'état active+clean

Pool

Métrique Description
Capacité utilisée Utilisation de la capacité de cluster globale pour un pool donné
Tous les objets Nombre d'objets pour un pool donné
Octets de lecture Octets lus par pool
Octets d'écriture Octets écrits par pool
Lecture (octets/s) Nombre d'octets lus par seconde pour le pool donné
Ecriture (octets/s) Nombre d'octets écrits par seconde pour le pool donné
Opérations de lecture Opérations de lecture par seconde pour le pool donné
Opérations d'écriture Opérations d'écriture par seconde pour le pool donné

Signatures d'intégrité

Pour chaque capteur, il existe une base de connaissances des signatures d'intégrité qui sont évaluées en permanence par rapport aux métriques entrantes et qui sont utilisées pour traiter les problèmes ou les incidents en fonction de l'impact sur l'utilisateur.

Les événements intégrés déclenchent des problèmes ou des incidents en fonction de signatures de santé défaillantes sur des entités, tandis que les événements personnalisés déclenchent des problèmes ou des incidents en fonction des seuils d'une métrique spécifique à une entité donnée.

Pour plus d'informations sur les événements intégr és du capteur « Ceph », consultez la référence sur les événements intégrés.