Surveillance de Kubernetes

Versions prises en charge

Instana prend actuellement en charge les versions stables les plus récentes d' Kubernetes Conformément à la politique de compatibilité des versions d' Kubernetes, Instana prend en charge la dernière version d' Kubernetes ainsi que les quatre versions précédentes. Toutefois, les deux premières versions sont considérées comme étant en voie de dépréciation progressive.

Par exemple, si la dernière version disponible est 1.31, alors Instana prend en charge les versions 1.31, 1.30, 1.29, 1.28 et 1.27, les versions 1.28 et 1.27 étant considérées comme obsolètes (mais toujours compatibles).

Paramètre	Idéal pour	Considérations
1s	Diagnostic approfondi, détection rapide des transitoires	Génère davantage de bruit et augmente les coûts d'infrastructure; peut faire apparaître des anomalies transitoires
10s	La plupart des cas d'utilisation des clients	Offre un bon équilibre entre réactivité et qualité du signal; détecte les changements importants sans accorder trop d'importance aux pics de courte durée
30s	environnements à grande échelle, où le coût est un facteur déterminant et qui sont stables	Détection plus lente des problèmes; les problèmes passagers risquent de ne pas être détectés

Métrique	Description
Allocation de pods	Rapport entre les pods alloués et la capacité des pods
Allocation des demandes d'UC	Rapport entre les demandes d'UC et la capacité d'UC
Allocation des limites d'UC	Rapport entre les limites d'UC et la capacité d'UC
Allocation des demandes de mémoire	Rapport entre les demandes de mémoire et la capacité de mémoire
Allocation des limites de mémoire	Rapport entre les limites de mémoire et la capacité de mémoire
Demandes d'UC	Demandes d'UC agrégées de tous les conteneurs en cours d'exécution
Limites d'UC	Limites d'UC agrégées de tous les conteneurs en cours d'exécution
Capacité d'UC	Capacité d'UC agrégée de tous les nœuds
Demandes de mémoire	Demandes de mémoire agrégées de tous les conteneurs en cours d'exécution
Limites de mémoire	Limites de mémoire agrégées de tous les conteneurs en cours d'exécution
Capacité de mémoire	Capacité de mémoire agrégée de tous les nœuds
Pods en cours d'exécution	Nombre de tous les pods en cours d'exécution dans ce cluster
Pods en attente	Nombre de tous les pods en attente dans ce cluster
Pods alloués	Nombre de tous les pods alloués dans ce cluster
Capacité des pods	Capacité des pods agrégée de tous les nœuds
Nœuds à court d'espace disque	Nombre de nœuds à court d'espace disque dans le cluster
Nœuds avec dépassement de mémoire	Nombre de nœuds avec dépassement de mémoire dans le cluster
Nœuds avec dépassement de disque	Nombre de nœuds avec dépassement de disque dans le cluster
Nœuds pour lesquels Kubelet est désactivé	Nombre de nœuds kubelet dont l'état est « Ready=False » dans ce cluster
Nœuds Kubelet pas prêts	Nombre de nœuds kubelet dont le statut est « Ready=Unknown » ou « Ready=False » dans ce cluster
Répliques disponibles	Répliques disponibles à partir de tous les déploiements
Répliques souhaitées	Répliques souhaitées à partir de tous les déploiements
Nombre de nœuds	Nombre de nœuds dans ce cluster

Métrique	Description
Durée du dernier travail	Durée de la dernière exécution du travail
Travaux actifs	Nombre de travaux actifs
Heure du dernier travail planifié	Depuis combien de temps un travail pour ce cronjob a été planifié

Métrique	Description
Répliques disponibles	Nombre de répliques disponibles
Répliques souhaitées	Nombre de répliques souhaitées
Répliques disponibles	Nombre de répliques non disponibles
Répliques planifiées incorrectement	Nombre de répliques planifiées incorrectement
Rapport entre les répliques désirées et les répliques souhaitées	Rapport entre les répliques désirées et les répliques souhaitées

Métrique	Description
Pods actifs	Nombre de pods actif dans ce travail
Pods ayant échoué	Nombre de pods ayant échoué dans ce travail
Pods ayant abouti	Nombre de pods ayant abouti dans ce travail
Durée du travail	Durée de l'exécution du travail

Métrique	Description
Demandes d'UC	Demandes d'UC agrégées pour ce service
Limites d'UC	Limites d'UC agrégées pour ce service
Demandes de mémoire	Demandes de mémoire agrégées pour ce service
Limites de mémoire	Limites de mémoire agrégées pour ce service

Métrique	Description
Capacité des demandes de mémoire	Mémoire maximale prise en charge pour les demandes de mémoire sur cet espace-noms
Demandes de mémoire utilisées	Quantité de mémoire allouée aux demandes de mémoire utilisées
Capacité des limites de mémoire	Mémoire maximale prise en charge pour les limites de mémoire sur cet espace-noms
Limites de mémoire utilisées	Quantité de mémoire allouée aux limites de mémoire utilisées
Capacité des demandes d'UC	Nombre maximal d'UC prises en charge pour les demandes d'UC sur cet espace-noms
Demandes d'UC utilisées	Quantité d'UC allouée aux demandes d'UC utilisées
Capacité des limites d'UC	Nombre maximal d'UC prises en charge pour les limites d'UC sur cet espace-noms
Limites d'UC utilisées	Quantité d'UC allouée aux limites d'UC utilisées
Pods utilisés	Nombre de pods utilisés pour cet espace de nom
Capacité des pods	Nombre de pods l'espace-noms peut prendre
Allocation de pods utilisés	Rapport entre les pods utilisés et la capacité des pods
Allocation des demandes d'UC	Rapport entre les demandes d'UC et la capacité d'UC
Allocation des limites d'UC	Rapport entre les limites d'UC et la capacité d'UC
Allocation des demandes de mémoire	Rapport entre les demandes de mémoire et la capacité des demandes de mémoire
Allocation des limites de mémoire	Rapport entre les limites de mémoire et la capacité des limites de mémoire
Allocation de pods	Rapport entre les pods alloués et la capacité de pod

Métrique	Description
Pods alloués	Nombre de pods alloués sur ce nœud
Capacité des pods	Nombre de pods que le nœud peut prendre
Demandes de mémoire	Demandes de mémoire agrégées de tous les conteneurs en cours d'exécution de cette configuration de déploiement
Limites de mémoire	Limites de mémoire agrégées de tous les conteneurs en cours d'exécution de cette configuration de déploiement
Capacité de mémoire	Mémoire maximale prise en charge sur ce nœud
Demandes d'UC	Demandes d'UC agrégées de tous les conteneurs en cours d'exécution sur ce nœud
Limites d'UC	Limites d'UC agrégées de tous les conteneurs en cours d'exécution sur ce nœud
Capacité d'UC	Nombre maximal d'UC prises en charge sur ce nœud
Allocation de pods	Rapport entre les pods alloués et la capacité de pod
Allocation des demandes d'UC	Rapport entre les demandes d'UC et la capacité d'UC
Allocation des limites d'UC	Rapport entre les limites d'UC et la capacité d'UC
Allocation des demandes de mémoire	Rapport entre les demandes de mémoire et la capacité de mémoire
Allocation des limites de mémoire	Rapport entre les limites de mémoire et la capacité de mémoire

Métrique	Description
Nombre de conteneurs	Nombre de conteneurs pour ce pod
Demandes d'UC	Demandes d'UC agrégées sur tous les conteneurs de ce nœud
Limites d'UC	Limites d'UC agrégées sur tous les conteneurs de ce nœud
Demandes de mémoire	Demandes de mémoire agrégées sur tous les conteneurs de ce nœud
Limites de mémoire	Limites de mémoire agrégées sur tous les conteneurs de ce nœud
Nombre de redémarrages	Redémarrages agrégés sur tous les conteneurs de cet nœud

Métriques	Description
Répliques en cours	Nombre de répliques disponibles
Répliques souhaitées	Nombre de répliques souhaitées
Nombre maximal de répliques	Le nombre maximal de répliques jusqu'auquel l'autoscaler peut augmenter la capacité
Nombre minimal de répliques	Le nombre minimum de répliques jusqu'auquel l'autoscaler peut réduire la capacité
Répliques actuelles / Nombre maximal de répliques	Rapport entre le nombre actuel de répliques et le nombre maximal de répliques
Répliques actuelles / Nombre minimum de répliques	Rapport entre le nombre actuel de répliques et le nombre minimum de répliques
Observed Generation	La dernière génération de répliques prise en compte par l'autoscaler

Métriques	Description
Nom de classe de stockage	Nom de `StorageClass` l'objet utilisé pour créer ce PV
Capacité totale ( GiB )	Capacité totale du parc photovoltaïque d' GiB
Capacité utilisée ( GiB )	Capacité photovoltaïque exploitée à l' GiB
Utilisation	Rapport entre la capacité utilisée de l'installation photovoltaïque et sa capacité totale, exprimé en pourcentage
Phase	Phase actuelle du PV, qui peut être `Available`, `Bound`, `Released`, ou `Failed`
Mode d'accès	Mode d'accès au PV

Fournisseur de cloud	Nom	Fournisseur	Support
GCP	PersistentDisk	pd.csi.storage.gke.io	✅
GCP	Hyperdisk	pd.csi.storage.gke.io	✅
GCP	Compartiment	gcsfuse.csi.storage.gke.io	✅
GCP	fileStore	filestore.csi.storage.gke.io	✅
AWS	Elastic Block Storage (EBS)	ebs.csi.aws.com	✅
AWS	File Storage d'Elastic ( EFS )	efs.csi.aws.com	✅
AWS	Amazon FSx / Amazon File Cache	filecache.csi.aws.com	✅
AWS	S3	s3.csi.aws.com	✅
Azure	CSI géré	disk.csi.azure.com	✅
Azure	CSI Premium géré	disk.csi.azure.com	✅
Azure	CSI Azure File	file.csi.azure.com	✅
Azure	Azure File CSI Premium	file.csi.azure.com	✅
IBM	Block Storage	vpc.block.csi.ibm.io	✅
IBM	File Storage	vpc.file.csi.ibm.io	✅
IBM	Cloud Object Storage	ibm.io/ibmc-s3fs	✅
Openshift	Ceph RBD Block Storage	openshift-storage.rbd.csi.ceph.com	✅
Openshift	CephFS	openshift-storage.cephfs.csi.ceph.com	✅
Openshift	Ceph RGW	openshift-storage.object.csi.ceph.com	✅
Openshift	Nooba	openshift-storage.noobaa.io/obc	✅

Métriques	Description
Capacité totale ( GiB )	Capacité totale de l'usine de PVC d' GiB
Capacité utilisée ( GiB )	Capacité de production de PVC utilisée à l' GiB
Utilisation	Rapport entre la capacité utilisée du PVC et sa capacité totale, exprimé en pourcentage
Phase	Phase actuelle du PVC, qui peut être `Available`, `Bound`, `Released`, ou `Failed`
Mode d'accès	Mode d'accès au PVC

Surveillance de Kubernetes

Versions prises en charge

Services Kubernetes gérés pris en charge

Maillages de services pris en charge

Installation de l'agent Instana dans Kubernetes

Kubernetes capteurs

Capteur hérité Kubernetes

Installation

Vérification de l'état et de la version du capteur existant

Traitement des incidents

Nouvelle génération K8sensor

Installation

Optimiser l'ingestion des données grâce à la configuration de l'intervalle d'interrogation

Vérification de l'état et de la version d' K8sensor

Activation de l'auto-scaling (HPA) pour « K8sensor » (solution de contournement)

Prérequis

Procédure

Traitement des incidents

Accès aux informations Kubernetes

Kubernetes page

Tableaux de bord Kubernetes

Utilisation de l'UC et de la mémoire

Page Applications

Page Infrastructure

Kubernetes Assistant IA

Analyse des appels d' Kubernetes

Analyse des journaux d' Kubernetes

Liaison des services Kubernetes et des services logiques

Liaison d'un service Kubernetes unique à plusieurs services logiques

Liaison d'un service logique unique à plusieurs services Kubernetes

Affichage des mesures

Cluster

CronJob

DaemonSet

Déploiement

Travail

Service Kubernetes

Espace de nom

Noeud

Pod

StatefulSet

Autoscalers de pods horizontaux (HPA)

Volume persistant (PV)

Surveillance des installations photovoltaïques

Configurer une alerte intelligente pour le photovoltaïque

Prise en charge des classes de stockage

Réservation de volume persistant (PVC)

Surveillance du PVC

Configurer une alerte intelligente pour le PVC

Surveillance du plan de contrôle

Accéder à la surveillance du plan de contrôle dans l'interface utilisateur

Informations de débogage

Règles d'intégrité

Intégré

Personnalisé

Contrôle d'accès basé sur les rôles (RBAC) requis pour l'installation de l'agent d' Instana

Instana opérateur

Instana agent ( DaemonSet )

K8Sensor (déploiement)

Contrôle d'accès basé sur les rôles (RBAC) requis pour le webhook « AutoTrace »

Pod de webhook en cours de mise à jour

Conteneur d'initialisation de l'instrumentation

Suivi de l' Java, via Istio ou OpenShift ServiceMesh

Surveiller à l'aide de agent.serviceMesh.enabled l'option

Surveillance à l'aide du contournement du maillage de services (obsolète)

Débogage de la fonction permettant d'ignorer le maillage de services

Vérifier si la fonction est activée

Vérifier les règles iptable

Remarques sur le dépannage

Pourquoi est-ce que je ne vois aucun cluster ou espace de nom Kubernetes ?

Droits ClusterRole manquants

Surveillance des ressources personnalisées

Création d'un service « ClusterRole » pour la surveillance des ressources personnalisées

Créer un fichier « ClusterRoleBinding »

Collecte des journaux

Étapes pour la collecte des journaux

Activer la journalisation de débogage pour le dépannage

Utilisation de la ressource personnalisée « agent » d' Instana

Utilisation d'un graphique « Helm »

Surveiller à l'aide de `agent.serviceMesh.enabled` l'option