Surveillance de Kafka
Vous pouvez surveiller votre environnement Kafka grâce au capteur Instana Kafka afin d'obtenir une visibilité de bout en bout, d'identifier les goulots d'étranglement des performances et d'optimiser ces dernières. Une fois l'agent hôte d' Instana s installé, celui-ci déploie automatiquement le capteur Kafka, qui collecte des métriques en temps réel. L' Instana e les appels de messagerie vers Kafka émis par les processus surveillés et capture les traces tout au long de votre flux de messagerie. Vous pouvez consulter à la fois les métriques et les traces dans l'interface utilisateur d' Instana.
Pour plus d'informations sur le traçage d' Kafka s, consultez la section « Traçage côté client pris en charge ». À l'heure actuelle, la corrélation entre les traces de flux de messages et l'infrastructure d' Kafka s n'est pas prise en charge.
Informations de support
Pour vous assurer que le capteur d' Kafka s est compatible avec votre configuration actuelle, consultez les sections suivantes de la documentation d'assistance :
Versions prises en charge et politique d'assistance
Toutes les métriques d' Kafka s collectées par Instana sont disponibles pour toutes les versions de Apache Kafka, Cloudera Kafka et Confluent Kafka, à l'exception de la métrique « Consumer group lag » et des métriques « Consumer/Producer Byte Rate/Throttling ». IBM® Event Streams, qui repose sur l' Apache Kafka open source, est pris en charge à partir de la version IBM Event Streams 11.0.4 ( IBM Event Streams Operator 3.0.5 ) et des versions ultérieures.
Le tableau suivant présente la dernière version prise en charge et la politique d'assistance :
| Technologie | Politique de support | Dernière version technologique | Dernière version prise en charge |
|---|---|---|---|
| Apache Kafka | 45 jours | 4.3.0 | 4.2.0 |
| Cloudera Kafka | 45 jours | 4.1.x | 4.1.x |
| Confluent Kafka | 45 jours | 8.3.0 | 8.1.0 |
| IBM Flux d'événements | A la demande | 12.3 | 11.6 |
Pour plus d'informations sur la politique d'assistance, consultez la section « Stratégie d'assistance pour les capteurs ».
Mécanismes d'authentification pris en charge
- Texte en clair
- SASL_PLAINTEXT
- SSL
Informations complémentaires sur l'assistance
Les métriques de retard de groupe de consommateurs sont disponibles pour les versions suivantes:
- Apache Kafka (avec Zookeeper) versions de 0.11.x.x à 3.9.0
- Apache Kafka (avec KRaft) versions disponibles sur 3.9.0
- Cloudera Kafka versions de 3.x.x à 4.1.x
- Confluent Kafka versions disponibles sur 3.3.x
- IBM Event Streams version 11.0.4 ( IBM Event Streams Operator 3.0.5 ) et versions ultérieures
Les indicateurs de débit et de régulation de la consommation/production ne sont disponibles que pour les clients Java Kafka et pour les versions suivantes :
- Apache Kafka versions disponibles sur 1.1.x
- Versions de Cloudera Kafka de 4.0.x à 4.1.x
- Confluent Kafka versions disponibles sur 4.1.x
- IBM Event Streams version 11.0.4 ( IBM Event Streams Operator v3.0.5 ) et versions ultérieures
Prise en charge du traçage côté client
Protocoles d'authentification pris en charge
Instana prend en charge les protocoles de sécurité suivants d' Kafka pour la surveillance et la collecte de mesures de latence côté utilisateur :
- TEXTE CLAIR : Pas d'authentification ni de chiffrement (par défaut)
- SSL : SSL / TLS connexions cryptées avec authentification client facultative
- SASL_PLAINTEXT : authentification SASL (mécanisme PLAIN) sur des connexions en texte clair
Configuration
L'agent « Instana » détecte automatiquement l'agent « Kafka » en cours d'exécution. Aucune configuration n'est donc nécessaire.
Instana rassemble les 400 premiers sujets, classés par nom de sujet.
Si vous avez besoin de filtrer les sujets, vous pouvez le configurer dans le fichier de <agent_install_dir>/etc/instana/configuration.yaml configuration de l'agent, comme le montre l'exemple suivant :
com.instana.plugin.kafka:
poll_rate: 1 # value is in seconds. Default value is 1 second.
topicsRegex: '<OPTIONAL_REGEX_HERE>'
brokerPropertiesFilePath: '/path/to/server.properties'
controllerPropertiesFilePath: '/path/to/controller.properties' # Optional
collectLagData: '' # true or false. The default value is true
poll_rate: Définit la fréquence d'interrogation en secondes; la valeur par défaut est 1.topicsRegex: expression régulière facultative pour sélectionner jusqu'à 400 rubriques par nom. Si la valeur est vide ou n'existe pas, Instana récupère les 400 premiers sujets, classés par nom.brokerPropertiesFilePath: Chemin d'accès au fichier duserver.propertiescourtier utilisé par l'agent pour obtenir des informations sur le réseau du courtier et les paramètres du protocole de sécurité.controllerPropertiesFilePath: (Facultatif) Chemin d'accès au fichier du contrôleurcontroller.propertiesKRaft pour les déploiements en mode KRaft.collectLagData: Option permettant d'activer ou de désactiver la collecte des données de latence (activée par défaut).
Si le chemin d'accès aux propriétés du courtier n'est pas indiqué, l'agent tente de les trouver server.properties aux emplacements suivants :
- Arguments de processus du courtier Kafka.
KAFKA_SERVER_PROPERTIESvariable d'environnement- En utilisant les chemins prédéfinis :
/path_to_kafka_home/config/server.propertiesou/path_to_kafka_home/etc/kafka/server.propertiespour l' Confluent Kafka
L'Agent utilise /opt/kafka/config/server.properties comme chemin par défaut lorsque le chemin vers ne peut server.properties être trouvé par aucune des méthodes mentionnées précédemment.
Pour les déploiements en mode KRaft avec des nœuds de contrôleur distincts, l'agent recherche /opt/kafka/config/controller.properties également comme chemin par défaut.
Configuration de la fréquence d'interrogation
Vous pouvez configurer la fréquence à laquelle l' Instana interroge Kafka pour collecter des données et des métriques en utilisant le poll_rate paramètre dans le fichier de configuration.yaml l'agent, comme le montre l'exemple suivant :
com.instana.plugin.kafka:
poll_rate: 1 # value is in seconds. Default value is 1 second.
Prise en charge de SSL/TLS
Si votre instance de broker Kafka utilise le protocole de sécurité SSL, configurez l'agent Instana via <agent_install_dir>/etc/instana/configuration.yaml afin d'activer la collecte des métriques de latence des consommateurs, comme illustré dans l'exemple suivant :
com.instana.plugin.kafka:
sslTrustStore: '/path/to/truststore.jks'
sslTrustStorePassword: 'kafkaTsPassword'
sslKeyStore: '/path/to/sslKeyStoreFile.jks'
sslKeyStorePassword: 'kafkaKsPassword'
Prise en charge de SASL
Si votre instance du broker Kafka utilise le protocole de sécurité SASL_PLAINTEXT avec le mécanisme d'authentification PLAIN, configurez l'agent Instana via <agent_install_dir>/etc/instana/configuration.yaml pour activer la collecte des métriques de latence des consommateurs, comme illustré dans l'exemple suivant :
com.instana.plugin.kafka:
saslUsername: 'kafkaUser'
saslPassword: 'kafkaPassword'
Assurez-vous que les clés sont au format Keystore JKS ( Java ). Utilisez l'outil keytool pour créer les clés.
JMX prise en charge de l'authentification
Si l'authentification via JMX est activée pour votre Kafka, vous devez configurer l'agent Instana en utilisant <agent_install_dir>/etc/instana/configuration.yaml pour authentifier votre JMX, comme indiqué dans l'exemple suivant :
com.instana.plugin.kafka:
jmxUsername: ''
jmxPassword: ''
jmxPort: '' # default jmx port is 1099
Configuration des en-têtes de corrélation de trace d' Kafka
Vous pouvez configurer le format des en-têtes de corrélation de trace d' Kafka, qui sont utilisés par les traceurs d' Instana. Pour plus d'informations, consultez la section « Configuration des en-têtes de corrélation des traces d' Kafka ».
Noeud Kafka - Collecte des métriques
Kafka La collecte des métriques des nœuds permet de recueillir et d'analyser des données relatives aux performances et à l'état de santé de chaque nœud au sein d'un cluster d' Kafka.
Données de configuration
Vous avez besoin des informations suivantes pour configurer un nœud d' Kafka :
- Version
- Zookeeper Connects (pour le mode Zookeeper) ou Controller Quorum Voters (pour le mode KRaft)
- ID du processus
- ID du noeud
- Sujets/Partitions
Métriques de performance
Le tableau suivant présente les détails des indicateurs de performance :
| Métrique | Description | Granularité |
|---|---|---|
| Temps total de production | Durée totale, en millisecondes, nécessaire pour traiter la requête spécifiée, telle qu'elle a été kafka.network:type=RequestMetrics,name=TotalTimeMs,request=Produceenregistrée. |
1 seconde |
| Temps total du consommateur d'extraction | Durée totale, en millisecondes, nécessaire pour traiter la requête spécifiée, telle qu'elle a été kafka.network:type=RequestMetrics,name=TotalTimeMs,request=FetchConsumerenregistrée. |
1 seconde |
| Temps total de suivi d'extraction | Durée totale, en millisecondes, nécessaire pour traiter la requête spécifiée, telle qu'elle a été kafka.network:type=RequestMetrics,name=TotalTimeMs,request=FetchFollowerenregistrée. |
1 seconde |
Trafic de courtier
Le tableau suivant présente les détails du trafic des courtiers :
| Métrique | Description | Granularité |
|---|---|---|
| Entrant | Débit binaire entrant total et source de collectekafka.server:type=BrokerTopicMetrics,name=BytesInPerSec. |
1 seconde |
| Sortant | Débit total en sortie (en octets) et source de collectekafka.server:type=BrokerTopicMetrics,name=BytesOutPerSec. |
1 seconde |
| Rejeté | Taux global d'octets rejetés et source de collectekafka.server:type=BrokerTopicMetrics,name=BytesRejectedPerSec. |
1 seconde |
Messages de courtier entrants
Le tableau suivant présente les détails des messages du courtier :
| Métrique | Description | Granularité |
|---|---|---|
| Nombre | Taux global des messages entrants et source de collectekafka.server:type=BrokerTopicMetrics,name=MessagesInPerSec. |
1 seconde |
Demandes de production
Le tableau suivant présente les détails des requêtes générées :
| Métrique | Description | Granularité |
|---|---|---|
| Nombre | Taux de demande et source de collectekafka.network:type=RequestMetrics,name=RequestsPerSec,request=Produce. |
1 seconde |
| Temps d'attente moyen | La latence moyenne est calculée en divisant le nombre (mentionné précédemment) par le temps total, en millisecondes, nécessaire pour traiter la kafka.network:type=RequestMetrics,name=TotalTimeMs,request=Producerequête spécifiée. |
1 seconde |
Demandes d'extraction du consommateur
Le tableau suivant présente les détails des requêtes des consommateurs récupérées :
| Métrique | Description | Granularité |
|---|---|---|
| Nombre | Taux de demande et source de collectekafka.network:type=RequestMetrics,name=RequestsPerSec,request=FetchConsumer. |
1 seconde |
| Temps d'attente moyen | La latence moyenne est calculée en divisant le nombre de requêtes (mentionné précédemment) par le temps total, en millisecondes, nécessaire pour traiter la kafka.network:type=RequestMetrics,name=TotalTimeMs,request=FetchConsumerrequête spécifiée. |
1 seconde |
Demandes d'extraction du suiveur
Le tableau suivant présente les détails des requêtes des abonnés récupérées :
| Métrique | Description | Granularité |
|---|---|---|
| Nombre | Taux de demande et source de collectekafka.network:type=RequestMetrics,name=RequestsPerSec,request=FetchFollower. |
1 seconde |
| Temps d'attente moyen | La latence moyenne est calculée en divisant le nombre de requêtes (mentionné précédemment) par le temps total, en millisecondes, nécessaire pour traiter la kafka.network:type=RequestMetrics,name=TotalTimeMs,request=FetchFollowerrequête spécifiée. |
1 seconde |
Temps d'inactivité moyen
Le tableau suivant présente les détails relatifs au temps d'inactivité moyen :
| Métrique | Description | Granularité |
|---|---|---|
| Processeur réseau | La proportion moyenne de temps pendant laquelle les threads du processeur réseau sont inactifs. Les valeurs varient entre 0 % (toutes les ressources sont utilisées) et 100 % (toutes les ressources sont disponibles) et sont collectées à partir dekafka.network:type=SocketServer,name=NetworkProcessorAvgIdlePercent. |
1 seconde |
| Gestionnaire des demandes | La proportion moyenne de temps pendant laquelle les threads du gestionnaire de requêtes sont inactifs. Les valeurs varient entre 0 % (toutes les ressources sont utilisées) et 100 % (toutes les ressources sont disponibles) et sont collectées à partir dekafka.server:type=KafkaRequestHandlerPool,name=RequestHandlerAvgIdlePercent. |
1 seconde |
Échecs du courtier
Le tableau suivant présente les détails des défaillances des courtiers :
| Métrique | Description | Granularité |
|---|---|---|
| Extraction | Taux de récupération des requêtes ayant échoué et dont les données kafka.server:type=BrokerTopicMetrics,name=FailedFetchRequestsPerSecont été collectées. |
1 seconde |
| Production | Calculer le taux de réussite des demandes qui ont échoué et pour lesquelles des kafka.server:type=BrokerTopicMetrics,name=FailedProduceRequestsPerSecdonnées ont été collectées. |
1 seconde |
Métriques d'état du courtier
Le tableau suivant présente les détails des indicateurs d'état du courtier :
| Métrique | Description | Granularité |
|---|---|---|
| Partitions sous-répliquées | Le nombre de partitions sous-répliquées (ISR < toutes les répliques) est renseigné à partir dekafka.server:type=ReplicaManager,name=UnderReplicatedPartitions. |
1 seconde |
| Partitions hors ligne | Le nombre de partitions qui ne disposent pas d'un leader actif et qui ne sont donc ni accessibles en écriture ni en lecture, et qui sont ainsi exclues du kafka.controller:type=KafkaController,name=OfflinePartitionsCountprocessus de collecte. |
1 seconde |
| Elections de leader | Le taux d'élection du leader et la latence sont mesurés à partir dekafka.controller:type=ControllerStats,name=LeaderElectionRateAndTimeMs. |
1 seconde |
| Elections de leader imparfaites | Le taux de participation à l'élection des dirigeants non irréprochables et la source de ces donnéeskafka.controller:type=ControllerStats,name=UncleanLeaderElectionsPerSec. |
1 seconde |
| Réductions ISR | Si un commutateur tombe en panne, l'ISR de certaines partitions diminue. Lorsque ce broker est de nouveau opérationnel, l'ISR est étendu une fois que les répliques ont rattrapé leur retard. Par ailleurs, la valeur attendue tant pour le taux de rétrécissement que pour le taux d'expansion de l'ISR est égale à 0. Source kafka.server:type=ReplicaManager,name=IsrShrinksPerSec: |
1 seconde |
| Extensions ISR | Lorsqu'un courtier redevient opérationnel après une panne, il commence à rattraper son retard en effectuant une lecture du leader. Une fois le rattrapage effectué, le courtier est à nouveau incorporé dans le pool ISR. Source kafka.server:type=ReplicaManager,name=IsrExpandsPerSec: |
1 seconde |
| Nombre de contrôleurs actifs | Le nombre de contrôleurs actifs dans le cluster est obtenu à partir dekafka.controller:type=KafkaController,name=ActiveControllerCount. |
1 seconde |
Partitions
Le tableau suivant présente les détails de la partition :
| Métrique | Description | Granularité |
|---|---|---|
| Nombre | Nombre total de partitions sur ce courtier. Ces données doivent être globalement homogènes pour l'ensemble des courtiers et sont collectées auprès dekafka.server:type=ReplicaManager,name=PartitionCount. |
1 seconde |
Vidage du journal
Le tableau suivant présente les détails relatifs à la vidange du journal :
| Métrique | Description | Granularité |
|---|---|---|
| Moyenne | Fréquence de vidage du journal et source de collectekafka.log:type=LogFlushStats,name=LogFlushRateAndTimeMs. |
1 seconde |
| Vidages | Nombre de vidages du journal et source de collectekafka.log:type=LogFlushStats,name=LogFlushRateAndTimeMs. |
1 seconde |
Rubriques
Le tableau suivant présente les rubriques des détails des nœuds d' Kafka :
| Métrique | Description | Granularité |
|---|---|---|
| Nom | Taux global des messages entrants et source de collectekafka.server:type=BrokerTopicMetrics,name=MessagesInPerSec. |
1 seconde |
| Partitions | Taux global des messages entrants et source de collectekafka.server:type=BrokerTopicMetrics,name=MessagesInPerSec. |
1 seconde |
| Octets entrants | Débit global en octets entrants pour le sujet à partir duquel les kafka.server:type=BrokerTopicMetrics,name=BytesInPerSecdonnées sont collectées. |
1 seconde |
| Octets sortants | Débit total en octets sortants pour le sujet à partir duquel les kafka.server:type=BrokerTopicMetrics,name=BytesOutPerSecdonnées sont collectées. |
1 seconde |
| Octets rejetés | Taux global d'octets rejetés pour le sujet à partir duquel les kafka.server:type=BrokerTopicMetrics,name=BytesRejectedPerSecdonnées sont collectées. |
1 seconde |
| Messages entrants | Taux global de messages entrants pour le sujet à partir duquel les kafka.server:type=BrokerTopicMetrics,name=MessagesInPerSecdonnées sont collectées. |
1 seconde |
| Répliques synchronisées | Le nombre de répliques synchronisées est comptabilisé et ces données sont collectées à partir de celles-cikafka.cluster:type=Partition,name=InSyncReplicasCount. |
1 seconde |
Cluster Kafka - Collecte des métriques
Kafka La collecte des métriques du cluster permet de recueillir et d'analyser des données sur les performances et l'état de santé de l'ensemble du cluster Apache Kafka, plutôt que sur des nœuds individuels.
Données de configuration
Vous avez besoin des informations suivantes pour configurer un cluster d' Kafka :
- Nom du cluster
- Zookeeper
- Noeuds (Nom, Version)
- Sujets/Partitions
Métriques de performance
Le tableau suivant présente les détails des indicateurs de performance :
| Métrique | Description | Granularité |
|---|---|---|
| Tous les messages entrants du courtier | La somme des messages de courtage, exprimée en métriques, provenant de tous les nœuds. | 1 seconde |
| Trafic rejeté | La somme de la métrique relative au trafic de courtage rejeté provenant de tous les nœuds. | 1 seconde |
| Temps total du consommateur d'extraction | La somme de la métrique « temps total de récupération côté consommateur » de tous les nœuds. | 1 seconde |
| Temps total de suivi d'extraction | La somme de la métrique « temps total de récupération des données » de tous les nœuds. | 1 seconde |
Latence moyenne des requêtes par rapport au débit
Le tableau suivant présente les détails concernant le rapport entre le temps de latence moyen des requêtes et le débit :
| Métrique | Description | Granularité |
|---|---|---|
| Débit de production | La somme du nombre de requêtes de production provenant de tous les nœuds. | 1 seconde |
| Débit d'extraction du consommateur | La somme de la métrique « nombre de requêtes de consommation de données » provenant de tous les nœuds. | 1 seconde |
| Débit d'extraction du suiveur | La somme du nombre de requêtes « fetch follower » provenant de tous les nœuds. | 1 seconde |
| Temps total de production | La somme du temps total de traitement de tous les nœuds. | 1 seconde |
| Temps total du consommateur d'extraction | La somme du temps total de récupération des données par les consommateurs sur l'ensemble des nœuds. | 1 seconde |
| Temps total de suivi d'extraction | La somme du temps total de récupération des données par les suiveurs sur l'ensemble des nœuds. | 1 seconde |
Trafic de tous les courtiers
Le tableau suivant présente les détails du trafic de tous les courtiers :
| Métrique | Description | Granularité |
|---|---|---|
| Entrant | La somme du trafic de courtage provenant de tous les nœuds. | 1 seconde |
| Sortant | Le total du trafic sortant des courtiers sur l'ensemble des nœuds. | 1 seconde |
| Rejeté | Le total du trafic de courtage rejeté par l'ensemble des nœuds. | 1 seconde |
Échecs de tous les courtiers
Le tableau suivant présente le détail des défaillances de tous les courtiers :
| Métrique | Description | Granularité |
|---|---|---|
| Extraction | Le total des défaillances de courtiers récupérées auprès de tous les nœuds. | 1 seconde |
| Production | La somme des défaillances des intermédiaires provenant de tous les nœuds. | 1 seconde |
Métriques d'état de tous les courtiers
Le tableau suivant présente les détails des indicateurs d'état de tous les courtiers :
| Métrique | Description | Granularité |
|---|---|---|
| Partitions sous-répliquées | La somme des indicateurs d'état du broker pour les partitions sous-répliquées de tous les nœuds. | 1 seconde |
| Partitions hors ligne | La somme des partitions hors ligne des métriques d'état du courtier provenant de tous les nœuds. | 1 seconde |
| Elections de leader | La somme des élections des responsables des métriques d'état du courtier provenant de tous les nœuds. | 1 seconde |
| Elections de leader imparfaites | La somme des mesures d'état du courtier concernant les élections de leader non valides provenant de tous les nœuds. | 1 seconde |
| Réductions ISR | La somme des indicateurs d'état du courtier ISR diminue sur tous les nœuds. | 1 seconde |
| Extensions ISR | La somme des extensions ISR des métriques d'état du courtier provenant de tous les nœuds. | 1 seconde |
| Nombre de contrôleurs actifs | La somme du nombre de contrôleurs actifs, telle qu'indiquée par les métriques d'état du courtier, sur l'ensemble des nœuds. | 1 seconde |
Pourcentage moyen de temps d'inactivité
Le tableau suivant présente les détails relatifs au pourcentage moyen de temps d'inactivité :
| Métrique | Description | Granularité |
|---|---|---|
| Processeur réseau | La moyenne globale du temps d'inactivité moyen des processeurs réseau de tous les nœuds. | 1 seconde |
| Gestionnaire des demandes | La moyenne globale du temps d'inactivité moyen des gestionnaires de requêtes sur l'ensemble des nœuds. | 1 seconde |
Vidage du journal
Le tableau suivant présente les détails relatifs à la vidange du journal :
| Métrique | Description | Granularité |
|---|---|---|
| Moyenne | La somme de la moyenne des opérations de vidage du journal de tous les nœuds. | 1 seconde |
| Vidages | La somme des opérations de vidage du journal effectuées par tous les nœuds. | 1 seconde |
Nœuds de cluster
Le tableau suivant présente les détails des nœuds du cluster :
| Métrique | Description | Granularité |
|---|---|---|
| Contrôleur | Le noeud est-il un contrôleur ? YES ou NO. | 1 seconde |
| Messages entrants | Graphique avec le nombre de messages de courtier entrants. | 1 seconde |
| Octets entrants | Graphique avec le nombre d'octets de courtier entrants. | 1 seconde |
| Octets sortants | Graphique avec le nombre d'octets de courtier sortants. | 1 seconde |
| Temps de réponse moyen | Graphique récapitulant le temps de réponse moyen du courtier. | 1 seconde |
| Intégrité | Indicateur d'intégrité du noeud. | 1 seconde |
Sujets de cluster
Le tableau suivant présente les détails des thèmes du cluster :
| Métrique | Description | Granularité |
|---|---|---|
| Partitions | Nombre total de partitions. | 10 minutes |
| Octets entrants | Graphique avec le nombre d'octets de sujet entrants. | 1 seconde |
| Octets sortants | Graphique avec le nombre d'octets de sujet sortants. | 1 seconde |
| Octets rejetés | Graphique avec le nombre d'octets de sujet rejetés. | 1 seconde |
| Messages entrants | Graphique avec le nombre de messages de sujet entrants. | 1 seconde |
Décalage dans le groupe de consommateurs
Le tableau suivant présente les détails relatifs au décalage des groupes de consommateurs :
| Métrique | Description | Granularité |
|---|---|---|
| Lag | Décalage dans le groupe de consommateurs par sujet. | 60 secondes |
Consommateurs
Le tableau suivant présente les coordonnées des clients :
| Métrique | Description | Granularité |
|---|---|---|
| Débit d'octets | Le nombre total d'octets consommés envoyés par seconde. | 1 seconde |
| Régulation | La durée moyenne totale d'accélération. | 1 seconde |
| Temps d'attente | La latence moyenne totale de récupération. | 1 seconde |
Producteurs
Le tableau suivant présente les coordonnées des producteurs :
| Métrique | Description | Granularité |
|---|---|---|
| Débit d'octets | Le nombre total d'octets sortants envoyés par seconde. | 1 seconde |
| Régulation | La durée moyenne totale d'accélération. | 1 seconde |
| Temps d'attente | La latence moyenne totale des requêtes. | 1 seconde |
Signatures d'intégrité
Pour chaque capteur, une base de connaissances contenant des indicateurs de santé est évaluée en continu par rapport aux données reçues et sert à signaler des problèmes ou des incidents en fonction de leur impact sur les utilisateurs.
Les événements intégrés déclenchent des problèmes ou des incidents en cas de non-conformité des signatures de santé des entités, tandis que les événements personnalisés déclenchent des problèmes ou des incidents en fonction des seuils d'une métrique spécifique à une entité donnée.
Pour plus d'informations sur les événements intégrés pour les nœuds et les clusters d' Kafka, consultez la référence des événements intégrés.
Traitement des incidents
SSL non configuré
Type de problème de surveillance : kafka_ssl_not_configured
Pour résoudre le problème de configuration d' SSL et configurer l'emplacement du magasin de certificats ainsi que le mot de passe d' Kafka SSL, consultez SSL / TLS Support.
Authentification client SSL non configurée
Type de problème de surveillance : kafka_ssl_client_not_configured
Pour résoudre le problème lié à l'authentification client d' SSL et configurer l'authentification client d' Kafka SSL (emplacement du keystore et mot de passe), consultez SSL / TLS Support.
JMX l'authentification n'est pas configurée
Type de problème de surveillance : kafka_invalid_jmx_credentials
Pour résoudre le problème lié à l'authentification d' JMX et configurer les identifiants d'authentification d' JMX, consultez la page « Prise en charge de l'authentification » à l'adresse JMX.