Alertes intelligentes

Ajouter une alerte

Dans la barre latérale, cliquez sur Applications.
Cliquez sur le nom de votre application.
Enfin, cliquez sur Ajouter une alerte intelligente.

mode simple

Par défaut, vous créez une alerte en mode simple, ce qui implique les étapes suivantes:

Sélectionnez une alerte.
Confirmez votre portée.
Sélectionnez un canal d'alerte.

Le mode simple vous permet de sélectionner des alertes sans configuration afin de ne pas avoir à créer de requêtes ou à définir des seuils.

Pour créer une alerte en mode avancé, qui vous permet d'examiner et de modifier un paramètre d'alerte configuré automatiquement, cliquez sur Passer en mode avancé.

Sélectionner une alerte

Modifier en ligne

Sélectionnez l'un des plans directeurs prédéfinis ci-dessous, pour lequel créer une alerte.


Plan directeur	Description
Appels lents	Sélectionnez Appels lents pour recevoir une alerte lorsque les appels aux services et noeuds finaux sélectionnés de cette perspective d'application sont plus lents que d'habitude.
Appels erronés	Sélectionnez Appels erronés pour recevoir une alerte lorsque le taux ou le nombre d'appels erronés pour les services et les noeuds finaux sélectionnés de cette perspective d'application est supérieur à la normale.
Codes de statut HTTP	Sélectionnez les codes d'état d' HTTP s pour recevoir une alerte chaque fois que des codes d'état d' HTTP s correspondants apparaissent plus fréquemment que d'habitude.
Débit	Sélectionnez Nombre d'appels anormalement faible ou Nombre d'appels anormalement élevé pour recevoir une alerte lorsque le nombre d'appels pour les services et les noeuds finaux sélectionnés de cette perspective d'application est anormalement faible ou élevé.

Sélectionnez votre domaine

Modifier en ligne

Vous pouvez ici sélectionner des services et des points de terminaison dans la vue « Application Perspective » de l'interface utilisateur d' Instana. La perspective d'application à partir de laquelle vous créez l'alerte intelligente est sélectionnée par défaut comme portée initiale. En utilisant les requêtes Unbounded Analytics, vous pouvez affiner davantage la portée de l'alerte pour cibler un sous-ensemble spécifique d'appels, tant horizontalement que verticalement. Par exemple, par type d'appel, nom du service, nom du point de terminaison ou attributs d'infrastructure tels que les étiquettes d' Kubernetes.

Ajouter des canaux d'alerte

Modifier en ligne

Pour ajouter des canaux d'alerte, cliquez sur « Sélectionner un canal d'alerte », puis sélectionnez les canaux vers lesquels envoyer les alertes. Dans les alertes intelligentes des applications, vous pouvez ajouter différents canaux d'alerte pour différents niveaux de gravité; en mode simple, les canaux sélectionnés se voient automatiquement attribuer le niveau de gravité par défaut. Le niveau de gravité par défaut est « Avertissement ». Pour plus d'informations sur la création de canaux, consultez la section « Canaux d'alerte ».

Mode avancé

Modifier en ligne

Pour avoir une compréhension et un contrôle complets de vos alertes, le mode avancé vous aide à inspecter les configurations de chaque alerte préconfigurée et à modifier les configurations si nécessaire. Outre les configurations disponibles en mode simple, le mode avancé offre les configurations suivantes.

Déclencheur

Modifier en ligne

Sélectionnez l'un des plans directeurs prédéfinis pour lesquels vous souhaitez être alerté. Pour plus d'informations sur les différents types de plan directeur, voir Sélectionner une alerte.

Type de seuil

Modifier en ligne

Lorsque vous configurez une Smart Alert, vous pouvez choisir d'utiliser des seuils statiques ou adaptatifs .

Type de seuil

Statique

Modifier en ligne

Les seuils statiques ne changent pas après la création de l'alerte intelligente. Le seuil lui-même peut être soit une valeur constante simple, soit tenir compte des variations saisonnières qui se sont produites dans le passé lors de la création de la configuration Smart Alert. Vous pouvez imaginer la plus récente comme une table de correspondance pour chaque point de la journée ou de la semaine qui est précalculée une fois en fonction des données d'historique.

Il se peut que le seuil ne soit plus pertinent une fois que la métrique sous-jacente a été modifiée de manière significative. En réponse, le seuil peut être ajusté manuellement ou recalculé à tout moment. Pour plus d'informations, voir Seuil d'alerte.

Quand utiliser un seuil statique

Modifier en ligne

Les seuils statiques fonctionnent mieux pour les plans directeurs tels que Appels faibles ou Appels erronés dans les situations suivantes:

Indépendamment de toute saisonnalité de l'indicateur sous-jacent. Il n'est pas souhaitable que la métrique soit supérieure ou inférieure à une valeur constante.
La métrique sous-jacente est saisonnière et, par conséquent, des seuils différents existent en fonction du moment de la journée ou de la semaine. Mais ces seuils eux-mêmes ne changent pas au fil du temps, et des changements progressifs de ces seuils sur de longues périodes de temps ne sont pas souhaitables.

Adaptative

Modifier en ligne

Les seuils adaptatifs évoluent en permanence et s'ajustent en fonction des nouvelles données enregistrées par Instana. Cela signifie que le seuil tient compte en permanence des changements saisonniers de la métrique sous-jacente sans intervention humaine. Pour plus d'informations, consultez la documentation sur le seuil adaptatif.

Quand utiliser le seuil adaptatif

Modifier en ligne

Les seuils adaptatifs fonctionnent mieux pour les plans directeurs tels que Débit ou de manière générale pour les situations suivantes:

L'indicateur sous-jacent n'est pas saisonnier. On s'attend à ce que le seuil change progressivement au fil du temps, mais tout écart soudain par rapport à cette tendance est indésirable.
La métrique sous-jacente est saisonnière et des seuils différents existent pour différentes heures du jour ou de la semaine. On s'attend à ce que les seuils eux-mêmes changent progressivement au fil du temps, mais tout écart soudain par rapport à cette tendance n'est pas souhaitable.

Portée

Modifier en ligne

La perspective d'application à partir de laquelle vous créez l'alerte intelligente est sélectionnée par défaut comme portée initiale.

Vous pouvez filtrer les appels globaux à un sous-ensemble à l'aide de notre langage de requête. Les appels qui correspondent au filtre basé sur la requête sont "dans la portée", et tous les autres appels sont "hors portée", et ne sont donc pas pris en compte.

En utilisant les requêtes Unbounded Analytics, vous pouvez affiner davantage la portée de l'alerte pour cibler un sous-ensemble spécifique d'appels, tant horizontalement que verticalement. Par exemple, utilisez le type d'appel, le nom de service, le nom de noeud final ou les attributs d'infrastructure tels que les libellés Kubernetes .

Choisissez la portée des alertes individuelles

Modifier en ligne

Type d'évaluation d'alerte

Les options suivantes permettent de contrôler le niveau de détail de l'évaluation des alertes et des notifications, allant d'un niveau global (au niveau de l'application) à un niveau plus précis (au niveau des terminaux).

pour cette perspective d'application

Modifier en ligne

Cette option évalue les indicateurs au *niveau de l'application*. Étant donné qu'une perspective d'application est un ensemble de services, tous les appels effectués au sein de cette perspective, tous services confondus, sont regroupés en une seule métrique. Le seuil d'alerte est évalué par rapport à cet indicateur agrégé et, en cas de dépassement, une seule notification d'alerte est envoyée pour l'ensemble de l'application.

Sélectionnez cette option pour : une surveillance globale de l'état de l'application, lorsque vous avez besoin d'identifier les problèmes au niveau de l'application dans son ensemble, quel que soit le service ou le point de terminaison spécifiquement concerné.

par service pour cette perspective d'application

Modifier en ligne

Cette option évalue les indicateurs au *niveau du service*. Chaque service, du point de vue de l'application, dispose de sa propre métrique, calculée en regroupant tous les appels vers les points de terminaison de ce service. Le seuil d'alerte est évalué séparément pour chaque service, et en cas de dépassement, des notifications d'alerte distinctes sont envoyées pour chaque service concerné.

Sélectionnez cette option pour : la surveillance au niveau des services, lorsque vous souhaitez identifier les services spécifiques qui rencontrent des problèmes, tout en continuant à agréger les métriques de tous les points de terminaison au sein de chaque service.

par noeud final pour cette perspective d'application

Modifier en ligne

Cette option évalue les indicateurs au *niveau des points de terminaison* (granularité maximale). Chaque point de terminaison au sein de chaque service dispose de sa propre métrique. Le seuil d'alerte est évalué séparément pour chaque terminal, et en cas de non-respect, des notifications d'alerte distinctes sont envoyées pour chaque terminal concerné.

Sélectionnez cette option pour : une surveillance détaillée au niveau des terminaux, lorsque vous devez identifier précisément quels terminaux rencontrent des problèmes.

Remarque : cette option n'est pas disponible lorsque le type de seuil est adaptatif.

Choisissez entre les appels entrants et tous les appels

Modifier en ligne

Etant donné qu'une perspective d'application inclut généralement plusieurs services, il est nécessaire de déterminer quels appels sont dans la portée de cette Smart Alert.

Portée de l'appel d'alerte

Choisissez Appels entrants pour restreindre les appels à cette perspective d'application uniquement (depuis le front-end ou tout service en amont). Les appels entre les services de cette perspective d'application sont exclus.

Choisissez tous les appels pour inclure non seulement les appels à cette perspective d'application en tant que destination (depuis le front-end ou tout service en amont), mais également les appels entre les services dans la perspective d'application.

Inclure et exclure les appels internes ou synthétiques

Modifier en ligne

Vous pouvez éventuellement inclure des appels internes ou synthétiques. Par défaut, ces deux appels sont exclus.

Un appel interne est un type particulier d'appel qui représente le travail effectué à l'intérieur d'un service. Il peut être créé à partir de plages intermédiaires qui sont envoyées via la fonction de trace personnalisée. Pour plus d'informations sur les appels internes, voir Concepts de traçage.

Les appels synthétiques sont ceux avec un noeud final synthétique comme destination, tels que les appels aux noeuds finaux de diagnostic d'intégrité.

Sélectionnez des services ou des points de terminaison individuels

Modifier en ligne

Si vous le souhaitez, utilisez la liste déroulante en regard du nom de la perspective d'application pour sélectionner ou exclure manuellement des services individuels auxquels cette Smart Alert doit limiter sa portée. Dans un service sélectionné ou exclu, la portée sélectionnée peut être définie pour chacun de ses noeuds finaux.

Sélection d'entité d'alerte

L'activation de l'option Trier par sélection d'utilisateur permet de conserver les services et les noeuds finaux sélectionnés sur le dessus.

Si vous utilisez la zone de recherche, l'arborescence de sélection est réduite à des services et des noeuds finaux dont le nom correspond au mot clé de recherche.

Vous pouvez éventuellement utiliser Ajouter un filtre pour des exigences de filtrage plus avancées et granulaires qui utilisent une logique booléenne arbitraire.

Seuil d'alerte

Modifier en ligne

Dans cette section, vous pouvez configurer le seuil d'alerte de la Smart Alert. La métrique sous-jacente est une agrégation d' appels liés à la perspective d'application donnée. Lorsque le seuil d'alerte de la Smart Alert est configuré, l'aperçu d'alerte de la boîte de dialogue affiche la métrique, le seuil et les violations sur les données d'historique des dernières 24 heures ou 7 jours.

Graphique de seuil d'alerte

Choisissez une unité de mesure

Modifier en ligne

Cette étape s'applique lorsque vous choisissez le modèle « Slow Calls »; vous pouvez alors choisir parmi les options suivantes : moyenne arithmétique, minimum et maximum, ainsi que les 25e, 50e, 75e, 90e, 95e, 98e et 99e centiles.

Remarque : cet indicateur est calculé pour les appels dont l'horodatage se situe dans la granularité d'évaluation, qui est définie dans le cadre du seuil temporel.

Choisissez l'opérateur de seuil

Modifier en ligne

En fonction du plan directeur choisi, vous disposez de l'option entre <, <=, >, >=.

Choisissez le type de seuil

Modifier en ligne

Vous pouvez choisir parmi les types de seuil statique suivants:

Seuil statique: prend une valeur constante comme seuil.
Saisonnalité quotidienne statique: Utilise un seuil qui capture les modèles de répétition quotidienne de l'unité de mesure où chaque jour se comporte à peu près de la même façon, mais est différent tout au long de la journée. Par exemple, une application qui reçoit plus d'appels pendant la journée que pendant la soirée.
Saisonnalité Hebdomadaire statique: Utilise un seuil qui capture les modèles de répétition hebdomadaires de l'unité de mesure où chaque jour d'une semaine se comporte à peu près de la même façon, mais est différent tout au long de la semaine. Par exemple, une application qui reçoit plus d'appels les jours ouvrables que le week-end.

Pour la saisonnalité quotidienne statique, au moins 5 jours de données de métrique continues sont requis, mais 7 jours de données sont recommandés. Pour la saisonnalité hebdomadaire statique, au moins 2 semaines de données de métrique d'historique continues sont requises. L'alerte intelligente ne peut pas être créée lorsque ces exigences ne sont pas satisfaites.

Pour Seuil adaptatif, au moins 14 jours de données de métrique continues sont requis. Si cette condition n'est pas remplie, l'alerte intelligente peut toujours être créée. La détection et l'alerte des problèmes commenceront à fonctionner dès que les exigences en matière de données seront satisfaites pour initialiser le modèle utilisé.

Choisissez une valeur seuil ou un niveau de sensibilité

Modifier en ligne

Si vous sélectionnez « Seuil statique », l'outil « Instana » sélectionne par défaut un niveau de gravité pour l'alerte et propose une valeur de seuil. Vous pouvez soit utiliser cette valeur par défaut, soit définir manuellement une valeur personnalisée. Pour configurer un niveau de gravité supplémentaire, tel que « critique », cochez la case « Critique » et indiquez une valeur seuil distincte qui déclenchera l'alerte en tant qu'alerte critique.

Lorsque vous sélectionnez un niveau de sensibilité, Instana attribue automatiquement un niveau de gravité à l'alerte. Vous pouvez régler le niveau de sensibilité à l'aide d'un curseur. Pour définir un niveau de sensibilité distinct pour la gravité « Critique », cochez la case « Critique » et configurez la sensibilité selon vos besoins.

L'augmentation de la sensibilité réduit les limites supérieure et inférieure de la détection des anomalies, ce qui entraîne une augmentation du nombre de notifications d'alerte. En réduisant la sensibilité, on élargit ces limites, ce qui diminue le nombre d'alertes. Ce paramètre définit la plage de valeurs attendues pour l'indicateur. En fonction de l'opérateur de seuil utilisé, un indicateur qui dépasse l'une ou l'autre des limites est considéré comme une violation et peut déclencher une alerte.

Seuil de temps

Modifier en ligne

Pour l'alerte qui est déclenchée, vous pouvez utiliser le seuil de temps pour imposer des conditions supplémentaires sur la manière dont le seuil défini sur la métrique est dépassé.

Dans cette section, vous choisissez la fenêtre d'évaluation ou la granularité, qui correspond à l'intervalle de temps au cours duquel les appels sont évalués dans Smart Alert. En outre, vous pouvez apporter des ajustements plus précis à la manière dont les alertes sont détectées et au moment où elles sont déclenchées. Les modifications apportées à cette section mettent à jour l'aperçu d'alerte affiché dans le graphique de la boîte de dialogue.

Persistance dans le temps

Modifier en ligne

Sélectionnez cette option si vous souhaitez retarder la répartition des notifications d'alerte jusqu'à ce que le nombre donné de fenêtres d'évaluation consécutives soit dépassé.

Suivez ces étapes :

Choisissez la fenêtre d'évaluation ou la granularité.
Choisissez le nombre de fenêtres d'évaluation qui doivent être violées consécutivement avant que la notification d'alerte ne soit déclenchée.

Nombre de violations dans le temps

Modifier en ligne

Sélectionnez cette option si vous souhaitez retarder la répartition des notifications d'alerte jusqu'à ce que les fenêtres d'évaluation N hors M soient violées.

L'image suivante illustre un exemple de dépassements par rapport à la configuration du seuil de temps. Avec une granularité de mesure de 5 minutes, une alerte est déclenchée lorsqu'au moins deux dépassements de seuil se produisent au cours des 15 dernières minutes.

Seuil de temps d'alerte

Suivez ces étapes :

Choisissez la fenêtre d'évaluation ou la granularité. Les valeurs individuelles des indicateurs sont regroupées par tranches de cette taille.
Choisissez le nombre de fenêtres d'évaluation (M) à suivre.
Définissez le nombre minimum de fenêtres d'évaluation surveillées qui doivent être dépassées pour que l'alerte soit déclenchée.

L'exemple suivant présente deux cycles d'évaluation distincts avec cette configuration.

Évolution des non-conformités au fil du temps

Les indicateurs sont agrégés par tranches de 5 minutes. Si deux des trois dernières périodes d'évaluation ne sont pas respectées, une alerte est envoyée.

Impact de trace

Modifier en ligne

Sélectionnez cette option si vous souhaitez retarder la répartition des notifications d'alerte jusqu'à ce qu'un nombre spécifié de traces soit affecté.

Suivez ces étapes :

Choisissez la fenêtre d'évaluation ou la granularité.
Entrez le nombre de traces qui violent le seuil dans la fenêtre d'évaluation.

Canaux d'alerte

Modifier en ligne

Vous pouvez choisir les canaux d'alerte pour l'envoi des notifications d'alerte. Dans les alertes intelligentes des applications, vous pouvez définir différents canaux d'alerte en fonction du niveau de gravité.

Si une valeur seuil est définie pour les niveaux de gravité « Avertissement » et « Critique », vous pouvez configurer les canaux d'alerte pour chaque niveau de gravité. Si une valeur seuil est définie pour les deux niveaux de gravité, tous les canaux d'alerte sont sélectionnés par défaut pour le niveau « avertissement ».

L'image suivante montre les canaux d'alerte pour lesquelles les deux niveaux de gravité ont été configurés :

Figure 1. Canaux d'alerte avec plusieurs niveaux de gravité

Si une valeur seuil est définie pour un seul niveau de gravité, ce niveau s'affiche pour chaque canal d'alerte en tant que niveau d'alerte.

En présence de lacunes pour une métrique qui n'est pas agrégée par SUM, comme la latence ou les taux d'erreur, Instana préserve l'état d'alerte actuel jusqu'à ce que la prochaine valeur de métrique soit vue. Par exemple, ce comportement s'avère utile lorsqu'une alerte intelligente est définie pour une application qui ne reçoit que peu de trafic, mais qui est confrontée à un problème récurrent. Par conséquent, ces périodes sans trafic d'applications ne déclenchent pas d'alertes répétitives. Toutefois, si aucun appel n'est passé pendant plus de trois heures, toute alerte active est clôturée.

L'image suivante montre les canaux d'alerte avec une seule gravité configurée :

Figure 2. Canaux d'alerte avec un seul niveau de gravité

Remarque : les configurations d'alerte existantes continuent de fonctionner pour le routage des alertes intelligentes. Par conséquent, les Smart Alerts sont toujours mises en correspondance et acheminées vers les canaux d'alerte respectifs qui sont configurés dans les configurations d'alerte. Cela vous aide à définir un routage d'alerte plus complexe en un seul endroit.

Propriétés d'alerte

Modifier en ligne

Dans cette section, vous pouvez éventuellement configurer diverses propriétés liées aux alertes créées à l'aide de la configuration Smart Alert.

Propriétés d'alerte

Titre

Modifier en ligne

Instana propose un titre par défaut en fonction du type de modèle utilisé et des options de configuration associées. Vous pouvez toutefois remplacer le titre par défaut par un texte statique personnalisé ou utiliser un titre dynamique en insérant des balises de remplacement.

Remarque : les variables de remplacement disponibles dépendent de la portée des alertes individuelles sélectionnées précédemment.

Par exemple, lorsque vous choisissez des alertes individuelles par service pour cette perspective d'application, ${application.name} et ${service.name} sont disponibles, mais pas ${endpoint.name}. Cette limitation existe car les alertes sont limitées à des services individuels, ce qui permet de faire référence à une perspective d'application et à un nom de service uniques, mais pas à des noms de points de terminaison spécifiques, qui peuvent varier d'un service à l'autre.

De plus, vous pouvez inclure ${severity} comme espace réservé dans le titre de l'alerte pour indiquer le niveau de gravité.

Déclenche un incident

Modifier en ligne

L'activation de cette option crée en outre un incident auquel ce problème est référencé en tant qu' événement déclencheur et d'autres événements liés à cet incident sont référencés en tant qu' événements connexes.

Description

Modifier en ligne

Vous pouvez éventuellement ajouter une description à l'alerte. Une bonne description inclut un bref récapitulatif de cette alerte et des étapes permettant d'agir lorsque l'alerte est reçue. Vous pouvez également créer une description dynamique en insérant des balises de remplacement, que vous pouvez sélectionner dans le menu déroulant « Insérer une balise de remplacement ».

Charges utiles personnalisées

Modifier en ligne

Si vous le souhaitez, vous pouvez ajouter des données personnalisées sous forme de paires clé-valeur, qui seront jointes à chaque notification d'alerte envoyée par Instana. Pour ajouter cette charge utile supplémentaire, cliquez sur « Ajouter une ligne » dans la section « Charges utiles personnalisées ».

Les données personnalisées globales et les données personnalisées spécifiques à l'alerte sont incluses dans les notifications d'alerte le cas échéant, mais la configuration spécifique à l'alerte prévaut sur la configuration globale. Par conséquent, dans le cas de l'utilisation de la même clé, la valeur de la zone de contenu personnalisé global est remplacée par la valeur spécifique à l'alerte.

Vous pouvez voir les contenus personnalisés définis globalement qui sont effectivement utilisés dans la configuration d'alerte comme suit:

Contenu personnalisé global en lecture seule

Les zones de contenu personnalisé dynamique dans une configuration spécifique à une alerte sont également prises en charge.

Sélectionnez la balise dynamique comme suit:

Charge personnalisée dynamique

Vous pouvez utiliser les suggestions pour sélectionner la clé de droite pour la balise dynamique sélectionnée ou l'ajouter manuellement.

Suggestions de contenu personnalisé dynamique

Alertes intelligentes mondiales

Modifier en ligne

Les alertes intelligentes globales permettent de simplifier les cas d'utilisation d'alerte de base dans lesquels une seule définition d'alerte doit être appliquée à un ensemble plus large d'applications. En bref, cela vous permet de gérer vos alertes à partir d'une seule configuration d'alerte, au lieu de plusieurs configurations d'alerte similaires.

Ajouter une alerte intelligente globale

Modifier en ligne

Dans la barre latérale, cliquez sur Applications.
Cliquez sur + Ajouter.
Sélectionnez Ajouter une alerte intelligente globale

Remarque : pour créer ou modifier une alerte intelligente globale, vous devez disposer de l'autorisation canConfigureGlobalAlertConfigs correspondante.

Configuration

Modifier en ligne

En règle générale, les options et les étapes de configuration sont identiques à celles d'une Smart Alert(individuelle). Cependant, il existe quelques différences qui sont décrites comme suit:

La configuration d'alerte peut être affectée à plusieurs au lieu d'une seule perspective d'application. Cela vous permet de définir et d'appliquer des définitions d'alerte de base dans différentes applications et de recevoir des notifications d'alerte sectorisées à chaque application de manière isolée.

Remarque : le nombre maximal de configurations d'alertes globales pour les applications est de 25.

Sélection d'entité Global Smart Alert

Les options de type de seuil disponibles sont limitées à Static threshold que vous devez définir.

Identifier les problèmes potentiels

Modifier en ligne

Instana surveille en permanence vos applications, vos services et vos terminaux, et propose des tableaux de bord de surveillance complets prêts à l'emploi. Les alertes intelligentes sont intégrées à ces tableaux de bord et mettent en évidence les problèmes potentiels dans un couloir en suivant les graphiques des indicateurs clés de performance, tels que le débit, le taux d'erreur et le temps d'attente.

Voie des problèmes potentiels

Lorsqu'un problème potentiel est détecté, vous cliquez sur l'élément de couloir correspondant pour afficher plus de détails.

Incident potentiel

Depuis cette boîte de dialogue, vous pouvez soit commencer immédiatement à analyser le problème à l'aide d 'Unbounded Analytics, soit activer une alerte intelligente pour être averti la prochaine fois qu'un tel problème sera détecté.

Utilisateurs affectés

Modifier en ligne

La fonctionnalité « Utilisateurs affectés » des alertes intelligentes de l'application permet d'identifier les problèmes de performances généralisés en recensant le nombre d'utilisateurs confrontés à une situation donnée. À l'heure actuelle, cette fonctionnalité n'est prise en charge que pour les alertes intelligentes d'application dont la portée est définie sur « Pour cette perspective d'application ».

Pour chaque incident généré par une application Smart Alert, vous pouvez désormais consulter les informations suivantes :

Nombre total d'utilisateurs concernés : le nombre total d'utilisateurs concernés lors de l'utilisation de sites web ou d'applications mobiles, du point de vue de l'application. Ce décompte est calculé à partir du moment où l'alerte est déclenchée jusqu'à l'heure actuelle ou jusqu'à l'heure de clôture du problème, selon la première éventualité. On entend par « utilisateur concerné » tout utilisateur qui reçoit un appel ne respectant pas les critères d'alerte. Par exemple, si une alerte intelligente est configurée pour les appels d'une durée supérieure à 500 ms, un utilisateur concerné est toute personne dont l'appel dépasse ce seuil de 500 ms. Dans ce cas, l'utilisateur est celui qui est identifié sur le site web ou l'application mobile. Si aucun utilisateur n'est connecté, l'identifiant de session est utilisé pour identifier l'utilisateur concerné. Pour plus d'informations, consultez la section « Identification des utilisateurs ».
Nombre total d'utilisateurs : le nombre total d'utilisateurs qui ont utilisé les sites web ou les applications mobiles du point de vue de l'application. Ce suivi commence au moment où l'alerte est déclenchée et se poursuit jusqu'à l'heure actuelle ou jusqu'à la clôture du ticket, selon la première éventualité.
Tableau : un tableau indique le nombre d'utilisateurs concernés par site web ou par application mobile. Le tableau répertorie tous les sites web et applications mobiles comptant au moins un utilisateur concerné et indique le nombre d'utilisateurs concernés pour chaque application.

Remarque : la somme des chiffres indiqués dans les lignes du tableau peut dépasser le nombre total d'utilisateurs concernés, car un même utilisateur peut accéder à plusieurs sites web ou applications mobiles.

Figure 3 Tableau des utilisateurs concernés
Rapport d'impact : un rapport détaillé indique les identifiants d'utilisateur concernés pour chaque site web ou application mobile. Ce rapport présente une ventilation plus détaillée des utilisateurs concernés; chaque enregistrement du tableau correspond à un utilisateur unique par site web ou application mobile. Pour chaque utilisateur, le rapport indique son nom, son adresse e-mail, son pays, sa région, le libellé de configuration (nom du site web ou de l'application mobile sur lequel/laquelle l'utilisateur a été affecté) et la source (site web ou application mobile) si celle-ci a été signalée par l'agent.

Figure 4 Rapport des utilisateurs concernés

Impacted user information is available only for the past 7 days. For more information, see [IBM data retention policy](../policies/index.html#data-retention-policy).
{: note}

Prise en charge de Terraform

Modifier en ligne

Instana permet de mettre en œuvre des fonctionnalités d'« Infrastructure as Code » ( IaC ) en fournissant une ressource Terraform permettant de gérer les alertes intelligentes des applications par programmation. Cette fonctionnalité permet aux équipes d' DevOps s et de SRE de définir, de déployer et de gérer les configurations d'alerte sous forme de code. Cela contribue à améliorer l'automatisation et la cohérence entre les différents environnements.

Pour plus d'informations sur la gestion des alertes intelligentes des applications à l'aide d' Terraform, consultez la documentation officielle d' Terraform :

🔗 Configuration des alertes de l'application Instana

🔗 Configuration des alertes d'application globales sur Instana

Questions fréquentes

Modifier en ligne

En quoi la définition de la portée à l'aide du générateur de requêtes basé sur les balises dans Smart Alerts diffère-t-elle de la fonction Dynamic Focus dans les événements personnalisés?

Modifier en ligne

Dans les événements personnalisés d' Instana pour les entités d'application, de service et de point de terminaison, vous pouvez définir la portée à l'aide de la requête Dynamic Focus Query (DFQ). Dans un nutshell, vous pouvez considérer DFQ comme un langage de requête pour sélectionner des entités, telles qu'un ensemble de services. Ces entités sélectionnées sont ensuite prises en compte par la règle d'événement personnalisé définie. À titre d'exemple, lorsque le type d'entité « Service » est utilisé, la portée entity.host.fqdn:gke-* DFQ appliquera la règle à toutes les entités de service fournies par l'un des hôtes de l' GKE. En outre, notez que les métriques de l' ensemble des services reconnus automatiquement dans la portée sont utilisées, même si ces services peuvent être dans le contexte de plusieurs perspectives d'application (AP). En d'autres termes, les événements personnalisés sur les entités Service et Endpoint ne respectent pas le contexte AP. Pour plus d'informations sur la manière dont l' Instana détecte automatiquement les services et les points de terminaison, consultez la documentation relative à la surveillance des applications.

En revanche, le générateur de requêtes basé sur des balises utilisé dans les alertes intelligentes ou Unbound Analytics permet de filtrer en fonction des attributs de chaque appel individuel. Par conséquent, il permet de sélectionner des entités de perspective d'application (AP) directement à l'aide de balises telles que service.name ou endpoint.id, ou indirectement à l'aide de balises d'infrastructure associées telles que host.fqdn ou kubernetes.namespace.name. En outre, les entités ne peuvent être incluses que partiellement, par exemple en excluant des noeuds finaux spécifiques d'un service ou en réduisant la portée des appels à un type spécifique tel que HTTP à l'aide du filtre de balise call.type . Et comme une Smart Alert est toujours implicitement associée à une perspective d'application à l'aide de application.id, toutes les métriques qui sont respectées par la règle sont toujours dans le contexte de ce point d'accès.

De plus, chaque alerte intelligente s'inscrit toujours dans le cadre d'une perspective d'application, qui peut également définir des filtres sur les attributs d'appel dans le cadre de la configuration de cette perspective. Par conséquent, vous pouvez voir que chaque service et noeud final appartenant au point d'accès peut afficher des métriques différentes dans son Tableau de bord de service par rapport au tableau de bord correspondant du service (complet) reconnu automatiquement. Seul un point d'accès qui ne définit aucun filtre de balise et qui correspond donc à chaque appel possède des services et des noeuds finaux comparables à Tableau de bord des services ou à Tableau de bord des noeuds finaux sans contexte de point d'accès. Un exemple de perspective d'application de ce type est le point d'accès Tous les services par défaut.

Comment migrer un événement personnalisé lié aux métriques d'une application, d'un service ou d'un point de terminaison vers les alertes intelligentes?

Modifier en ligne

Étant donné que les alertes intelligentes et les événements personnalisés sont conceptuellement différents, notamment en ce qui concerne leur portée, il n'existe pas toujours de correspondance simple et directe entre les deux. En outre, certaines fonctionnalités prises en charge dans les Smart Alerts ne sont pas prises en charge dans les événements personnalisés, comme les suivantes:

Respectez toujours le contexte d'une perspective d'application par défaut.
Définissez des filtres sur les appels sous-jacents bruts au lieu d'être limité à la sélection d'entités uniquement.
Possibilité d'affecter directement des canaux d'alerte.
Incluez le nom respectif de l'application, du service ou du noeud final dans le titre de l'alerte. Pour certaines fonctionnalités, il existe des solutions de contournement, comme la création d'événements personnalisés ou de points d'accès en double. Il serait certes possible de convertir un à un les événements personnalisés en alertes intelligentes similaires, mais vous pouvez envisager d'utiliser les solutions de contournement existantes plutôt que de créer de nouvelles alertes intelligentes.

Migration semi-automatique

Modifier en ligne

Toutefois, pour vous aider à migrer vos événements personnalisés existants vers les alertes intelligentes, l'interface utilisateur d' Instana fournit des outils de migration de base. La page de détails d'un événement personnalisé associé à une entité Application, Service ou Point de terminaison affiche deux boutons liés à la migration des alertes intelligentes :

Marquer comme migré: marque un événement personnalisé obsolète comme migré et le désactive. Cela est utile si vous avez migré manuellement cet événement personnalisé vers une Smart Alert. Après l'avoir marquée comme étant migrée, vous pourrez toujours l'afficher dans la liste et vérifier sa configuration à tout moment à l'avenir pour référence. Ce n'est pas le cas si vous supprimez cette configuration à la place. En outre, cette fonction permet de suivre la progression de la migration et de s'assurer qu'aucun événement personnalisé n'est migré plus d'une fois.
Migrer vers Smart Alert: ouvre la boîte de dialogue Smart Alert avec les valeurs des zones respectives, y compris le nom, la description, la gravité, l'incident, le type d'entité, la métrique, la granularité d'évaluation, l'agrégation, l'opérateur et le seuil. Même si les champs des événements personnalisés ne peuvent pas toujours être mis en correspondance avec ceux des alertes intelligentes, Instana s'efforcera de migrer ces champs des événements personnalisés vers les alertes intelligentes dans la mesure du possible. En outre, la portée de la fonction DFQ ou des perspectives d'application sélectionnées est prise en charge en sélectionnant les entités respectives de manière explicite ou à l'aide des filtres de balises du générateur de requêtes. Notez que certaines requêtes Dynamic Focus ne peuvent être mappées que partiellement ou pas du tout à des filtres de sélection d'entité ou de balise de générateur de requête. Vous verrez le message d'avertissement correspondant dans ces cas. Si DFQ ne peut pas être entièrement mappé par l'outil de migration, vous pouvez vous référer à Entity type mapping and scope selection pour sélectionner manuellement la portée de Smart Alert. L'enregistrement de cette Smart Alert désactive automatiquement l'événement personnalisé précédent et le marque comme migré.

Boutons de l'outil de migration

Migration manuelle

Modifier en ligne

Vous pouvez transférer manuellement les événements personnalisés vers les alertes intelligentes.

Correspondance entre les mesures métriques et les plans

Modifier en ligne


Nom d'indicateur	Plan directeur
Appels/s	Débit
Taux d'appels erronés	Appels erronés avec l'indicateur Taux d'erreurs sélectionné dans la section Seuil de l'assistant de création ou d'édition d'alerte intelligente
Appels/s erronés	Appels erronés avec la métrique Nombre d'erreurs sélectionnée dans la section Seuil de l'assistant de création ou d'édition Smart Alert
Temps d'attente min / moy / max des appels, Nième temps d'attente des appels	Appels lents ; avec l'agrégation respective sélectionnée

Mappage des types d'entités et sélection de la portée

Modifier en ligne

Une option importante à définir correctement est la portée des alertes individuelles. Définit si les alertes sont sectorisées à l'ensemble de l'application ou individuellement pour chaque service ou noeud final dans son contexte. En effet, vous pouvez comparer la fonctionnalité de délimitation de portée à celle de regroupement dans Unbound Analytics (UA), qui regroupe par application.id, service.id ou endpoint.id. La capture d'écran suivante utilise service.name comme exemple pour une meilleure lisibilité.

Regroupement d'analyses non liées

Par conséquent, pour mieux comprendre quels services sont dans la portée d'un DFQ donné, entrez une requête similaire dans UA en utilisant le regroupement correspondant du Type d'entité précédemment défini dans l'événement personnalisé à migrer. Comme illustré dans la figure précédente, la sortie répertorie ensuite tous les services qui ont été dans la portée des événements personnalisés. Et puis cette sélection peut être reprise sur la sélection de service de votre Smart Alert.

Mappage des appels entrants ou de tous les appels

Modifier en ligne

Pour choisir correctement entre les appels entrants uniquement ou tous les appels, il vous suffit de vérifier la métrique utilisée dans l'événement personnalisé à migrer.

Indicateurs de point d'accès d'événement personnalisé

Seul le type d'entité Application offre des indicateurs sur les appels entrants dans les événements personnalisés. Par conséquent, l'entité Service et l'entité Endpoint doivent toujours être migrées à l'aide de l'option All Calls afin qu'elles aient le comportement le plus similaire consistant à faire correspondre les mêmes appels après la migration.

Correspondance entre les appels internes et synthétiques

Modifier en ligne

Dans les événements personnalisés, les appels internes et synthétiques n'ont pas été inclus dans les indicateurs clés de performance de chaque application, service ou noeud final. En conséquence, ces deux options de configuration doivent être désactivées lorsque le comportement le plus similaire est souhaité.

Définition de la plage horaire, de la taille de la fenêtre et de la valeur seuil

Modifier en ligne

Dans Evénements personnalisés, la fonction de fenêtrage appliquée de la règle dépend de la métrique sélectionnée:

Fenêtre de temps: L'opérateur utilisé est appliqué à la métrique non percentile avec une granularité d'une seconde, de manière dynamique. A titre d'exemple, la métrique agrégée avg d'une fenêtre de temps de 10 minutes comprend jusqu'à 600 échantillons de métrique individuels et la valeur de métrique agrégée est définie par la somme de tous les échantillons de métrique, qui sont divisés par le nombre d'échantillons.
Taille de la fenêtre : pour les indicateurs de percentile tels que le « All Calls Latency 90th », Instana fournit des valeurs agrégées précalculées pour divers indicateurs de percentile pouvant être utilisées dans les événements personnalisés. Aucune fenêtre dynamique n'est impliquée et l'agrégation est implicitement définie par la métrique précalculée. A la place, la valeur de seuil est comparée à une valeur de cumul individuelle.

Dans Smart Alerts, la granularité de l'indicateur peut être définie à l'aide de Granularité d'évaluation. Cette option est plus similaire à la taille de la fenêtre utilisée dans les événements personnalisés que la fenêtre de temps. Il n'y a pas de fenêtre glissante, ce qui présente l'avantage de permettre de comparer les valeurs métriques agrégées avec n'importe quel tableau de bord de la surveillance des applications d' Instana. Les indicateurs ne sont pas précalculés, mais sont dérivés individuellement en fonction des filtres de balises utilisés. Cela vous permet de définir la portée de votre alerte en fonction de ce qui vous importe. En outre, les options Time Threshold disponibles vous permettent de mieux contrôler la taille de la fenêtre dans les événements personnalisés en ce qui concerne la fréquence à laquelle une évaluation individuelle doit être considérée comme une violation de la règle dans l'ordre.

Lorsque vous migrez un événement personnalisé vers une alerte intelligente, gardez à l'esprit que la valeur de seuil doit être ajustée en conséquence. Cela peut être dû à des changements dans le délai utilisé pour l'agrégation, à une normalisation différente appliquée à l'unité de mesure ou au contexte AP appliqué dans chaque Smart Alert. Par exemple, prenez en compte la configuration de condition d'événement personnalisé suivante sur une entité de type Application:

Règle d'événement personnalisée

La règle définit une fenêtre dynamique sur jusqu'à 60 valeurs Tous les appels / s par granularité par seconde à l'aide de l'agrégation avg . Et la règle est considérée comme violée lorsque la valeur agrégée est inférieure au seuil de 10 appels par seconde en moyenne.

Lorsque vous créez une Smart Alert équivalente à l'aide de l'option Granularité d'évaluation de 5 minutes, le seuil doit être ajusté en conséquence, car l'échelle de métrique n'est plus normalisée à des valeurs par seconde. Par conséquent, le seuil doit être défini sur 3000 appels par période de 5 minutes.

Règle d'événement personnalisée

Le graphique d'aperçu de la boîte de dialogue Smart Alert vous aide à définir la valeur de seuil appropriée en la comparant aux données d'historique du dernier jour ou de la dernière semaine.

Pourquoi l'option « Logs Blueprint » n'apparaît-elle pas dans la configuration de mon édition Classic auto-hébergée ( Docker )?

Modifier en ligne

Lorsque nous avons rendu les Smart Alerts d'application disponibles en général, nous avons conservé le Plan directeur des journaux et l'utilisation des balises associées aux journaux en tant que fonction d'aperçu public. L'une des raisons pour lesquelles il n'est pas activé par défaut est l'impact global qu'il a sur les performances de requête des données de surveillance d'application lorsqu'il est utilisé de manière intensive. En outre, il y a eu une idée fausse commune que les métriques respectives seraient basées sur les journaux bruts, alors qu'elles sont en fait basées sur le nombre d' appels parent. La notification des journaux, même en dehors des journaux d'erreurs et d'avertissements collectés par les traceurs « Instana », est une fonctionnalité distincte qui sera ajoutée ultérieurement dans le cadre de la surveillance des journaux. L'option Plan directeur des journaux est alors remplacée dans les Smart Alerts de l'application.

Toutefois, si vous souhaitez activer l'option « Logs Blueprint » dans votre Classic Edition ou Custom Edition, procédez comme suit :

Instana Console ( édition classique )

Modifier en ligne

Activez l'indicateur de fonction dans le fichier settings.hcl :

...
feature "smartAlertsLogsBlueprintEnabled" {
    enabled=true
}
...

Appliquez les modifications à l'aide de la commande instana update .

Instana Opérateur ( Kubernetes )

Modifier en ligne

Activez l'indicateur de fonctionnalité dans le core.yaml fichier comme suit :

apiVersion: instana.io/v1beta2
kind: Core
metadata:
  name: instana-core
  namespace: core
spec:
  ...
  featureFlags:
    - name:  feature.smart.alerts.logs.blueprint.enabled
      enabled: true
  ...

Appliquez les modifications à l'aide de la kubectl apply -f core.yaml commande.

Pourquoi ne puis-je pas consulter les informations relatives aux utilisateurs concernés par mon alerte intelligente?

Modifier en ligne

Pour consulter les informations relatives aux utilisateurs concernés, vous devez configurer les sites Web ou les applications mobiles et activer la corrélation en arrière-plan en suivant les instructions fournies. De plus, l'agent doit soit être configuré pour la surveillance des sessions, soit utiliser l' API s de l'agent pour définir un utilisateur valide.

Alertes intelligentes

Ajouter une alerte

mode simple

Sélectionner une alerte

Sélectionnez votre domaine

Ajouter des canaux d'alerte

Mode avancé

Déclencheur

Type de seuil

Statique

Quand utiliser un seuil statique

Adaptative

Quand utiliser le seuil adaptatif

Portée

Choisissez la portée des alertes individuelles

pour cette perspective d'application

par service pour cette perspective d'application

par noeud final pour cette perspective d'application

Choisissez entre les appels entrants et tous les appels

Inclure et exclure les appels internes ou synthétiques

Sélectionnez des services ou des points de terminaison individuels

Seuil d'alerte

Choisissez une unité de mesure

Choisissez l'opérateur de seuil

Choisissez le type de seuil

Choisissez une valeur seuil ou un niveau de sensibilité

Seuil de temps

Persistance dans le temps

Nombre de violations dans le temps

Impact de trace

Canaux d'alerte

Propriétés d'alerte

Titre

Déclenche un incident

Description

Charges utiles personnalisées

Alertes intelligentes mondiales

Ajouter une alerte intelligente globale

Configuration

Identifier les problèmes potentiels

Utilisateurs affectés

Prise en charge de Terraform

Questions fréquentes

En quoi la définition de la portée à l'aide du générateur de requêtes basé sur les balises dans Smart Alerts diffère-t-elle de la fonction Dynamic Focus dans les événements personnalisés?

Comment migrer un événement personnalisé lié aux métriques d'une application, d'un service ou d'un point de terminaison vers les alertes intelligentes?

Migration semi-automatique

Migration manuelle

Correspondance entre les mesures métriques et les plans

Mappage des types d'entités et sélection de la portée

Mappage des appels entrants ou de tous les appels

Correspondance entre les appels internes et synthétiques

Définition de la plage horaire, de la taille de la fenêtre et de la valeur seuil

Quel est le lien entre le délai de temps dans les alertes intelligentes et le délai de grâce dans les événements personnalisés?

Pourquoi l'option « Logs Blueprint » n'apparaît-elle pas dans la configuration de mon édition Classic auto-hébergée ( Docker )?

Instana Console ( édition classique )

Instana Opérateur ( Kubernetes )

Pourquoi ne puis-je pas consulter les informations relatives aux utilisateurs concernés par mon alerte intelligente?