Alertes intelligentes

Les alertes intelligentes vous fournissent des configurations d'alerte générées automatiquement, ce qui vous permet de recevoir des alertes basées sur des modèles prêts à l'emploi, tels que la lenteur d'un site web, les erreurs JavaScript et les codes d'état HTTP.

Sélectionnez un plan directeur pour lequel vous souhaitez être alerté, choisissez une portée arbitraire, par exemple par géolocalisation, navigateur, système d'exploitation, etc., et le système crée automatiquement une alerte personnalisée pour vous.

Ajouter une alerte

Vous pouvez ajouter une alerte en suivant les étapes suivantes :

  1. Dans la barre latérale, cliquez sur Sites Web.
  2. Cliquez sur le nom de votre site Web, puis sur Ajouter une alerte.

mode simple

Par défaut, vous créez une alerte en mode simple, ce qui implique les étapes suivantes:

  1. Sélectionnez une alerte.
  2. Confirmez votre portée.
  3. Sélectionnez un canal d'alerte.

Mode simple : vous pouvez sélectionner des alertes sans aucune configuration, ce qui vous évite d'avoir à créer des requêtes ou à définir des seuils.

Pour créer une alerte en mode avancé, qui permet d'examiner et de modifier tous les paramètres d'alerte configurés automatiquement, cliquez sur « Passer en mode avancé ».

Sélectionner une alerte

Sélectionnez l'un des modèles prédéfinis ci-dessous pour créer une alerte.

Plan directeur Description
Erreurs JS Cliquez sur Sélectionner une erreur JS afin de sélectionner un message d'erreur JavaScript existant pour lequel recevoir une alerte. Vous pouvez également choisir le message d'erreur en fournissant un modèle de message JavaScript en utilisant equal, conte, commence parou se termine par une chaîne définie.
Lenteur Sélectionnez « Ralentissement » pour recevoir des alertes lorsque ou HTTP latency dépasse onLoad time les prévisions établies à partir des données historiques. Cet onLoad time indicateur est disponible à chaque chargement de page et mesure le temps nécessaire jusqu'à la fin de la navigation. Par exemple, lorsque l'indicateur de chargement du navigateur est arrêté. Cet HTTP latency indicateur mesure le temps nécessaire au traitement d'une requête Ajax. Pour plus d'informations sur onLoad time et les indicateurs associés, consultez la FAQ sur la surveillance des sites Web.
Codes de statut HTTP Sélectionnez un code d'état d' HTTP s spécifique pour lequel vous souhaitez recevoir une alerte lorsqu'il apparaît plus fréquemment que d'habitude.
Débit Sélectionnez Nombre anormalement bas de chargements de page ou Nombre anormalement élevé de chargements de page pour recevoir des alertes lorsque le nombre prévu de chargements de page de votre site Web diffère de façon significative par rapport aux données historiques disponibles. Un chargement de page est l'extraction du document HTML initial et de toutes les actions ultérieures jusqu'à la navigation suivante dans le navigateur.
Evénements personnalisés Sélectionnez un événement personnalisé spécifique pour recevoir une alerte lorsqu'il se produit plus ou moins souvent qu'il ne le devrait.

Confirmation de votre portée

La portée, c'est-à-dire le site Web ouvert, est sélectionnée automatiquement. En utilisant les requêtes d'Unbounded Analytics, vous pouvez affiner davantage le champ d'application de l'alerte pour qu'elle porte sur un sous-ensemble spécifique du trafic du site web, par exemple en fonction de la géolocalisation, du navigateur ou de l'utilisateur.

Chaque filtre de requête se connecte à l'opérateur logique AND par défaut. Par conséquent, une balise de site Web doit correspondre à tous les filtres appliqués:

  • Pages spécifiques
  • Types de navigateur
  • Systèmes d'exploitation
  • Pays
  • Meta: spécifiez d'autres métadonnées que vous pouvez utiliser pour annoter les chargements de page. Sélectionnez l'une des clés disponibles, une valeur prédéfinie, puis un opérateur.

Ajouter des canaux d'alerte

Pour ajouter des canaux d'alerte, cliquez sur « Sélectionner un canal d'alerte », puis sélectionnez les canaux vers lesquels envoyer les alertes. Dans les alertes intelligentes pour les sites web, vous pouvez ajouter différents canaux d'alerte pour les niveaux de gravité « avertissement » et « critique ». En mode simple, le système attribue automatiquement aux canaux sélectionnés le niveau de gravité par défaut. Le niveau de gravité par défaut est « avertissement ». Pour plus d'informations sur la création de canaux, consultez la section « Canaux d'alerte ».

Mode avancé

Pour bien comprendre et maîtriser vos alertes, le mode avancé vous permet de vérifier la configuration de chaque alerte prédéfinie et de la modifier si nécessaire. En plus des sélections disponibles en mode simple, le mode avancé propose les options suivantes :

Déclencheur

Sélectionnez l'un des modèles prédéfinis ci-dessous pour lesquels vous souhaitez recevoir des alertes.

Erreurs JS

Les mêmes options de configuration sont disponibles qu'en mode simple. Pour plus d'informations, voir Sélectionner une alerte.

De plus, vous pouvez sélectionner la métrique qui est utilisée pour l'évaluation d'alerte : taux d'erreurs ou nombre d'erreurs. Quelle que soit la métrique que vous sélectionnez, Instana dérive automatiquement une valeur de seuil reposant sur les quatre dernières semaines de données, que vous pouvez également modifier.

L'image suivante montre comment configurer des alertes pour les erreurs JS :

Figure 1. Signaler les erreurs JS
Signaler les erreurs JS

Lenteur

Les mêmes options de configuration sont disponibles qu'en mode simple. Pour plus d'informations, voir Sélectionner une alerte.

De plus, vous pouvez choisir l'indicateur à utiliser pour l'évaluation des alertes, par exemple onLoad time ou HTTP latency. Vous pouvez également choisir le percentile à utiliser pour l'évaluation des alertes. Une alerte est déclenchée lorsque le pourcentage de chargements de pages du site web dont la durée onLoad time est inférieure au seuil est inférieur au percentile correspondant.

Selon la quantité de données historiques disponibles, Instana suggère une version de référence statique ou dynamique. De plus, vous pouvez choisir entre une référence de saisonnalité quotidienne ou hebdomadaire lorsque les données disponibles sont suffisantes.

La valeur de version de référence statique peut être modifiée directement. La saisonnalité quotidienne ou hebdomadaire peut être ajustée à l'aide du sensitivity paramètre, qui définit le nombre de valeurs aberrantes pouvant s'écarter de la valeur attendue avant que cela ne soit considéré comme un écart.

L'image suivante montre comment configurer des alertes en cas de ralentissement :

Figure 2. Alertes de ralentissement
Alertes de ralentissement

Codes de statut HTTP

Les mêmes options de configuration sont disponibles qu'en mode simple. Pour plus d'informations, voir Sélectionner une alerte.

Vous pouvez également choisir l'indicateur à utiliser pour l'évaluation des alertes; status code count ou status code rate. Quelle que soit la métrique que vous sélectionnez, Instana recommande une valeur de seuil reposant sur des données historiques pouvant être modifiées.

L'image suivante illustre la configuration des alertes pour les codes d'état d' HTTP :

Figure 3 Alertes : codes d'état de l' HTTP
Alertes : codes d'état d' HTTP

Débit

Contrairement aux options spécifiques à un cas d'utilisation proposées en mode simple, décrites dans la section « Sélectionner une alerte », le mode avancé permet de définir une alerte intelligente plus générique, basée sur n'importe quel indicateur lié à la consultation des pages.

De plus, vous pouvez sélectionner la métrique utilisée pour l'évaluation d'alerte, par exemple Chargements de page ou Transitions de page. Vous trouverez plus d'informations sur les indicateurs disponibles dans la FAQ relative à la surveillance du site web. Etant donné l'exemple de configuration dans l'image, une alerte est déclenchée lorsque le nombre de transitions de page est supérieur à la normale. Selon la quantité de données historiques disponibles, Instana suggère une version de référence statique ou dynamique. De plus, vous pouvez choisir entre une référence de saisonnalité quotidienne ou hebdomadaire lorsque les données disponibles sont suffisantes.

La valeur de version de référence statique peut être modifiée directement. La saisonnalité quotidienne ou hebdomadaire peut être ajustée à l'aide du sensitivity paramètre, qui définit dans quelle mesure les valeurs aberrantes peuvent s'écarter de la valeur attendue avant d'être considérées comme une anomalie.

L'image suivante illustre la configuration des alertes pour les transitions de page :

Figure 4 Transitions entre les pages d'alertes
Transitions entre les pages d'alertes

Evénements personnalisés

Les mêmes options de configuration sont disponibles qu'en mode simple. Pour plus d'informations, voir Sélectionner une alerte.

L'image suivante illustre la configuration des alertes pour les événements personnalisés :

Figure 5. Alertes sur les événements personnalisés
Alertes sur les événements personnalisés

Type de seuil

Lorsque vous configurez une Smart Alert, vous pouvez choisir d'utiliser des seuils statiques ou adaptatifs .

Figure 6 Type de seuil
Type de seuil

Statique

Les seuils statiques ne changent pas après la création de l'alerte intelligente. Le seuil lui-même peut être soit une valeur constante simple, soit tenir compte des variations saisonnières qui se sont produites dans le passé lors de la création de la configuration Smart Alert. Vous pouvez l'imaginer comme une table de correspondance pour chaque point de la journée ou de la semaine qui est précalculée une fois en fonction des données d'historique.

Il se peut que le seuil ne soit plus pertinent une fois que la métrique sous-jacente a été modifiée de manière significative. En réponse, le seuil peut être ajusté manuellement ou recalculé à tout moment.

Quand utiliser un seuil statique

Les seuils statiques fonctionnent mieux pour les plans directeurs tels que Slowness ou JS Errors dans les situations suivantes:

  • Indépendamment de toute saisonnalité de l'indicateur sous-jacent. Il n'est pas souhaitable que la métrique soit supérieure ou inférieure à une valeur constante.
  • Par conséquent, l'indicateur sous-jacent est saisonnier, et les seuils varient en fonction du moment de la journée ou de la semaine. Mais ces seuils eux-mêmes ne changent pas au fil du temps, et des changements progressifs de ces seuils sur de longues périodes de temps ne sont pas souhaitables.

Adaptative

Les seuils adaptatifs évoluent en permanence et s'ajustent en fonction des nouvelles données enregistrées par Instana. Le seuil tient compte en permanence des variations saisonnières de l'indicateur sous-jacent, sans aucune intervention humaine. Pour plus d'informations, consultez la documentation sur le seuil adaptatif.

Quand utiliser le seuil adaptatif

Les seuils adaptatifs fonctionnent mieux pour les plans directeurs tels que Débit ou de manière générale pour les situations suivantes:

  • L'indicateur sous-jacent n'est pas saisonnier. On s'attend à ce que le seuil change progressivement au fil du temps, mais tout écart soudain par rapport à cette tendance est indésirable.
  • L'indicateur sous-jacent est saisonnier et des seuils différents existent pour différentes heures du jour ou de la semaine. On s'attend à ce que les seuils eux-mêmes changent progressivement au fil du temps, mais tout écart soudain par rapport à cette tendance n'est pas souhaitable.

Seuil d'alerte

Vous pouvez configurer le seuil d'alerte de la fonction Smart Alert. L'indicateur sous-jacent est une agrégation de balises liées au site Web donné. Lorsque le seuil d'alerte de la Smart Alert est configuré, l'aperçu d'alerte de la boîte de dialogue affiche la métrique, le seuil et les violations sur les données d'historique des dernières 24 heures ou 7 jours.

Choisissez une unité de mesure

Cette étape s'applique lorsque vous sélectionnez le modèle « Slowness »; vous pouvez alors choisir parmi les options suivantes : moyenne arithmétique, minimum et maximum, ainsi que les 25e, 50e, 75e, 90e, 95e, 98e et 99e centiles.

Remarque : cet indicateur est calculé pour les balises de site web dont l'horodatage se situe dans la granularité d'évaluation, qui est définie dans le cadre du seuil temporel.

Choisissez un opérateur de seuil

En fonction du plan directeur choisi, vous disposez de l'option entre <, <=, >, >=.

Choisissez un type de seuil

Vous pouvez choisir parmi les types de seuil statique suivants:

  • Seuil statique : utilise une valeur constante comme seuil.
  • Saisonnalité quotidienne statique: Utilise un seuil qui capture les modèles de répétition quotidienne de l'unité de mesure où chaque jour se comporte à peu près de la même façon, mais est différent tout au long de la journée. Par exemple, un site Web qui a plus de trafic pendant la journée que pendant la soirée.
  • Saisonnalité Hebdomadaire statique: Utilise un seuil qui capture les modèles de répétition hebdomadaires de l'unité de mesure où chaque jour d'une semaine se comporte à peu près de la même façon, mais est différent tout au long de la semaine. Par exemple, un site Web qui a plus de trafic sur les jours de travail par rapport au week-end.

Pour la saisonnalité quotidienne statique, au moins 5 jours de données de métrique continues sont requis, mais 7 jours de données sont recommandés. Pour la saisonnalité hebdomadaire statique, au moins 2 semaines de données de métrique d'historique continues sont requises. L'alerte intelligente ne peut pas être créée lorsque ces exigences ne sont pas satisfaites.

Pour Seuil adaptatif, au moins 5 jours de données de métrique continues sont requis. Si cette condition n'est pas remplie, l'alerte intelligente peut tout de même être créée. La détection et l'alerte des problèmes commenceront à fonctionner dès que les exigences en matière de données seront satisfaites pour initialiser le modèle utilisé.

Choisissez une valeur seuil ou un niveau de sensibilité

Si vous choisissez Seuil statique, vous pouvez utiliser la valeur de seuil suggérée ou la définir manuellement.

Réglez la sensibilité pour affiner les limites de détection des anomalies. Par conséquent, vous recevez davantage d'alertes. Toutefois, si vous souhaitez recevoir moins de notifications d'alerte, vous pouvez diminuer la sensibilité. Cela permet d'étendre les limites de détection qui définissent la plage de valeurs attendues de la métrique. Selon l'opérateur de seuil utilisé, une métrique qui dépasse la limite supérieure ou inférieure de détection est considérée comme une violation susceptible de déclencher une alerte.

Seuil de temps

Pour que l'alerte se déclenche, le seuil temporel impose des conditions supplémentaires concernant la manière dont le seuil défini pour la métrique est dépassé.

Les conditions typiques suivantes, souvent utilisées en pratique, sont proposées:

  • Persistance du temps : sélectionnez une fenêtre de temps. Vous recevez une alerte lorsque la métrique enfreint un seuil défini au cours de la fenêtre de temps définie.

  • Nombre de violations dans le temps : sélectionnez une fenêtre de temps et le nombre de violations. Lorsque la métrique dépasse le seuil un nombre spécifié de fois au cours de la fenêtre de temps, vous êtes alerté.

  • Impact sur l'utilisateur:

    En outre, la condition de seuil sur la métrique sélectionnée, vous pouvez définir un critère secondaire sur le nombre minimal d'utilisateurs impactés requis. Ce système ne reçoit des alertes que lorsqu'un nombre ou un pourcentage significatif d'utilisateurs est affecté par le problème défini.

    • Méthode d'évaluation de l'impact sur l'utilisateur: Définit la façon dont l'impact sur l'utilisateur est mesuré lorsque la mesure principale est violée pour le nombre de fenêtres d'évaluation. Vous pouvez sélectionner l'une des méthodes suivantes :
      • Agrégation de toutes les fenêtres d'évaluation, qui mesure l'impact sur l'utilisateur en tant qu'agrégat unique sur la fenêtre de temps définie. Cette valeur doit être dépassée pour recevoir une alerte.
      • Calculer pour chaque fenêtre d'évaluation, qui permet de mesurer l'impact sur les utilisateurs pour chaque fenêtre d'évaluation individuellement, comme n'importe quelle autre métrique. Pour recevoir une alerte, le nombre défini de fenêtres d'évaluation doit être violé en séquence à la fois pour l'indicateur principal et pour l'impact sur l'utilisateur.
    • Nombre d'utilisateurs affectés ou pourcentage d'utilisateurs affectés : Indiquez le nombre absolu d'utilisateurs touchés, le pourcentage d'utilisateurs touchés, ou les deux. Dans ce dernier cas, vous n'êtes alerté que lorsque les deux limites sont atteintes pendant la fenêtre de temps définie.

    L'indicateur d'impact sur les utilisateurs nécessite l'utilisation de la table « Users » API d' Instana pour identifier les utilisateurs authentifiés, ainsi que la table « Session » API pour estimer le nombre d'autres utilisateurs en fonction de leur session. En fonction de l'intégration de ces API, l'ID utilisateur est utilisé s'il est fourni, sinon l'ID de session est utilisé en tant que rétromigration.

En présence de lacunes pour une métrique qui n'est pas agrégée par SUM, comme la latence ou les taux d'erreur, Instana préserve l'état d'alerte actuel jusqu'à ce que la prochaine valeur de métrique soit vue. Cette fonctionnalité s'avère utile lorsqu'une alerte intelligente est configurée pour un site web qui ne reçoit que peu de trafic, mais qui est confronté à un problème récurrent. Par conséquent, ces périodes sans trafic de site Web ne provoqueront pas d'alertes répétitives. Toutefois, l'absence de signal provenant du site web pendant plus de trois heures entraîne systématiquement la fermeture de toute alerte active.

L'image suivante illustre un exemple de configuration pour un seuil de temps basé sur l' impact sur l'utilisateur. Avec une granularité d'évaluation de 5 minutes, une alerte est déclenchée lorsqu'au moins 10 utilisateurs ont été affectés au cours des 15 dernières minutes.

Figure 7. Seuil temporel : impact sur l'utilisateur
Seuil temporel : impact sur les utilisateurs

Canaux d'alerte

Vous pouvez choisir les canaux d'alerte pour l'envoi des notifications d'alerte. Dans les alertes intelligentes pour les sites Web, vous pouvez configurer différents canaux d'alerte pour les niveaux de gravité « avertissement » et « critique ».

Si une valeur seuil est définie pour les niveaux de gravité « Avertissement » et « Critique », vous pouvez configurer les canaux d'alerte pour chaque niveau de gravité. Si une valeur seuil est définie pour les deux niveaux de gravité, tous les canaux d'alerte sont sélectionnés par défaut pour le niveau « Avertissement ».

L'image suivante montre les canaux d'alerte pour lesquelles les deux niveaux de gravité ont été configurés :

Figure 8. Canaux d'alerte avec plusieurs niveaux de gravité
Canaux d'alerte avec plusieurs niveaux de gravité

Si une valeur seuil est définie pour un seul niveau de gravité, ce niveau s'affiche pour chaque canal d'alerte en tant que « niveau d'alerte ».

L'image suivante montre les canaux d'alerte avec une seule gravité configurée :

Figure 9. Canaux d'alerte avec un seul niveau de gravité
Canaux d'alerte avec un seul niveau de gravité

Propriétés d'alerte

L'ajout d'autres propriétés d'alerte est facultatif. Ces options permettent notamment de modifier le titre et la description par défaut de l'alerte, d'utiliser des espaces réservés pour créer des titres et des descriptions dynamiques, et de choisir si l'alerte doit déclencher un incident. Pour plus d'informations, consultez la section « Alertes ».

Charges utiles personnalisées

Pour ajouter une charge utile supplémentaire qui vous concerne dans les notifications d'alerte pour une configuration d'alerte spécifique envoyée par Instana, cliquez sur « Ajouter une ligne » dans la section « Charges utiles personnalisées ».

Pour plus d'informations, consultez : Configurer une charge utile personnalisée au niveau global.

La charge personnalisée globale et la charge personnalisée spécifique à l'alerte seront incluses dans les notifications d'alerte, le cas échéant, mais la configuration spécifique à l'alerte est prioritaire sur la configuration globale. Par conséquent, si vous utilisez la même clé, la valeur du champ de charge utile personnalisée globale sera remplacée par celle spécifique à l'alerte.

Vous pouvez voir les contenus personnalisés définis globalement qui sont effectivement utilisés dans la configuration d'alerte comme suit:

Figure 10. Chargement personnalisé global en lecture seule
Chargement personnalisé global en lecture seule

Les zones de contenu personnalisé dynamique dans une configuration spécifique à une alerte sont également prises en charge.

Sélectionnez « Dynamic Tag » comme indiqué sur l'image suivante :

Figure 11. Charge personnalisée dynamique
Charge personnalisée dynamique

Vous pouvez utiliser les suggestions pour sélectionner la clé appropriée pour la balise dynamique choisie ou l'ajouter manuellement, comme indiqué dans l'image suivante :

Figure 12. Suggestions dynamiques de charges utiles personnalisées
Suggestions dynamiques de charges utiles personnalisées

Prise en charge de Terraform

Instana permet de mettre en œuvre des fonctionnalités d'« Infrastructure as Code » ( IaC ) en fournissant une ressource Terraform permettant de gérer les alertes intelligentes du site Web par programmation. Cette fonctionnalité permet aux équipes d' DevOps s et de SRE de définir, de déployer et de gérer les configurations d'alerte sous forme de code. Cela contribue à améliorer l'automatisation et la cohérence entre les différents environnements.

Pour plus d'informations sur la gestion des alertes intelligentes du site Web à l'aide d' Terraform, consultez la page Instana website alert configuration.

Utilisateurs affectés

La fonctionnalité « Utilisateurs affectés » des alertes intelligentes du site web permet d'identifier les problèmes de performance généralisés en recensant le nombre d'utilisateurs confrontés à une situation donnée.

Pour chaque problème signalé par une alerte Smart Alert générée par un site web, vous pouvez désormais consulter les informations suivantes :

  1. N ombre total d'utilisateurs concernés : nombre total d'utilisateurs concernés lors de l'utilisation du site web sur lequel l'alerte intelligente a été créée. Ce décompte est calculé à partir du moment où l'alerte est déclenchée jusqu'à l'heure actuelle ou jusqu'à l'heure de clôture du problème, selon la première éventualité. On entend par « utilisateur concerné » tout utilisateur dont le navigateur émet une balise qui ne respecte pas les critères d'alerte. Par exemple, si une alerte intelligente est configurée pour les temps de chargement de page supérieurs à 500 ms, un utilisateur affecté est toute personne dont le temps de chargement de la page dépasse ce seuil de 500 ms. Dans ce cas, l'utilisateur est celui qui est identifié dans l'agent du site web. Si aucun utilisateur n'est connecté, l'identifiant de session est utilisé pour identifier l'utilisateur concerné. Pour plus d'informations, consultez la section « Identification des utilisateurs ».

  2. Nombre total d'utilisateurs : le nombre total d'utilisateurs qui ont consulté le site web. Ce suivi commence au moment où l'alerte est déclenchée et se poursuit jusqu'à l'heure actuelle ou jusqu'à la clôture du ticket, selon la première éventualité.

  3. Rapport d'impact : un rapport détaillé indique les identifiants d'utilisateur concernés pour le site web. Ce rapport présente une ventilation plus détaillée des utilisateurs concernés, chaque enregistrement du tableau correspondant à un utilisateur unique du site web. Pour chaque utilisateur, le rapport indique son nom, son adresse e-mail, son pays, sa région, le libellé de configuration (nom du site web ou de l'application mobile sur lequel/laquelle l'utilisateur a été affecté) et la source (site web ou application mobile) si celle-ci a été signalée par l'agent.

Figure 13. Rapport des utilisateurs concernés
Rapport des utilisateurs concernés
Impacted user information is available only for the past 7 days. For more information, see [IBM data retention policy](../policies/index.html#data-retention-policy).
{: note}