Seuils adaptatifs dans les alertes intelligentes

Les seuils adaptatifs sont une fonctionnalité puissante du système d'alerte d' Instana qui s'ajuste automatiquement aux variations de vos métriques. Contrairement aux seuils statiques, qui restent fixes quel que soit le comportement de votre application, les seuils adaptatifs évoluent en permanence en fonction de vos données, ce qui les rend idéaux pour les environnements dynamiques.

Figure 1. Aperçu des seuils adaptatifs
Aperçu des seuils adaptatifs

Les seuils adaptatifs (ligne rouge) suivent la tendance naturelle des données métriques (ligne bleue) et s'ajustent automatiquement à mesure que le comportement métrique évolue.

Quand utiliser les seuils adaptatifs

Les seuils adaptatifs fonctionnent mieux dans les scénarios suivants :

  • Indicateurs avec des changements progressifs : lorsque l'indicateur sous-jacent devrait évoluer progressivement au fil du temps, mais que des écarts soudains par rapport à cette tendance ne sont pas souhaitables.
  • Indicateurs saisonniers : lorsque les indicateurs suivent des tendances quotidiennes ou hebdomadaires et que vous avez besoin de seuils différents pour différents moments de la journée ou de la semaine.
  • Indicateurs qui évoluent au fil du temps : lorsque le comportement de référence change à mesure que votre application se développe ou que les modes d'utilisation évoluent.

Comment fonctionnent les seuils adaptatifs

Algorithmes de prévision

Les seuils adaptatifs utilisent un algorithme avancé de prévision de séries chronologiques qui excelle dans la capture des tendances et des modèles saisonniers dans vos données. Le système effectue les étapes suivantes :

  1. Analyse les données historiques afin d'identifier des tendances.
  2. Prédit les valeurs futures en fonction de ces modèles.
  3. Calcule les intervalles de confiance autour de ces prédictions.
  4. Utilise ces intervalles pour déterminer les seuils appropriés.

Période de formation

Le système a besoin de données historiques pour établir des modèles fiables. La durée de formation requise varie selon le type d'alerte :

  • Alertes intelligentes de l'application : au moins 14 jours de données métriques continues.
  • Alertes intelligentes du site Web : au moins 5 jours de données métriques continues.

Lorsque vous configurez un seuil adaptatif, le système :

  1. Analyse les données métriques historiques existantes.
  2. Identifie le comportement de référence.
  3. Détecte les tendances saisonnières (le cas échéant).
  4. Établit les valeurs seuils initiales.

Si suffisamment de données historiques sont disponibles, le seuil adaptatif devient opérationnel dès sa configuration. Une fois initialisé, le système se met à jour en continu à mesure que de nouvelles données arrivent, s'adaptant progressivement aux changements dans le comportement de votre application.

Recyclage des modèles

Le système se réentraîne périodiquement afin de s'assurer qu'il reste à jour avec la nature évolutive de vos métriques. Cette formation continue est importante lorsque :

  • Le modèle saisonnier d'une métrique change, par exemple, de non saisonnier à saisonnier quotidien.
  • Les habitudes d'utilisation changent en raison des changements dans les activités commerciales.
  • Le comportement des applications évolue après les déploiements ou les modifications de configuration.

Ce réentraînement automatique garantit que vos seuils restent pertinents sans intervention manuelle, même si les caractéristiques fondamentales de vos métriques changent au fil du temps. Actuellement, le système conserve les modèles une fois par jour.

Paramètres clés

Sensibilité

Le paramètre de sensibilité contrôle le degré d'ajustement du seuil à vos données métriques :

  • Plage : 1-16.
  • Fonction : Contrôle le nombre d'écarts types (sigma) utilisés pour calculer les valeurs seuils.
  • Effet :
    • Des valeurs plus faibles correspondent à une sensibilité plus élevée et créent des seuils plus stricts qui détectent des changements plus faibles.
    • Des valeurs plus élevées correspondent à une sensibilité plus faible et créent des seuils plus larges qui ne détectent que les changements importants.
Figure 2. Comparaison de sensibilité élevée
Comparaison de sensibilité élevée

Un réglage de sensibilité élevé (valeur inférieure) crée des seuils plus stricts autour de la métrique (ligne bleue), détectant ainsi des écarts plus faibles.

Figure 3 Comparaison de sensibilité faible
Comparaison de sensibilité faible

Un réglage de sensibilité faible (valeur plus élevée) crée des seuils plus larges autour de la métrique (ligne bleue), ne détectant que les écarts importants.

Pour les conditions d'alerte qui utilisent les > opérateurs (par exemple, lorsque la latence de réponse dépasse un seuil), le seuil est calculé en ajoutant une certaine marge à la valeur prévue. Le réglage de la sensibilité détermine cette marge en la multipliant par l'écart calculé.

Pour les conditions d'alerte qui utilisent les < opérateurs (par exemple, lorsque la disponibilité passe en dessous d'un seuil), le seuil est calculé en soustrayant une certaine marge de la valeur prévue. Le réglage de la sensibilité détermine également cette marge en la multipliant par l'écart calculé.

Comment le système traite les valeurs aberrantes

Pour éviter que les valeurs extrêmes ne faussent les seuils, le système utilise un mécanisme de découpage :

  1. Pendant l'initialisation : les valeurs extrêmes sont tronquées en fonction des percentiles des données historiques.
  2. Après initialisation : les valeurs sont tronquées en fonction des prévisions du système et des intervalles de confiance.

Ce mécanisme garantit que les pics ou les baisses occasionnels n'influencent pas les calculs de seuil tout en permettant au système de s'adapter aux changements réels dans le comportement des métriques.

Meilleures pratiques

Choisissez la bonne sensibilité

  • Sensibilité supérieure (1-2) : à utiliser pour les mesures critiques où les petits écarts ont leur importance.
  • Sensibilité moyenne (2-4) : à utiliser par défaut pour la plupart des indicateurs.
  • Sensibilité faible (4-16) : à utiliser pour les mesures bruitées ou lorsque vous souhaitez uniquement recevoir des alertes en cas d'écarts importants.

Draft comment:
Choosing the right adaptability (private preview)

Draft comment:
  • Lower adaptability (0.0-0.1): Use when threshold stability is more important over responsiveness to metric fluctuations.
  • Medium adaptability (0.1-0.5): Provides an optimal balance between threshold stability and responsiveness.
  • Higher adaptability (0.5-1.0): Appropriate when thresholds must rapidly adjust to changing metric patterns.

Draft comment:
Seasonality selection (private preview)

Draft comment:
  • Start with Auto detection.
  • Switch to No seasonality if your metric does not follow regular patterns.
  • Select Daily or Weekly if you know that your metric follows these specific patterns.

Limitations connues

Les seuils adaptatifs offrent de puissantes fonctionnalités pour les alertes dynamiques, mais les limitations suivantes s'appliquent :

  • Restrictions relatives au filtrage des balises : certaines balises peuvent ne pas être disponibles pour le filtrage avec des seuils adaptatifs. Le système limite les balises que vous pouvez combiner avec les configurations de seuil adaptatif.
  • Regroupement des alertes intelligentes d'application : les alertes intelligentes d'application ne prennent pas en charge le regroupement par terminal lorsque vous utilisez des seuils adaptatifs. Si vous avez besoin d'un regroupement au niveau des terminaux, utilisez des seuils statiques.

Conclusion

Les seuils adaptatifs constituent un moyen puissant de créer des alertes dynamiques et auto-ajustables qui évoluent avec votre application. En comprenant comment les paramètres de sensibilité, d'adaptabilité et de saisonnalité fonctionnent ensemble, vous pouvez affiner vos alertes afin de détecter les problèmes réels et de minimiser le nombre de faux positifs.

Les seuils adaptatifs nécessitent suffisamment de données historiques pour établir des modèles fiables. La période d'entraînement spécifique dépend du type d'alerte (voir la section Période d'entraînement ci-dessus pour plus de détails). Lorsque suffisamment de données sont disponibles, le seuil devient opérationnel immédiatement après la configuration. Avec une configuration adéquate, les seuils adaptatifs peuvent réduire considérablement le bruit des alertes et vous aider à vous concentrer sur ce qui compte vraiment.