objectifs de niveau de service

La section « Objectifs de niveau de service » (SLO) dans la barre de navigation latérale offre une expérience ciblée et des données pertinentes pour suivre les performances des services. Vous pouvez suivre les applications, les sites Web, les tests synthétiques et les entités d'infrastructure sur des périodes fixes et glissantes.

Remarque : les SLO et les widgets SLO (version héritée) sont des fonctionnalités distinctes. Les widgets correspondants sont disponibles séparément pour SLO.

Vous pouvez utiliser un tableau de bord récapitulatif pour afficher tous vos SLO et leur statut, ainsi qu'une page détaillée pour afficher l'indicateur, le budget d'erreurs et le trafic sur différentes périodes.

Remarque : les SLO ne sont pas pris en charge dans l'édition Classic auto-hébergée ( Docker ).

Pour plus d'informations sur les autorisations et les conditions d'accès aux niveaux de service, consultez la section « Gestion de l'accès des utilisateurs - Niveaux de service ».

Présentation des tableaux de bord

Dans l'interface utilisateur d' Instana, passez la souris sur la barre de navigation latérale et sélectionnez « Niveaux de service ». La page « Niveaux de service » comprend les onglets suivants :
  • Objectifs de niveau de service - Afficher et gérer les SLO.
  • Apdex - Afficher et gérer les configurations Apdex. Pour plus d'informations, consultez Apdex.
  • Fenêtres de correction - Gérer les fenêtres de correction pour les SLO.
L'onglet SLO présente une vue d'ensemble de tous les SLO, classés par ordre alphanumérique avec leur statut. Vous pouvez trier le tableau par nom, entité, schéma ou statut. Vous pouvez également effectuer une recherche par nom de SLO ou utiliser le panneau de filtrage pour affiner les résultats.

Dans l'interface utilisateur d' Instana, passez la souris sur la barre de navigation latérale et sélectionnez « Niveaux de service ». La page « Niveaux de service » présente un aperçu de tous vos SLO, classés par ordre alphanumérique et accompagnés de leur statut. Vous pouvez trier le tableau par nom, effectuer une recherche par nom SLO ou utiliser le panneau de filtrage pour affiner l'affichage.

Filtrage des SLO

  1. Cliquez sur l'icône du filtre pour ouvrir le panneau de filtrage, qui vous permet de filtrer les SLO par :
    • Statut : Filtrer par statut de performance SLO
      • Tout : Afficher tous les SLO
      • Dans la cible : afficher uniquement les SLO atteignant leur cible
      • Hors objectif : afficher uniquement les SLO qui n'atteignent pas leur objectif
    • Balises : sélectionnez une ou plusieurs balises pour filtrer les SLO en fonction des balises qui leur sont attribuées
    • Plan : Filtrer par type d'indicateur
      • Tout : Afficher tous les types de plans
      • Disponibilité : Afficher uniquement les SLO de disponibilité
      • Personnalisé : afficher uniquement les SLO personnalisés
      • Latence : afficher uniquement les SLO de latence
      • Saturation : afficher uniquement les SLO de saturation
      • Trafic : afficher uniquement les SLO relatifs au trafic
    • Type d'entité : filtrer par type d'entité surveillée
      • Application
      • Site Web
      • Tests synthétiques
      • Infrastructure
  2. Après avoir sélectionné vos critères de filtrage, cliquez sur Filtrer pour appliquer les filtres. Cliquez sur Effacer pour réinitialiser tous les filtres et revenir à l'affichage sans filtre.

Table SLO

Le tableau affiche les informations suivantes :

  • Nom : Le nom du SLO. La couleur de la bordure à gauche indique l'état actuel de l'indicateur de niveau de service (SLI).

  • Type d'entité : type d'entité surveillée, telle qu'une application, un site Web, un test synthétique, un hôte ou un cluster d' Kubernetes.

  • Nom de l'entité : nom de l'application, du site Web ou des tests synthétiques spécifiques associés à ce SLO. Pour les SLO d'infrastructure, la valeur est indiquée comme « agrégée » car l'entité est dynamique.

Remarque : si l'entité associée est supprimée ou n'est plus visible, cette colonne affiche « Entité inconnue ». La définition SLO reste inchangée, mais les données relatives aux entités supprimées ne sont plus collectées.
  • Plan directeur : type d'indicateur qui est mesuré.

    • Latence : mesure la rapidité de réponse du service par rapport à un seuil défini.
    • Disponibilité : mesure la fréquence à laquelle un service répond sans erreur.
    • Trafic : mesure le volume de trafic reçu par un service.
    • Saturation : mesure l'utilisation des ressources par rapport à un seuil défini.
    • Personnalisé : mesure le nombre d'événements positifs ou négatifs à l'aide de filtres définis par l'utilisateur.
  • Budget d'erreurs restant : indique la quantité de budget d'erreurs encore disponible. La valeur est représentée en minutes, appels, balises, résultats ou instantanés métriques, selon le type d'entité et le type d'indicateur sélectionnés. Des informations sur la configuration des plages horaires des SLO sont également affichées.

  • Statut/Objectif : affiche le statut actuel du SLO sous forme de pourcentage, ainsi que l'objectif visé. Si le statut correspond à l'objectif, il s'affiche en vert jusqu'à ce que votre budget d'erreurs soit épuisé; il s'affiche alors en rouge.

  • Balises : affiche les balises associées au SLO, qui peuvent être utilisées pour filtrer l'affichage des SLO associés.

  • Équipes : répertorie les équipes associées au SLO, qui détermine les autorisations d'accès.
  • Actions : contient les boutons Modifier, Copier et Supprimer.

Détails SLO

Sélectionnez un SLO dans le tableau de données du tableau de bord pour afficher ses détails. La page affiche un résumé de l'état SLO, du budget d'erreurs et du trafic, avec des graphiques détaillés de l'indicateur, du budget d'erreurs et du trafic au fil du temps. Vous pouvez basculer entre la fenêtre temporelle SLO configurée et la plage horaire indiquée dans l'interface utilisateur pour afficher les données.

La page affiche les informations suivantes :

  • Nom du SLO : le nom du SLO.

  • Analyser : ouvre un menu permettant de consulter les données relatives aux entités dans la page Analytics. Cette option est disponible uniquement pour les types d'entités Application et * Site Web. Pour les applications, vous pouvez sélectionner Appels ou Mauvais appels. Pour les sites Web, vous pouvez sélectionner les requêtes « HTTP » (Réponse 404) ou « Bad HTTP » (Réponse incorrecte).

  • Analyser l'infrastructure : ouvre la vue Analyser l'infrastructure. Cette option est disponible uniquement pour les types d'entités Infrastructure.

  • Afficher les fenêtres de correction : ouvre une boîte de dialogue pour afficher temporairement les effets de l'activation des fenêtres de correction sur l'état SLO et le budget d'erreurs. Seules les fenêtres de correction actives qui s'appliquent à ce SLO sont affichées. Les modifications sont réinitialisées lorsque vous actualisez la page.

  • Entité : nom de l'application, du site Web, du test synthétique ou de l'entité d'infrastructure associé(e) à ce SLO. Toutes les configurations de portée déclarées sont également affichées.

Remarque : si l'entité associée est supprimée ou n'est plus visible pour vous, cette colonne affiche « Entité inconnue ». La définition SLO reste inchangée, mais les données SLO relatives aux entités supprimées ne sont plus enregistrées.
  • Balises : affiche les balises associées au SLO, qui peuvent être utilisées pour filtrer l'affichage des SLO associés.
  • Équipes : répertorie les équipes associées au SLO, qui détermine les autorisations d'accès.

L 'onglet Résumé affiche des informations agrégées sur le SLO pour la période sélectionnée, avec des cartes et des graphiques pour les indicateurs clés de performance (KPI) du SLO.

  • Commutateur de contenu temporel : permet de basculer entre la fenêtre temporelle de la configuration SLO et la plage temporelle sélectionnée.

  • Fenêtre temporelle SLO configurée : affiche la fenêtre temporelle configurée pour le SLO qui détermine le budget d'erreurs, ainsi que le fuseau horaire configuré.

    Remarque : si le fuseau horaire configuré dans SLO diffère de celui de votre navigateur, une bannière d'information s'affiche en haut de la page. La bannière affiche : « Ce SLO a été créé dans [fuseau horaire SLO]. Votre fuseau horaire actuel est défini sur [Votre fuseau horaire] Cliquez sur Modifier le fuseau horaire du SLO dans la bannière pour modifier la configuration du fuseau horaire du SLO.
  • Windows de temps SLO correspondantes : affiche les fenêtres temporelles configurées qui couvrent la période sélectionnée. Si la période sélectionnée couvre plusieurs fenêtres, celles-ci seront représentées par des couleurs distinctes dans les graphiques correspondants.

  • Statut : affiche le statut actuel du SLO représenté en pourcentage, ainsi que l'objectif configuré.

  • Budget d'erreurs restant : affiche le budget d'erreurs restant et total. La valeur est représentée en minutes, appels, balises, résultats ou instantanés métriques, selon le type d'entité et le type d'indicateur sélectionnés.

  • Taux d'épuisement : affiche le taux d'épuisement du budget d'erreurs.

  • Trafic : affiche le nombre d'appels reçus par l'application ou le site web configuré, ou le nombre total de résultats des tests synthétiques configurés.

Les graphiques suivants montrent la tendance sur les périodes sélectionnées :

  • Indicateur : affiche la métrique de l'indicateur par rapport au seuil configuré. Les données de ce graphique sont agrégées pour des fenêtres temporelles plus larges. Pour afficher des données plus détaillées, sélectionnez une période plus courte.
Remarque : lorsque le graphique indicateur est affiché avec une granularité horaire, chaque point de données représente la valeur maximale des valeurs agrégées sous-jacentes au niveau des minutes pour cette heure. Les valeurs indiquées dans ce graphique peuvent différer de celles figurant dans d'autres graphiques au niveau des entités en raison de différences dans les méthodes d'agrégation et la granularité des données.
  • Budget d'erreurs : affiche le budget d'erreurs restant.
  • Taux de consommation : affiche le taux de consommation sur la période SLO.
  • Trafic : affiche le nombre d'appels reçus par l'application ou le site web configuré, ou le nombre total de résultats des tests synthétiques configurés.

Résumé SLO et vue de configuration

Comme le montre l'exemple d'image suivant de la page de perspective de l'application, un marqueur de correction s'affiche sous forme d'annotation sur chaque graphique de votre environnement. Ce marqueur sert de point de référence pour vous aider à identifier rapidement les changements, par exemple les régressions ou les améliorations dans les performances de leurs applications.

Figure 1. Marqueur de correction sur les graphiques du tableau de bord SLO
Marqueur de correction sur les graphiques du tableau de bord SLO

Comme le montre l'image précédente de la page de perspective de l'application, le marqueur de correction contient les informations suivantes :

  • Nom : nom défini par l'utilisateur pour la correction.
  • Heure de correction : moment où la correction a eu lieu.

Pour garantir la lisibilité des marqueurs et éviter qu'ils ne se chevauchent, les corrections sont regroupées en clusters lorsqu'elles se trouvent dans le même compartiment du graphique. Tous les compartiments d'un cluster sont mis en surbrillance lorsque vous passez la souris sur l'icône de correction correspondante. Si un compartiment a une capacité élevée, les corrections qui ont eu lieu pendant la période du compartiment sont regroupées.

L'onglet Configuration affiche les informations de configuration du SLO. Il existe des options permettant de modifier, copier ou supprimer le SLO.

L'onglet « Alertes intelligentes » affiche des informations sur les alertes intelligentes configurées pour cet SLO.

L'onglet Fenêtres de correction affiche les fenêtres de correction associées à ce SLO.

Analyse des SLO basée sur l'IA

Instana offre des fonctionnalités de synthèse et d'explication basées sur l'IA pour vous aider à comprendre rapidement les performances des SLO et à identifier des informations exploitables.

Génération de résumés par IA

Sur la page de détails des SLO, vous pouvez générer des résumés basés sur l'IA pour analyser les performances de vos SLO.

Pour générer le résumé, procédez comme suit :

  1. Dans le tableau de bord des niveaux de service, sélectionnez un SLO.
  2. Cliquez sur « Générer un résumé par IA » sur la page de détails du SLO.

    La boîte de dialogue de synthèse par IA s'ouvre et affiche une analyse détaillée de votre SLO.

Boîte de dialogue de synthèse par IA

La boîte de dialogue de synthèse par IA propose deux affichages :

Vue récapitulative (par défaut)

La vue récapitulative affiche un résumé concis d'un paragraphe comprenant le nom de l'objectif de performance (SLO), le pourcentage cible, le nom de l'entité, la valeur actuelle de l'indicateur de performance (SLI), l'état du budget d'erreur et l'état de conformité (conforme ou en dessous de l'objectif). Il offre un aperçu rapide et clair de l'état de vos SLO.

Figure 2. Fenêtre de dialogue « Résumé » de SLO AI

Fenêtre de dialogue « Résumé » de SLO AI

Afficher tous les détails

Cliquez sur « Afficher plus » pour agrandir la fenêtre de dialogue et accéder à une analyse détaillée, structurée comme suit :

  • Présentation du SLO : détails complets de la configuration, notamment le nom, le pourcentage cible, le type d'indicateur (disponibilité, latence, trafic, saturation ou personnalisé), la fenêtre temporelle et le fuseau horaire.
  • Contexte de l'entité : informations complètes sur l'entité, notamment le type (application, site web, test synthétique ou infrastructure), le nom, les identifiants, les libellés et la configuration de la portée.
  • État de performance : pourcentage SLI actuel avec indicateur d'état, budget d'erreurs restant (les valeurs négatives indiquent que le budget est épuisé), budget d'erreurs utilisé par rapport au budget total, et taux d'épuisement du budget d'erreurs par rapport à l'objectif.
  • Points clés : analyse approfondie portant notamment sur les schémas d'accumulation d'erreurs persistantes, les tendances en matière de rythme de dépense, les indicateurs de surconsommation chronique, les problèmes de qualité des données (erreurs nulles, interruptions de service, données manquantes), les pics d'erreurs corrélés aux modifications budgétaires et l'état des violations en cours.
  • Recommandations : mesures détaillées et classées par ordre de priorité, telles que des conseils pour l'analyse des causes profondes, l'ajustement des seuils d'alerte, l'amélioration de la redondance et des mécanismes de basculement, l'affinement de la définition des erreurs, l'amélioration de l'instrumentation et l'ajustement des objectifs SLO.
Figure 3 Affichage détaillé de SLO AI

Affichage détaillé de SLO AI

Actions de la boîte de dialogue

  • Fermer : Fermer la boîte de dialogue et revenir à la page de détails du SLO.
  • Icône « Copier » : Copiez le texte du résumé dans votre presse-papiers pour l'utiliser dans des rapports ou d'autres communications.
  • Télécharger au format « PDF » : exportez l'analyse complète de l'IA sous forme de document « PDF » à des fins de partage ou d'archivage (disponible dans la vue détaillée).

Cas d'utilisation

L'analyse des SLO basée sur l'IA est utile pour :

  • Vérification rapide de l'état : obtenez une vue d'ensemble immédiate de l'état des SLO sans avoir à analyser manuellement les graphiques.
  • Gestion des incidents : identifier rapidement les causes profondes et proposer des mesures à prendre en cas de panne.
  • Rapports : Rédiger des résumés à l'intention des parties prenantes.
  • Analyse des tendances : comprendre l'évolution des violations des SLO au fil du temps.
  • Optimisation : recevez des recommandations fondées sur des données pour améliorer la fiabilité du service.

Remarques

  • Les résumés générés par l'IA sont basés sur la fenêtre temporelle actuellement sélectionnée (qu'il s'agisse de la fenêtre temporelle SLO configurée ou de la plage horaire sélectionnée dans l'interface utilisateur).
  • L'analyse prend en compte à la fois les configurations de SLO basées sur le temps et celles basées sur les événements.
  • Les recommandations sont adaptées au type d'indicateur concerné (disponibilité, latence, trafic, saturation ou personnalisé).
  • Prise en charge pour tous les types d'entités : applications, sites web, tests synthétiques et infrastructure.
  • Pour les SLO basés sur les événements, le budget d'erreurs est dynamique et évolue en fonction des fluctuations du volume de trafic.

Création d'un SLO

Pour créer un SLO, cliquez sur « Créer un objectif de niveau de service ». Cela ouvre une fenêtre dans laquelle vous pouvez créer un nouveau SLO en suivant ces étapes :

Sélectionner un type d'entité

Sélectionnez le type d'entité à mesurer pour votre SLO. Vous pouvez définir et mesurer des objectifs de performance pour les types d'entités suivants :

  • Application : Mesurer les performances des appels dans une perspective applicative.
  • Site Web : mesurez les performances des balises et des traces dans un site Web.
  • Tests synthétiques : mesurez les performances des résultats d'un ou plusieurs tests synthétiques.
  • Infrastructure : mesurez les performances des entités d'infrastructure telles que les hôtes, les conteneurs ou d'autres composants d'infrastructure.

Sélectionner une entité

Après avoir sélectionné le type d'entité, choisissez l'entité spécifique à surveiller.

pour les applications

Sélectionnez une perspective d'application dans la liste consultable des perspectives d'application disponibles dans votre environnement.

Pour les sites Web

Sélectionnez un site Web dans la liste consultable des sites Web disponibles dans votre environnement.

Pour les tests synthétiques
  • D'après les tests synthétiques individuels : cliquez sur « Ajouter un test synthétique » pour ouvrir une boîte de dialogue dans laquelle vous pouvez rechercher et sélectionner un ou plusieurs tests synthétiques parmi ceux disponibles dans votre environnement. Vous pouvez filtrer les tests en fonction de critères tels que le lieu et le type, et sélectionner plusieurs tests parmi les résultats de la recherche. Les tests sélectionnés constituent une liste statique, ce qui signifie que seuls les tests choisis sont pris en compte dans l'évaluation des SLO.

    • Résultats des tests synthétiques : activez ce bouton pour inclure les résultats des tests synthétiques à la demande dans les calculs des SLO. Par défaut, cette option est désactivée et tous les résultats des tests à la demande sont exclus.
  • En fonction des filtres : vous pouvez également définir la portée du SLO à l'aide d'une expression de filtre de balises. Dans cette option, vous pouvez définir des filtres tels que le nom du test synthétique, l'ID de site, l'ID d'application ou d'autres attributs pris en charge. Les filtres comprennent des opérateurs tels que « égal à », « commence par » ou d'autres règles de correspondance prises en charge, et peuvent permettre des correspondances de type « caractère générique » selon l'opérateur utilisé. Tous les tests synthétiques qui correspondent aux filtres spécifiés sont automatiquement pris en compte dans le calcul du SLO. Contrairement à la sélection de tests individuels, cette approche crée une portée dynamique, ce qui signifie que le SLO intègre automatiquement les nouveaux tests synthétiques qui répondent aux critères de filtrage dès leur création.

Pour les infrastructures

La sélection du type d'infrastructure fait partie de la configuration de la portée dans l'étape suivante.

Définir la portée

Configurez la portée pour spécifier les données à mesurer. La configuration de la portée dépend du type d'entité.

Applications

Sous Appels concernés, choisissez les appels à inclure pour déterminer la disponibilité du service et du terminal :

  • Appels considérés

    • Appels entrants : inclut les appels initiés depuis l'extérieur de l'application et dont le service de destination fait partie de la perspective d'application sélectionnée.
    • Tous les appels : inclut à la fois les appels entrants provenant de l'extérieur de l'application et les appels qui se produisent dans la perspective de l'application.
  • Inclure les appels masqués (facultatif)

    • Appels internes : appels qui représentent le travail effectué au sein d'un service. Ils peuvent être créés à partir de portées intermédiaires envoyées via un traçage personnalisé.
    • Appels synthétiques : appels dont la destination est un point de terminaison synthétique, tels que les appels vers des points de terminaison de vérification de l'état.
  • Services et points de terminaison Choisissez comment définir la portée :

    • Sélectionner : utilisez les menus déroulants pour sélectionner parmi les services et les points de terminaison disponibles
      • Sélectionnez un service spécifique dans votre application ou utilisez la valeur par défaut Tous les services pour inclure l'ensemble de la perspective de l'application.
      • Sélectionnez un point de terminaison dans le service spécifié ou utilisez la valeur par défaut Tous les points de terminaison pour l'appliquer à l'ensemble du service.
    • Filtre : spécifiez des filtres personnalisés à l'aide des balises disponibles pour définir la portée des appels mesurés pour l'application. Ces filtres peuvent être combinés pour créer des requêtes composites selon les besoins.

Sites Web

  • Balise : sélectionnez le type de balise à surveiller. Actuellement, seules les requêtes HTTP sont prises en charge. Une bannière informative affiche cette limitation.
  • Filtres personnalisés (facultatif) : ajoutez des filtres personnalisés pour affiner la portée du type de balise sélectionné. Vous pouvez combiner plusieurs filtres pour créer des requêtes composites basées sur des attributs tels que la géolocalisation, le navigateur ou l'utilisateur.

Infrastructure

  • Type d'infrastructure : sélectionnez le type d'entité d'infrastructure à surveiller parmi les types disponibles dans votre environnement (par exemple, hôtes, conteneurs, clusters d' Kubernetes s ou autres composants d'infrastructure).
  • Filtres personnalisés (facultatif) : ajoutez un filtre personnalisé pour affiner la portée de l'infrastructure. Vous pouvez combiner plusieurs filtres pour créer des requêtes composites. Ces filtres utilisent des expressions de filtrage par balises associées à des opérateurs logiques (AND, OR, NOT) et à des opérateurs de comparaison (égal à, différent de, existe).

Définir l'indicateur

Définissez l'indicateur de performance clé (KPI) à mesurer pour l'entité.

Vous pouvez sélectionner un modèle pour définir le type d'indicateur. Les plans disponibles dépendent du type d'entité :

  • Pour les entités Application et Site Web : latence, disponibilité, trafic et personnalisation
  • Pour les entités de tests synthétiques : latence, disponibilité et trafic
  • Pour les entités d'infrastructure : saturation et personnalisation

L'indicateur sert à spécifier la métrique et le type de mesure utilisés pour calculer le statut SLO et le budget d'erreurs.

  • Latence : mesure le temps de réponse pour les appels, les balises ou les résultats de test par rapport à un seuil spécifié. Le seuil est spécifié en millisecondes (ms). Le modèle de latence prend en charge deux types de mesures :
    • Basé sur le temps : le temps de réponse pour tous les appels, balises ou résultats de test est regroupé en tranches d'une minute. Le budget d'erreur est mesuré en minutes et correspond à une valeur statique dérivée de l'objectif SLO et de la durée de la fenêtre temporelle SLO. Si le résultat agrégé pour chaque minute dépasse le seuil spécifié, cette minute est considérée comme mauvaise et le budget d'erreur est réduit. Vous pouvez également spécifier le type d'agrégation utilisé parmi les options suivantes :
      • Moyenne
      • Min
      • Max
      • Centile (25, 50, 75, 90, 95, 98, 99)
    • Basé sur les événements : le temps de réponse pour chaque appel, balise ou résultat de test est comparé au seuil spécifié et déterminé comme étant un événement positif ou négatif. Le budget d'erreurs est mesuré en appels, balises ou résultats et est dérivé de l'objectif SLO et du nombre total d'événements pendant la fenêtre temporelle SLO. Étant donné que le nombre total d'événements varie au cours de la période couverte par la fenêtre temporelle SLO, le budget d'erreur total est une valeur dynamique.
  • Disponibilité : mesure le taux de réussite des appels, des balises ou des résultats de test sur une période donnée. Le seuil est défini en pourcentage (%). Le modèle de disponibilité prend en charge deux types de mesures :
    • Basé sur le temps : le taux de réussite de tous les appels, balises ou résultats de test est agrégé en tranches d'une minute. Le budget d'erreur est mesuré en minutes et correspond à une valeur statique dérivée de l'objectif SLO et de la durée de la fenêtre temporelle SLO. Si le résultat agrégé pour chaque minute est inférieur au seuil spécifié, cette minute est considérée comme mauvaise et le budget d'erreur est réduit. Actuellement, seule l'agrégation moyenne est prise en charge pour les plans de disponibilité.
    • Basé sur les événements : le taux de réussite global des appels, des balises ou des résultats de test est calculé sur la période SLO. Le budget d'erreur est mesuré en appels, balises ou résultats et est dérivé de l'objectif SLO et du nombre total d'événements pendant la fenêtre temporelle SLO. Étant donné que le nombre total d'événements varie au cours de la période couverte par la fenêtre temporelle SLO, le budget d'erreur total est une valeur dynamique.
  • Trafic : mesure la charge (appels, balises ou résultats de tests) qu'un système rencontre au fil du temps. Il s'agit d'une mesure basée sur le temps, où le nombre d'événements par minute est comparé à un seuil défini. Si le seuil n'est pas atteint, cette minute est considérée comme mauvaise et le budget d'erreur est réduit. Vous pouvez également spécifier le type d'événement à compter :
    • Nombre total de balises (pour les sites Web), nombre total d'appels (pour les applications) ou nombre total de résultats (pour les tests synthétiques) : cette option permet de mesurer le trafic global du système pour les entités spécifiées.
    • Nombre d'erreurs de balise (pour les sites Web), appels erronés (pour les applications) ou résultats erronés (pour les tests synthétiques) : cette option permet de concentrer la mesure uniquement sur le trafic erroné.
  • Saturation : mesure l'utilisation des ressources par rapport à un seuil spécifié. Le modèle Saturation n'est disponible que pour les types d'entités Infrastructure. Il existe deux types de mesures pour le modèle Saturation :
    • Basé sur le temps : les valeurs des mesures d'infrastructure sont agrégées en tranches d'une minute. Le budget d'erreur est mesuré en minutes et correspond à une valeur statique dérivée de l'objectif SLO et de la durée de la fenêtre temporelle SLO. Si le résultat agrégé pour chaque minute dépasse le seuil spécifié, cette minute est considérée comme mauvaise et le budget d'erreur est réduit. Vous devez indiquer :

      • Mesure : la mesure d'infrastructure à évaluer
      • Agrégation : type d'agrégation (moyenne, minimum, maximum ou centile : 25, 50, 75, 90, 95, 98, 99)
      • Opérateur : L'opérateur de comparaison (>, >=, <, <=)
      • Seuil : valeur seuil utilisée pour la comparaison
    • Basé sur les événements : les valeurs des mesures d'infrastructure sont récupérées toutes les 10 secondes. Le budget d'erreur est mesuré en instantanés métriques et correspond à une valeur statique dérivée de l'objectif SLO et de la durée de la fenêtre temporelle SLO. Étant donné que les instantanés métriques sont pris à intervalles constants de 10 secondes, le nombre total d'instantanés est prédéterminé et ne change pas pendant la durée de la fenêtre temporelle SLO. Vous devez indiquer :

      • Mesure : la mesure d'infrastructure à évaluer
      • Opérateur : L'opérateur de comparaison (>, >=, <, <=)
      • Seuil : valeur seuil utilisée pour la comparaison

      Le type d'agrégation est automatiquement sélectionné en fonction de l'opérateur de seuil :

      • Pour les opérateurs >>= ou : l'agrégation MAX est utilisée pour garantir que tout pic supérieur au seuil dans la fenêtre de 10 secondes soit capturé comme une violation potentielle.
      • Pour les opérateurs <<= ou : l'agrégation MIN est utilisée pour garantir que toute baisse inférieure au seuil dans la fenêtre de 10 secondes soit capturée comme une violation potentielle.
  • Personnalisé : utilisez des filtres personnalisés pour définir ce qui constitue un événement positif ou négatif. Il s'agit d'une mesure basée sur les événements.
    • Pour les types d'entités Application et Site Web : vous pouvez définir des filtres pour les appels ou balises valides et non valides :

      • Événements réussis : spécifiez des filtres pour identifier les balises ou les appels réussis. Ces filtres peuvent être combinés pour créer des requêtes composites selon les besoins. Si seuls les événements réussis sont définis, les événements qui ne correspondent pas au filtre sont considérés comme ayant échoué.
      • Événements infructueux (facultatif) : vous pouvez éventuellement spécifier des filtres pour les balises ou les appels infructueux. Si le filtre des événements infructueux est défini, les événements qui ne correspondent ni au filtre des événements réussis ni à celui des événements infructueux sont exclus de la mesure.
    • Pour les types d'entités Infrastructure : vous pouvez définir des conditions basées sur des métriques pour les événements positifs et négatifs. Vous devez indiquer :

      • Événements positifs : définissez la métrique, l'opérateur et le seuil pour les événements positifs
      • Événements indésirables : définissez la métrique, l'opérateur et le seuil pour les événements indésirables

      Les indicateurs utilisés pour définir les événements positifs et négatifs peuvent être identiques ou différents. Contrairement aux indicateurs basés sur la saturation (en fonction du temps ou des événements), cette approche permet de définir des SLO flexibles et personnalisés en fonction des besoins de surveillance de votre infrastructure.

Définir l'objectif

Définissez la valeur cible globale du SLO ainsi que les détails relatifs à la fenêtre temporelle du SLO.

  • Objectif SLO : spécifiez le pourcentage cible que votre entité doit atteindre lorsqu'elle fonctionne correctement.
Remarque : la précision maximale actuellement prise en charge est de quatre neuf ( 99.99 %).
  • Fenêtre temporelle : spécifiez le type de fenêtre temporelle pour le SLO.
    • Fixe : une fenêtre temporelle avec une heure de début et une durée distinctes. Par exemple, vous pouvez configurer une fenêtre fixe d'une semaine qui commence le 01/01/2020. La fenêtre temporelle sera automatiquement réinitialisée à la semaine suivante (2020-01-08) lorsque la semaine sera terminée.
    • Roulement : fenêtre temporelle dynamique avec une taille fixe, dont la fin est définie par la date et l'heure sélectionnées dans le sélecteur de temps global. Par exemple, la fenêtre temporelle mobile permet de toujours voir la semaine écoulée.
  • Durée : durée de la fenêtre temporelle SLO, exprimée en jours, semaines ou mois civils.
    • Pour la sélection du mois civil : disponible uniquement pour les plages horaires fixes. La période correspond aux limites du mois civil (du premier au dernier jour de chaque mois). Si un SLO est créé au milieu du mois, la période de mesure initiale s'étend de la date de création jusqu'à la fin du mois (une période partielle), les périodes suivantes correspondant à des mois civils complets.
  • Lier le fuseau horaire : activez ou désactivez la liaison du fuseau horaire à la fenêtre horaire SLO. S'il n'est lié à aucun fuseau horaire, UTC est sélectionné par défaut.
  • Fuseau horaire : spécifiez le fuseau horaire pour la fenêtre horaire SLO. À titre de référence, la liste complète des identifiants de fuseaux horaires valides est disponible ici.
Remarque : la durée maximale d'un SLO prise en charge est de 4 semaines.
  • Début : pour les fenêtres horaires fixes, le jour et l'heure auxquels le calcul du SLO doit commencer.

Après avoir saisi les valeurs pour SLO Target et Time window, le budget d'erreur s'affiche.

  • Pour les plans basés sur le temps, il s'agit d'un véritable budget d'erreurs en minutes, déterminé par la durée de la fenêtre temporelle et l'objectif SLO.
  • Pour les blueprints basés sur les événements, il s'agit d'un budget d'erreur estimé basé sur les appels ou les balises rencontrés au cours de la période SLO précédente, ainsi que sur la durée de la fenêtre temporelle spécifiée et l'objectif SLO.

Entrer les détails

  • Nom : Indiquez le nom du SLO.
  • Balises (facultatif) : spécifiez un ensemble de balises pouvant être utilisées pour classer ou trier le SLO.
  • Équipes (facultatif) : affectez des équipes pour gérer les autorisations d'accès pour ce SLO.
  • Pour créer la configuration SLO, cliquez sur Créer.