Exemples de configuration d'objectifs de niveau de service (SLO)

Exemple 1 : SLO d'application avec modèle de latence

Objectif : garantir que 90 % des appels de l'application « Robot-shop » aient une latence moyenne inférieure à 100 ms sur une période fixe d'une semaine.

La configuration du SLO serait la suivante :

Entité : Application Robot-shop
- Portée :
- Limite : tous les services
- Inclure les appels internes : faux
- Inclure les appels synthétiques : faux
- Service : Tous les services
- Point final : Tous les points finaux
Indicateur :
- Plan directeur : Latence
- Type : Temps
- Agrégation : moyenne
- Seuil : 100 ms
Objectif :
- Objectif SLO : 90 %
- Type de fenêtre temporelle : glissante
- Durée de la fenêtre temporelle : 1 semaine

Scénario : en supposant que le SLO ait enregistré 400 minutes de mauvaise qualité au cours de la période SLO d'une semaine (400 minutes avec une latence moyenne > 100 ms) à compter du 04/03/2025 :

Le budget d'erreur pour ce SLO serait calculé comme suit :

Minutes dans la période x (1 - pourcentage cible SLO)
- Nombre total de minutes dans la fenêtre temporelle : 24 × 60 × 7 minutes en 1 semaine = 10 080 minutes
- Pourcentage cible SLO : 90 % ( 0.9 )
- Budget d'erreur : 10080 x (1 - 0.9 ) = 1008 minutes

Le statut SLO serait calculé comme suit :

Statut SLO = 100 % x (nombre total de minutes dans la fenêtre temporelle - nombre de minutes incorrectes dans la fenêtre temporelle) / nombre total de minutes dans la fenêtre temporelle
- 100 % x (10 080 minutes totales - 400 minutes incorrectes) / 10 080 minutes totales = 96.03 %

Exemples de configuration d'objectifs de niveau de service (SLO)

Exemple 1 : SLO d'application avec modèle de latence

Exemple 2 : SLO de site Web avec plan de disponibilité basé sur les événements

Exemple 3 : Surveillance synthétique avec modèle de trafic

Exemple 4 : Surveillance synthétique des SLO avec disponibilité basée sur les événements à l'aide de filtres de balises

Exemple 5 : SLO d'application avec un modèle personnalisé

Exemple 6 : SLO d'application avec modèle de latence basé sur les événements

Exemple 7 : SLO d'un site web avec un modèle de disponibilité basé sur le temps

Exemple 8 : SLO d'infrastructure avec modèle de saturation basé sur le temps (CPU)

Exemple 9 : SLO d'infrastructure avec modèle de saturation basé sur les événements (mémoire)

Exemple 10 : SLO d'infrastructure avec un modèle personnalisé pour un cluster d' Kubernetes

Exemple 11 : Comportement des SLO avec liaison au fuseau horaire

Exemple 12 : SLO associé à une équipe

Exemple 13 : SLO mensuel créé en cours de mois

Exemple 14 : SLO mensuel créé le premier jour du mois

Exemples de configuration des alertes intelligentes pour les niveaux de service

Exemple 1 : Alerte intelligente relative aux niveaux de service pour surveiller l'état d'un SLO

Scénario : Surveillance et déclenchement d'événements

Exemple 2 : Alerte intelligente relative aux niveaux de service pour surveiller le budget d'erreurs d'un SLO

Scénario : Surveillance et déclenchement d'événements

Calcul des alertes intelligentes sur le taux d'épuisement des niveaux de service

Exemple 3 - Alerte intelligente pour surveiller le taux d'épuisement d'un SLO avec une seule fenêtre d'alerte et un seul seuil

Scénario : Surveillance et déclenchement d'événements

Exemple 4 - Alerte intelligente pour surveiller le taux de consommation d'un SLO avec plusieurs fenêtres d'alerte et des seuils respectifs

Scénario : Surveillance et déclenchement d'événements

Traitement des incidents