objectifs de niveau de service
Les objectifs de niveau de service (SLO) constituent des outils essentiels en matière d'observabilité, que les organisations peuvent utiliser pour surveiller de manière systématique et objective les performances et la disponibilité de leurs services. Les objectifs de niveau de service vous permettent de définir des cibles claires pour les performances du système afin de faciliter l'identification de l'expérience utilisateur dégradée et de l'instabilité de la plateforme. En outre, les objectifs de niveau de service peuvent être utilisés pour suivre les performances d'un service au fil du temps afin de permettre aux organisations d'identifier les tendances et les modèles de performances du service.
- Souhaitez-vous surveiller la disponibilité de vos applications?
- Souhaitez-vous surveiller la latence de vos sites web?
- Souhaitez-vous suivre le taux de réussite de vos tests synthétiques?
- Souhaitez-vous définir vous-même quels appels sont considérés comme bons ou mauvais et les suivre?
Les utilisateurs peuvent définir une cible pour les performances du système sur une période donnée en fonction de l'indicateur fourni. Lorsque la cible n'est pas atteinte, une analyse plus approfondie peut être effectuée pour déterminer la cause de la dégradation des performances.
Terminologie
Indicateur de niveau de service (SLI) : définit une mesure quantitative d'une caractéristique spécifique du service fourni à un client. Parmi les exemples courants, on peut citer le taux d'erreur ou le temps de réponse. Le type de SLI est indiqué par le Blueprint dans la configuration du SLO.
Objectif SLO : définit la valeur cible du SLO mesurée par un SLI. Par exemple, l'objectif du niveau de service peut indiquer qu'un indicateur de niveau de service spécifique correspond à 99.9% du temps défini.
Statut SLO : évaluation actuelle de l'indice SLI sur la période de référence SLO, exprimée en pourcentage. Ce statut permet de déterminer si le service répond aux objectifs définis par la cible SLO.
Marge d'erreur : la valeur cible d'un SLO définit implicitement une marge de tolérance pour le manque de fiabilité du service. Cette marge d'erreur tient compte à la fois des temps d'arrêt planifiés et imprévus, en reconnaissant qu'un certain niveau de perturbation du service est inévitable dans la pratique.
Taux d'épuisement : le taux d'épuisement est un ratio qui indique à quelle vitesse un service épuise sa marge d'erreur par rapport à la durée cible de son SLO. Son objectif est de détecter les signes avant-coureurs susceptibles d'entraîner une violation des SLO avant qu'elle ne se produise.
Fenêtre de correction : une plage horaire spécifique, ponctuelle ou récurrente, qui est exclue des calculs relatifs au statut SLO et au budget d'erreurs.
Les SLO dans l' Instana
Instana propose la zone des niveaux de service pour la création et la gestion des SLO, des configurations Apdex, des alertes intelligentes et des fenêtres de correction pour plusieurs types d'entités.
Pour accéder à la section « Niveaux de service », cliquez sur « Niveaux de service » dans le menu de navigation. La section « Niveaux de service » comprend des onglets dédiés aux SLO, à l'Apdex, aux alertes intelligentes et aux fenêtres de correction.
Vous pouvez créer des widgets de tableau de bord personnalisés pour vos SLO (versions allégées et héritées) et vos mesures Apdex.
La configuration des SLO d' Instana peut être automatisée à l'aide d' API ou de Terraform, et les données SLO peuvent être importées dans Grafana. Pour plus d'informations, consultez la section « Intégrations SLO ».
L'onglet « Alertes intelligentes » affiche les alertes pour les deux configurations SLO, avec une séparation par filtre permettant de visualiser les alertes par type d'entité. Vous pouvez créer des alertes intelligentes pour surveiller l'état des SLO, le budget d'erreurs, le taux d'épuisement et les seuils du score Apdex.
Pour des exemples et des informations sur le dépannage, consultez la section « Premiers pas avec les SLO » et les exemples de configuration d'Apdex.

Objectifs du niveau de service existants
Les widgets SLO issus des versions précédentes des SLO d' Instana s continuent d'être pris en charge et sont désormais désignés sous le nom de « SLO Legacy » dans les widgets du tableau de bord personnalisé. Les widgets SLO Legacy et les configurations SLI associées ne sont actuellement pas intégrés aux SLO créés dans le tableau de bord SLO. Pour plus d'informations, consultez la section « Widgets SLO (version héritée) ».
SLO Lite
Les widgets SLO utilisés sur l'édition Classic auto-hébergée ( Docker ) sont toujours pris en charge et sont désormais appelés « SLO Lite » dans les widgets du tableau de bord personnalisé. SLO Lite offre des fonctionnalités limitées et ne propose que des widgets pour les SLO d'application. Ces widgets et ces configurations d'indicateurs ne peuvent pas être transférés vers le tableau de bord SLO actuel. Pour plus d'informations, consultez la section « Widgets SLO (version allégée) ».
Options d'installation
Les SLO sont pris en charge sur les éditions Instana, SaaS,, Standard Edition et Custom Edition. Seule la configuration SLO Lite est prise en charge dans l'édition Classic.
Conservation des données
Les données métriques utilisées pour calculer les SLO sont conservées selon la granularité de la configuration de la fenêtre temporelle, comme suit :
- Données temporelles à la minute près : 13 mois
- Données à la minute près basées sur des événements : 48 heures
- Données de granularité horaire basées sur des événements : 13 mois
- Données Apdex avec une granularité à la minute : 48 heures
- Données Apdex avec une granularité horaire : 91 jours