5 indicateurs de SLA à surveiller
Le 10 juin 2024
Temps de lecture : 7 min

Dans le monde des affaires et au-delà, la communication est reine. Les accords de niveau de service (SLA) reposent sur ce principe et jettent les bases d’une relation fructueuse entre fournisseurs et clients.

Un accord de niveau de service (SLA) est un élément clé des contrats des fournisseurs de technologie qui décrit les conditions de service entre le fournisseur et son client. Les SLA définissent les niveaux de performances attendus, la manière dont celles-ci seront mesurées et les répercussions en cas de non-respect de ces niveaux. Ils permettent de veiller à ce que toutes les parties prenantes comprennent l’accord de service et contribuent à instaurer une relation de travail plus harmonieuse.

Types de SLA

Il existe trois principaux types d’accords de niveau de service :

SLA de niveau client

Les SLA de niveau client définissent les conditions de service entre un fournisseur de services et un client. Le client peut être externe, comme une entreprise qui achète un service de stockage cloud à un fournisseur, ou interne, comme dans le cas d’un accord de niveau de service entre les équipes commerciales et informatiques concernant le développement d’un produit.

SLA de niveau service

Les fournisseurs de services qui proposent le même service à plusieurs clients utilisent souvent ce type de SLA. Ces accords ne changent pas en fonction du client, mais décrivent un niveau général de service fourni à tous les clients.

SLA multiniveaux

Lorsqu’un fournisseur de services propose un plan de tarification à plusieurs niveaux pour le même produit, il propose souvent des SLA multiniveaux afin de communiquer clairement le service offert à chaque niveau. Les SLA multiniveaux sont également employés dans le cadre de la conclusion d’accords entre plus de deux parties.

Composants des SLA

Les SLA présentent une vue d’ensemble des parties concernées, des services à fournir, de la répartition des rôles des parties prenantes, du contrôle des performances et des exigences en matière de reporting. Les protocoles de sécurité, les accords de correction, les procédures de révision, les clauses de résiliation et bien d’autres éléments font également partie des accords de niveau de service. Surtout, ils définissent les modalités d’évaluation des performances.

Les SLA doivent définir précisément les indicateurs clés (indicateurs de l’accord de niveau de service) qui seront utilisés pour mesurer la performance du service. Ces indicateurs sont souvent liés aux objectifs de niveau de service (SLO) de l’organisation (lien externe à ibm.com). Alors que les SLA définissent l’accord entre l’organisation et le client, les SLO fixent des objectifs de performance internes. Pour respecter les SLA, il faut surveiller d’importants indicateurs liés aux opérations métier et aux performances du fournisseur de services. L’essentiel est de surveiller les bons indicateurs.

Que sont les KPI des SLA ?

Les indicateurs sont des mesures spécifiques d’un aspect de la performance d’un service, comme la disponibilité ou la latence. Les indicateurs clés de performance (KPI) sont liés aux objectifs de l’entreprise et permettent d’évaluer les progrès accomplis par une équipe dans la réalisation de ces objectifs. Les KPI n’existent pas sans les objectifs métier ; ce sont des « indicateurs » de la progression vers un objectif donné.

Prenons l’exemple de la croissance annuelle des ventes, avec un objectif organisationnel de 30 % de croissance d’une année sur l’autre. Les KPI tels que les renouvellements d’abonnement à ce jour ou les pistes générées fournissent un aperçu en temps réel de la progression de l’entreprise vers l’objectif de croissance des ventes annuelles.

Des indicateurs tels que la disponibilité et la latence des applications permettent de fournir un contexte. Ainsi, si l’entreprise perd des clients et ne parvient pas à atteindre son objectif annuel, un examen des indicateurs liés à la satisfaction de la clientèle (c’est-à-dire la disponibilité des applications et la latence) pourrait apporter des éléments de réponse quant aux raisons du départ des clients.

Les indicateurs de SLA à surveiller

Les SLA comportent différents termes en fonction du fournisseur, du type de service fourni, des exigences du client, des normes de conformité et autres, et les indicateurs varient en fonction du secteur d’activité et des cas d’utilisation. Toutefois, certains indicateurs de performance des SLA, tels que la disponibilité, le temps moyen de récupération, le temps de réponse, les taux d’erreur et les mesures de sécurité et de conformité, sont communs à l’ensemble des services et des secteurs d’activité. Ces indicateurs servent de référence pour les opérations et la qualité des services fournis.

En définissant clairement les indicateurs clés de performance (KPI) destinés à mesurer les performances et la manière dont ces informations seront communiquées, les équipes de gestion des services informatiques (ITSM) identifient les données à collecter et à surveiller. Avec les bonnes données, les équipes peuvent mieux respecter les SLA et s’assurer que les clients savent exactement à quoi s’attendre.

Idéalement, les équipes ITSM contribuent à la rédaction des SLA et surveillent les indicateurs liés à leur exécution. L’implication des équipes ITSM dès le début du processus permet de garantir que les équipes commerciales ne concluent pas avec les clients des accords que les équipes informatiques ne sont pas en mesure d’atteindre.

Les indicateurs de SLA que les responsables informatiques et ITSM doivent impérativement surveiller sont les suivants :

1. Disponibilité

Les interruptions de service, ou temps d’arrêt, sont coûteuses, peuvent nuire à la crédibilité de l’entreprise et entraîner des problèmes de conformité. Le SLA entre une organisation et un client dicte le niveau attendu de disponibilité du service ou de temps de fonctionnement et est un indicateur de la fonctionnalité du système.

La disponibilité est souvent mesurée en « neuf sur la voie des 100 % » : 90 %, 99 %, 99,9 %, etc. De nombreux fournisseurs de services cloud et SaaS visent une norme industrielle de « cinq neuf » ou 99,999 % de temps de fonctionnement.

Pour certaines entreprises, même une heure de temps d’arrêt peut entraîner des pertes considérables. Si un site d’e-commerce subit une panne pendant une période de forte affluence, comme le Black Friday, ou pendant des soldes importantes, cela peut nuire à la réputation de l’entreprise et à son chiffre d’affaires annuel. Les interruptions de service ont également un impact négatif sur l’expérience client. Les services qui ne sont pas toujours disponibles incitent souvent les utilisateurs à chercher d’autres solutions. Les besoins des entreprises varient, mais la nécessité de fournir aux utilisateurs des produits et des services rapides et efficaces est universelle.

En général, il est préférable d’avoir un temps de fonctionnement maximal. Toutefois, dans certains secteurs, les fournisseurs peuvent estimer qu’il est plus rentable d’offrir un taux légèrement inférieur si cela permet de répondre aux besoins des clients.

2. Temps moyen de récupération

Le temps moyen de récupération mesure le temps moyen qu’il faut pour restaurer un produit en cas de panne ou de défaillance. Aucun système ou service n’est à l’abri d’un problème ou d’une panne occasionnelle, mais les entreprises qui peuvent rapidement rétablir leurs services ont plus de chances de préserver leur rentabilité, de répondre aux besoins de leurs clients et de respecter leurs SLA.

3. Temps de réponse et temps de résolution

Les accords de niveau de service précisent souvent le délai dans lequel un fournisseur de services doit réagir après qu’un problème a été signalé ou consigné. Lorsqu’un problème est signalé ou qu’une demande de service est formulée, le temps de réponse indique le temps qu’il faut à un fournisseur pour répondre et traiter le problème. Le temps de résolution indique le temps qu’il faut pour résoudre le problème. Il est essentiel de réduire ces délais pour garantir la performance des services.

Les organisations doivent chercher à résoudre les problèmes avant qu’ils ne deviennent des défaillances à l’échelle du système et n’entraînent des problèmes de sécurité ou de conformité. Les solutions logicielles qui offrent une observabilité de la pile complète des fonctions métier peuvent jouer un rôle important dans le maintien de systèmes optimisés et de la performance des services. Nombre de ces plateformes font appel à des outils d’automatisation et de machine learning (ML) pour automatiser le processus de résolution ou identifier les problèmes avant qu’ils ne surviennent.

Par exemple, les systèmes de détection d’intrusion (IDS) alimentés par l’IA surveillent en permanence le trafic réseau à la recherche d’activités malveillantes, de violations des protocoles de sécurité ou de données anormales. Ces systèmes déploient des algorithmes de machine learning pour surveiller de vastes jeux de données et les utiliser pour identifier les données anormales. Les anomalies et les intrusions déclenchent des alertes qui avertissent les équipes informatiques. Sans l’IA et le machine learning, la surveillance manuelle de ces grands jeux de données ne serait pas possible.  

4. Taux d’erreur

Les taux d’erreur mesurent les défaillances de service et le nombre de fois où les performances du service sont inférieures aux normes définies. Selon votre entreprise, les taux d’erreur peuvent être corrélés à un certain nombre de problèmes liés aux fonctions métier.

Ainsi, dans le secteur de la fabrication, les taux d’erreur sont liés au nombre de défauts ou de problèmes de qualité sur une ligne de produits spécifique, ou au nombre total d’erreurs détectées au cours d’un intervalle de temps donné. Ces taux d’erreur, ou taux de défaut, aident les entreprises à identifier la cause racine d’une erreur et à savoir si elle est liée aux matériaux employés ou à un problème plus global.

Il existe un sous-ensemble d’indicateurs basés sur les clients qui surveillent les interactions avec le service client et qui sont également liés aux taux d’erreur :

  • Taux de résolution au premier appel : dans le domaine du service client, les problèmes liés aux interactions avec le centre d’assistance peuvent être pris en compte dans les taux d’erreur. Évaluer les résultats des interactions avec les services client peut s’avérer difficile. Tous les clients ne répondent pas à une enquête ou ne déposent pas une réclamation si un problème n’est pas résolu ; certains chercheront simplement un autre service. Le taux de résolution au premier appel est un indicateur qui peut aider à mesurer les interactions avec le service client. Il indique si le problème d’un utilisateur a été résolu lors de la première interaction avec un centre d’assistance, un chatbot ou un représentant. Chaque remontée d’une demande faite au service client au-delà du contact initial implique des dépenses en ressources supplémentaires. Elle peut également avoir un impact sur l’expérience client.
  • Taux d’abandon : ce taux reflète la fréquence à laquelle un client abandonne sa demande avant de trouver une solution. Le taux d’abandon peut également s’ajouter au taux d’erreur global et permet de mesurer l’efficacité d’un centre d’assistance, d’un chatbot ou du personnel humain.

5. Sécurité et conformité

Les gros volumes de données et l’utilisation de serveurs sur site, de serveurs cloud et d’un nombre croissant d’applications augmentent le risque de violations de données et de menaces pour la sécurité. Si elles ne sont pas suffisamment surveillées, les violations de la sécurité et les vulnérabilités peuvent exposer les fournisseurs de services à des répercussions juridiques et financières.

Ainsi, le secteur des soins de santé a des exigences spécifiques en matière de stockage, de transfert et d’élimination des données médicales d’un patient. Le non-respect de ces normes de conformité peut entraîner des amendes et une indemnisation pour les pertes subies par les clients.

S’il existe une multitude d’indicateurs spécifiques au secteur définis par les différents services fournis, nombre d’entre eux relèvent de cadres généraux plus vastes. Pour réussir, les équipes commerciales et de gestion des services informatiques doivent collaborer afin d’améliorer la fourniture des services et de répondre aux attentes des clients.

Les avantages du suivi des indicateurs de SLA

Le suivi des indicateurs de SLA est le moyen le plus efficace pour les entreprises d’évaluer si les services informatiques répondent aux attentes de la clientèle et d’identifier les domaines à améliorer. En surveillant les KPI et autres indicateurs en temps réel, les équipes informatiques peuvent identifier les faiblesses du système et optimiser la prestation de services.

Voici les principaux avantages du suivi des indicateurs de SLA :

Une observabilité accrue

Une compréhension claire de bout en bout des opérations commerciales aide les équipes ITSM à trouver des moyens d’améliorer les performances. Une meilleure observabilité permet aux organisations de mieux comprendre le fonctionnement des systèmes et des workflows, d’identifier les erreurs, d’équilibrer plus efficacement les workloads et de relever les normes de performance.

Performances optimisées

En surveillant les bons indicateurs et en exploitant les informations qui en découlent, les organisations peuvent fournir de meilleurs services et applications, dépasser les attentes des clients et stimuler la croissance commerciale.

Augmentation de la satisfaction des clients

De même, le contrôle des KPI et autres indicateurs de SLA est l’un des meilleurs moyens de s’assurer que les services répondent aux besoins des clients. Dans un secteur très concurrentiel, la satisfaction des clients est un facteur clé pour les fidéliser et se forger une réputation positive.

Une plus grande transparence

En décrivant clairement les conditions de service, les SLA contribuent à dissiper toute confusion et à protéger les différentes parties. Des accords de niveau de service bien rédigés indiquent clairement ce à quoi toutes les parties prenantes peuvent s’attendre, proposent un calendrier bien défini pour la fourniture des services et désignent les parties prenantes responsables d’actions spécifiques. Lorsqu’ils sont bien conçus, les SLA contribuent à donner le ton à un partenariat harmonieux.

Comprendre les performances et dépasser les attentes des clients

La plateforme IBM Instana Observability et IBM Cloud Pak for AIOps peuvent aider les équipes à obtenir de meilleures informations à partir de leurs données et à améliorer la prestation de services.

IBM Instana Observability offre une observabilité de la pile complète en temps réel, alliant l’automatisation, le contexte et l’action intelligente au sein d’une seule et même plateforme. Instana aide à briser les silos opérationnels et fournit un accès aux données aux équipes DevOps, SRE (ingénierie de fiabilité des sites), ingénierie de plateforme et ITOps.

Les équipes de gestion des services informatiques tirent profit des outils automatisés d’IBM Cloud Pak for AIOps, qui permettent de gérer les incidents et de les résoudre. IBM Cloud Pak for AIOps propose des outils pour l’innovation et la transformation des opérations informatiques. Respectez vos SLA et surveillez les indicateurs connexes grâce à une solution de visibilité avancée qui contextualise les dépendances entre les environnements.

IBM Cloud Pak for AIOps est une plateforme AIOps qui fournit une visibilité sur les données de performance et les dépendances entre les environnements. Elle permet aux responsables ITOps et aux ingénieurs de fiabilité des sites (SRE) de faire appel à l’intelligence artificielle, au machine learning et à l’automatisation pour mieux aborder la gestion et la résolution des incidents. Avec IBM Cloud Pak for AIOps, les équipes peuvent innover plus rapidement, réduire les coûts opérationnels et transformer les opérations informatiques (ITOps).

Auteur
Camilo Quiroz-Vázquez IBM Staff Writer