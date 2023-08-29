Vous pouvez choisir parmi plusieurs indicateurs, mais nous vous recommandons de vous concentrer sur ces huit indicateurs pour en tirer le meilleur avantage au sein de votre entreprise IT.

1. Scores Apdex et SLA

Commençons par les scores de l'indice de performance des applications (Apdex) et du contrat de niveau de service (SLA), car ils constituent la base d'une expérience client supérieure. Les vitesses et les avances que vous mesurerez sont les aspects spécifiques qui devraient s’additionner pour des performances rapides, mais elles sont les moyens, pas la fin. Votre objectif est de satisfaire vos clients, ce qui, espérons-le, entraînera une augmentation des ventes.

Les scores Apdex et SLA sont les méthodes les plus populaires pour suivre l'expérience des utilisateurs finaux. Le score Apdex permet de suivre les performances relatives d'une application en spécifiant un objectif quant à la durée normale d'une demande ou d'une transaction sur le Web. Les SLA sont les indicateurs de votre contrat client et tout ce qui est inférieur au SLA défini risque une baisse de l’expérience client (et éventuellement des pénalités prédéfinies).

2. Disponibilité des applications (également appelée temps de fonctionnement ou surveillance des performances Web)

C’est l'indicateur le plus simple : l’application est-elle opérationnelle ? Vous contrôlez et mesurez si votre application est disponible et en ligne. La plupart des entreprises l'utilisent pour mesurer le respect des accords de niveau de service (SLA). Le temps de fonctionnement est souvent utilisé pour évaluer de manière sommaire la fiabilité et l’état général du système. Les temps d'arrêt excessifs peuvent avoir un impact négatif sur la satisfaction des utilisateurs des entreprises fournissant des services en ligne. Dans le cas d’une application web, la disponibilité peut être vérifiée par une simple requête HTTP à intervalles réguliers.

3. Utilisation de l'unité centrale (également appelée utilisation des ressources)

Un pourcentage élevé de la capacité du processeur utilisé par une application peut être le signe d'un problème de performance. Un pic soudain d'utilisation du processeur peut entraîner un ralentissement des temps de réponse. Les fluctuations de la demande pour une application peuvent également indiquer que vous devez ajouter d’autres instances d’application. En règle générale, si l’utilisation du processeur dépasse 70 % plus de 30 % du temps, vous risquez de manquer de capacité CPU.

L’utilisation des ressources peut également inclure l’utilisation de la mémoire et du disque. Le suivi de la RAM permet d’identifier les fuites de mémoire qui pourraient entraîner une défaillance ou la nécessité de disposer d’une mémoire plus importante. Les indicateurs d'utilisation du disque peuvent aider à empêcher une application de manquer de stockage persistant, ce qui pourrait entraîner son échec. Une utilisation élevée du disque peut également être le signe d'un stockage de données inefficace ou de politiques de conservation des données erronées.

4. Taux d’erreur

Votre logiciel de suivi des indicateurs APM devrait surveiller les applications pour enregistrer le pourcentage de demandes qui aboutissent à des échecs. Il s’agit d’identifier et de résoudre en priorité les incidents qui nuisent à l’expérience utilisateur. Les erreurs d'application peuvent inclure des erreurs de serveur, une réponse 404 ou un dépassement de délai dans une application web. Vous pouvez configurer votre solution APM pour qu'elle envoie des notifications lorsqu'un taux d'erreur dépasse un paramètre défini. Par exemple, envoyez une alerte lorsque 2,5 % des 25 demandes précédentes ont abouti à une erreur.

5. Récupération de place

La récupération de place (GC) peut optimiser les performances en détectant et en supprimant l’utilisation constante et importante de la mémoire dans Java et d’autres langages. La bonne nouvelle, c'est que l'automatisation GC récupère la mémoire consacrée aux objets ou aux données inutilisés ou redondants qui ne sont plus utilisés par une application. Les objets ou données inutilisés sont supprimés et les objets vivants sont copiés dans un pool de mémoire de génération ultérieure. Il s'agit d'un indicateur qu'il faut maintenir au cœur de votre activité. Si la GC est exécutée trop souvent, cela peut nécessiter trop de temps ; mais si la GC n'est pas exécutée assez souvent, il se peut que votre système ait trop peu de mémoire.

6. Nombre d’instances

Le suivi des instances vous permet de dimensionner votre application pour répondre à la demande réelle des utilisateurs, en fonction du nombre d'instances d'application ou de serveurs exécutées à tout moment. Cela peut être particulièrement important pour les applications cloud. Auto-Scaling permet de garantir que les applications modernes peuvent évoluer pour répondre aux pics de demande, tout en réduisant les coûts lors des périodes de faible activité. Cela peut également engendrer des défis en matière de surveillance de l’infrastructure. Par exemple, si votre application augmente automatiquement en fonction de l'utilisation du processeur, il se peut que vous ne voyiez jamais votre consommation augmenter. Au lieu de cela, vous pourriez voir le nombre d'instances de serveur augmenter trop, de même que votre facture d'hébergement.

7. Taux de requêtes

Vous pouvez mesurer le trafic reçu par une application afin d'identifier toute diminution ou augmentation significative ou toute coïncidence entre les utilisateurs. La corrélation entre les taux de requête et les autres indicateurs de performance des applications vous aidera à comprendre l'évolutivité de vos applications logicielles. Les logiciels APM peuvent également surveiller le trafic afin d'identifier les anomalies. La surveillance des utilisateurs montrant une augmentation inattendue des demandes pourrait être une attaque par déni de service (DoS). Un grand nombre de demandes émanant du même utilisateur peut indiquer que le compte a été piraté. De même, un nombre de requêtes anormalement faible est source d’inquiétude : aucune activité ou aucun trafic du tout pourrait signifier un incident dans presque tous les composants de votre système.

8. Temps de réponse (également appelé durée)

En suivant le temps de réponse moyen à une demande, c’est-à-dire le temps qu’il faut à une application pour renvoyer une demande de ressources, vous pouvez évaluer les performances de l’application. Ces demandes peuvent inclure des transactions initiées par des utilisateurs finaux, comme une demande de chargement d'une page Web, ou des demandes internes d'une partie de votre application à une autre, comme un processus ou un microservice demandant des données depuis un disque ou une mémoire. Le temps de réponse total comprend le temps de réponse du serveur (le temps nécessaire à votre serveur pour traiter une requête) plus la latence du réseau (le temps total nécessaire à la requête pour se déplacer sur le réseau).

Un indicateur associé est le temps de chargement de la page, qui mesure le temps nécessaire à une page Web pour se charger dans un navigateur. Le suivi des temps de chargement des pages permet aux outils de surveillance de performances des applications d'identifier les problèmes à l'origine du ralentissement du chargement des pages, puis d'améliorer l'expérience en ligne. Un chargement lent des pages peut entraîner l’abandon de pages et une perte d’activité. Les solutions APM peuvent être configurées pour un niveau de référence de performance pour cet indicateur et vous alerter lorsque cette référence n'est pas atteinte.