Qu’est-ce que l’observabilité ?

L'observabilité est la mesure dans laquelle il est possible de comprendre l'état ou la condition interne d'un système complexe en se basant uniquement sur la connaissance de ses résultats externes. Plus un système est observable, plus il est possible de remonter rapidement et précisément d'un problème de performance identifié à son origine, sans test ou codage supplémentaire.

Observability offre une visibilité approfondie des applications distribuées modernes pour une identification et une résolution plus rapides et automatisées des problèmes.

Dans le domaine de l’informatique et du cloud computing, l’observabilité implique l’utilisation de pratiques et d’outils logiciels. Ces outils permettent d’agréger, de corréler et d’analyser un flux constant de données de performances provenant d’une application distribuée, ainsi que du matériel et du réseau sur lesquels elle s’exécute. Ce processus permet de surveiller, de dépanner et de déboguer efficacement les applications et les réseaux. L’objectif est de répondre aux attentes en matière d’expérience client, aux accords de niveau de service (SLA) et à d’autres exigences métier.

Domaine de l'informatique relativement nouveau, l’observabilité est souvent considérée à tort comme un mot à la mode surfait ou comme un nouveau nom pour la surveillance des systèmes, la surveillance des performances des applications (APM) et la gestion des performances réseau (NPM). En réalité, l'observabilité est une évolution naturelle des méthodes de collecte de données APM et NPM qui permet de mieux répondre à la nature de plus en plus rapide, distribuée et dynamique des déploiements d'applications cloud natives. L'observabilité ne remplace pas la surveillance : elle permet une meilleure surveillance, ainsi qu'une APM et NPM de meilleure qualité.

Le terme « observabilité » provient de la théorie du contrôle, un domaine de l'ingénierie dédié à l'automatisation du contrôle d'un système dynamique. Les exemples incluent la régulation du débit d'eau dans un tuyau ou le contrôle de la vitesse d'une automobile sur les pentes, en fonction des informations fournies par le système.

Démystifier les préjugés liés à l’observabilité

Cet e-book démystifie les préjugés concernant l’observabilité et présente son rôle dans le monde numérique.

Contenu connexe

Pourquoi avons-nous besoin de l’observabilité ?

Au cours des 20 dernières années environ, les équipes informatiques se sont surtout appuyées sur l'APM pour surveiller et dépanner les applications. L'APM échantillonne et agrège périodiquement les données des applications et des systèmes, appelées télémétrie, qui sont connues pour être liées à des problèmes de performance des applications.

L'APM analyse la télémétrie par rapport aux indicateurs clés de performance (KPI) et rassemble les résultats dans un tableau de bord. Ces résultats alertent les équipes chargées des opérations et du support sur des conditions anormales qui doivent être traitées pour résoudre ou éviter un problème.

L'APM est suffisamment efficace pour surveiller et dépanner des applications monolithiques ou des applications distribuées traditionnelles. Dans ces configurations, les nouvelles versions du code sont périodiques et les flux de travail et les dépendances entre les composants de l'application, les serveurs et les ressources connexes sont bien connus ou faciles à retracer.

Aujourd'hui, les organisations adoptent avec engouement des pratiques de développement modernes qui comprennent le développement agile, l’intégration et le déploiement continus (CI/CD), le DevOps et plusieurs langages de programmation.

Les organisations adoptent également des technologies cloud natives telles que les microservices, les conteneurs Docker, Kubernetes et les fonctions serverless. Cela leur permet de lancer leurs services sur le marché plus rapidement que jamais, mais ce faisant elles déploient de nouveaux composants d'application à plein d'endroits différents, dans plusieurs langues et pendant des périodes très variables, qui peuvent se compter en secondes ou fractions de seconde, pour les fonctions serverless : l'échantillonnage des données une fois par minute par APM ne peut pas suivre ce rythme.

Cela nécessite une télémétrie de meilleure qualité et bien plus fournie, qui puisse être utilisée pour créer un enregistrement de haute fidélité, riche en contexte et entièrement corrélé de chaque demande ou transaction de l’utilisateur de l’application. C'est là que l'observabilité entre en jeu.

Comment fonctionne l'observabilité ?

Les plateformes d'observabilité découvrent et collectent des données télémétriques de performance en continu en s'intégrant aux instruments existants des composants d'application et d'infrastructure, et en fournissant des outils pour renforcer cette instrumentation. L’observabilité se concentre sur quatre principaux types de données télémétriques :

Les journaux. Les journaux sont des enregistrements granulaires, horodatés, complets et immuables des événements de l'application. Ils peuvent notamment être utilisés pour créer un enregistrement haute fidélité, milliseconde par milliseconde, de chaque événement, avec le contexte environnant. Les développeurs peuvent consulter ces journaux à des fins de dépannage et de débogage.
Les indicateurs. Les indicateurs (parfois appelés indicateurs de séries temporelles) sont des mesures fondamentales de l'état des applications et des systèmes sur une période donnée. Les indicateurs mesurent, par exemple, la quantité de mémoire ou la capacité de processeur utilisée par une application sur une période de cinq minutes, ou la durée de latence subie par une application lors d'un pic d'utilisation.
Les traces. Les traces enregistrent le « parcours » de chaque requête utilisateur sur l’ensemble de l’architecture distribuée, de l’interface utilisateur (ou l’application mobile) jusqu’au retour à l’utilisateur.
Les dépendances (également appelées cartes de dépendance) révèlent la façon dont chaque composant d’application dépend des autres composants, applications et ressources informatiques.

Après avoir recueilli ces données télémétriques, la plateforme les met en corrélation en temps réel. Ce processus fournit aux équipes DevOps, aux équipes d'ingénierie de la fiabilité des sites (SRE) et au personnel informatique un contexte complet. Les équipes comprennent le quoi, le où et le pourquoi de tout événement susceptible d'indiquer, de causer ou d'être utilisé pour résoudre un problème de performance au sein d'une application.

De nombreuses plateformes d’observabilité découvrent automatiquement de nouvelles sources de télémétrie qui pourraient émerger dans le système (comme un nouvel appel d’API vers une autre application logicielle). Elles traitent plus de données qu’une solution APM standard et beaucoup d'entre elles intègrent des fonctionnalités AIOps (intelligence artificielle pour les opérations) qui filtrent les signaux, c’est-à-dire toute indication de problème réel, parmi le bruit (les données sans rapport avec les problèmes).

Avantages de l'observabilité

L'observabilité rend un système plus simple à comprendre (en général et dans le détail) et à surveiller, plus facile et plus sûr à mettre à jour avec un nouveau code, et plus pratique à réparer qu'un système moins observable. Plus précisément, l'observabilité soutient directement les objectifs Agile/DevOps/SRE visant à livrer des logiciels de meilleure qualité plus rapidement en permettant à une organisation de :

Découvrir et résoudre les problèmes dont vous ne soupçonnez pas l’existence. L’une des principales limites des outils de monitoring est qu’ils ne surveillent que les « inconnues connues », à savoir les conditions atypiques que vous savez déjà surveiller. L'observabilité permet de découvrir des conditions que l'on ne soupçonne pas ou que l'on ne pense pas à rechercher, puis de faire le lien avec des problèmes de performance spécifiques afin de fournir le contexte nécessaire à l'identification des origines du problème et d'accélérer sa résolution.
Identifier et résoudre les problèmes à un stade précoce du développement. L'observabilité intègre la surveillance aux premières phases du processus de développement logiciel. Les équipes DevOps peuvent identifier et résoudre les problèmes dans le nouveau code avant qu'ils n'aient un impact sur l'expérience client ou les SLA.
Mettre automatiquement l’observabilité à l'échelle. Par exemple, vous pouvez spécifier l'instrumentation et l'agrégation de données comme faisant partie de la configuration d'un cluster Kubernetes et collecter des données télémétriques dès sa mise en service et jusqu'à sa désactivation.
Allier résolution automatisée et infrastructure d’auto-réparation pour les applications. Combinez l’observabilité avec les fonctionnalités AIOps de machine learning et d’automatisation pour prévoir les problèmes en fonction des sorties du système et les résoudre sans intervention des managers.

Solutions connexes

Observabilité avec IBM Instana

Découvrez la meilleure plateforme d’observabilité d’entreprise pour les environnements de cloud hybride.

Découvrir l’observabilité avec Instana

IBM Cloud Logs

Améliorez les performances de l'infrastructure et des applications où que vous soyez grâce à une observabilité proactive des journaux tout en optimisant le coût total de possession de votre infrastructure d'observabilité au sein et en dehors d'IBM Cloud.

Découvrir la journalisation cloud nouvelle génération

IBM Cloud Monitoring

Surveillez et dépannez votre infrastructure, vos services cloud et vos applications avec IBM Cloud Monitoring à l’intérieur et à l’extérieur de l’infrastructure IBM Cloud.

Découvrir IBM Cloud Monitoring

Automatisation basée sur l'IA

Découvrez comment l’automatisation alimentée par l’IA peut vous aider sur plein de tableaux, de vos workflows métier à vos opérations informatiques.

Découvrir l’automatisation basée sur l’IA

IBM Cloud Pak for Watson AIOps

Découvrez comment IBM Cloud Pak for Watson AIOps, une solution de gestion des opérations informatiques, permet aux opérateurs informatiques de placer l’IA au cœur de leur chaîne d’outils ITOps.

Découvrez IBM Cloud Pak for Watson AIOps

IBM SevOne Network Performance Management

Optimisez les opérations informatiques grâce aux informations et aux actions issues de l’observabilité du réseau centrée sur les applications.

Découvrir IBM SevOne Network Performance Management

Gérez les ressources de vos applications avec IBM Turbonomic

Tirez parti de l’observabilité pour optimiser de manière proactive les ressources applicatives, garantir les performances et réaliser des économies.

Découvrez IBM Turbonomic

Ressources

Le guide de l’observabilité pour les entreprises

Explorez ce guide du débutant pour comprendre ce qu’est l’observabilité et découvrir comment vous pouvez vous lancer dans l’observabilité en trois étapes simples.

Observabilité et surveillance : quelle différence ?

Découvrez comment le suivi et l’observabilité peuvent vous aider à identifier la cause sous-jacente des problèmes, ainsi que leurs similitudes et leurs différences.

Ce que les développeurs doivent savoir sur l'observabilité

Entrez dans une nouvelle ère avec cet eBook. Laissez derrière vous tous les mauvais sentiments à l’égard de la surveillance et faites vos premiers pas dans le monde de l’observabilité, qui revêt une importance grandissante pour les développeurs.

Solutions d’observabilité et d’opérations optimisées par l’IA d’IBM – Comment elles se combinent pour résoudre les incidents

Découvrez les trois solutions synergiques d’IBM dans le domaine de l’AIOps : Observability by Instana APM, Turbonomic Application Resource Management for IBM Cloud Paks et IBM Cloud Pak for Watson AIOps.

Passez à l’étape suivante

IBM Instana fournit une observabilité en temps réel que tout le monde peut utiliser. La solution accélère la création de valeur tout en vérifiant que votre stratégie d’observabilité peut s’adapter à la complexité dynamique des environnements actuels et futurs. Du mobile au mainframe, Instana prend en charge plus de 250 technologies, et poursuit son expansion.

Découvrir IBM Instana

Réserver une démo en direct