L'observabilité est la mesure dans laquelle il est possible de comprendre l'état ou la condition interne d'un système complexe en se basant uniquement sur la connaissance de ses résultats externes. Plus un système est observable, plus il est possible de remonter rapidement et précisément d'un problème de performance identifié à son origine, sans test ou codage supplémentaire.
Observability offre une visibilité approfondie des applications distribuées modernes pour une identification et une résolution plus rapides et automatisées des problèmes.
Dans le domaine de l’informatique et du cloud computing, l’observabilité implique l’utilisation de pratiques et d’outils logiciels. Ces outils permettent d’agréger, de corréler et d’analyser un flux constant de données de performances provenant d’une application distribuée, ainsi que du matériel et du réseau sur lesquels elle s’exécute. Ce processus permet de surveiller, de dépanner et de déboguer efficacement les applications et les réseaux. L’objectif est de répondre aux attentes en matière d’expérience client, aux accords de niveau de service (SLA) et à d’autres exigences métier.
Domaine de l'informatique relativement nouveau, l’observabilité est souvent considérée à tort comme un mot à la mode surfait ou comme un nouveau nom pour la surveillance des systèmes, la surveillance des performances des applications (APM) et la gestion des performances réseau (NPM). En réalité, l'observabilité est une évolution naturelle des méthodes de collecte de données APM et NPM qui permet de mieux répondre à la nature de plus en plus rapide, distribuée et dynamique des déploiements d'applications cloud natives. L'observabilité ne remplace pas la surveillance : elle permet une meilleure surveillance, ainsi qu'une APM et NPM de meilleure qualité.
Le terme « observabilité » provient de la théorie du contrôle, un domaine de l'ingénierie dédié à l'automatisation du contrôle d'un système dynamique. Les exemples incluent la régulation du débit d'eau dans un tuyau ou le contrôle de la vitesse d'une automobile sur les pentes, en fonction des informations fournies par le système.
Cet e-book démystifie les préjugés concernant l’observabilité et présente son rôle dans le monde numérique.
S’inscrire pour obtenir le guide sur l’observabilité
Au cours des 20 dernières années environ, les équipes informatiques se sont surtout appuyées sur l'APM pour surveiller et dépanner les applications. L'APM échantillonne et agrège périodiquement les données des applications et des systèmes, appelées télémétrie, qui sont connues pour être liées à des problèmes de performance des applications.
L'APM analyse la télémétrie par rapport aux indicateurs clés de performance (KPI) et rassemble les résultats dans un tableau de bord. Ces résultats alertent les équipes chargées des opérations et du support sur des conditions anormales qui doivent être traitées pour résoudre ou éviter un problème.
L'APM est suffisamment efficace pour surveiller et dépanner des applications monolithiques ou des applications distribuées traditionnelles. Dans ces configurations, les nouvelles versions du code sont périodiques et les flux de travail et les dépendances entre les composants de l'application, les serveurs et les ressources connexes sont bien connus ou faciles à retracer.
Aujourd'hui, les organisations adoptent avec engouement des pratiques de développement modernes qui comprennent le développement agile, l’intégration et le déploiement continus (CI/CD), le DevOps et plusieurs langages de programmation.
Les organisations adoptent également des technologies cloud natives telles que les microservices, les conteneurs Docker, Kubernetes et les fonctions serverless. Cela leur permet de lancer leurs services sur le marché plus rapidement que jamais, mais ce faisant elles déploient de nouveaux composants d'application à plein d'endroits différents, dans plusieurs langues et pendant des périodes très variables, qui peuvent se compter en secondes ou fractions de seconde, pour les fonctions serverless : l'échantillonnage des données une fois par minute par APM ne peut pas suivre ce rythme.
Cela nécessite une télémétrie de meilleure qualité et bien plus fournie, qui puisse être utilisée pour créer un enregistrement de haute fidélité, riche en contexte et entièrement corrélé de chaque demande ou transaction de l’utilisateur de l’application. C'est là que l'observabilité entre en jeu.
Les plateformes d'observabilité découvrent et collectent des données télémétriques de performance en continu en s'intégrant aux instruments existants des composants d'application et d'infrastructure, et en fournissant des outils pour renforcer cette instrumentation. L’observabilité se concentre sur quatre principaux types de données télémétriques :
Après avoir recueilli ces données télémétriques, la plateforme les met en corrélation en temps réel. Ce processus fournit aux équipes DevOps, aux équipes d'ingénierie de la fiabilité des sites (SRE) et au personnel informatique un contexte complet. Les équipes comprennent le quoi, le où et le pourquoi de tout événement susceptible d'indiquer, de causer ou d'être utilisé pour résoudre un problème de performance au sein d'une application.
De nombreuses plateformes d’observabilité découvrent automatiquement de nouvelles sources de télémétrie qui pourraient émerger dans le système (comme un nouvel appel d’API vers une autre application logicielle). Elles traitent plus de données qu’une solution APM standard et beaucoup d'entre elles intègrent des fonctionnalités AIOps (intelligence artificielle pour les opérations) qui filtrent les signaux, c’est-à-dire toute indication de problème réel, parmi le bruit (les données sans rapport avec les problèmes).
L'observabilité rend un système plus simple à comprendre (en général et dans le détail) et à surveiller, plus facile et plus sûr à mettre à jour avec un nouveau code, et plus pratique à réparer qu'un système moins observable. Plus précisément, l'observabilité soutient directement les objectifs Agile/DevOps/SRE visant à livrer des logiciels de meilleure qualité plus rapidement en permettant à une organisation de :
Découvrez la meilleure plateforme d’observabilité d’entreprise pour les environnements de cloud hybride.
Améliorez les performances de l'infrastructure et des applications où que vous soyez grâce à une observabilité proactive des journaux tout en optimisant le coût total de possession de votre infrastructure d'observabilité au sein et en dehors d'IBM Cloud.
Surveillez et dépannez votre infrastructure, vos services cloud et vos applications avec IBM Cloud Monitoring à l’intérieur et à l’extérieur de l’infrastructure IBM Cloud.
Découvrez comment l’automatisation alimentée par l’IA peut vous aider sur plein de tableaux, de vos workflows métier à vos opérations informatiques.
Découvrez comment IBM Cloud Pak for Watson AIOps, une solution de gestion des opérations informatiques, permet aux opérateurs informatiques de placer l’IA au cœur de leur chaîne d’outils ITOps.
Optimisez les opérations informatiques grâce aux informations et aux actions issues de l’observabilité du réseau centrée sur les applications.
Tirez parti de l’observabilité pour optimiser de manière proactive les ressources applicatives, garantir les performances et réaliser des économies.
Explorez ce guide du débutant pour comprendre ce qu’est l’observabilité et découvrir comment vous pouvez vous lancer dans l’observabilité en trois étapes simples.
Découvrez comment le suivi et l’observabilité peuvent vous aider à identifier la cause sous-jacente des problèmes, ainsi que leurs similitudes et leurs différences.
Entrez dans une nouvelle ère avec cet eBook. Laissez derrière vous tous les mauvais sentiments à l’égard de la surveillance et faites vos premiers pas dans le monde de l’observabilité, qui revêt une importance grandissante pour les développeurs.
Découvrez les trois solutions synergiques d’IBM dans le domaine de l'AIOps : Observability by Instana APM, Turbonomic Application Resource Management for IBM Cloud Paks et IBM Cloud Pak for Watson AIOps.