Observabilité
Arrière-plan noir et bleu
Observabilité

L'observabilité offre une visibilité approfondie des applications distribuées modernes pour une identification et une résolution plus rapides et automatisées des problèmes.

Solutions proposées

IBM AIOps et automatisation informatique


Qu'est-ce que l'observabilité ?

En général, l'observabilité est la mesure dans laquelle vous pouvez comprendre l'état ou la condition interne d'un système complexe en vous basant uniquement sur la connaissance de ses sorties externes. Plus un système est observable, plus on peut naviguer rapidement et précisément d'un problème de performances identifié à sa cause première, sans test ni codification supplémentaire.

Dans le cloud computing , l'observabilité fait également référence aux outils et pratiques logiciels qui permettent d'agréger, de corréler et d'analyser un flux régulier de données de performances depuis une application distribuée et le matériel sur lequel elle fonctionne, afin de plus efficacement surveiller, identifier et déboguer l'application pour répondre aux attentes de l'expérience client, aux accords de niveau de service (SLA) et aux autres exigences commerciales.

Sujet informatique relativement nouveau, l'observabilité est souvent mal interprétée, comme un mot à la mode survendu, ou un « rebranding » de surveillance de système en général et d'analyse des performances d'application (APM) en particulier. En fait, l'observabilité est une évolution naturelle des méthodes de recueil de données APM (surveillance des points d'analyse) qui répond mieux à la nature toujours plus rapide, distribuée et dynamique des déploiements d'applications cloud-natives. L'observabilité ne remplace pas la surveillance – elle permet une meilleure surveillance, et une meilleure surveillance des points d'analyse.

(Le terme « observabilité » vient de la théorie du contrôle, un domaine d'ingénierie centré sur le contrôle automatique d'un système dynamique - par exemple, le flux d'eau dans un tuyau ou la vitesse d'une automobile dans les pentes et les montées - basées sur les retours du système.)

Produits à la une

IBM Cloud Pak for Watson AIOps

Observabilité IBM avec Instana


Pourquoi avons-nous besoin de l'observabilité ?

Depuis une vingtaine d'années, les équipes informatiques s'appuient principalement sur l'APM (surveillance des points d'analyse) pour surveiller et dépanner les applications. L'APM échantillonne et regroupe les données des systèmes et applications, appeléestélémétrie, qui sont connues pour être liées aux problèmes de performance des applications. Elle analyse la télémétrie relative aux indicateurs de performance clés (KPI) et rassemble les résultats dans un tableau de bord dans le but d'alerter les équipes de support et des opérations des conditions anormales qui doivent être traitées pour résoudre ou éviter des problèmes.

La surveillance des points d'analyse est suffisamment efficace pour surveiller et dépanner les applications monolithiques ou traditionnelles distribuées, où le nouveau code est publié périodiquement et les flux de travail et dépendances entre les composants de l'application, les serveurs et les ressources connexes sont bien connues ou faciles à retrouver.

Mais les organisations d'aujourd'hui adoptent rapidement des pratiques de développement modernes - développement agile,intégration continue etdéploiement continu (CI/CD), DevOps, langages de programmation multiples – et des technologies cloud-natives telles que les microservices, les conteneurs Docker,Kubernetes et les fonctions sans serveur. En rconséquence, ils apportent plus de services sur le marché, plus rapidement que jamais. Mais dans le processus ils déploient de nouveaux composants d'applications si souvent, dans tant d'endroits, dans tant de langues différentes et pour des périodes très variables de temps (des secondes ou des fractions de seconde, dans le cas des fonctions sans serveurs) que l' échantillonnage de données une fois par minute de l'APM ne peut pas suivre le rythme.

Ce qu'il faut, c'est une télémétrie de meilleure qualité - et en plus grand nombre - qui peut être utilisée pour créer un enregistrement haute fidélité, riche en contexte et entièrement corrélé de chaque requête ou transaction d'utilisateur de l'application. Entrez dans l'observabilité.


Comment l'observabilité fonctionne-t-elle ?

Les plateformes d'observabilité découvrent et recueillent des télémétrie de performance de manière continue en intégrant avec l'instrumentation existante intégrée dans les composants de l'infrastructure et de l'application, et en fournissant des outils pour ajouter des instrumentations à ces composants. L'observabilité se concentre sur quatre types de télémétrie principaux :

  • Les journaux. Les journaux sont des rapports granulaires, horodatés, complets et non modifiables des événements de l'application. Entre autre choses, les journaux peuvent être utilisés pour créer des enregistrements haute fidélité, milliseconde par milliseconde, de chaque événement, complétés par le contexte environnant, que les développeurs peuvent « lire » à des fins d'identification et résolution des problèmes, et de débogage.
  • Les mesures. Les mesures (parfois mesures de série temporelle) sont des mesures fondamentales de l'application et de la santé du système sur une période de temps donnée, telles que la quantité de mémoire ou de capacité d'unité centrale qu'une application utilise sur une période de cinq minutes, ou combien de temps d'attente une application expérimente lors d'un faire un pic en cours d'usage.
  • Les traçages. Les traçages enregistrent le « voyage » de bout en bout 'voyage' de chaque requête utilisateur, depuis l'interface utilisateur ou l'application mobile via l'ensemble de l' architecture distribuée et de retour à l'utilisateur.
  • Les dépendances (également appelées cartes de dépendances) révèlent comment chaque composant d'application est dépendante d'autres composants, applications et ressources informatiques.

Après avoir rassemblé cette télémétrie, la plateforme la corrèle en temps réel pour fournir aux équipes DevOps équipes, aux équipes d'ingénierie de fiabilité site (SRE) et à l'ensemble du personnel informatique les informations contextuelles – le quoi, où et pourquoi de tout événement qui pourrait indiquer, causer ou être utilisé pour traiter une question de performance d'application. 

De nombreuses plateformes d'observabilité découvrent automatiquement de nouvelles sources de télémétrie, car elles peuvent émerger au sein du système (comme un nouvel appel API à un autre application logicielle). Et parce qu'elles traitent bien plus de données qu'une solution APM standard, de nombreuses plateformes incluent des capacités AIOps (intelligence artificielle pour les opérations) qui tamisent les signaux - indications de réels problèmes - du bruit (données non liées à des questions).

 


Avantages de l'observabilité

L'avantage primordial de l'observabilité est qu'avec tous les autres éléments étant égaux, un système plus observable est plus facile à comprendre (en général et en détail), plus facile à surveiller, plus facile et plus sûr à mettre à jour avec un nouveau code, et plus facile à réparer qu'un système moins observable. Plus précisément, l'observabilité soutient directement les buts Agile/DevOps/SRE de fournir un logiciel de plus haute qualité plus rapidement en permettant à une organisation de :

  • Découvrir et traiter les « inconnues inconnues » - des problèmes dont vous ne connaissez pas l'existence. Une limitation principale des outils surveillance est qu'ils ne fonctionnent que pour les « inconnues connues » - des conditions exceptionnelles pour lesquelles vous savez quoi rechercher. L'observabilité découvre des conditions que vous n'auriez jamais découvertes ou pensé à rechercher, puis suit leur relation avec les performances spécifiques et fournit le contexte pour identifier les causes superutilisateur de la résolution rapide.
  • Détecter et résoudre les problèmes dès le début du développement. L'observabilité intègre la surveillance dans les premières phases du processus de développement de logiciel. Les équipes DevOps peuvent identifier et corriger les problèmes dans un nouveau code avant qu'ils n'affectent l'expérience client ou les SLA.
  • Adapter l'observabilité automatiquement. Par exemple, vous pouvez indiquer l'instrumentation et l'agrégation de données an tant que composant d'une configuration de groupe Kubernetes et un commencer un rassemblement de télémétrie à partir du moment où il tourne vers le haut, jusqu'à ce qu'il redescende.
  • Permettre le rattrapage automatisé et l'infrastructure d'application de réparation spontanée. Combiner l'observabilité avec les capacités d'apprentissage automatique et d'automatisation AIOP afin de prévoir les problèmes en fonction des sorties système et les résoudre sans intervention de la direction.

Observabilité et IBM Cloud®

Avec l'acquisition d'Instana, IBM offre des capacités d'automatisation propulsée par IA leader du secteur visant à gérer la complexité des applications modernes qui couvrent des paysages de clouds hybrides - d'autant plus que la demande de meilleures expériences client et de plus d'applications affecte les opérations informatiques et commerciales.

Toute évolution vers une automatisation à l'échelle de l'entreprise doit commencer par de petits projets au succès quantifiable, que vous pourrez ensuite adapter et optimiser pour d'autres processus et dans d'autres parties de votre organisation.

En collaborant avec IBM, vous aurez accès à des capacité d'automatisation propulsées par l'IA, notamment des flux de travaux préconfigurés qui rendent plus intelligents tous les processus de services IT et permettent aux équipes de se consacrer aux problèmes IT les plus importants et d'accélérer l'innovation.

Pour aller plus loin :

  • En savoir plus à propos de l'observabilité IBM® avec Instana.
  • Instana fonctionne avecIBM Cloud Pak® for Watson AIOps afin de fournir une plateforme d'observabilité leader pour le rattrapage automatisé, alimentée par un flux continu de données télémétriques contextualisées.
  • Inscrivez-vous pour télécharger le rapport Gartner et découvrir comment améliorer vos opérations informatiques grâce à l'IA.
  • Téléchargez linforgraphie IBM Cloud® (PDF, 464 Ko) qui montre les avantages de l'automatisation propulsée par IA pour les opérations informatiques.
Commencez dès aujourd'hui avec un compte IBM Cloud.

Solutions connexes

Automatisation basée sur l'IA

De vos flux de travaux métier jusqu'à vos opérations informatiques, nous avons la solution qu'il vous faut avec l'automatisation basée sur l'IA.


Observability with Instana

Découvrez la plateforme d'entreprise leader pour les clouds hybrides.


IBM Cloud Pak for Watson AIOps

IBM Cloud Pak for Watson AIOps est une solution de gestion des opérations informatiques qui permet aux opérateurs informatiques de placer l'IA au cœur de leur chaîne d'outils IT.