Observabilidad
Fondo negro y azul
Observabilidad

La capacidad de observación proporciona una visibilidad profunda de las aplicaciones distribuidas modernas para una identificación y resolución de problemas más rápida y automatizada.

Soluciones presentadas

IBM AIOps y automatización de TI


¿Qué es la observabilidad?

En general, la observabilidad es la medida que se utiliza para comprender el estado o la condición interna de un sistema complejo basándose únicamente en el conocimiento de sus resultados. Cuanto más observable sea un sistema, con mayor rapidez y precisión podrá navegar desde un problema de rendimiento identificado hasta su causa raíz, sin pruebas ni codificación adicionales.

En la computación en la nube , la observabilidad también se refiere a las herramientas y prácticas de software para agregar, correlacionar y analizar un flujo constante de datos de rendimiento de una aplicación distribuida y el hardware en el que se ejecuta, con el fin de monitorear, solucionar problemas y depurar de manera más efectiva la aplicación para cumplir con las expectativas de la experiencia del cliente, los acuerdos de nivel de servicio (SLA) y otros requisitos comerciales.

Siendo un tema de TI relativamente nuevo, la observabilidad a menudo se caracteriza erróneamente como una palabra de moda exagerada o un 'rebranding' para la supervisión del sistema, en lo general, y el monitoreo del rendimiento de la aplicación (APM), en lo particular. De hecho, la observabilidad es una evolución natural de los métodos de recopilación de datos de APM que mejor aborda una naturaleza cada vez más rápida, distribuida y dinámica de las implementaciones de aplicaciones nativas de la nube. La observabilidad no reemplaza el monitoreo, sino que permite un mejor monitoreo y una mejor APM.

(El término 'observabilidad' proviene de la teoría del control, un área de la ingeniería que se ocupa de automatizar el control de un sistema dinámico, por ejemplo, el flujo de agua a través de una tubería o la velocidad de un automóvil en pendientes y bajadas, según la retroalimentación del sistema.)

Productos destacados

IBM Cloud Pak for Watson AIOps

IBM Observability by Instana


¿Por qué necesitamos la observabilidad?

Durante los últimos 20 años, los equipos de TI han utilizado principalmente en APM para monitorear y solucionar problemas de aplicaciones. APM muestrea y agrega periódicamente datos de aplicaciones y sistemas denominadostelemetría , que se sabe que está relacionado con problemas de rendimiento de la aplicación. Analiza la telemetría en relación con los indicadores clave de rendimiento (KPI) y reúne los resultados en un tablero para alertar a los equipos de operaciones y soporte sobre condiciones anormales que deben abordarse para resolver o prevenir problemas.

APM es lo suficientemente eficaz para monitorear y solucionar problemas de aplicaciones monolíticas o aplicaciones distribuidas tradicionales, donde se publica nuevo código de forma periódica y los flujos de trabajo y las dependencias entre los componentes de la aplicación, los servidores y los recursos relacionados son bien conocidos o fáciles de rastrear.

Pero hoy, las organizaciones están adoptando rápidamente prácticas de desarrollo modernas: desarrollo ágil,integración ydespliegue continuo (CI/CD),DevOps, múltiples lenguajes de programación y tecnologías nativas de la nube comomicroservicios, contenedores Docker,Kubernetes y funciones de sistemas sin servidor. Como resultado, nuevos servicios están saliendo al mercado mucho más rápido que nunca. Pero, en ese proceso, se están implementando nuevos componentes de aplicaciones con tanta frecuencia, en tantos lugares, en tantos lenguajes diferentes y durante períodos de tiempo tan variables (segundos o fracciones de segundo, en el caso de las funciones sin servidor) que los APM no pueden seguirles el paso.

Lo que se necesita es una telemetría de mayor calidad y, aun más, que se pueda utilizar para crear un registro de alta fidelidad, rico en contexto y completamente correlacionado de cada solicitud o transacción del usuario de la aplicación. Ingrese a la observabilidad.


¿Cómo funciona la observabilidad?

Las plataformas de observabilidad descubren y recopilan la telemetría del rendimiento de forma continua al integrarse con la instrumentación existente incorporada en los componentes de la aplicación y la infraestructura, así como al proporcionar herramientas para agregar instrumentación a estos componentes. La observabilidad se centra en cuatro tipos principales de telemetría:

  • Registros. Los registros son eventos granulares, con marca de tiempo, completos e inmutables de incidencias en las aplicaciones. Entre otras cosas, se pueden usar para crear un registro de alta fidelidad, milisegundo por milisegundo, de cada evento completo con el contexto circundante que los desarrolladores pueden 'reproducir' con fines de resolución de problemas y depuración.
  • Métricas. Las métricas (a veces llamadas métricas de series de tiempo) son medidas fundamentales del estado de la aplicación y el sistema durante un período de tiempo determinado, como cuánta memoria o capacidad de CPU usa una aplicación durante un lapso de cinco minutos, o cuánta latencia experimenta una aplicación durante un período de tiempo determinado. pico en el uso.
  • Rastros. Los rastros registran el 'recorrido' de un extremo a otro de cada solicitud de usuario, desde la interfaz de usuario o la aplicación móvil a través de toda la arquitectura distribuida y de regreso al usuario.
  • Dependencias (también llamados mapas de dependencia) revelan cómo cada componente de la aplicación depende de otros componentes, aplicaciones y recursos de TI.

Después de recopilar esta telemetría, la plataforma la correlaciona en tiempo real para proporcionar a los equipos de DevOps,la ingeniería de confiabilidad del sitio (SRE) y la información completa y contextual del equipo de TI: el qué, dónde y por qué de cualquier evento que pueda indicar, causar o usarse para abordar un problema de rendimiento de la aplicación. 

Muchas plataformas de observabilidad descubren automáticamente nuevas fuentes de telemetría que puedan surgir dentro del sistema (como una nueva llamada API a otra aplicación de software). Y debido a que manejan muchos más datos que una solución APM estándar, muchas plataformas incluyen capacidades de AIOps (inteligencia artificial para operaciones) que filtran las señales (indicaciones de problemas reales) del ruido (datos no relacionados con los problemas).

 


Beneficios de la observabilidad

El beneficio general de la observabilidad es que, en igualdad de condiciones, un sistema más observable es más fácil de entender (en general y con gran detalle), más fácil de monitorear, más fácil y más seguro de actualizar con nuevo código y más fácil de reparar que un sistema menos observable. Más específicamente, la observabilidad respalda directamente los objetivos Agile/DevOps/SRE para entregar software de mayor calidad más rápido al permitir que una organización:

  • Descubra y aborde 'incógnitas desconocidas', problemas que no sabe que existen. Una limitación principal de las herramientas de monitoreo es que solo observan 'incógnitas conocidas', condiciones excepcionales a las que ya sabe que debe estar atento. La observabilidad descubre condiciones que quizás no conozca o piense encontrar, luego rastrea su relación con problemas de desempeño específicos y proporciona el contexto para identificar las causas fundamentales para acelerar la resolución.
  • Detectar y resolver problemas desde el inicio del desarrollo. La observabilidad convierte el monitoreo en las primeras fases del proceso de desarrollo de software. Los equipos de DevOps pueden identificar y solucionar problemas en el nuevo código antes de que afecten la experiencia del cliente o los SLA.
  • Escale la observabilidad automáticamente. Por ejemplo, puede especificar la instrumentación y la agregación de datos como parte de una configuración de clúster de Kubernetes y comenzar a recopilar datos de telemetría desde que inicie hasta que termine.
  • Habilitar la infraestructura de aplicaciones de reparación automática. Combinar la observabilidad con las capacidades de automatización y aprendizaje automático de AIOps para predecir problemas basados en los resultados del sistema y resolverlos sin la intervención de la administración.

Observabilidad e IBM Cloud®

Con la adquisición de Instana, IBM ofrece capacidades de automatización impulsadas por la IA creada por líderes de las industrias, con el fin de gestionar la complejidad de las aplicaciones modernas que abarcan entornos de nube híbrida, especialmente cuando la demanda de mejores experiencias de cliente y más aplicaciones impacta las operaciones comerciales y de TI.

El cambio hacia una automatización en toda la empresa y de toda la TI debe comenzar con pequeños proyectos cuyo éxito sea mensurable, que luego puede escalar y optimizar para otros procesos y en otras partes de su organización.

Al trabajar con IBM, tendrá acceso a funcionalidades de automatización impulsadas por la IA , incluyendo flujos de trabajo preintegrados, para hacer que cada proceso de los servicios de TI sea más inteligente, lo que permitirá a los equipos centrarse en los problemas de TI más importantes y acelerar la innovación.

Dé el siguiente paso:

Comience hoy mismo con una cuenta de IBM Cloud

Soluciones relacionadas

Automatización basada en IA

Desde sus flujos de trabajo de negocios hasta sus operaciones de TI, lo tenemos cubierto con automatización basada en IA.


Observability with Instana

Descubra la plataforma de observabilidad empresarial líder para nubes híbridas.


IBM Cloud Pak for Watson AIOps

IBM Cloud Pak for Watson AIOps es una solución de gestión de operaciones de TI que permite a los operadores de TI colocar la IA en el centro de su cadena de herramientas de operaciones de TI.