La observabilidad es la medida en que se puede comprender el estado o condición interna de un sistema complejo basándose únicamente en el conocimiento de sus outputs externos. Cuanto más observable sea un sistema, más rápido y preciso podrá navegar desde un problema de rendimiento identificado hasta su causa raíz, sin pruebas o codificación adicionales.
La observabilidad proporciona una visibilidad profunda de las aplicaciones distribuidas modernas para una identificación y resolución de problemas más rápidas y automatizadas.
En TI y cloud computing, la observabilidad implica el uso de herramientas y prácticas de software. Estas herramientas son para agregar, correlacionar y analizar un flujo constante de datos de rendimiento desde una aplicación distribuida junto con el hardware y la red en la que se ejecuta. Este proceso ayuda a monitorizar, solucionar problemas y depurar aplicaciones y redes de forma eficaz. El objetivo es cumplir las expectativas de experiencia del cliente, los acuerdos de nivel de servicio (SLA) y otros requisitos empresariales.
La observabilidad, un tema de TI relativamente nuevo, se suele calificar erróneamente como una palabra de moda que se ha exagerado o un «cambio de marca» de la monitorización de sistemas, la monitorización del rendimiento de las aplicaciones (APM) y la gestión del rendimiento de la red (NPM). De hecho, la observabilidad es una evolución natural de los métodos de recopilación de datos de APM y NPM que aborda mejor la naturaleza cada vez más rápida, distribuida y dinámica de las implementaciones de aplicaciones nativas de la nube. La observabilidad no sustituye a la monitorización, sino que permite una mejor monitorización y mejores APM y NPM.
El término "observabilidad" procede de la teoría del control, un área de la ingeniería que se ocupa de automatizar el control de un sistema dinámico. Algunos ejemplos son la regulación del caudal de agua a través de una tubería, o el control de la velocidad de un automóvil en pendientes y declives, basándose en comentarios del sistema.
Este libro electrónico tiene como objetivo debatir los mitos relacionados con la observabilidad y mostrar su papel en el mundo digital.
Regístrese para obtener la guía sobre observabilidad
Durante los últimos 20 años aproximadamente, los equipos de TI han confiado principalmente en la APM para monitorizar y solucionar los problemas de las aplicaciones. La APM muestrea y agrega periódicamente datos de aplicaciones y sistemas, denominados telemetría, que se sabe que están relacionados con problemas de rendimiento de las aplicaciones.
La APM analiza la telemetría en relación con los indicadores clave de rendimiento (KPI) y reúne los resultados en un panel de control. Estos resultados alertan a los equipos de operaciones y soporte de las condiciones anómalas que deben abordarse para resolver o prevenir los problemas.
La APM es suficientemente eficaz para monitorizar y solucionar problemas de aplicaciones monolíticas o aplicaciones distribuidas tradicionales. En estas configuraciones, las nuevas versiones de código se producen periódicamente y los flujos de trabajo y las dependencias entre los componentes de la aplicación, los servidores y los recursos relacionados son bien conocidos o fáciles de rastrear.
Hoy en día, las organizaciones están adoptando rápidamente prácticas de desarrollo modernas. Estas prácticas incluyen el desarrollo ágil, la integración continua y la implementación continua (CI/CD), DevOps, varios lenguajes de programación.
Las organizaciones también están adoptando tecnologías nativas de la nube, como microservicios, contenedores de Docker, Kubernetes y funciones sin servidor. Como resultado, están sacando más servicios al mercado más rápido que nunca. Pero en el proceso están implementando nuevos componentes de aplicaciones. Lo hacen en muchos lugares, en diferentes idiomas y durante periodos de tiempo muy variables, incluso segundos o fracciones de segundo, en el caso de las funciones sin servidor. El muestreo de datos una vez al minuto de la APM no puede seguir este ritmo.
Lo que se necesita es telemetría de mayor calidad (y mucha más) que pueda utilizarse para crear un registro de alta fidelidad, rico en contexto y totalmente correlacionado de cada solicitud o transacción del usuario de la aplicación. Aquí entra la observabilidad.
Las plataformas de observabilidad descubren y recopilan telemetría de rendimiento de forma continua integrándose con la instrumentación existente incorporada en los componentes de las aplicaciones y la infraestructura, y proporcionando herramientas para añadir instrumentación a estos componentes. La observabilidad se centra en cuatro tipos principales de telemetría:
Tras recopilar esta telemetría, la plataforma la correlaciona en tiempo real. Este proceso proporciona a los equipos DevOps, a los equipos de ingeniería de fiabilidad del sitio (SRE) y al personal de TI una información completa y contextual. Los equipos comprenden el qué, el dónde y el por qué de cualquier evento que pueda indicar, causar o servir para solucionar un problema de rendimiento de la aplicación.
Muchas plataformas de observabilidad descubren automáticamente nuevas fuentes de telemetría a medida que surgen en el sistema (como una nueva llamada a la API de otra aplicación de software). Las plataformas tratan más datos que una solución APM estándar. Muchas plataformas incluyen capacidades AIOps (inteligencia artificial para operaciones) que tamizan las señales, indicios de problemas reales, del ruido (datos no relacionados con los problemas).
La observabilidad hace que un sistema sea más fácil de entender (en general y en gran detalle) y de monitorizar, más fácil y seguro de actualizar con código nuevo, y más fácil de reparar que un sistema menos observable. Más concretamente, la observabilidad respalda directamente los objetivos de Agile/DevOps/SRE de entregar software de mayor calidad con mayor rapidez al permitir que una organización:
Descubra la plataforma de observabilidad empresarial líder para nubes híbridas.
Mejore el rendimiento de la infraestructura y las aplicaciones en cualquier lugar con la observabilidad proactiva de registros, a la vez que optimiza el coste total de propiedad de su infraestructura de observabilidad dentro y fuera de IBM Cloud.
Monitorice y solucione los problemas de su infraestructura, servicios en la nube y aplicaciones con IBM Cloud Monitoring dentro y fuera de la infraestructura de IBM Cloud.
Descubra cómo le cubrimos con la automatización con IA, desde sus flujos de trabajo empresariales hasta sus operaciones de TI.
Descubra cómo IBM Cloud Pak para Watson AIOps, una solución de gestión de operaciones de TI, permite a los operadores de TI colocar la IA en el núcleo de su cadena de herramientas ITOps.
Optimice las operaciones de TI con conocimientos y acciones a partir de la observabilidad de la red centrada en las aplicaciones.
Aproveche la observabilidad para optimizar de manera proactiva los recursos de las aplicaciones, garantizar el rendimiento y ahorrar dinero.
Explore esta guía para principiantes para entender qué es la observabilidad y cómo puede empezar con la observabilidad de su empresa en tres sencillos pasos.
Lea cómo la monitorización y la observabilidad pueden ayudarle a identificar la causa subyacente de los problemas: ¿en qué se parecen y en qué se diferencian?
Explore el nuevo mundo con este libro electrónico. Dejaremos atrás las malas sensaciones sobre la monitorización y daremos nuestros primeros pasos en el mundo de la observabilidad y su importancia cada vez mayor para los desarrolladores.
Explore las tres soluciones sinérgicas de IBM en el ámbito de las AIOps: IBM Observability by Instana APM, Turbonomic Application Resource Management for IBM Cloud Paks e IBM Cloud Pak for Watson AIOps.