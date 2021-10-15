La observabilidad es la medida en que se puede comprender el estado o condición interna de un sistema complejo con base en solo el conocimiento de sus salidas externas.
Cuanto más observable sea un sistema, más rápida y precisa será la navegación desde un problema de rendimiento identificado hasta su causa raíz, sin pruebas ni codificación adicionales.
La observabilidad proporciona una visibilidad profunda de las aplicaciones distribuidas modernas para una identificación y resolución de problemas más rápida y automatizada.
En informática y computación en la nube, la observabilidad implica el uso de herramientas y prácticas de software. Estas herramientas sirven para agregar, correlacionar y analizar un flujo constante de datos de rendimiento procedentes de una aplicación distribuida junto con el hardware y la red en los que se ejecuta.
Este proceso ayuda a monitorear, solucionar problemas y depurar aplicaciones y redes con eficacia. El objetivo es cumplir las expectativas de experiencia del cliente, los acuerdos de nivel de servicio (SLA) y otros requisitos empresariales.
Un tema de TI relativamente nuevo, la observabilidad a menudo se caracteriza erróneamente como una palabra de moda sobrevalorada o un "cambio de marca" de monitoreo del sistema, monitoreo del rendimiento de las aplicaciones (APM) y administración del rendimiento de la red (NPM).
De hecho, la observabilidad es una evolución natural de los métodos de recopilación de datos de APM y NPM que aborda mejor la naturaleza cada vez más rápida, distribuida y dinámica de las implementaciones de aplicaciones nativas de la nube. La observabilidad no reemplaza el monitoreo, sino que permite un mejor monitoreo y un mejor APM y NPM.
El término “observabilidad” proviene de la teoría del control, un área de la ingeniería que se ocupa de automatizar el control de un sistema dinámico. Los ejemplos incluyen regular el flujo de agua a través de una tubería, o controlar la velocidad de un automóvil sobre las inclinaciones y descensos, en función de la retroalimentación del sistema.
Durante los últimos 20 años más o menos, los equipos de TI han confiado principalmente en APM para monitorear y solucionar problemas de aplicaciones. APM muestra y agrega periódicamente datos de aplicaciones y sistemas, llamados telemetría, que se sabe que están relacionados con problemas de rendimiento de las aplicaciones.
APM analiza la telemetría en relación con los indicadores clave de rendimiento (KPI) y reúne los resultados en un panel. Estos hallazgos alertan a los equipos de operaciones y soporte sobre condiciones anormales que deben abordar para resolver o prevenir problemas.
APM es lo suficientemente eficaz para monitorear y solucionar problemas de aplicaciones monolíticas o aplicaciones distribuidas tradicionales. En estas configuraciones, las nuevas versiones de código se producen periódicamente y los flujos de trabajo y las dependencias entre los componentes de la aplicación, los servidores y los recursos relacionados son bien conocidos o fáciles de rastrear.
Hoy en día, las organizaciones están adoptando rápidamente prácticas modernas de desarrollo. Estas prácticas incluyen desarrollo ágil, integración continua e implementación continua (CI/CD), DevOps, varios lenguajes de programación.
Las organizaciones también están adoptando tecnologías nativas de la nube como microservicios, contenedores Docker, Kubernetes y funciones sin servidor. Como resultado, están aportando más servicios al mercado más rápido que nunca. Pero en el proceso están desplegando nuevos componentes de aplicaciones. Lo hacen en muchos lugares, en diferentes idiomas y durante periodos de tiempo muy variables, incluso segundos o fracciones de segundo, para funciones sin servidor. La ejemplificación de datos una vez por minuto de APM no puede seguir el ritmo.
Lo que se necesita es telemetría de mayor calidad, y mucho más, que se pueda usar para crear un registro de alta fidelidad, rico en contexto y totalmente correlacionado de cada solicitud o transacción de usuario de la aplicación. Y aquí es cuando aparece la observabilidad.
– Registros
– Métricas
– Rastros
– Las dependencias
Las plataformas de observabilidad descubren y recopilan telemetría de rendimiento continuamente al integrar con la instrumentación existente integrada en los componentes de la aplicación y la infraestructura, y al proporcionar herramientas para agregar instrumentación a estos componentes. La observabilidad se centra en cuatro tipos principales de telemetría:
Luego de recopilar esta telemetría, la plataforma la correlaciona en tiempo real. Este proceso proporciona a los equipos de DevOps, los equipos de ingeniería de confiabilidad del sitio (SRE) y el personal de TI información completa y contextual. Los equipos entienden el qué, dónde y por qué de cualquier evento que pueda indicar, causar o emplear para abordar un problema de rendimiento de la aplicación.
Muchas plataformas de observabilidad descubren automáticamente nuevas fuentes de telemetría a medida que pueden surgir dentro del sistema (como una nueva llamada API a otra aplicación de software).
Las plataformas manejan más datos que una solución APM estándar. Muchas plataformas incluyen capacidades AIOps (inteligencia artificial para operaciones) que tamizan las señales, indicaciones de problemas reales, del ruido (datos no relacionados con los problemas).
– Descubra y aborde problemas que no sabe que existen
– Detecte y resuelva problemas al principio del desarrollo
– Escale la observabilidad automáticamente
– Permita la reparación automatizada y la infraestructura de aplicaciones autorreparable
La observabilidad hace que un sistema sea más fácil de entender (en general y en gran detalle) y monitorear, más fácil y seguro de actualizar con nuevo código y más fácil de reparar que un sistema menos observable. Más concretamente, la observabilidad respalda directamente los objetivos de Agile/DevOps/SRE de ofrecer software de mayor calidad con mayor rapidez al permitir a una organización:
