¿Qué es la observabilidad nativa de la nube?

By Derek Robertson and Matthew Kosinski

Observabilidad nativa de la nube, definida

La observabilidad nativa de la nube es la capacidad de comprender aplicaciones y sistemas en la nube altamente complejos, normalmente basados en microserviciosy, a menudo, sin servidor, a partir de sus resultados y datos de telemetría.

La observabilidad nativa de la nube difiere de la observabilidad tradicional en su enfoque específico en los desafíos que plantean los sistemas en la nube. En estos sistemas, los contenedores, las máquinas virtuales y otros recursos pueden aprovisionarse y eliminarse en cualquier momento, creando cantidades masivas de datos a veces efímeros.

Las soluciones de observabilidad nativas de la nube ayudan a las organizaciones a realizar un seguimiento de los puntos de datos clave en este sistema mutable, lo que a su vez contribuye a respaldar el proceso DevOps y sus actualizaciones pequeñas, frecuentes y, a menudo, automatizadas.

Las plataformas de observabilidad nativas de la nube recopilan datos de todo el entorno de nube híbrida de una organización, que puede consistir en servicios de múltiples proveedores (como Microsoft Azure y Amazon Web Services), servidores locales y las numerosas herramientas y recursos que admiten (como microservicios o herramientas de orquestación de contenedores como Kubernetes). Proporcionan insights aplicables en la práctica sobre métricas como el tráfico de red y la latencia y las correlaciones entre esas métricas en todas las plataformas, a menudo automatizando las reparaciones necesarias y la visualización de los datos recopilados.

Por ejemplo, una plataforma de observabilidad basada en la nube podría recopilar métricas de latencia de una máquina virtual alojada en un servidor en la nube, registros de los contenedores orquestados por Kubernetes de esa máquina virtual que describen sus llamadas a la API e información sobre eventos de red, como el despliegue de una nueva aplicación. Luego, puede presentar los datos recopilados como un cuadro o gráfico y realizar un análisis de la causa principal, brindando a los administradores insights concretos sobre las causas del tiempo de inactividad.

Muchas plataformas modernas emplean inteligencia artificial (IA) y machine learning (ML) para potenciar estas características automatizadas. Según un informe de 2025 de 451 Research, el 71% de las organizaciones que utilizan soluciones de observabilidad utilizan sus características de IA, un aumento del 26% con respecto a 2024.¹

Muchas herramientas populares de observabilidad nativas de la nube son de código abierto, como OpenTelemetry, Jaeger y Prometheus. Al permitir que la comunidad de desarrolladores realice arreglos específicos para cada plataforma o aplicación a medida que surgen los problemas, las herramientas de código abierto ofrecen a las organizaciones una mayor flexibilidad en entornos nativos de la nube, a veces impredecibles, y una mayor capacidad para conectar sus herramientas con diversos sistemas e interfaces de programación de aplicaciones (API).

Boletín de la industria

Las últimas noticias tecnológicas, respaldadas por los insights de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¿Cómo funciona la observabilidad nativa de la nube?

Las herramientas de observabilidad nativas de la nube recopilan registros, trazas y métricas de todo el ecosistema de la nube. A menudo presentan datos sin procesar, análisis y visualizaciones a través de un panel de control que ayuda a los usuarios a supervisar el estado de las aplicaciones y los objetivos empresariales.

Recopilación de datos

En un entorno en la nube compuesto en gran parte por microservicios, los nuevos contenedores y máquinas virtuales pueden desaparecer y aparecer en cualquier momento, lo que genera una gran cantidad de datos de telemetría. Esto crea un nuevo problema que las plataformas de observabilidad nativas de la nube deben abordar: ver todo lo que ocurre en una red que cambia constantemente y rastrear datos de fuentes que podrían dejar de existir a medida que la red se expande y se contrae automáticamente para satisfacer las necesidades empresariales.

Las herramientas de observabilidad facilitan la recopilación y agregación de datos de memoria de CPU, registros de aplicaciones, información de disponibilidad, latencia promedio y otros puntos de datos dentro de estas redes complejas.

Las plataformas de observabilidad nativas de la nube se basan en los tres pilares de la observabilidad: logs, trazas y métricas.

Registros

Los registros son registros granulares, con marca de tiempo, completos e inmutables de eventos de aplicaciones. Entre otras cosas, los registros se pueden emplear para crear un registro de alta fidelidad, milisegundo a milisegundo, de cada evento, completo con el contexto circundante. Los desarrolladores emplean registros para solucionar problemas y depurar.

Rastreos

Los rastros registran el “recorrido” de principio a fin de cada solicitud del usuario, desde la interfaz de usuario, a través de toda la arquitectura y de regreso al usuario.

Métricas

Las métricas son medidas fundamentales del estado de la aplicación y del sistema a lo largo del tiempo. Por ejemplo, las métricas se utilizan para medir cuánta memoria o capacidad de CPU utiliza una aplicación en cinco minutos, o cuánta latencia experimenta una aplicación durante un pico de uso.

Supervisión

La visibilidad es una función fundamental de las plataformas de observabilidad nativas de la nube. La capacidad de monitorear los contenedores, máquinas virtuales, servidores y otros elementos de una red basada en microservicios es una característica crítica para estas arquitecturas, en las que el seguimiento distribuido y los mapas de dependencia pueden ser complicados y casi indescifrables.

Los paneles de observabilidad permiten a los usuarios supervisar medidas del estado de las aplicaciones, como la disponibilidad y el uso de recursos, y objetivos empresariales relevantes, como la tasa de conversión o los usuarios activos. Las características de monitoreo también ayudan a aclarar cómo funcionan los servicios entre sí (mediante el uso de herramientas como gráficos de dependencia) y cómo encajan en la arquitectura general.

Análisis

La monitorización tradicional se realizaba con herramientas de gestión del rendimiento de las aplicaciones (APM), que agregaban los datos recogidos de cada fuente para crear reportes digeribles, paneles y visualizaciones, no muy diferente a la función de monitorización en el software moderno de observabilidad.

En un entorno moderno de computación en la nube, las herramientas de observabilidad a menudo descargan telemetría básica a la capa Kubernetes, donde el software de orquestación de contenedores utiliza herramientas nativas para realizar la observabilidad dentro de la plataforma. Permitir que Kubernetes automatice esta actividad permite a los equipos de TI centrar el análisis de datos en objetivos de nivel de servicio (SLO) e indicadores de nivel de servicio (SLI).

La automatización en el software de observabilidad moderno va más allá de la recopilación, el monitoreo y el análisis. Las herramientas de observabilidad también pueden automatizar procesos de depuración, instrumentación y actualizaciones de panel de control a medida que se agregan nuevos servicios a la red. También pueden gestionar el manejo de agentes, donde los agentes son pequeños componentes de software desplegados en todo un ecosistema para recopilar continuamente datos de telemetría.

Beneficios de la observabilidad nativa de la nube

La práctica de la observabilidad nativa de la nube puede brindar a las organizaciones una visión más completa de los sistemas complejos, reducir el tiempo medio de reparación (MTTR) e integrar aún más las herramientas de automatización en el flujo de trabajo de DevOps.

Transparencia del sistema

En los sistemas altamente distribuidos, una gran cantidad de servidores superpuestos y aplicaciones nativas de la nube emiten señales, métricas, registros y rastreos, y no siempre comparten datos de forma limpia. Las herramientas de observabilidad nativo de la nube ayudan a superar estos cuellos de botella mediante la recopilación de observabilidad de todo el ecosistema, lo que permite a los administradores solucionar problemas en tiempo real y tomar decisiones basadas en datos.

Recuperación más rápida

Una vez que los administradores, o las herramientas automatizadas dentro de la plataforma de observabilidad, han detectado correlaciones entre los problemas en la nube, pueden realizar un análisis de causa principal. Por ejemplo, una plataforma podría marcar globalmente la respuesta lenta de la aplicación que coincide con una alta latencia en una región en particular, y luego realizar un análisis para identificar el servidor mal configurado o que funciona mal y es responsable del problema.

Este análisis puede marcar la diferencia entre clasificar un incidente durante horas y resolver un problema inminente antes de que suceda, reduciendo el tiempo de inactividad y liberando a los equipos de DevOps para otras tareas.

Mayor automatización

Las herramientas de inteligencia artificial y machine learning están en el corazón de muchas plataformas modernas de observabilidad, detectando anomalías sin intervención del usuario, realizando análisis de causa principal y utilizando IA generativa para la visualización de datos.

El gran volumen de datos de telemetría que se genera en un entorno de nube hace que la IA y el ML sean muy valiosos para la observabilidad basada en la nube. La automatización de la observabilidad a escala puede generar insights que permitan a las organizaciones automatizar también otras funciones empresariales. El análisis predictivo, por ejemplo, puede permitir que una empresa aprovisione una nueva infraestructura de servidores antes del tráfico pesado.

Desafíos de la observabilidad nativa de la nube

Debido a que recopila y sintetiza una cantidad tan vasta y diversa de datos, la observabilidad nativa de la nube puede plantear desafíos con respecto al escalamiento y la complejidad, el uso de múltiples herramientas de observabilidad y la privacidad de datos.

Escalamiento y complejidad

Las organizaciones deben equilibrar la visibilidad en un entorno de nube complejo con las limitaciones prácticas relacionadas con los costos de almacenamiento, el rendimiento de las consultas y la retención de datos. Sin estrategias de ejemplificación adecuadas y priorización de datos, el volumen de datos recogidos puede superar a las plataformas de observabilidad.

La naturaleza expansiva y rápidamente cambiante de los microservicios en contenedores también puede significar que el monitoreo debe extenderse más allá del nivel de aplicación a los clústeres y nodos de una herramienta de orquestación como Kubernetes.

Uso de múltiples herramientas

La mayoría de las organizaciones operan docenas de herramientas de monitoreo acumuladas a lo largo de los años, cada una de las cuales sirve a equipos o tecnologías específicas. La pila tecnológica suele abarcar múltiples lenguajes de programación, sistemas heredados, entornos multinube, microservicios, componentes de infraestructura y marcos. Esto dificulta la interoperabilidad y crea datos fragmentados, lo que anula el objetivo fundamental de la observabilidad: crear una visión unificada del estado del sistema.

Privacidad y cumplimiento

La observabilidad nativa de la nube puede crear desafíos de cumplimiento de normas al agregar datos confidenciales de toda la empresa en plataformas. Los datos de telemetría pueden contener información de identificación personal (PII), detalles de tarjetas de pago o información médica protegida. Este tipo de datos pueden caer bajo la autoridad de regulaciones como el Reglamento General de Protección de Datos (GDPR), la Ley de Portabilidad y Responsabilidad del Seguro Médico (HIPAA) y la California Consumer Privacy Act (CCPA).

Sin enmascaramiento de datos, tokenización, restricciones geográficas y controles de acceso basados en roles, las organizaciones corren el riesgo de exponer datos confidenciales a usuarios no autorizados o infringir los requisitos normativos. Por ejemplo, resolver un problema de transacción para un cliente europeo puede requerir acceder a registros que contienen información de identificación personal. Si los empleados con sede en Estados Unidos ven esos datos, esa situación podría abrir la puerta a violaciones del RGPD.

Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Vea todos los episodios de Mixture of Experts

Observabilidad nativa de la nube y AIOps

La implementación de la observabilidad nativa en la nube es uno de los pilares del cambio hacia AIOps, la aplicación de capacidades de inteligencia artificial para automatizar, agilizar y optimizar la gestión de servicios de TI y los flujos de trabajo operativos.

Cuando las organizaciones tienen una mayor visibilidad de los datos en la nube, pueden automatizar las decisiones sobre el aprovisionamiento o la resolución de problemas, incluso en el entorno de la nube, que a menudo es vasto, extenso e impredecible. En resumen, la observabilidad permite AIOps al brindar a las organizaciones una mayor confianza en la toma de decisiones de sus herramientas de IA y ML.

Las funciones clave de IA en la observabilidad nativa de la nube incluyen:

detección de anomalías, donde los algoritmos pueden analizar datos a escala para determinar el rendimiento de referencia del sistema e identificar rápidamente las desviaciones;
análisis de causa principal, que va más allá de la correlación para identificar las acciones que se pueden tomar para corregir directamente un error;
y análisis predictivo, mediante el cual los modelos de IA pueden predecir futuras cargas de trabajo y escalar la red hacia arriba o hacia abajo en consecuencia.

Observabilidad nativa de la nube vs. observabilidad de pila completa

Aunque ambos comparten similitudes importantes, la observabilidad nativa de la nube es diferente de la práctica de la observabilidad de pila completa. La observabilidad nativa de la nube puede considerarse una evolución de la observabilidad de pila completa, adaptando las mismas herramientas y técnicas para un entorno nativo de la nube.

La observabilidad de la pila completa correlaciona la telemetría en todas las capas de la pila tecnológica. Las plataformas de observabilidad de pila completa recopilan datos de múltiples sistemas en tiempo real y emplean IA y ML para detectar anomalías, predecir fallas y generar insights para los administradores.

La observabilidad nativa de la nube es una evolución de esto, donde las herramientas de recogida y análisis de datos empleadas para la observabilidad de pila completa se desarrollan específicamente para tecnologías nativas de la nube, integrar perfectamente con microservicios complejos y contenedores.

En resumen, mientras que la observabilidad de pila completa proporciona datos de telemetría completos en todo un entorno de TI, la observabilidad nativa de la nube se centra específicamente en entornos de nube a menudo sin servidor.

Autores

Derek Robertson

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor