¿Qué es la observabilidad nativa de la nube?

By Derek Robertson and Matthew Kosinski

La bservabilidad nativa de la nube, definida

La observabilidad nativa de la nube es la capacidad de entender aplicaciones y sistemas en la nube muy complejos (normalmente basados en microserviciosy, a menudo, sin servidor) en función de sus outputs y datos de telemetría.

La observabilidad nativa de la nube difiere de la observabilidad tradicional en su enfoque específico en los desafíos que plantean los sistemas en la nube. En estos sistemas, los contenedores, las máquinas virtuales y otros recursos pueden aprovisionarse y eliminarse en cualquier momento, creando cantidades masivas de datos a veces efímeros.

Las soluciones de observabilidad nativas de la nube ayudan a las organizaciones a rastrear puntos de datos clave en este sistema mutable, lo que a su vez ayuda a respaldar el proceso DevOps y sus actualizaciones pequeñas, frecuentes y a menudo automatizadas.

Las plataformas de observabilidad nativas de la nube recopilan datos de todo el entorno de nube híbrida de una organización, que puede consistir en servicios de varios proveedores (como Microsoft Azure y Amazon Web Services), servidores in situ y las numerosas herramientas y recursos que admiten (como microservicios o herramientas de orquestación de contenedores como Kubernetes). Proporcionan conocimientos accionables sobre métricas como el tráfico de red y la latencia, así como sobre las correlaciones entre estas métricas en las distintas plataformas. A menudo, también automatizan las reparaciones necesarias y la visualización de los datos recopilados.

Por ejemplo, una plataforma de observabilidad basada en la nube podría recopilar métricas de latencia de una máquina virtual alojada en un servidor en la nube, registros de los contenedores orquestados por Kubernetes de esa máquina virtual que describan sus llamadas a la API e información sobre eventos de red como la implementación de una nueva aplicación. Luego puede presentar los datos recopilados en forma de gráfico o diagrama y realizar un análisis de la causa raíz, proporcionando a los administradores una conocimiento concreto sobre qué causa el tiempo de inactividad.

Muchas plataformas modernas utilizan la inteligencia artificial (IA) y el machine learning (ML) para impulsar estas características automatizadas. Según un informe de 2025 de la investigación de 451, el 71 % de las organizaciones que utilizan soluciones de observabilidad están utilizando sus características de IA, un aumento del 26 % desde 2024.¹

Muchas herramientas populares de observabilidad nativa en la nube son de código abierto, como OpenTelemetry, Jaeger y Prometheus. Al permitir a la comunidad de desarrolladores hacer correcciones específicas para la plataforma o la aplicación a medida que surgen problemas, las herramientas de código abierto ofrecen a las organizaciones más flexibilidad en entornos nativos de la nube, a veces impredecibles, y una mayor capacidad para conectar sus herramientas con varios sistemas e interfaces de programación de aplicaciones (API).

Boletín del sector

Las últimas novedades sobre tecnología, respaldadas por conocimientos de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes del sector en materia de IA, automatización, datos y mucho más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¿Cómo funciona la observabilidad nativa de la nube?

Las herramientas de observabilidad nativas de la nube recopilan registros, rastros y métricas de todo el ecosistema de la nube. Suelen presentar datos sin procesar, análisis y visualizaciones a través de un panel de control que ayuda a los usuarios a monitorizar el estado de la aplicación y los objetivos empresariales.

Recopilación de datos

En un entorno de nube compuesto en gran parte por microservicios, los nuevos contenedores y máquinas virtuales pueden desaparecer y aparecer en un momento, creando una gran cantidad de datos de telemetría. Esto crea un nuevo problema que las plataformas de observabilidad nativas de la nube deben abordar: ver todo lo que ocurre en una red que cambia constantemente y realizar un seguimiento de los datos de fuentes que podrían dejar de existir a medida que la red se expande y se contrae automáticamente para satisfacer las necesidades empresariales.

Las herramientas de observabilidad facilitan la recopilación y agregación de datos de memoria de CPU, registros de aplicaciones, información de disponibilidad, latencia media y otros puntos de datos dentro de estas complejas redes.

Las plataformas de observabilidad nativas de la nube se basan en los tres pilares de la observabilidad: registros, trazas y métricas.

Registros

Los registros son granulares, tienen marca de tiempo, son completos e inmutables, y contienen información detallada de los eventos de las aplicaciones. Se pueden utilizar para crear un registro de alta fidelidad, milisegundo a milisegundo, de cada evento, completo con el contexto circundante. Los desarrolladores los utilizan para solucionar problemas y depurar errores.

Rastreos

Los registros trazan el "recorrido" completo de cada solicitud de usuario, desde la interfaz de usuario, a través de toda la arquitectura y de vuelta al usuario.

Métricas

Las métricas son medidas fundamentales del estado de las aplicaciones y los sistemas a lo largo del tiempo. Por ejemplo, las métricas se utilizan para medir la cantidad de memoria o de capacidad de CPU que utiliza una aplicación en cinco minutos o la latencia que experimenta una aplicación durante un pico de uso.

Monitorización

La visibilidad es una función esencial de las plataformas de observabilidad nativas de la nube. La capacidad de monitorizar los contenedores, las máquinas virtuales, los servidores y otros elementos de una red basada en microservicios es una característica crítica para estas arquitecturas, en las que el seguimiento distribuido y los mapas de dependencias pueden ser complicados y casi indescifrables.

Los paneles de control de observabilidad permiten a los usuarios monitorizar medidas del estado de las aplicaciones, como la disponibilidad y el uso de recursos, así como objetivos empresariales relevantes, como la tasa de conversión o el número de usuarios activos. Las características de monitorización también ayudan a aclarar cómo funcionan los servicios entre sí (mediante el uso de herramientas como los gráficos de dependencia) y cómo encajan en la arquitectura general.

Análisis

La monitorización tradicional se realizaba con herramientas de gestión del rendimiento de las aplicaciones (APM), que recopilaban los datos de cada fuente para crear informes, paneles de control y visualizaciones fáciles de entender, de forma similar a las características de monitorización del software de observabilidad moderno.

En un entorno moderno de cloud computing, las herramientas de observabilidad suelen descargar la telemetría básica a la capa de Kubernetes, donde el software de orquestación de contenedores utiliza herramientas nativas para lograr la observabilidad dentro de la plataforma. Permitir que Kubernetes automatice esta actividad permite a los equipos de TI centrar el análisis de datos en objetivos de nivel de servicio (SLO) e indicadores de nivel de servicio (SLI).

La automatización en el software de observabilidad moderno va más allá de la recopilación, el seguimiento y el análisis. Las herramientas de observabilidad también pueden automatizar los procesos de depuración, instrumentación y actualización del monitoring dashboard a medida que se añaden nuevos servicios a la red. También pueden gestionar el manejo de agentes, donde los agentes son pequeños componentes de software implementados en todo un ecosistema para recopilar continuamente datos de telemetría.

Beneficios de la observabilidad nativa de la nube

Practicar la observabilidad nativa de la nube puede ofrecer a las organizaciones una visión más completa de los sistemas complejos, reducir el tiempo medio de reparación (MTTR) e integrar aún más las herramientas de automatización en el flujo de trabajo de DevOps.

Transparencia del sistema

En sistemas altamente distribuidos, un gran número de servidores y aplicaciones nativas de la nube que se solapan emiten señales, métricas, registros y rastros, y no siempre comparten datos de forma limpia. Las herramientas de observabilidad nativas de la nube ayudan a superar estos cuellos de botella mediante la recopilación de datos de observabilidad de todo el ecosistema, lo que permite a los administradores solucionar los problemas en tiempo real y tomar decisiones basadas en datos.

Recuperación más rápida

Una vez que los administradores (o las herramientas automatizadas de la plataforma de observabilidad) han detectado correlaciones entre los problemas en la nube, pueden realizar un análisis de la causa raíz. Por ejemplo, una plataforma podría indicar una respuesta lenta de la aplicación a nivel global que coincida con una alta latencia en una región concreta y, a continuación, llevar a cabo un análisis para identificar el servidor con la configuración incorrecta o defectuosa que está causando el problema.

Este análisis puede marcar la diferencia entre pasar horas clasificando un incidente y resolver un problema inminente antes de que ocurra, lo que reduce el tiempo de inactividad y permite que los equipos de DevOps se dediquen a otras tareas.

Mayor automatización

Las herramientas de inteligencia artificial y machine learning están en el corazón de muchas plataformas modernas de observabilidad, detectando anomalías sin intervención del usuario, realizando análisis de causa raíz y utilizando IA generativa para la visualización de datos.

El enorme volumen de datos de telemetría que se genera en un entorno de nube hace que la IA y el ML resulten muy valiosos para la observabilidad basada en la nube. La automatización de la observabilidad a escala puede generar conocimientos que permitan a las organizaciones automatizar también otras funciones comerciales. El análisis predictivo, por ejemplo, puede permitir a una empresa aprovisionar una nueva infraestructura de servidores antes de un tráfico intenso.

Desafíos de la observabilidad nativa de la nube

Debido a que recopila y sintetiza una cantidad tan vasta y diversa de datos, la observabilidad nativa de la nube puede plantear desafíos en cuanto a escalado y complejidad, el uso de múltiples herramientas de observabilidad y protección de datos.

Escalado y complejidad

Las organizaciones deben equilibrar la visibilidad en un entorno de nube complejo con las limitaciones prácticas en torno a los costes de almacenamiento, el rendimiento de las consultas y la conservación de los datos. Sin estrategias de muestreo adecuadas y priorización de datos, el volumen de datos recogidos puede superar a las plataformas de observabilidad.

La naturaleza expansiva y rápidamente cambiante de los microservicios en contenedores también puede significar que la monitorización debe extenderse más allá del nivel de aplicación a los clústeres y los nodos de una herramienta de orquestación como Kubernetes.

Utilización de múltiples herramientas

La mayoría de las organizaciones utilizan docenas de herramientas de monitorización acumuladas a lo largo de los años, cada una de las cuales sirve a equipos o tecnologías específicos. La pila tecnológica suele abarcar varios lenguajes de programación, sistemas heredados, entornos multinube, microservicios, componentes y marcos de infraestructura. Esto dificulta la interoperabilidad y crea datos fragmentados, lo que anula el objetivo fundamental de la observabilidad: crear una visión unificada del estado del sistema.

Privacidad y cumplimiento

La observabilidad nativa de la nube puede crear desafíos de cumplimiento al agrupar datos confidenciales de toda la empresa en plataformas. Los datos de telemetría pueden contener información de identificación personal (PII), detalles de tarjetas de pago o información médica protegida. Este tipo de datos pueden estar sujetos a la autoridad de reglamentos como el Reglamento General de Protección de Datos (GDPR), la Ley de Portabilidad y Responsabilidad del Seguro Médico (HIPAA) y la California Consumer Privacy Act (CCPA).

Sin el enmascaramiento de datos, tokenización, restricciones geográficas y controles de acceso basados en roles, las organizaciones corren el riesgo de exponer datos sensibles a usuarios no autorizados o de incumplir los requisitos regulatorios. Por ejemplo, resolver un problema de transacción de un cliente europeo puede requerir acceder a registros que contengan información de identificación personal. Si los empleados con sede en EE. UU. ven esos datos, esa situación podría abrir la puerta a violaciones del RGPD.

Mixture of Experts | 12 de diciembre, episodio 85

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

Vea todos los episodios de Mixture of Experts

Observabilidad nativa de la nube y AIOps

La implementación de la observabilidad nativa de la nube es un pilar del cambio hacia AIOps, la aplicación de las capacidades de IA para automatizar, agilizar y optimizar la gestión de los servicios de TI y los workflows.

Cuando las organizaciones disponen de una mayor visibilidad de los datos en la nube, pueden automatizar las decisiones sobre el aprovisionamiento o la resolución de problemas, incluso en el entorno a menudo vasto, disperso e impredecible de la nube. En resumen, la observabilidad permite el uso de AIOps, ya que proporciona a las organizaciones una mayor confianza en las decisiones que toman sus herramientas de IA y ML.

Las principales funciones de la IA en la observabilidad nativa de la nube incluyen:

detección de anomalías, donde los algoritmos pueden analizar datos a escala para determinar el rendimiento base del sistema e identificar desviaciones rápidamente;
análisis de la causa raíz, que va más allá de la correlación para identificar las acciones que se pueden tomar para corregir directamente un error;
y análisis predictivo, mediante el cual los modelos de IA pueden predecir futuras cargas de trabajo y escalar o reducir la red en consecuencia.

Observabilidad nativa de la nube frente a observabilidad full stack

Aunque ambas comparten similitudes importantes, la observabilidad nativa en la nube es diferente de la práctica de la observabilidad full stack. La observabilidad nativa de la nube puede considerarse una evolución de la observabilidad full stack, adaptando las mismas herramientas y técnicas para un entorno nativo de la nube.

La observabilidad full stack correlaciona la telemetría en todas las capas de la pila tecnológica. Las plataformas de observabilidad full stack recopilan datos de múltiples sistemas en tiempo real y utilizan IA y ML para detectar anomalías, predecir fallos y generar conocimientos útiles para los administradores.

La observabilidad nativa de la nube es una evolución de este enfoque, en la que las herramientas de recopilación y análisis de datos utilizadas para la observabilidad full stack se desarrollan específicamente para tecnologías nativas de la nube e interactúan de manera fluida con microservicios complejos y contenedorizados.

En resumen, mientras que la observabilidad full stack proporciona datos de telemetría completos en un entorno informático, la observabilidad nativa de la nube se centra específicamente en entornos de nube a menudo sin servidor.

Autores

Derek Robertson

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor