Observabilidad de Kubernetes

Los contenedores y entornos de Kubernetes (K8s) son el enfoque líder para empaquetar, implementar y administrar aplicaciones en contenedores a escala. La configuración dinámica de código abierto y basada en microservicios de Kubernetes puede ser una gran opción para las empresas que buscan maximizar la agilidad de la infraestructura. Sin embargo, la flexibilidad distribuida que hace que Kubernetes sea atractivo también puede hacer que la implementación de prácticas de monitorización y observabilidad de Kubernetes sea un desafío.

La observabilidad comprende una variedad de procesos y métricas que ayudan a los equipos a obtener información procesable sobre el estado interno de un sistema mediante el examen de los resultados del sistema. Es una parte esencial del mantenimiento de cualquier infraestructura de TI. Sin embargo, la gestión del gran volumen de datos, nodos, pods, servicios y endpoints que componen los entornos de Kubernetes requiere prácticas de observabilidad adecuadas para el trabajo.

En este blog, analizamos cómo funciona la observabilidad de Kubernetes y cómo las organizaciones pueden usarla para optimizar las arquitecturas de TI nativas de la nube.

¿Cómo funciona la observabilidad?

En términos generales, la observabilidad describe en qué medida se pueden inferir los estados internos del sistema a partir de salidas externas. Es la capacidad de diagnosticar y comprender por qué un sistema se comporta de una manera particular, lo cual es vital para solucionar problemas, descifrar problemas de rendimiento y mejorar el diseño del sistema.

En DevOps, el concepto de observabilidad ha evolucionado para referirse a la visibilidad integral de un estado del sistema según lo dictado por los datos de telemetría. Las principales clases de datos utilizadas, conocidas como los tres pilares de la observabilidad, son registros, métricas y seguimientos.

Registros

Los registros incluyen eventos discretos registrados cada vez que ocurre algo en el sistema, como mensajes de estado o de error, o detalles de transacciones. Los registros de Kubernetes pueden escribirse tanto en texto estructurado como no estructurado.

Métricas

Uso de CPU, consumo de memoria, E/S de red, latencia de solicitudes o cualquier indicador específico de la empresa. Las métricas de Kubernetes a menudo se agregan para crear datos de observabilidad de series temporales que pueden ayudar a los equipos a detectar tendencias e identificar patrones.

Rastreos

Los rastreos ayudan a los equipos a seguir una solicitud o transacción a través de los diversos servicios y componentes de un sistema distribuido. También ayudan a los equipos a visualizar las dependencias entre los diferentes componentes de una infraestructura para que los retrasos y los errores se puedan localizar rápidamente.

Lograr una observabilidad exitosa requiere la implementación de herramientas de monitorización de Kubernetes adecuadas y la implementación de procesos efectivos para recopilar, almacenar y analizar los tres resultados principales. Esto puede incluir configurar y mantener sistemas de supervisión, agregadores de registro de aplicaciones, herramientas de gestión del rendimiento de las aplicaciones (APM) u otras plataformas de observabilidad.

Sin embargo, los entornos de Kubernetes también requieren un examen más exhaustivo de las métricas estándar. Los sistemas de Kubernetes incluyen un amplio entorno de contenedores interconectados, microservicios y otros componentes, que generan grandes cantidades de datos. Kubernetes programa y automatiza las tareas relacionadas con los contenedores a lo largo del ciclo de vida de la aplicación, que incluyen:

Implementación

Kubernetes puede implementar un número específico de contenedores en un host específico y mantenerlos ejecutándose en el estado deseado.

Despliegues

Un despliegue es una modificación de la implementación de Kubernetes. Kubernetes permite a los equipos iniciar, pausar, reanudar y revertir implementaciones.

Descubrimiento de servicios

Kubernetes puede exponer automáticamente un contenedor a internet o a otros contenedores utilizando un nombre DNS o una dirección IP.

Escalado automático

Cuando aumenta el tráfico, Kubernetes puede crear automáticamente nuevos clústeres para manejar la carga de trabajo adicional.

Almacenamiento suministrado

Los equipos pueden configurar Kubernetes para montar almacenamiento local o en la nube persistente para contenedores.

Equilibrio de carga

Basadas en el uso de la CPU o en métricas personalizadas, las entidades de equilibrio de carga de Kubernetes pueden distribuir cargas de trabajo en toda la red para mantener el rendimiento y la estabilidad.

Autorreparación para una alta disponibilidad.

Kubernetes puede depurar, reiniciar o sustituir automáticamente un contenedor con error para evitar tiempo de inactividad. También puede desmantelar contenedores que no cumplan con los requisitos de comprobación de estado.

Con tantos componentes cambiantes, interactivos y estratificados, vienen muchos posibles problemas y puntos de fallo, por lo que hay muchas áreas en las que la monitorización en tiempo real se convierte en una necesidad. También significa que un enfoque convencional para monitorear registros, métricas y rastreos podría resultar insuficiente para la observabilidad en un entorno de Kubernetes.

Principios de observabilidad de Kubernetes

Debido a que cada componente de una arquitectura de Kubernetes es interdependiente de otros componentes, la observabilidad requiere un enfoque más holístico.

La observabilidad de Kubernetes requiere que las organizaciones vayan más allá de la recopilación y el análisis de datos a nivel de clúster de registros, seguimientos y métricas; conectar puntos de datos para comprender mejor las relaciones y los eventos dentro de los clústeres de Kubernetes es fundamental para el proceso. Esto significa que las organizaciones deben confiar en una estrategia de observabilidad personalizada y nativa de la nube y examinar todas las fuentes de datos disponibles dentro del sistema.

La observabilidad en un entorno de K8s implica:

1. Ir más allá de las métricas, los registros y las aplicaciones. De forma muy similar a la supervisión de máquinas virtuales (VM), la observabilidad de Kubernetes debe tener en cuenta todos los datos de registro (de contenedores, nodos maestros y de trabajo, y de la infraestructura subyacente) y las métricas a nivel de aplicación. Sin embargo, a diferencia de las máquinas virtuales, Kubernetes organiza las interacciones de contenedores que trascienden aplicaciones y clústeres. Como tales, los entornos Kubernetes albergan enormes cantidades de datos valiosos tanto fuera como dentro de los clústeres de red y las aplicaciones. Esto incluye los datos en canalizaciones de CI/CD (que se alimentan en clústeres de K8s) y los flujos de trabajo de GitOps (que alimentan clústeres de K8s).

Kubernetes tampoco expone métricas, registros y datos de seguimiento de la misma manera que lo hacen las aplicaciones y máquinas virtuales tradicionales. Kubernetes tiende a capturar "instantáneas" de datos o información capturada en un punto específico del ciclo de vida. En un sistema en el que cada componente de cada clúster registra diferentes tipos de datos en diferentes formatos a diferentes velocidades, puede ser difícil, o imposible, establecer la observabilidad simplemente analizando puntos de datos discretos.

Además, Kubernetes no crea archivos de registro maestros ni a nivel de aplicación ni de clúster. Cada aplicación y clúster registra datos en su entorno respectivo, por lo que los usuarios deben agregar y exportar datos manualmente para verlos todos en un solo lugar. Y dado que los contenedores pueden girar, girar hacia abajo o desaparecer por completo en cuestión de segundos, incluso los datos agregados manualmente pueden ofrecer una imagen incompleta sin el contexto adecuado.

2. Priorizar el contexto y la correlación de datos. Tanto la supervisión como la observabilidad son partes clave para mantener una infraestructura de Kubernetes eficiente. Lo que los diferencia es una cuestión de objetivo. Mientras que la monitorización ayuda a aclarar lo que está sucediendo en un sistema, la observabilidad tiene como objetivo aclarar por qué el sistema se comporta de la manera en que lo hace. Con ese fin, la observabilidad efectiva de Kubernetes prioriza conectar los puntos entre los puntos de datos para llegar a la causa raíz de los cuellos de botella de rendimiento y los problemas de funcionalidad.

Para comprender el comportamiento del clúster de Kubernetes, debe comprender cada evento individual de un clúster en el contexto de todos los demás eventos del clúster, el comportamiento general del clúster y cualquier evento que haya provocado el evento en cuestión.

Por ejemplo, si un pod comienza en un nodo de trabajo y termina en otro, debe comprender todos los eventos que ocurren simultáneamente en los otros nodos de Kubernetes y todos los eventos que ocurren en sus otros servicios de Kubernetes, servidores de API y espacios de nombres para obtener una comprensión clara del cambio, su causa raíz, y sus posibles consecuencias.

En otras palabras, la mera supervisión de las tareas suele ser inadecuada en un entorno de Kubernetes. Para lograr la observabilidad de Kubernetes, obtener información relevante sobre el sistema o realizar análisis de causa raíz precisos, los equipos de TI deben poder agregar datos de toda la red y contextualizarlos.

3. Uso de herramientas de observabilidad de Kubernetes. Implementar y mantener la observabilidad de Kubernetes es una tarea grande y compleja. Sin embargo, el uso de los marcos y herramientas adecuados puede simplificar el proceso y mejorar la visualización y la transparencia generales de los datos.

Las empresas pueden elegir entre una gama de soluciones de observabilidad, incluidos programas que automatizan la agregación y el análisis de métricas (como Prometheus y Grafana), programas que automatizan el registro (como ELK, Fluentd y Elasticsearch) y programas que facilitan la visibilidad del rastreo (como Jaeger). Las soluciones integradas, como OpenTelemetry, pueden gestionar las tres principales prácticas de observabilidad. Y las soluciones personalizadas y nativas de la nube, como Google Cloud Operations, AWS X-Ray, Azure Monitor e IBM Instana Observability, ofrecen herramientas de observabilidad y paneles de Kubernetes optimizados para los clústeres que se ejecutan en su infraestructura.

Buenas prácticas para optimizar la observabilidad de Kubernetes

- Defina sus KPI. Averigüe qué indicadores clave de rendimiento, como el rendimiento de las aplicaciones, el estado del sistema y el uso de los recursos, le ofrecen la información más útil sobre el comportamiento de su infraestructura. Revíselas según sea necesario.
• Centralice el registro. Los entornos K8s generan cantidades ingentes de datos. Agruparlos y almacenarlos mediante una solución de registro centralizada forma parte integral de la gestión de datos.
• Supervise el uso de los recursos. Recopile datos en tiempo real sobre el uso de la memoria, la CPU y la red para poder escalar los recursos de forma proactiva cuando sea necesario.
• Establezca alertas y alarmas. Utilice los umbrales de KPI establecidos para configurar alertas y alarmas. Esta práctica permite a los equipos recibir notificaciones oportunas cuando surgen problemas.

Establezca la observabilidad de Kubernetes con IBM Instana Observability

Kubernetes es la plataforma de organización de contenedores estándar del sector, que gestiona las cargas de trabajo en contenedores con una eficiencia notable. Sin embargo, la arquitectura de microservicios distribuidos y multicapa de Kubernetes exige mecanismos de observabilidad robustos y soluciones avanzadas, como IBM Instana Observability.

IBM Instana Observability proporciona observabilidad automatizada de Kubernetes y capacidades de APM diseñadas para supervisar toda su pila de aplicaciones de Kubernetes (desde los nodos y los pods hasta los contenedores y las aplicaciones) para todas las distribuciones de Kubernetes.

La observabilidad en Kubernetes no es solo una implementación técnica; es un enfoque estratégico que requiere una planificación atenta y una cultura organizacional que valore la transparencia de los datos.

Instana Observability ayuda a los equipos a obtener un conocimiento exhaustivo de sus entornos Kubernetes y a ofrecer aplicaciones robustas y de alto rendimiento en un mundo cada vez más basado en la nube.

Autor

Chrystal R. China

Staff Writer, Automation & ITOps

IBM Think

Cómo lograr la observabilidad de Kubernetes: principios y buenas prácticas