Las ocho principales métricas de APM que los equipos de TI utilizan para monitorizar sus aplicaciones

Autor

Jim Holdsworth

Staff Writer

IBM Think

Una experiencia del cliente (CX) superior se basa en métricas precisas y oportunas de monitorización de rendimiento de aplicación (APM). No puede afinar sus aplicaciones o su sistema para mejorar la CX hasta que sepa cuál es el problema o dónde están las oportunidades.

Las soluciones de APM suelen proporcionar un panel de control centralizado para agregar métricas de rendimiento en tiempo real y conocimiento para ser analizados y comparados. También establecen puntos de referencia para alertar a los administradores del sistema sobre desviaciones que indican problemas de rendimiento reales o potenciales. Los equipos de TI, DevOps y ingenieros de fiabilidad del sitio pueden identificar y dirigirse a los problemas de la aplicación.

La monitorización del rendimiento de las aplicaciones es la fase inicial de la gestión del rendimiento de las aplicaciones. La monitorización realiza un seguimiento del rendimiento de la aplicación y permite la gestión de la aplicación. Una solución APM ofrece a los administradores las herramientas de instrumentación necesarias para recopilar datos rápidamente y realizar análisis de causa raíz; luego aíslan, solucionan y resuelven ese problema.

Las últimas novedades sobre tecnología, respaldadas por conocimientos de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes del sector en materia de IA, automatización, datos y mucho más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Está suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Métricas clave de APM para monitorizar

Hay una serie de métricas entre las que puede elegir, pero le recomendamos que se centre en estas ocho métricas para obtener el máximo beneficio dentro de su organización de TI.

1. Puntuaciones de Apdex y SLA

Empecemos por las puntuaciones del índice de rendimiento de las aplicaciones (Apdex) y del acuerdo de nivel de servicio (SLA), ya que son la base de una experiencia del cliente superior. Las velocidades y los avances que medirá son los aspectos específicos que deberían sumarse para un rendimiento rápido, pero son el medio, no el fin. Los clientes satisfechos son su objetivo, lo que con suerte conducirá a un aumento de las ventas.

Las puntuaciones Apdex y SLA son la forma más popular de ver la monitorización de la experiencia del usuario final. La puntuación de Apdex realiza un seguimiento del rendimiento relativo de una aplicación especificando un objetivo para el tiempo que normalmente debería tardar una solicitud o transacción web. Los SLA son las métricas establecidas en el contrato con el cliente, y cualquier incumplimiento de los SLA definidos conlleva el riesgo de una disminución de CX (y, posiblemente, sanciones predefinidas).

2. Disponibilidad de las aplicaciones (también conocida como tiempo de actividad o monitorización del rendimiento web)

Esta es la métrica más básica: ¿Están las luces encendidas? Está monitorizando y midiendo si su aplicación está en línea y disponible. La mayoría de las empresas utilizan esto para medir el cumplimiento del acuerdo de nivel de servicio (SLA). El tiempo de actividad suele ser una abreviatura para evaluar la fiabilidad y el estado general del sistema. Un tiempo de inactividad excesivo puede afectar negativamente a la satisfacción de los usuarios de las organizaciones que prestan servicios en línea. Para una aplicación, puede verificar la disponibilidad con una comprobación HTTP simple y programada regularmente.

3. Uso de CPU (también conocido como uso de recursos)

Un alto porcentaje de capacidad de CPU utilizada por una aplicación puede ser un signo de un problema de rendimiento. Un aumento repentino en el uso de la CPU puede provocar tiempos de respuesta más lentos. Las fluctuaciones en la demanda de una aplicación también pueden ser una indicación de que necesita agregar más instancias de aplicación. Una regla general es que si el uso de la CPU supera el 70 % más del 30 % del tiempo, es posible que se esté quedando sin capacidad de CPU.

El uso de recursos también puede incluir el uso de memoria y disco. El seguimiento de la RAM ayuda a identificar fugas de memoria que podrían provocar fallos o la necesidad de más memoria. Las métricas de uso del disco pueden ayudar a evitar que una aplicación se quede sin almacenamiento persistente, lo que podría provocar que falle. Un alto uso del disco también podría ser un signo de almacenamiento de datos backend ineficiente o políticas de retención de datos defectuosas.

4. Tasas de error

Su software de métricas de APM debe monitorizar las aplicaciones para registrar el porcentaje de solicitudes que dan lugar a fallos. Esto ayuda a identificar y priorizar la resolución de problemas que afectan a la experiencia del usuario. Los errores de aplicación pueden incluir errores del servidor, una respuesta 404 o tiempo de espera en una aplicación web. Puede configurar su solución APM para enviar notificaciones cuando una tasa de error supere un parámetro establecido. Por ejemplo, envíe una alerta cuando el 2,5 % de las 25 solicitudes anteriores hayan dado lugar a un error.

5. Recogida de basura

La recogida de basura (GC) puede mejorar el rendimiento identificando y eliminando el uso intensivo de memoria de Java u otros lenguajes. La buena noticia es que la automatización de GC recupera la memoria dedicada a objetos o datos no utilizados o redundantes que una aplicación ya no utiliza. Los objetos o datos no utilizados se eliminan y los objetos activos se copian en un grupo de memoria de última generación. Esta es una métrica que desea mantener en el medio feliz. Si GC se ejecuta con demasiada frecuencia, podría requerir demasiada sobrecarga; pero si GC no se ejecuta con la frecuencia suficiente, su sistema podría quedarse con muy poca memoria.

6. Número de instancias

El seguimiento de instancias le permite escalar su aplicación para satisfacer la demanda real de los usuarios, en función de cuántas instancias de aplicación o servidor se estén ejecutando en cualquier momento. Esto puede ser especialmente importante para las aplicaciones en la nube. El autoescalado puede ayudarle a garantizar que las aplicaciones se escalen para satisfacer la demanda y ahorrar presupuesto durante las horas de menor actividad. Esto también puede crear desafíos de monitorización de infraestructura. Por ejemplo, si su aplicación aumenta automáticamente el uso de la CPU, es posible que nunca vea aumentar su uso de la CPU; en cambio, podría ver que el número de instancias del servidor aumenta demasiado, junto con su factura de alojamiento.

7. Tasas de solicitud

Puede medir el tráfico recibido por una aplicación para identificar cualquier disminución significativa, aumento o usuarios coincidentes. Correlacionar las tasas de solicitud con otras métricas de rendimiento de las aplicaciones le ayudará a comprender la escalabilidad de sus aplicaciones de software. El software APM también puede monitorizar el tráfico para identificar anomalías. La monitorización de usuarios que muestra un aumento inesperado de las solicitudes podría ser un ataque de denegación de servicio (DoS). Un gran número de solicitudes del mismo usuario podría ser un indicio de una cuenta pirateada. Incluso las solicitudes inusualmente bajas podrían ser malas: la inactividad o la falta de tráfico podrían significar un fallo en casi cualquier parte de su sistema.

8. Tiempos de respuesta (también conocidos como duración)

Al realizar un seguimiento del tiempo medio de respuesta a una solicitud, es decir, el tiempo que tarda una aplicación en devolver una solicitud de recursos, puede evaluar el rendimiento de la aplicación. Estas solicitudes pueden incluir transacciones iniciadas por los usuarios finales, como una solicitud para cargar una página web, o pueden incluir solicitudes internas de una parte de su aplicación a otra, como un proceso o microservicio que solicita datos del disco o la memoria. El tiempo de respuesta total incluye el tiempo de respuesta del servidor (el tiempo que tarda su servidor en procesar una solicitud) más la latencia de la red (el tiempo total que tarda la solicitud en moverse por la red).

Una métrica relacionada es el tiempo de carga de la página, que mide el tiempo que tarda una página web en cargarse en un navegador. El seguimiento de los tiempos de carga de las páginas permite a las herramientas de monitorización del rendimiento de la aplicación identificar los problemas que provocan la lentitud de la carga de las páginas y, a continuación, mejorar la experiencia digital. Las cargas lentas de la página pueden significar el abandono de la página y la pérdida de negocios. Las soluciones APM se pueden establecer para una línea de base de rendimiento para esta métrica y luego alertarle cuando no se cumpla ese punto de referencia.

Mixture of Experts | 28 de agosto, episodio 70

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

Métricas de aplicación adicionales

Para aquellos que buscan un conjunto más completo de métricas relacionadas con la supervisión del rendimiento de las aplicaciones, es posible que desee considerar las siguientes métricas:

  • Consultas de base de datos: mide el número de consultas solicitadas a una base de datos por una aplicación. Sus herramientas de APM pueden ayudar a identificar consultas lentas o ineficientes que pueden estar ralentizando el rendimiento general de su aplicación.
  • E/S (entrada/salida): E/S muestra la velocidad a la que las aplicaciones leen o escriben datos. Puede realizar un seguimiento del rendimiento de los medios de almacenamiento persistentes (como HDD o SSD) y de las velocidades de E/S de la memoria o los discos virtuales.
  • Uso de la red: el uso de la red representa el ancho de banda total de la red utilizado por una aplicación. El aumento del uso de la red puede indicar problemas de rendimiento que ralentizan el tiempo de respuesta de la aplicación o crean cuellos de botella.
  • Disponibilidad de nodos: una medida similar al número de instancias es la disponibilidad de nodos, pero es específica de la nube. Cuando implementa aplicaciones en un clúster de Kubernetes, el número de nodos disponibles y que responden (del total de nodos en un clúster) puede ayudar a identificar problemas dentro de su infraestructura. Las métricas de gasto en la nube también pueden ser importantes, ya que le brindan visibilidad en tiempo real de los costes de la nube mediante el seguimiento de las llamadas a la API, el tiempo de ejecución de las máquinas virtuales (VM) basadas en la nube y las tasas totales de salida de datos.
  • Rendimiento: el rendimiento es el volumen de datos que se puede transferir entre una aplicación y los usuarios u otros sistemas. Se puede utilizar para determinar si una aplicación es capaz de manejar el volumen de tráfico esperado.
  • Seguimiento de transacciones: esto le da una imagen de las transacciones individuales realizadas por una aplicación. Los datos capturados pueden incluir llamadas a bases de datos, llamadas externas y llamadas a funciones, monitorizando la solicitud de transacción de principio a fin.
  • Volumen de transacciones: el volumen de transacciones mide el número de transacciones procesadas por una aplicación. Esto permite que las herramientas de APM identifiquen problemas de escalabilidad y planificación de la capacidad.

Primeros pasos para elegir su solución APM

IBM® Instana Observability proporciona observabilidad en tiempo real que todos, y cualquiera, puede utilizar. Ofrece un tiempo de obtención de valor rápido, a la vez que garantiza que su estrategia de observabilidad pueda seguir el ritmo de la complejidad dinámica y futura. Desde dispositivos móviles hasta ordenadores centrales, Instana es compatible con más de 250 tecnologías y sigue creciendo.

 
Soluciones relacionadas
IBM Turbonomic

Escale automáticamente su infraestructura de TI actual para obtener un mayor rendimiento a un coste menor.

Explore IBM Turbonomic
Soluciones AIOps

Descubra cómo la IA para operaciones de TI ofrece los conocimientos que necesita para impulsar un rendimiento empresarial excepcional.

Explore las soluciones AIOps
Servicios de consultoría en automatización

Vaya más allá de la simple automatización de tareas para gestionar procesos de alto perfil, orientados al cliente y generadores de ingresos con adopción y escala integradas.

Explore los servicios de consultoría para la automatización
Dé el siguiente paso

Descubra cómo la IA para operaciones de TI ofrece conocimientos para impulsar un rendimiento empresarial excepcional.

Explore Turbonomic Explore las soluciones AIOps