Hay una serie de métricas entre las que puede elegir, pero le recomendamos que se centre en estas ocho métricas para obtener el máximo beneficio dentro de su organización de TI.
1. Puntuaciones de Apdex y SLA
Empecemos por las puntuaciones del índice de rendimiento de las aplicaciones (Apdex) y del acuerdo de nivel de servicio (SLA), ya que son la base de una experiencia del cliente superior. Las velocidades y los avances que medirá son los aspectos específicos que deberían sumarse para un rendimiento rápido, pero son el medio, no el fin. Los clientes satisfechos son su objetivo, lo que con suerte conducirá a un aumento de las ventas.
Las puntuaciones Apdex y SLA son la forma más popular de ver la monitorización de la experiencia del usuario final. La puntuación de Apdex realiza un seguimiento del rendimiento relativo de una aplicación especificando un objetivo para el tiempo que normalmente debería tardar una solicitud o transacción web. Los SLA son las métricas establecidas en el contrato con el cliente, y cualquier incumplimiento de los SLA definidos conlleva el riesgo de una disminución de CX (y, posiblemente, sanciones predefinidas).
2. Disponibilidad de las aplicaciones (también conocida como tiempo de actividad o monitorización del rendimiento web)
Esta es la métrica más básica: ¿Están las luces encendidas? Está monitorizando y midiendo si su aplicación está en línea y disponible. La mayoría de las empresas utilizan esto para medir el cumplimiento del acuerdo de nivel de servicio (SLA). El tiempo de actividad suele ser una abreviatura para evaluar la fiabilidad y el estado general del sistema. Un tiempo de inactividad excesivo puede afectar negativamente a la satisfacción de los usuarios de las organizaciones que prestan servicios en línea. Para una aplicación, puede verificar la disponibilidad con una comprobación HTTP simple y programada regularmente.
3. Uso de CPU (también conocido como uso de recursos)
Un alto porcentaje de capacidad de CPU utilizada por una aplicación puede ser un signo de un problema de rendimiento. Un aumento repentino en el uso de la CPU puede provocar tiempos de respuesta más lentos. Las fluctuaciones en la demanda de una aplicación también pueden ser una indicación de que necesita agregar más instancias de aplicación. Una regla general es que si el uso de la CPU supera el 70 % más del 30 % del tiempo, es posible que se esté quedando sin capacidad de CPU.
El uso de recursos también puede incluir el uso de memoria y disco. El seguimiento de la RAM ayuda a identificar fugas de memoria que podrían provocar fallos o la necesidad de más memoria. Las métricas de uso del disco pueden ayudar a evitar que una aplicación se quede sin almacenamiento persistente, lo que podría provocar que falle. Un alto uso del disco también podría ser un signo de almacenamiento de datos backend ineficiente o políticas de retención de datos defectuosas.
4. Tasas de error
Su software de métricas de APM debe monitorizar las aplicaciones para registrar el porcentaje de solicitudes que dan lugar a fallos. Esto ayuda a identificar y priorizar la resolución de problemas que afectan a la experiencia del usuario. Los errores de aplicación pueden incluir errores del servidor, una respuesta 404 o tiempo de espera en una aplicación web. Puede configurar su solución APM para enviar notificaciones cuando una tasa de error supere un parámetro establecido. Por ejemplo, envíe una alerta cuando el 2,5 % de las 25 solicitudes anteriores hayan dado lugar a un error.
5. Recogida de basura
La recogida de basura (GC) puede mejorar el rendimiento identificando y eliminando el uso intensivo de memoria de Java u otros lenguajes. La buena noticia es que la automatización de GC recupera la memoria dedicada a objetos o datos no utilizados o redundantes que una aplicación ya no utiliza. Los objetos o datos no utilizados se eliminan y los objetos activos se copian en un grupo de memoria de última generación. Esta es una métrica que desea mantener en el medio feliz. Si GC se ejecuta con demasiada frecuencia, podría requerir demasiada sobrecarga; pero si GC no se ejecuta con la frecuencia suficiente, su sistema podría quedarse con muy poca memoria.
6. Número de instancias
El seguimiento de instancias le permite escalar su aplicación para satisfacer la demanda real de los usuarios, en función de cuántas instancias de aplicación o servidor se estén ejecutando en cualquier momento. Esto puede ser especialmente importante para las aplicaciones en la nube. El autoescalado puede ayudarle a garantizar que las aplicaciones se escalen para satisfacer la demanda y ahorrar presupuesto durante las horas de menor actividad. Esto también puede crear desafíos de monitorización de infraestructura. Por ejemplo, si su aplicación aumenta automáticamente el uso de la CPU, es posible que nunca vea aumentar su uso de la CPU; en cambio, podría ver que el número de instancias del servidor aumenta demasiado, junto con su factura de alojamiento.
7. Tasas de solicitud
Puede medir el tráfico recibido por una aplicación para identificar cualquier disminución significativa, aumento o usuarios coincidentes. Correlacionar las tasas de solicitud con otras métricas de rendimiento de las aplicaciones le ayudará a comprender la escalabilidad de sus aplicaciones de software. El software APM también puede monitorizar el tráfico para identificar anomalías. La monitorización de usuarios que muestra un aumento inesperado de las solicitudes podría ser un ataque de denegación de servicio (DoS). Un gran número de solicitudes del mismo usuario podría ser un indicio de una cuenta pirateada. Incluso las solicitudes inusualmente bajas podrían ser malas: la inactividad o la falta de tráfico podrían significar un fallo en casi cualquier parte de su sistema.
8. Tiempos de respuesta (también conocidos como duración)
Al realizar un seguimiento del tiempo medio de respuesta a una solicitud, es decir, el tiempo que tarda una aplicación en devolver una solicitud de recursos, puede evaluar el rendimiento de la aplicación. Estas solicitudes pueden incluir transacciones iniciadas por los usuarios finales, como una solicitud para cargar una página web, o pueden incluir solicitudes internas de una parte de su aplicación a otra, como un proceso o microservicio que solicita datos del disco o la memoria. El tiempo de respuesta total incluye el tiempo de respuesta del servidor (el tiempo que tarda su servidor en procesar una solicitud) más la latencia de la red (el tiempo total que tarda la solicitud en moverse por la red).
Una métrica relacionada es el tiempo de carga de la página, que mide el tiempo que tarda una página web en cargarse en un navegador. El seguimiento de los tiempos de carga de las páginas permite a las herramientas de monitorización del rendimiento de la aplicación identificar los problemas que provocan la lentitud de la carga de las páginas y, a continuación, mejorar la experiencia digital. Las cargas lentas de la página pueden significar el abandono de la página y la pérdida de negocios. Las soluciones APM se pueden establecer para una línea de base de rendimiento para esta métrica y luego alertarle cuando no se cumpla ese punto de referencia.