Hay una serie de métricas entre las que puede elegir, pero le recomendamos que se centre en estas ocho métricas para obtener los mayores beneficios dentro de su organización de TI.
1. Puntuaciones de Apdex y SLA
Comencemos con el índice de rendimiento de las aplicaciones (Apdex) y las puntuaciones del acuerdo de nivel de servicio (SLA), ya que son la base de una experiencia del cliente superior. Las velocidades y los feeds que medirá son los aspectos específicos que deberían sumarse para un rendimiento rápido, pero son el medio, no el fin. Los clientes satisfechos son su objetivo, lo que con suerte conducirá a un aumento de las ventas.
Las puntuaciones de Apdex y SLA son la forma más popular de ver el monitoreo de la experiencia del usuario final. La puntuación de Apdex realiza un seguimiento del rendimiento relativo de una aplicación especificando un objetivo para el tiempo que normalmente debería tardar una solicitud o transacción web. Los SLA son las métricas en su contrato de cliente y cualquier valor inferior al SLA definido corre el riesgo de una caída en la CX (y posiblemente penalizaciones predefinidas).
2. Disponibilidad de la aplicación (también conocida como tiempo de actividad o monitoreo del rendimiento web)
Esta es la métrica más básica: ¿están las luces encendidas? Está monitoreando y midiendo si su aplicación está en línea y disponible. La mayoría de las empresas utilizan esto para medir el cumplimiento del acuerdo de nivel de servicio (SLA). El tiempo de actividad es a menudo una abreviatura para evaluar la confiabilidad y el estado general del sistema. El tiempo de inactividad excesivo puede afectar negativamente la satisfacción del usuario para las organizaciones que prestan servicios en línea. Para una aplicación, puede verificar la disponibilidad con una verificación HTTP simple y programada regularmente.
3. Uso de CPU (también conocido como uso de recursos)
Un alto porcentaje de capacidad de CPU utilizada por una aplicación puede ser un signo de un problema de rendimiento. Un aumento repentino en el uso de la CPU puede dar lugar a tiempos de respuesta más lentos. Las fluctuaciones en la demanda de una aplicación también pueden ser una indicación de que necesita agregar más instancias de aplicación. Una regla general es que si el uso de la CPU supera el 70 % más del 30 % del tiempo, es posible que se esté quedando sin capacidad de CPU.
El uso de recursos también puede incluir el uso de memoria y disco. El seguimiento de la RAM ayuda a identificar fugas de memoria que podrían provocar fallas o la necesidad de más memoria. Las métricas de uso del disco pueden ayudar a evitar que una aplicación se quede sin almacenamiento persistente, lo que podría provocar que falle. El alto uso del disco también podría ser un signo de almacenamiento de datos de backend ineficiente o políticas de retención de datos defectuosas.
4. Tasas de error
Su software de métricas de APM debe monitorear las aplicaciones para registrar el porcentaje de solicitudes que resultan en fallas. Esto ayuda a identificar y priorizar la resolución de problemas que afectan la experiencia del usuario. Los errores de la aplicación pueden incluir errores del servidor, una respuesta 404 o tiempo de espera en una aplicación web. Puede configurar su solución APM para enviar notificaciones cuando una tasa de error supere un parámetro establecido. Por ejemplo, envíe una alerta cuando el 2.5 % de las 25 solicitudes anteriores hayan resultado en un error.
5. Recolección de basura
La recolección de basura (GC) puede mejorar el rendimiento al identificar y eliminar el uso intensivo continuo de memoria de Java u otros lenguajes. La buena noticia es que la automatización de GC recupera la memoria dedicada a objetos o datos no utilizados o redundantes que una aplicación ya no utiliza. Los objetos o datos no utilizados se eliminan y los objetos activos se copian en un grupo de memoria de última generación. Esta es una métrica que desea mantener en el medio feliz. Si la GC se ejecuta con demasiada frecuencia, podría requerir demasiada sobrecarga; pero si la GC no se ejecuta con la frecuencia suficiente, su sistema podría quedarse con muy poca memoria.
6. Número de instancias
El seguimiento de instancias le permite escalar su aplicación a escala para satisfacer la demanda real de los usuarios, en función de cuántas instancias de aplicación o servidor se estén ejecutando en cualquier momento. Esto puede ser especialmente importante para las aplicaciones en la nube. El escalado automático puede ayudarle a garantizar que las aplicaciones modernas se escalen para satisfacer la demanda y ahorrar presupuesto durante las horas de menor actividad. Esto también puede crear desafíos de monitoreo de infraestructura. Por ejemplo, si su aplicación se amplía automáticamente con el uso de CPU, es posible que nunca vea aumentar su uso de CPU; en cambio, podría ver que la cantidad de instancias de servidor aumenta demasiado, junto con su factura de hosting.
7. Tasas de solicitudes
Puede medir el tráfico recibido por una aplicación para identificar disminuciones significativas, aumentos o usuarios coincidentes. La correlación de las tasas de solicitudes con otras métricas de rendimiento de las aplicaciones le ayudará a comprender la escalabilidad de sus aplicaciones de software. El software APM también puede monitorear el tráfico para identificar anomalías. El monitoreo de usuarios que muestra un aumento inesperado en las solicitudes podría ser un ataque de denegación del servicio (DoS). Una gran cantidad de solicitudes del mismo usuario podría ser una indicación de una cuenta pirateada. Incluso las solicitudes inusualmente bajas podrían ser malas: la inactividad o la falta de tráfico podrían significar una falla en casi cualquier parte de su sistema.
8. Tiempos de respuesta (también conocidos como duración)
Al realizar un seguimiento del tiempo promedio de respuesta a una solicitud, es decir, cuánto tiempo tarda una aplicación en devolver una solicitud de recursos, puede evaluar el rendimiento de la aplicación. Estas solicitudes pueden incluir transacciones iniciadas por los usuarios finales, como una solicitud para cargar una página web, o pueden incluir solicitudes internas de una parte de su aplicación a otra, como un proceso o un microservicio que solicita datos del disco o la memoria. El tiempo de respuesta total incluye el tiempo de respuesta del servidor (el tiempo que tarda su servidor en procesar una solicitud) más la latencia de la red (el tiempo total que tarda la solicitud en moverse por la red).
Una métrica relacionada es el tiempo de carga de la página, que mide el tiempo que tarda una página web en cargarse en un navegador. El seguimiento de los tiempos de carga de las páginas permite que las herramientas de monitoreo del rendimiento de su aplicación identifiquen los problemas que causan la carga lenta de las páginas y luego mejoren la experiencia digital. Las cargas lentas de la página pueden significar el abandono de la página y la pérdida de negocios. Las soluciones de APM se pueden establecer para una referencia de rendimiento para esta métrica y luego alertarlo cuando no se cumpla ese punto de referencia.