Las 8 métricas principales de APM que los equipos de TI emplean para monitorear sus aplicaciones

Autor

Jim Holdsworth

Staff Writer

IBM Think

Una experiencia del cliente (CX) superior se basa en métricas precisas y oportunas de monitoreo del rendimiento de la aplicación (APM). No puede ajustar sus aplicaciones o sistema para mejorar la CX hasta que sepa cuál es el problema o dónde están las oportunidades.

Las soluciones de APM suelen proporcionar un panel centralizado para agregar métricas e insights de rendimiento en tiempo real para analizarlos y compararlos. También establecen líneas de base para alertar a los administradores del sistema sobre desviaciones que indican problemas de rendimiento reales o potenciales. Los equipos de TI, DevOps e ingenieros de confiabilidad del sitio pueden identificar y abordar rápidamente los problemas de la aplicación.

El monitoreo del rendimiento de las aplicaciones es la fase inicial de la gestión del rendimiento de las aplicaciones. El monitoreo rastrea el rendimiento de la aplicación y permite la gestión de esa aplicación. Una solución APM brinda a los administradores las herramientas de instrumentación necesarias para recopilar datos rápidamente y realizar análisis de causa principal; luego aíslan, solucionan y resuelven ese problema.

Las últimas noticias tecnológicas, respaldadas por los insights de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Métricas clave de APM para monitorear

Hay una serie de métricas entre las que puede elegir, pero le recomendamos que se centre en estas ocho métricas para obtener los mayores beneficios dentro de su organización de TI.

1. Puntuaciones de Apdex y SLA

Comencemos con el índice de rendimiento de las aplicaciones (Apdex) y las puntuaciones del acuerdo de nivel de servicio (SLA), ya que son la base de una experiencia del cliente superior. Las velocidades y los feeds que medirá son los aspectos específicos que deberían sumarse para un rendimiento rápido, pero son el medio, no el fin. Los clientes satisfechos son su objetivo, lo que con suerte conducirá a un aumento de las ventas.

Las puntuaciones de Apdex y SLA son la forma más popular de ver el monitoreo de la experiencia del usuario final. La puntuación de Apdex realiza un seguimiento del rendimiento relativo de una aplicación especificando un objetivo para el tiempo que normalmente debería tardar una solicitud o transacción web. Los SLA son las métricas en su contrato de cliente y cualquier valor inferior al SLA definido corre el riesgo de una caída en la CX (y posiblemente penalizaciones predefinidas).

2. Disponibilidad de la aplicación (también conocida como tiempo de actividad o monitoreo del rendimiento web)

Esta es la métrica más básica: ¿están las luces encendidas? Está monitoreando y midiendo si su aplicación está en línea y disponible. La mayoría de las empresas utilizan esto para medir el cumplimiento del acuerdo de nivel de servicio (SLA). El tiempo de actividad es a menudo una abreviatura para evaluar la confiabilidad y el estado general del sistema. El tiempo de inactividad excesivo puede afectar negativamente la satisfacción del usuario para las organizaciones que prestan servicios en línea. Para una aplicación, puede verificar la disponibilidad con una verificación HTTP simple y programada regularmente.

3. Uso de CPU (también conocido como uso de recursos)

Un alto porcentaje de capacidad de CPU utilizada por una aplicación puede ser un signo de un problema de rendimiento. Un aumento repentino en el uso de la CPU puede dar lugar a tiempos de respuesta más lentos. Las fluctuaciones en la demanda de una aplicación también pueden ser una indicación de que necesita agregar más instancias de aplicación. Una regla general es que si el uso de la CPU supera el 70 % más del 30 % del tiempo, es posible que se esté quedando sin capacidad de CPU.

El uso de recursos también puede incluir el uso de memoria y disco. El seguimiento de la RAM ayuda a identificar fugas de memoria que podrían provocar fallas o la necesidad de más memoria. Las métricas de uso del disco pueden ayudar a evitar que una aplicación se quede sin almacenamiento persistente, lo que podría provocar que falle. El alto uso del disco también podría ser un signo de almacenamiento de datos de backend ineficiente o políticas de retención de datos defectuosas.

4. Tasas de error

Su software de métricas de APM debe monitorear las aplicaciones para registrar el porcentaje de solicitudes que resultan en fallas. Esto ayuda a identificar y priorizar la resolución de problemas que afectan la experiencia del usuario. Los errores de la aplicación pueden incluir errores del servidor, una respuesta 404 o tiempo de espera en una aplicación web. Puede configurar su solución APM para enviar notificaciones cuando una tasa de error supere un parámetro establecido. Por ejemplo, envíe una alerta cuando el 2.5 % de las 25 solicitudes anteriores hayan resultado en un error.

5. Recolección de basura

La recolección de basura (GC) puede mejorar el rendimiento al identificar y eliminar el uso intensivo continuo de memoria de Java u otros lenguajes. La buena noticia es que la automatización de GC recupera la memoria dedicada a objetos o datos no utilizados o redundantes que una aplicación ya no utiliza. Los objetos o datos no utilizados se eliminan y los objetos activos se copian en un grupo de memoria de última generación. Esta es una métrica que desea mantener en el medio feliz. Si la GC se ejecuta con demasiada frecuencia, podría requerir demasiada sobrecarga; pero si la GC no se ejecuta con la frecuencia suficiente, su sistema podría quedarse con muy poca memoria.

6. Número de instancias

El seguimiento de instancias le permite escalar su aplicación a escala para satisfacer la demanda real de los usuarios, en función de cuántas instancias de aplicación o servidor se estén ejecutando en cualquier momento. Esto puede ser especialmente importante para las aplicaciones en la nube. El escalado automático puede ayudarle a garantizar que las aplicaciones modernas se escalen para satisfacer la demanda y ahorrar presupuesto durante las horas de menor actividad. Esto también puede crear desafíos de monitoreo de infraestructura. Por ejemplo, si su aplicación se amplía automáticamente con el uso de CPU, es posible que nunca vea aumentar su uso de CPU; en cambio, podría ver que la cantidad de instancias de servidor aumenta demasiado, junto con su factura de hosting.

7. Tasas de solicitudes

Puede medir el tráfico recibido por una aplicación para identificar disminuciones significativas, aumentos o usuarios coincidentes. La correlación de las tasas de solicitudes con otras métricas de rendimiento de las aplicaciones le ayudará a comprender la escalabilidad de sus aplicaciones de software. El software APM también puede monitorear el tráfico para identificar anomalías. El monitoreo de usuarios que muestra un aumento inesperado en las solicitudes podría ser un ataque de denegación del servicio (DoS). Una gran cantidad de solicitudes del mismo usuario podría ser una indicación de una cuenta pirateada. Incluso las solicitudes inusualmente bajas podrían ser malas: la inactividad o la falta de tráfico podrían significar una falla en casi cualquier parte de su sistema.

8. Tiempos de respuesta (también conocidos como duración)

Al realizar un seguimiento del tiempo promedio de respuesta a una solicitud, es decir, cuánto tiempo tarda una aplicación en devolver una solicitud de recursos, puede evaluar el rendimiento de la aplicación. Estas solicitudes pueden incluir transacciones iniciadas por los usuarios finales, como una solicitud para cargar una página web, o pueden incluir solicitudes internas de una parte de su aplicación a otra, como un proceso o un microservicio que solicita datos del disco o la memoria. El tiempo de respuesta total incluye el tiempo de respuesta del servidor (el tiempo que tarda su servidor en procesar una solicitud) más la latencia de la red (el tiempo total que tarda la solicitud en moverse por la red).

Una métrica relacionada es el tiempo de carga de la página, que mide el tiempo que tarda una página web en cargarse en un navegador. El seguimiento de los tiempos de carga de las páginas permite que las herramientas de monitoreo del rendimiento de su aplicación identifiquen los problemas que causan la carga lenta de las páginas y luego mejoren la experiencia digital. Las cargas lentas de la página pueden significar el abandono de la página y la pérdida de negocios. Las soluciones de APM se pueden establecer para una referencia de rendimiento para esta métrica y luego alertarlo cuando no se cumpla ese punto de referencia.

IBM DevOps

¿Qué es DevOps?

Andrea Crawford explica qué es DevOps, el valor de DevOps y cómo las prácticas y herramientas de DevOps le ayudan a mover sus aplicaciones a través de todo el delivery pipeline, desde la ideación hasta la producción. Dirigido por los principales líderes de pensamiento de IBM, el programa de estudio está diseñado para ayudar a los líderes empresariales a adquirir los conocimientos necesarios para priorizar las inversiones en IA que pueden impulsar el crecimiento.

Métricas de aplicación adicionales

Para aquellos que buscan un conjunto más completo de métricas relacionadas con el monitoreo del rendimiento de las aplicaciones, es posible que desee considerar las siguientes métricas:

  • Consultas de base de datos: mide el número de consultas solicitadas desde una base de datos por una aplicación. Sus herramientas de APM pueden ayudar a identificar consultas lentas o ineficientes que pueden estar ralentizando el rendimiento general de su aplicación.
  • E/S (entrada/salida): la E/S muestra la velocidad a la que las aplicaciones leen o escriben datos. Puede realizar un seguimiento del rendimiento de los medios de almacenamiento persistentes (como HDD o SSD) y las tasas de E/S para la memoria o los discos virtuales.
  • Uso de la red: el uso de la red representa el ancho de banda total de la red utilizado por una aplicación. Un mayor uso de la red puede indicar problemas de rendimiento que ralentizan el tiempo de respuesta de la aplicación o crean cuellos de botella.
  • Disponibilidad de nodos: una medida similar al número de instancias es la disponibilidad de nodos, pero es específica de la nube. Cuando despliega aplicaciones en un clúster de Kubernetes, la cantidad de nodos disponibles y que responden (del total de nodos en un clúster) puede ayudar a identificar problemas dentro de su infraestructura. Las métricas de gasto en la nube también pueden ser importantes, ya que le dan visibilidad en tiempo real de los costos de la nube mediante el seguimiento de las llamadas a la API, el tiempo de ejecución de las máquinas virtuales (VM) basadas en la nube y las tasas totales de salida de datos.
  • Rendimiento: el rendimiento es el volumen de datos que se puede transferir entre una aplicación y los usuarios u otros sistemas. Se puede utilizar para determinar si una aplicación puede manejar el volumen de tráfico esperado.
  • Seguimiento de transacciones: esto le da una idea de las transacciones individuales realizadas por una aplicación. Los datos capturados pueden incluir llamadas a bases de datos, llamadas externas y llamadas a funciones, monitoreando la solicitud de transacción de principio a fin.
  • Volumen de transacciones: el volumen de transacciones mide el número de transacciones procesadas por una aplicación. Esto permite que las herramientas de APM identifiquen problemas de escalabilidad y planificación de la capacidad.

Primeros pasos con su solución APM

IBM Instana Observability proporciona observabilidad en tiempo real que todos, y cualquiera, puede usar. Ofrece una rápida creación de valor, al tiempo que garantiza que su estrategia de observabilidad pueda seguir el ritmo de la complejidad dinámica de los entornos actuales y futuros. Desde dispositivos móviles hasta mainframe, Instana admite más de 250 tecnologías y sigue creciendo.

 
Soluciones relacionadas
Monitoreo del rendimiento de aplicaciones (APM)

Observe, monitoree y repare automáticamente toda su pila de aplicaciones con IBM Instana Observability.

Explore el monitoreo del rendimiento de las aplicaciones
Servicios de administración de aplicaciones

Ofrezca un rendimiento máximo y una alta satisfacción del usuario en toda su cartera de aplicaciones personalizadas.

Explore los servicios de administración de aplicaciones
Software y soluciones de Application Performance Management

Conecte Full Stack Observability con la gestión automatizada de recursos de aplicaciones para abordar los problemas de rendimiento antes de que afecten la experiencia del cliente.

Explore las soluciones de Application Performance Management
Dé el siguiente paso

Con IBM Instana Observability, obtenga total observabilidad empresarial que le proporcione una visibilidad rápida, automatizada y contextualizada del estado y la disponibilidad de todo su entorno de aplicaciones.

Explorar Instana Observability Pruébelo gratis