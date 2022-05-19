¿Cuándo se convertirían 10 segundos en un gran problema? Cuando se trata del rendimiento de las aplicaciones.
Para las aplicaciones de microservicios nativas de la nube, 10 segundos es mucho tiempo.
Las cosas que pueden sucederle a sus aplicaciones en 10 segundos son inagotables y la mayoría no son buenas.
Pero, antes de profundizar en los detalles sobre lo que podría suceder con sus aplicaciones, veamos algunos eventos del mundo real que muestran lo que puede suceder en 10 segundos:
Nos gusta especialmente el ejemplo de Usain Bolt porque esa distancia es un largo camino para correr en menos de 10 segundos.
Para el rendimiento y la disponibilidad de aplicaciones nativas de la nube, 10 segundos es una eternidad. Las transacciones se realizan a toda velocidad a través de Internet, lo que mantiene las ruedas del comercio bien lubricadas.
¿Qué puede suceder en 10 segundos si algo sale mal? Bueno, miles de transacciones pueden sufrir retrasos o fallos y no completarse en absoluto.
Con este tipo de problema, los ingresos pueden caer debido a la pérdida de ventas. Los clientes abandonarán los carritos de compras y su sitio y buscarán otro lugar para comprar lo que quieren. Y su imagen de marca puede padecerlo.
Entonces, ¿por qué sería aceptable que las herramientas de observabilidad capturen métricas lentamente o, peor aún, muestreen y agreguen métricas y trazas? ¿Cómo puede una plataforma así considerar equivalente a una plataforma de observabilidad, como la plataforma IBM Instana que recopila y contextualiza información a la velocidad de los microservicios modernos? Permiten que los problemas descritos anteriormente persistan durante un período prolongado de tiempo hasta que la información que necesita para remediar el problema esté disponible.
Para PRISA Tecnologia, el rendimiento es clave. Cuando se enfrentan a un problema de rendimiento, tiene un impacto inmediato y perjudicial en el rendimiento del negocio y en la percepción que el consumidor tiene de su marca.
"Una diferencia de tiempo de un segundo en la visualización de contenido marca una gran diferencia en la experiencia de nuestra audiencia". – Jorge Tomé Hernando, director de Arquitectura de TI, Operaciones, Seguridad y Lugar de Trabajo, PRISA Tecnología
Los principales competidores de observabilidad de la plataforma Instana muestrean métricas a intervalos de 10 segundos o agregan métricas en intervalos de un minuto o más, en comparación con el intervalo ultrapreciso de métricas de un segundo de la plataforma Instana. La plataforma Instana también notifica un problema en tres segundos. Esta respuesta se ilustra en el diagrama de brecha de detección de observabilidad que se muestra aquí.
¿Realmente puede permitirse esperar 10 segundos o hasta un minuto para que su plataforma de observabilidad le diga que hay un problema? Con triaje manual, tal vez. Pero con la corrección automatizada o incluso semiautomática no se puede.
Para todas las aplicaciones, la velocidad y la confiabilidad son los objetivos. Para lograr un mejor rendimiento y confiabilidad de la aplicación, la estrategia de referencia de que "siempre es un humano quien necesita arreglar un problema (MTTR)" tiene que cambiar. La intervención humana para realizar arreglos remediales sobrecargará los recursos humanos y restringirá el ritmo del cambio. También reducirá los indicadores de nivel de servicio (SLI).
“Con Instana, nuestro objetivo diario es poder garantizar una expectativa de latencia. Nuestro objetivo para las llamadas de servicio es completarlas en menos de 250 milisegundos. Por lo tanto, no es solo para simulacros de incendio. En el día a día, podemos mejorar el rendimiento y eso nos impulsa hacia ese objetivo de 250 ms. Instana lo hace posible”. – Bryce Hendrix, arquitecto principal de Plataformas, Dealerware
Para mejorar el rendimiento con mayor disponibilidad, el AIOps automatizado es el camino a seguir. AIOps automatizado proporciona automatización adicional combinada con AIOps, que es un camino a seguir para lograr niveles más altos de rendimiento y disponibilidad. ¿Cómo? Al permitir que AIOps automatizado resuelva problemas que la máquina puede corregir perfectamente mucho más rápido que un humano. Hay muchos problemas relacionados con la asignación de recursos de infraestructura y otros que la máquina puede remediar y prevenir antes de que un humano pueda intervenir.
¿Estos beneficios significan que todos los problemas de las aplicaciones se pueden resolver con AIOps automatizado? Por supuesto que no.
Hay muchos problemas lógicos complejos que solo la clasificación humana puede resolver, como problemas de código y similares. Pero también hay muchos problemas en los que AIOps automatizado es más rápido, más eficiente y debe preferirse para la corrección de problemas.
Considere el tiempo medio de prevención (MTTP), que se clasifica como la cantidad de tiempo que la observabilidad más AIOps tarda en evitar que un problema afecte negativamente a las aplicaciones e infraestructura de la nube híbrida.
AIOps automatizado agrega una nueva opción al proceso continuo de corrección de problemas de aplicaciones. El diagrama anterior ilustra que la continuidad comienza con la corrección de problemas totalmente automatizada hasta el MTTR básico humano.
En el continuo, la observabilidad es el punto de partida para todo tipo de corrección. Cuanto más tiempo tarda la plataforma de observabilidad en detectar un problema, más tiempo se tarda en iniciar el proceso de corrección. Este lapso de tiempo significa que cuando se agrega AIOps automatizado, la diferencia entre la detección de un segundo y la detección de 10 segundos o más se vuelve enorme. Si su aplicación puede permitirse esperar más de 10 segundos para que se detecte un problema, ¿por qué utilizar AIOps automatizado?
La corrección automatizada de AIOps es la ola del futuro. Es el siguiente paso lógico para mejorar el rendimiento y la resiliencia de las aplicaciones. Los problemas de rendimiento de la infraestructura a menudo superan los problemas de código de microservicios y continuarán haciéndolo en el futuro.
El nuevo estándar de oro para la detección y corrección de incidencias de aplicaciones será la observabilidad automatizada más AIOps. Se usarán en conjunto para ayudar a garantizar que los problemas no se conviertan en problemas importantes.
Si desea obtener todos los beneficios de la corrección automatizada de AIOps, necesita métricas y rastreos de alta frecuencia y ultraprecisos para alimentar el motor de AIOps. Y puede obtenerlos por una fracción del costo de las tecnologías de observabilidad más lentas.
De hecho, pueden pasar muchas cosas en 10 segundos. Con métricas en tiempo real y AIOps automatizados, puede asegurarse de que los problemas no le sucedan a sus aplicaciones.
