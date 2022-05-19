¿Cuándo se convertirían 10 segundos en algo importante? Cuando se trata del rendimiento de las aplicaciones.
Para las aplicaciones de microservicios nativas de la nube, 10 segundos es mucho tiempo.
Las cosas que pueden sucederle a sus aplicaciones en 10 segundos son inagotables y la mayoría no son buenas.
Pero, antes de entrar en detalles sobre lo que podría suceder con sus aplicaciones, veamos algunos acontecimientos reales que muestran lo que puede ocurrir en 10 segundos:
Nos gusta especialmente el ejemplo de Usain Bolt porque esa distancia es una gran distancia para correr en menos de 10 segundos.
Para el rendimiento y la disponibilidad de aplicaciones nativas en la nube, 10 segundos es una eternidad. Las transacciones circulan a toda velocidad por Internet, manteniendo las ruedas del comercio bien engrasadas.
¿Qué puede pasar en 10 segundos si algo sale mal? Pues bien, miles de transacciones pueden sufrir retrasos o fallos y no completarse en absoluto.
Con este tipo de problema, los ingresos pueden caer debido a la pérdida de ventas. Los clientes abandonarán los carritos de la compra y su sitio y buscarán otro lugar donde comprar lo que quieren. Y la imagen de su marca puede verse afectada.
¿Por qué, entonces, sería aceptable que las herramientas de observabilidad capturaran métricas lentamente o, peor aún, muestrearan y agregaran métricas y trazas? ¿Cómo puede una plataforma así considerarse equivalente a una plataforma de observabilidad, como la plataforma IBM Instana que recopila y contextualiza información a la velocidad de los microservicios modernos? Permiten que los problemas descritos anteriormente persistan durante un largo periodo de tiempo hasta que se disponga de la información necesaria para solucionar el problema.
Para PRISA Tecnologia, el rendimiento es clave. Cuando se enfrentan a un problema de rendimiento, tiene un impacto inmediato y perjudicial en el rendimiento del negocio y en la percepción que el consumidor tiene de su marca.
"Una diferencia de tiempo de un segundo en la visualización de contenido marca una gran diferencia en la experiencia de nuestra audiencia". – Jorge Tomé Hernando, Director de arquitectura de TI, Operaciones, Seguridad y lugar de trabajo, PRISA Tecnología
Los principales competidores de observabilidad de la plataforma Instana muestrean métricas a intervalos de 10 segundos o agregan métricas en intervalos de un minuto o más, en comparación con el intervalo ultrapreciso de métricas de un segundo de la plataforma Instana. La plataforma Instana también notifica un problema en tres segundos. Esta respuesta se ilustra en el diagrama de la brecha de detección de la observabilidad que se muestra aquí.
¿Realmente puede permitirse esperar 10 segundos o hasta un minuto para que su plataforma de observabilidad le diga que hay un problema? Con un triaje manual, tal vez. Pero con la corrección automatizada o incluso semiautomática no se puede.
Para todas las aplicaciones, la velocidad y la fiabilidad son los objetivos. Para lograr un mejor rendimiento y fiabilidad de las aplicaciones, la estrategia de referencia de que "un humano siempre necesita solucionar un problema (MTTR)" tiene que cambiar. La intervención humana para corregirlo sobrecargará los recursos humanos y restringirá el ritmo del cambio. También reducirá los indicadores de nivel de servicio (SLI).
"Con Instana, nuestro objetivo diario es poder garantizar una expectativa de latencia. Nuestro objetivo para las llamadas de servicio es completarlas en menos de 250 milisegundos. Por lo tanto, no se trata solo de simulacros de incendio. En el día a día, podemos mejorar el rendimiento y eso nos impulsa hacia ese objetivo de 250 ms. Instana lo hace posible". – Bryce Hendrix, arquitecto jefe de plataformas, Dealerware
Para mejorar el rendimiento con mayor disponibilidad, la AIOps automatizado es el camino a seguir. La AIOps automatizada proporciona automatización adicional combinada con AIOps, que es el camino a seguir para lograr niveles más altos de rendimiento y disponibilidad. ¿Cómo? Al permitir que las AIOps automatizadas resuelvan problemas que la máquina puede corregir sin problemas mucho más rápido que un humano. Hay muchos problemas relacionados con la asignación de recursos de infraestructura y otros que la máquina puede corregir y prevenir antes incluso de que intervenga un humano.
¿Estos beneficios significan que todos los problemas de las aplicaciones pueden resolverse con AIOps automatizadas? Por supuesto que no.
Hay muchos problemas lógicos complejos que solo el triaje humano puede resolver, como problemas de código y similares. Pero también hay muchos problemas en los que la AIOps automatizada es más rápida, más eficiente y debe preferirse para la corrección de problemas.
Consideremos el tiempo medio hasta la prevención (MTTP), que se clasifica como el tiempo que la observabilidad más AIOps tarda en evitar que un problema afecte negativamente a las aplicaciones e infraestructuras de nube híbrida.
Las AIOps automatizadas añaden una nueva opción al continuo de corrección de problemas de la aplicación. El diagrama anterior ilustra que la continuidad comienza con la corrección totalmente automatizada hasta el nivel básico de MTTR humano.
En el continuo, la observabilidad es el punto de partida para cada tipo de corrección. Cuanto más tarde la plataforma de observabilidad detecte un problema, más tardará en iniciar el proceso de corrección. Este lapso de tiempo significa que cuando se añade AIOps automatizada, la diferencia entre la detección de un segundo y la detección de 10 segundos o más se vuelve enorme. Si su aplicación puede permitirse esperar más de 10 segundos a que se detecte un problema, ¿por qué utilizar AIOps automatizada?
La corrección automatizada de AIOps es el futuro. Es el siguiente paso lógico para mejorar el rendimiento y la resiliencia de las aplicaciones. Los problemas de rendimiento de la infraestructura a menudo superan los problemas de código de microservicios y seguirán haciéndolo en el futuro.
El nuevo estándar de oro para la detección y corrección de problemas de aplicaciones será la observabilidad automatizada más AIOps. Se utilizarán en conjunto para ayudar a garantizar que los problemas no se conviertan en problemas importantes.
Si desea obtener todos los beneficios de la corrección automatizada de AIOps, necesita métricas y rastreos de alta frecuencia y ultraprecisos para alimentar el motor de AIOps. Y puede conseguirlos por una fracción del coste de las tecnologías de observabilidad más lentas.
De hecho, pueden pasar muchas cosas en 10 segundos. Con métricas en tiempo real y AIOps automatizada, puede asegurarse de que los problemas graves no ocurran en sus aplicaciones.
