¿Qué es analytics de operaciones de TI?

Profesional de TI que mira una computadora portátil mientras trabaja en un servidor en un centro de datos

La complejidad de los sistemas de TI ha aumentado significativamente en los últimos años, creando una mayor urgencia para que los equipos de TI se mantengan al tanto del estado de las operaciones. El aumento de los dispositivos que se conectan a aplicaciones individuales, el auge de la computación en la nube y el desarrollo de nuevos productos han llevado a las empresas a invertir en servicios digitales para satisfacer las necesidades de los clientes.

Por ejemplo, el 99 % de las organizaciones encuestadas por McKinsey afirmaron que llevaron a cabo una transformación tecnológica a gran escala desde 2020. Y, sin embargo, los CIO dicen que sus ejecutivos creen que el 59% de las iniciativas digitales tardan demasiado en completar y el 52% tarda demasiado en generar valor, según una encuesta de Gartner de 2023.

El aumento de la complejidad ha creado la necesidad de adoptar un enfoque sistemático para garantizar el estado y la optimización de los servicios de TI de cualquier organización. Esto ha llevado a un aumento en la importancia del analytics de operaciones de TI (ITOA), el proceso basado en datos mediante el cual las organizaciones recopilan, almacenan y analizan los datos producidos por sus servicios de TI.

ITOA convierte los datos operativos en insights en tiempo real. A menudo es parte de AIOps, que emplea inteligencia artificial (IA) y machine learning para mejorar el DevOps general de una organización para que esta pueda brindar un mejor servicio. El uso de capacidades de automatización y machine learning agiliza los flujos de trabajo operativos, creando insights de inmediato y eliminando posibles errores humanos de la ecuación.

ITOA ayuda a ITOps a optimizar su proceso de toma de decisiones mediante el uso de tecnología para analizar grandes conjuntos de datos e identificar la estrategia de TI adecuada.

La creciente complejidad de los sistemas informáticos ha creado la necesidad de que las organizaciones supervisen y analicen mejor los datos para tomar decisiones más informadas. Cada organización tiene una pila tecnológica única, que normalmente está compuesta por software nativo y plataformas en la nube. La infraestructura de TI de las organizaciones modernas se compone de un gran ecosistema interdependiente en el que un problema con un incidente o error podría poner en peligro todo el sistema.

La pila tecnológica de software, infraestructura y servicios de red de una organización permite a las empresas proporcionar más servicios a sus clientes, pero la mayor complejidad significa que más cosas pueden salir mal, y esos errores pueden tener un impacto exponencial. Las organizaciones se esfuerzan por minimizar los tiempos de inactividad ya que interrumpen sus servicios y ponen en peligro su reputación entre clientes y socios. Los departamentos de TI necesitan saber cómo asignar mejor sus recursos para abordar cualquier problema emergente, aumentar el tiempo de actividad y mantener la gestión de operaciones de TI (ITOM) de la organización funcionando sin problemas.

Afortunadamente, los sistemas de TI producen sus propios datos y recopilan aún más datos agregados de clientes, socios y empleados. Las organizaciones pueden utilizar todos estos datos para comprender el estado general de su sistema a través de operations analytics de TI.

Analytics de operaciones de TI (ITOA) frente a observabilidad

ITOA y observabilidad comparten un objetivo común: emplear datos de operaciones de TI para rastrear y analizar el rendimiento de un sistema y así mejorar la eficiencia y efectividad operativa. Ambos ayudan a la business intelligence por permitir que las organizaciones resuelvan los problemas de operaciones de TI más rápidamente, informen las estrategias de clasificación para problemas futuros y ayuden en el despliegue de nuevas tecnologías.

La observabilidad se ocupa de comprender el estado o condición interna de un sistema complejo basándose únicamente en el conocimiento de sus salidas externas. Realiza un seguimiento de cuatro pilares importantes: métricas, eventos, registros y trazas (MELT) para comprender el comportamiento, el rendimiento y otros aspectos de la infraestructura y las aplicaciones en la nube. Su objetivo es comprender lo que ocurre dentro de un sistema mediante el estudio de datos externos. ITOA utiliza principios de minería de datos y big data para analizar conjuntos de datos ruidosos dentro del sistema y crea una infraestructura que utiliza esos insights para que todo el sistema funcione sin problemas. Se ocupa del análisis de causa principal de los incidentes en Operaciones, para que los equipos de TI puedan hacer arreglos de problemas que podrían volver a ocurrir. El objetivo es dirigir el problema subyacente mientras se determina si otros programas o sistemas también están en riesgo de fallo.

Tecnologías de analytics de operaciones de TI

El analytics de operaciones de TI (ITOA) contiene varias herramientas, procesos y tecnologías clave, todos los cuales trabajan juntos para producir valor dentro de la organización. Estas son algunas de las tecnologías y casos de uso más comunes:

  • Gestión del rendimiento de las aplicaciones (APM): la gestión del rendimiento de las aplicaciones es un componente importante de ITOA que McKinsey estima que es un negocio de USD 11.800 millones. Implica el uso de datos de telemetría y herramientas de monitoreo para rastrear las métricas de rendimiento de las aplicaciones de software, identificar la asignación de recursos y el uso del programa y ayudar a resolver cuellos de botella y detectar anomalías. Los ejemplos de APM incluyen la identificación de páginas web de carga lenta, tiempos de procesamiento de transacciones y problemas de latencia.
  • Gestión de incidentes: las organizaciones deben identificar los incidentes y contar con un enfoque optimizado para abordarlos. La gestión de incidentes permite a los equipos de DevOps abordar eventos no planificados, como fallas del servidor u otros problemas de calidad del servicio, lo más rápido posible. 
  • Automatización del flujo de trabajo: la automatización del flujo de trabajo implica la coordinación de tareas realizadas por personas y tareas automatizadas, como las notificaciones por correo electrónico y la automatización de la entrada y el archivo de datos.
  • Análisis predictivo: una solución de análisis predictivo emplea datos históricos y en tiempo real para predecir si el software y los servicios de TI pueden enfrentar problemas futuros, lo que proporciona a las organizaciones la capacidad de realizar mejoras o arreglar errores antes de que ocurran. El análisis predictivo ayuda a optimizar las operaciones de TI al intervenir antes de que ocurra un incidente. El análisis predictivos puede ayudar a identificar problemas del servidor o sobretensiones de tráfico, ayudando a la organización a preparar una defensa o a arreglar el problema de manera proactiva.
  • Correlación de eventos y alertas: analiza los datos de registro de aplicaciones o hosts para detectar patrones, comprender mejor cómo una aplicación o sistema afecta a otro y alertar a los ingenieros de DevOps sobre posibles problemas que podrían afectar a varios sistemas. La correlación de eventos es especialmente valiosa para detectar si problemas como patrones de tráfico inusuales o múltiples intentos fallidos de inicio de sesión forman parte de un problema de seguridad más amplio.
  • Monitorización y mantenimiento en la nube: las organizaciones necesitan conocer la dependabilidad de sus centros de datos, ya sea que utilicen la nube pública, entornos multicloud o enfoques on-premises. Si la nube deja de funcionar, las organizaciones deben comprender cómo afecta eso a su capacidad para proporcionar servicios.

Etapas del analytics de operaciones

El analytics de operaciones de TI (ITOA) ayuda a las organizaciones a analizar grandes cantidades de datos operativos estructurados y no estructurados a través de tres etapas clave: 

  1. Búsqueda: los sistemas de operaciones de TI capturan y almacenan big data generados por las operaciones comerciales, las interacciones con los clientes y los archivos de registro que una organización puede utilizar para comprender y gestionar mejor el estado general de su sistema. La ITOA implica buscar en los datos para evaluar el estado actual, identificar cualquier problema existente o potencial en el futuro y alertar al equipo de operaciones de TI sobre cualquier problema.
  2. Visualizar: esto ayuda a las decisiones comerciales de la organización al proporcionar una vista única de cómo funciona un sistema. El analytics de operaciones de TI consume big data y los convierte en gráficos, tablas y hojas de cálculo utilizables. La visualización puede ocurrir a través de paneles interactivos u otros paneles de administración. Ayuda a las organizaciones a comprender dónde necesitan invertir, como licencias, aplicaciones de seguridad o compra de nuevo equipamiento o software.
  3. Analizar: la organización puede utilizar las analytics visualizadas para identificar el rendimiento del sistema y la detección de cualquier actividad inusual en entornos de TI y recomendar acciones para resolver esos problemas.

Indicadores clave de rendimiento (KPI) del analytics de operaciones de TI

Las organizaciones pueden evaluar el éxito de los programas de analytics de operaciones mediante varios indicadores clave de rendimiento (KPI):

  • Tiempo medio de reparación (MTTR): el analytics de operaciones de TI puede ayudar a los equipos de TI a reparar los problemas que la disciplina descubre, mejorando así el MTTR. Las organizaciones con una ITOA y un programa de gestión de incidentes fluidos pueden resolver los problemas rápidamente.
  • Tasas de falsos positivos: la ITOA, que depende cada vez más de la automatización, a veces puede producir falsos positivos, lo que puede llevar a una clasificación innecesaria y fatigar a los ingenieros de confiabilidad del sitio y a otros empleados de TI. Un número cada vez mayor de falsos positivos demuestra potencialmente que el proceso de ITOA o las operaciones de TI no funcionan según lo previsto.
  • Disponibilidad del servicio: este es el porcentaje de tiempo de actividad del servicio (es decir, la cantidad de tiempo que los servicios se ejecutan según lo esperado y son accesibles para los usuarios finales). Es crucial que las organizaciones realicen un seguimiento de la disponibilidad del servicio para asegurarse de que están cumpliendo con las expectativas del cliente y que estén en buen estado en relación con sus acuerdos de nivel de servicio (SLAs).
  • Utilización de la capacidad: ITOA también puede ayudar a las organizaciones a saber si sus sistemas de TI están funcionando al máximo de su capacidad o están infrautilizados. Conocer esto último es cada vez más importante para las organizaciones que utilizan la nube, ya que les permite establecer una base de referencia para su uso y eliminar costos innecesarios.

Beneficios clave del analytics de operaciones

Existen varios beneficios para cualquier organización que tenga una sólida práctica de analytics de operaciones de TI (ITOA):

  • Ahorro de costos: las organizaciones que utilizan ITOA tienen varios beneficios de costo, incluyendo la eficiencia operativa, la reducción de la interrupción y el tiempo de inactividad, y la minimización de las costosas filtraciones de datos y otras amenazas externas.
  • Experiencia del cliente mejorada: los clientes tienen grandes expectativas de que los servicios y productos que compran funcionen cuando lo desean. Las organizaciones que planean ofrecer un excelente atención al cliente dependen de ITOA para evitar interrupciones innecesarias para que los clientes puedan acceder a los productos y soluciones de esas organizaciones a demanda.
  • Seguridad y cumplimiento mejorados: ITOA desempeña un papel crucial en la detección de posibles problemas de seguridad causados por endpoint vulnerables y dispositivos finales. La ITOA también puede detectar problemas de cumplimiento, como configuraciones de sistemas no conformes y registros de auditoría que no funcionan.
  • Toma de decisiones basada en datos: el ITOA suele formar parte de un enfoque organizativo más amplio centrado en los datos y las herramientas de analytics. ITOA ayuda a las organizaciones a realizar inversiones en TI más inteligentes, asignar mejor los recursos y prepararse para cualquier desafío futuro.

Adopta la automatización de TI

Las herramientas de automatización de TI de IBM, incluidas IBM AIOps Insights, IBM Cloud Pak for AIOps, IBM Turbonomic e IBM Instana, ayudan a mantener todos sus sistemas en funcionamiento al brindarle las capacidades de observabilidad y gestión de recursos para predecir, detectar y remediar incidentes de forma más rápida y económica. También pueden ayudar a automatizar la innovación y la gestión dentro y entre los equipos de TI.

 

Autor

Keith O'Brien

Writer

IBM Consulting

Soluciones relacionadas
IBM Instana Observability

Aproveche el poder de la IA y la automatización para resolver problemas de manera proactiva en toda la pila de aplicaciones.

Explore IBM Instana Observability
Servicios de consultoría en automatización

Vaya más allá de la simple automatización de tareas para manejar procesos de alto perfil, orientados al cliente que generan ingresos con adopción y escala integradas.

Explorar los servicios de consultoría para la automatización
Soluciones AIOps

Descubra la manera en que la IA para las operaciones de TI ofrece los insights necesarios para ayudar a impulsar un rendimiento comercial excepcional.

Explore las soluciones de AIOps
Dé el siguiente paso

Descubra cómo la IA para las operaciones de TI ofrece los insights que necesita para ayudar a impulsar un rendimiento empresarial excepcional.

Explorar Instana Observability Juegue con Instana