Collage de pictogramas con nubes, gráficos circulares y gráficos

Publicado: 27 de agosto de 2024
Colaboradores: Dave Bergmann, Cole Stryker

¿Qué es el análisis aumentado?

El análisis aumentado es la integración del procesamiento del lenguaje natural (PLN) y otras capacidades de machine learning en plataformas de análisis de datos. Las herramientas de análisis aumentado también utilizan la inteligencia artificial (IA) para automatizar y agilizar el análisis de datos a través de flujos de trabajo intuitivos y fáciles de usar.

El análisis aumentado ayuda a democratizar la toma de decisiones basada en datos mediante la automatización o simplificación de procesos que incluyen la preparación de los datos, la selección de modelos, la generación de conocimientos y la visualización de datos. Con las capacidades de análisis aumentado, las tareas que antes requerían la experiencia técnica de los científicos de datos pueden ser llevadas a cabo tanto por analistas como por usuarios empresariales.  

La IA generativa ha acelerado la proliferación de plataformas de análisis aumentado y herramientas de autoservicio. La creciente disponibilidad de sofisticados modelos de lenguaje de gran tamaño (LLM) facilita las consultas en lenguaje natural y la generación de lenguaje natural (GNL), lo que permite a los usuarios consultar datos e interpretar resultados sin conocimientos técnicos ni lenguajes de programación especializados.

Además, los algoritmos de machine learning pueden optimizar continuamente la funcionalidad principal de las herramientas de análisis aumentadas para adaptarse mejor a las necesidades de usuarios o casos de uso específicos. Por ejemplo, una plataforma de inteligencia empresarial (BI) puede identificar patrones en las consultas de los usuarios a lo largo del tiempo y luego mostrar automáticamente información procesable relevante a esos patrones en tiempo real en un panel de control de informes.

Al reducir las barreras técnicas para obtener información significativa a partir de datos complejos, el análisis aumentado amplía el acceso al proceso de análisis. Al hacerlo, las soluciones de análisis aumentado pueden mejorar la alfabetización de datos en toda la empresa y garantizar mejor que las decisiones empresariales clave en toda la organización se basen en un análisis de datos reflexivo.

Elementos clave del análisis aumentado

Como sugiere el término, las soluciones de análisis aumentado están diseñadas para aumentar cada etapa del proceso de análisis de datos, desde la preparación de los datos hasta la generación de información y el suministro de informes claros y fáciles de interpretar. Una sólida plataforma de análisis de autoservicio permite a cualquier usuario obtener información más detallada con menos esfuerzo o conocimientos técnicos.

Las capacidades clave de una solución ideal de análisis aumentado incluyen:

  • Gestión automatizada de los datos
  • Interacciones en lenguaje natural
  • Visualización de datos
  • Información automatizada y análisis estadístico

Gestión automatizada de los datos


Entre los beneficios más obvios del análisis aumentado se encuentra la oportunidad de reducir el tedio y ahorrar tiempo. Con el aumento de la cantidad de datos que trajo consigo la era del big data, vino acompañado de un aumento en la cantidad de trabajo necesario para preparar esos datos para su análisis y consolidar información de distintas fuentes de datos.
 

Preparación de datos

Para ser procesados por algoritmos de machine learning, los datos deben recopilarse de múltiples fuentes, organizarse y agregarse, y luego formatearse de forma limpia y coherente. Cuando se trata de conjuntos de datos tabulares, por ejemplo, los campos de datos deben ordenarse de forma coherente para ayudar a garantizar que las características respectivas de las incrustaciones vectoriales de cada punto de datos se correspondan con las de otros puntos de datos. Si se hace manualmente, puede resultar un proceso muy tedioso y laborioso.

Las plataformas de BI modernas y mejoradas con IA pueden utilizar el machine learning para automatizar muchas tareas de limpieza de datos mediante:

  • Detección automática de atributos de datos relevantes. Por ejemplo, un algoritmo puede detectar la presencia de información geográfica (como un código postal o coordenadas de latitud y longitud) o información de contacto (como una dirección de correo electrónico o un número de teléfono). Estas características de datos se pueden colocar dentro de un esquema de formato unificado.

  • Garantía de la calidad de los datos y preservación de la privacidad. Los algoritmos se pueden entrenar para ponderar, restar importancia o ignorar las entradas de diferentes fuentes de datos de acuerdo con la política de gobierno de datos de una organización. Una plataforma de análisis aumentado puede aplicar aún más las prácticas de gobierno de datos, por ejemplo, eliminando automáticamente los puntos de datos de información de identificación personal (PII). Esto es particularmente útil en campos como la atención médica, en el que el uso de dicha información está muy regulado.

  • Lectura y extracción de información de un PDF o fuentes de texto enriquecido. Este proceso también puede implicar la eliminación o sustitución de valores nulos o caracteres especiales, como signos de puntuación o símbolos no estándar, para convertir el texto a un formato legible por máquina.

  • Indexación y agrupación de información relacionada. Por ejemplo, un algoritmo puede reconocer la presencia de puntos de datos paralelos en diferentes orígenes y sugerir la agregación o detectar puntos de datos redundantes y combinarlos automáticamente en una sola entrada. Además, una plataforma de análisis aumentado puede integrar un modelo capaz de producir incrustaciones vectoriales eficaces para cada documento con el fin de permitir una búsqueda vectorial eficiente y generación aumentada de recuperación.

 

Detección de datos

Aunque el trabajo típicamente asociado con los analistas de datos generalmente implica la consulta proactiva de datos para informar decisiones específicas o probar hipótesis específicas, gran parte del valor que ofrece la ciencia de datos sólida proviene de la exploración de datos en general para conexiones e información invisibles o inesperadas.  

Una herramienta de análisis aumentado podría, por ejemplo, recomendar automáticamente asociaciones entre diferentes fuentes de datos que un usuario podría haber pasado por alto de otro modo o sacar a la luz valores atípicos o tendencias anómalas para su posterior análisis. La aplicación del aprendizaje no supervisado, como los modelos de asociación o clustering, puede reconocer patrones y correlaciones inherentes que podrían aportar información procesable.

Interacciones en lenguaje natural


Una de las barreras de entrada más importantes para los usuarios no técnicos interesados en la analítica de datos es la profundidad de los conocimientos técnicos especializados necesarios para el análisis de datos tradicional. Para muchas personas, aprender a codificar o utilizar el lenguaje de consulta estructurado (SQL) es prohibitivamente difícil o requiere mucho tiempo. Esto incluye el aprendizaje de las técnicas estadísticas, la nomenclatura y las mejores prácticas necesarias para interpretar y validar eficazmente los resultados.

La combinación del análisis de datos con el procesamiento del lenguaje natural (PLN) es quizá la forma más impactante e intuitiva en que la analítica aumentada amplía el acceso a la información basada en datos. Los usuarios pueden consultar los datos utilizando un lenguaje sencillo y sencillo: "¿qué productos tienen las tasas de devolución más altas en los 30 días posteriores a la temporada navideña?”, y recibir respuestas en un lenguaje igualmente sencillo.

En el back-end, un LLM debe interpretar esa consulta en lenguaje natural, traducirla en una solicitud estructurada y hacer suposiciones para completar la información faltante basándose en su comprensión del contexto de la pregunta del usuario. Se deben seleccionar uno o más modelos para procesar la solicitud. El modelo debe extraer la fuente (o fuentes) de datos más pertinentes al asunto. Por último, el LLM debe interpretar los resultados matemáticos y articularlos de manera que centre los detalles relevantes. 

Pero desde la perspectiva del usuario, simplemente está haciendo una pregunta y recibiendo una respuesta.

Visualización de datos



Las mejores soluciones de análisis aumentado no solo pueden ofrecer funciones sólidas de visualización de datos, sino también incorporar visualizaciones de datos en la producción automatizada de informes para facilitar el intercambio de información y la toma de decisiones colaborativa.

Aunque el lenguaje natural suele ser una forma muy útil de articular información, la visualización suele ser la forma más intuitiva de establecer comparaciones y resaltar patrones. Los gráficos, tablas, diagramas, trazados, mapas de calor y otros tipos de visualización de datos pueden ser una forma útil de explorar los datos y establecer conexiones que uno podría no pensar en incorporar explícitamente en una consulta.

Históricamente, tomar una petición en lenguaje natural como entrada y devolver una sofisticada visualización de datos como salida requería la sofisticada coreografía de múltiples modelos que operaban de forma similar a una cadena de montaje. Pero la evolución continua de los LLM que antes solo eran de texto hacia modelos de IA multimodal que pueden operar sin problemas en diferentes modalidades de datos ha racionalizado aún más la versatilidad de las plataformas de análisis aumentadas.

Esto permite un enfoque dinámico del análisis de datos en el que incluso los usuarios sin conocimientos técnicos pueden explorar abiertamente las conexiones e hipótesis, y los resultados, las recomendaciones y la información destacable están disponibles fácilmente en paneles de control interactivos fáciles de usar.

Información automatizada y análisis estadístico



Aunque el PNL se lleva la atención, los resultados recientes de una encuesta del Magic Quadrant de Gartner indican que la capacidad más solicitada de las plataformas de análisis e inteligencia empresarial (ABI) no son las consultas en lenguaje natural, sino la información automatizada. En otras palabras, los usuarios empresariales están más preocupados por los resultados que por el proceso de obtención de esos resultados.1

Las mejores soluciones de análisis aumentados alivian la carga de decidir exactamente cómo interrogar a sus datos para obtener información, liberando a los usuarios empresariales para que se centren en cómo actuar a partir de esa información. Más allá de las capacidades de PLN a nivel superficial, un LLM puede actuar como un motor de toma de decisiones en tiempo real. Esto permite a una plataforma moderna de análisis aumentados adaptar el análisis al contexto específico de la solicitud de un usuario de una manera mucho más dinámica de lo que sería posible con reglas simples de IF-THEN. 

Por ejemplo, el software de análisis aumentado puede deducir de la naturaleza de una solicitud qué tipo de datos se examinarán y qué tipo de análisis se desea, y luego sugerir de forma inteligente esquemas óptimos de visualización de datos. Las soluciones de análisis aumentado también pueden ejecutar análisis en múltiples modelos de previsión y resaltar las predicciones del modelo que ofrece la mayor certeza. De este modo, las plataformas pueden ofrecer información sobre el proceso de predicción, en lugar de limitarse a escupir predicciones.

La información automatizada también facilita el análisis proactivo de los datos, sacando a la luz los valores atípicos y las tendencias emergentes a medida que surgen, en lugar de esperar a que la consulta adecuada los saque a la luz. Por ejemplo, las herramientas de análisis automático podrían identificar una caída inesperada en las métricas de compromiso del cliente, alertando a los usuarios empresariales de alguna deficiencia en la experiencia del cliente para que pueda ser comprendida y abordada.

Análisis predictivo y análisis prescriptivo

Una plataforma de análisis óptima debe ser capaz de proporcionar múltiples lentes de análisis de datos, para comprender el pasado y tomar decisiones informadas sobre el futuro. Hay cuatro subconjuntos clave de conocimientos analíticos, todos los cuales son esenciales para el proceso de toma de decisiones.

  • El análisis descriptivo se ocupa del análisis objetivo: ¿qué ha sucedido o qué está sucediendo? Por ejemplo, en el contexto de las cadenas de suministro, el análisis descriptivo podría explorar dónde se gasta el dinero o dónde hay déficit de inventario.

  • El análisis diagnóstico tiene como objetivo comprender el pasado: por qué sucedieron las cosas. Por ejemplo, el análisis del comportamiento anterior de los clientes podría utilizarse para explicar por qué una iniciativa de marketing en curso no está cumpliendo con las expectativas.

  • El análisis predictivo tiene como objetivo predecir el futuro: la probabilidad de que algo suceda o los resultados esperados para un posible curso de acción. El análisis predictivo suele representar la base de una operación de inteligencia empresarial, ya que basa las decisiones en una comprensión más profunda de sus posibles consecuencias.

  • El análisis prescriptivo tiene como objetivo predecir acciones óptimas: qué debería suceder o cómo maximizar la probabilidad de un resultado deseado. La disciplina del modelado prescriptivo impulsa sistemas como los motores de recomendación, que combinan el análisis predictivo con una sólida lógica de toma de decisiones para identificar el camino ideal a seguir.

Desafíos y limitaciones del análisis aumentado

Aunque las plataformas de análisis aumentado ofrecen una amplia gama de beneficios importantes, no son una panacea autónoma para todos los males empresariales. El análisis aumentado debe verse como una herramienta potente que produce los mejores resultados cuando la utilizan empleados con una adecuada alfabetización en datos y se implementa junto con prácticas sólidas de gobierno de datos.

  • Alfabetización en datos: aunque los análisis aumentados reducen en gran medida el trabajo preliminar necesario para obtener información procesable a partir de los datos, dicha información sólo es útil en manos de empleados cuyos departamentos hayan priorizado la alfabetización en datos. Por ejemplo, una plataforma puede descubrir y sacar a la superficie una correlación digna de mención, pero sólo un usuario informado puede ejercer el juicio necesario para desentrañar la diferencia entre correlación y causalidad.

  • Gobierno de datos: la calidad de los conocimientos y las recomendaciones con IA depende directamente de la calidad y confiabilidad de los conjuntos de datos que respaldan ese análisis. Para establecer confianza en toda la organización en el análisis prescriptivo, las organizaciones deben invertir en un gobierno de datos sólido. Un gobierno de datos sólido permite una calidad de datos constante, garantiza el cumplimiento normativo, consolida de forma clara las fuentes de datos y monitoriza las desviaciones del modelo y otros problemas del machine learning.

Soluciones de IBM relacionadas
  IBM watsonx BI Assistant

IBM watsonx BI Assistant responde a sus preguntas empresariales en segundos, guiándole hacia las decisiones más impactantes. Entienda lo que ha ocurrido y por qué, lo que podría ocurrir y lo que puede hacer al respecto. Con explicaciones claras y paso a paso de su razonamiento, watsonx BI Assistant capacita a todos los usuarios empresariales.

Explore IBM watsonx BI Assistant
IBM Cognos Analytics

Libere todo el potencial de sus datos con la automatización y los conocimientos con IA El asistente de inteligencia artificial en lenguaje natural está siempre disponible: simplemente describa los datos que necesita y deje que Cognos Analytics cree impresionantes visualizaciones de datos para usted.

Explore IBM Cognos Analytics
IBM Planning Analytics

Anticipe resultados con previsiones flexibles y con IA. Analice escenarios hipotéticos a gran escala y de grano fino en tiempo real. Impleméntelo como necesite, en las instalaciones o en la nube, incluso como servicio en AWS. Automatice y unifique la planificación de negocio integrada en toda su organización y convierta las predicciones impulsadas por IA en acciones.

Explore IBM Planning Analytics
Dé el siguiente paso

Cree una estrategia de IA para su empresa en una plataforma colaborativa de IA y datos: IBM watsonx. Entrene, valide, ajuste e implemente modelos de IA para ayudarle a escalar y acelerar el impacto de la misma con datos de confianza en toda su empresa.

Explore watsonx Solicite una demostración en directo
Notas a pie de página

Nota: enlaces externos a ibm.com

1 "Predicts 2024: How Artificial Intelligence Will Impact Analytics Users". (enlace externo a ibm.com) Gartner. 4 de enero de 2024.