IBM® watsonx.data: Mejora de la precisión de la IA con datos estructurados y no estructurados listos para la IA

Renderizado digital para representar la empresa watsonx.ai

Autor

Edward Calvesbert

Vice President, Product Management - watsonx.data

IBM

Hoy, IBM lanzó la evolución de IBM® watsonx.data, el único lakehouse de datos híbrido y abierto para IA y análisis empresariales, para disponibilidad general.

Las organizaciones ahora pueden simplificar y escalar el acceso a datos, la preparación y la entrega de datos estructurados y no estructurados para impulsar aplicaciones de IA generativa más precisas y relevantes, escalar análisis de autoservicio y simplificar y escalar el acceso a datos, el enriquecimiento y el gobierno de datos que antes eran complejos.

IA más precisa que la RAG convencional

Los datos empresariales son la mejor herramienta para impulsar una IA precisa y diferenciada que sea relevante para su sector y sus clientes e impulse la ventaja competitiva. Sin embargo, el 90 % de los datos empresariales son datos no estructurados, que en gran medida han permanecido inaccesibles e infrautilizados para la IA generativa2.

Ahora puede acceder, preparar y entregar sus datos no estructurados para impulsar una IA un 40 % más precisa que la RAG convencional con IBM® watsonx.data*. watsonx.data es único:

  1. Híbrido y abierto para acceder a los datos dondequiera que residan e implementar en las instalaciones, en la nube y multinube con interoperabilidad con su ecosistema existente y sus inversiones en datos.
  2. Carga de trabajo optimizada con múltiples motores de consulta adaptados, incluido el nuevo Spark mejorado Apache Gluten de código abierto para optimizar las cargas de trabajo en cuanto a costes y rendimiento.
  3. IA generativa lista con capacidades de tejido de datos integradas, watsonx.data integration y watsonx.data intelligence, todo dentro del lakehouse de datos, para evitar crear otro silo.

Ahora puede escalar y automatizar:

  1. Ingesta de los datos estructurados y no estructurados de una variedad de nuevos sistemas de origen, incluidos Filenet, Box, Google Docs y más.
  2. Enriquecimiento semántico de los datos, creando embeddings y derivados estructurados a partir de entidades extraídas y normalizadas en sus documentos para impulsar aplicaciones de IA que comprendan el contexto posicional, las relaciones y los cálculos para obtener resultados más precisos y completos.
  3. Gobierno de los datos con controles de acceso heredados de los sistemas de origen de documentos hasta la recuperación de sus datos para IA, con anotación de PII para evitar que aparezca información confidencial.
  4. Recuperación de esos datos en un amplio espectro de cargas de trabajo, desde BI hasta aplicaciones y agentes de IA generativa

Todo esto se puede hacer en IBM® watsonx.data para desbloquear datos no estructurados para IA y análisis tradicionales, como ingeniería de datos, BI y ML.

Velocidad y escalabilidad para cargas de trabajo analíticas complejas

IBM® watsonx.data ofrece ahora Spark acelerado de Apache Gluten como uno de sus múltiples motores de consulta adaptados, lo que aumenta significativamente el rendimiento de las cargas de trabajo SQL Spark de cálculo intensivo. Apache Gluten, una biblioteca de alto rendimiento, optimiza las cargas de trabajo de Apache Spark SQL descargando la ejecución a Velox, un motor de ejecución nativo de C++. Esta integración ofrece un procesamiento más rápido de las consultas y una mayor eficiencia de los recursos para el análisis de datos a gran escala. Ahora las organizaciones pueden ejecutar tareas analíticas complejas con una velocidad y escalabilidad aún mayores y a costes más bajos.

La nueva base de datos DataStax noSQL añade capacidades operativas y vectoriales 

IBM ha adquirido recientemente DataStax, lo que añade a watsonx.data un almacén de datos vectoriales operativos NoSQL, basado en Apache Cassandra. Esta incorporación a watsonx.data mejora nuestras capacidades vectoriales y refuerza nuestras capacidades de generación aumentada por recuperación y capacidades de embedding.

DataStax está optimizado para aplicaciones de IA generativa de lectura y escritura y cargas de trabajo operativas que exigen rendimiento en tiempo real, alta disponibilidad y escalabilidad, aportando a las organizaciones la velocidad, fiabilidad y soporte multimodal necesarios para las aplicaciones de IA modernas.

DataStax también se conecta de manera fluida con Langflow, que pronto estará disponible como parte de IBM® watsonx.ai. Langflow es una herramienta de código abierto con más de 60 000 estrellas de GitHub, que permite a los desarrolladores crear prototipos, crear e implementar aplicaciones de IA multiagente y generación aumentada por recuperación a través de una interfaz intuitiva low-code para reducir la fricción de desarrollo y acelerar el tiempo de obtención de valor.

Disponibilidad general de nuestra vista previa de Think 2025

Anunciamos la vista previa cerrada de estas capacidades en Think 2025, mientras compartimos escenario con distinguidos ponentes invitados en la sesión magistral de datos, sesiones destacadas y demostraciones de techbyte, que están allanando el camino para la innovación de datos e IA en sus sectores.

Lockheed Martin se unió al escenario de la sesión magistral con Meta. Lockheed aprovechó recientemente la transformación del watsonx.data, permitiendo a 70 000 ingenieros, científicos y técnicos recuperar respuestas e información de millones de documentos mediante lenguaje natural. "Estamos acelerando rápidamente nuestra innovación y eficiencia, para sacar soluciones del laboratorio y llevarlas al terreno, ayudando a crear un mundo más seguro y protegido", afirma John Clark, vicepresidente senior de tecnología e innovación estratégica de Lockheed.

EY presentó recientemente soluciones innovadoras de cumplimiento fiscal global con IA que abordan los mayores desafíos a los que se enfrentan los departamentos fiscales, creadas con watsonx. "EY presta servicios fiscales en más de 150 países y, en casi todos ellos, nuestros clientes tienen problemas con los datos", dice Christopher Aiken, líder de IA de impuestos indirectos de América en EY. "watsonx ha reducido nuestro esfuerzo humano para la limpieza, el enriquecimiento y la revisión de la calidad de los datos entre un 30 y un 50 %".

USAA está aprovechando la IA generativa para impulsar el futuro de los seguros y mejorar la experiencia del cliente. "En el sector de seguros, trabajamos con una cantidad significativa de datos no estructurados", afirma Ramnik Bajaj, director de análisis de datos e IA de USAA. "Por ejemplo, los informes de inspección de viviendas, los informes policiales y las imágenes de accidentes contienen muy pocos datos estructurados. Con la IA generativa, tenemos la oportunidad de extraer atributos clave y conocimiento de estos datos no estructurados, haciéndolos mucho más accesibles y útiles para aseguradores, ajustadores y representantes de servicios.

Empiece hoy con watsonx.data

Ahora puede dar los primeros pasos con la evolución de watsonx.data como parte de la edición premium.

Más información

Pruebe una prueba sin coste con 2000 USD en créditos gratuitos

Póngase en contacto con nosotros para empezar.