使用 IBM watsonx.data 利用 AI 就绪的非结构化和结构化数据提高 AI 准确性

作者

Edward Calvesbert

Vice President, Product Management - watsonx.data

IBM

今天，IBM 正式推出了 IBM® watsonx.data 的进化版，这是唯一一款面向企业级 AI 与分析的混合型、开放式数据湖仓，现在已全面上市。

各大组织现在可以简化并扩展对非结构化和结构化数据的访问、准备和交付，从而支持更准确、更相关的生成式 AI 应用，扩展自助服务分析能力，并简化和扩展原本复杂的数据访问、数据增强和数据治理流程。

AI 比传统 RAG 更准确

企业数据堪称利器，它能驱动精准且差异化的 AI，既与您所在行业及客户需求紧密相关，又能持续驱动竞争优势。然而，90% 的企业数据是非结构化数据，针对生成式 AI，这些数据在很大程度上仍然无法访问且未得到充分利用。²

现在，您可以访问、准备并交付企业级非结构化数据，通过 IBM® watsonx.data* 驱动比传统 RAG 方法高出 40% 准确率的 AI。Watsonx.data 独具以下优势：

混合且开放，可访问数据所在的任何位置，并实现跨本地、云端及多云环境的部署，与您现有的生态系统和数据投资互操作。
通过多种针对特定用途的查询引擎进行工作负载优化，包括新的开源 Apache Gluten 增强版 Spark，可以优化工作负载，可同时优化成本与性能表现。
生成式 AI 就绪，具有嵌入式 Data Fabric 功能（watsonx.data 集成和 watsonx.data 智能），一切均位于湖仓一体内，以避免产生另一个数据孤岛。

现在，您可以扩大规模并实现自动化：

从包括 Filenet、Box、Google Docs 等多种新源系统摄取您的非结构化和结构化数据。
对您的数据进行语义增强，从文档中提取并标准化的实体生成矢量化嵌入和结构化衍生数据，支持能够理解位置上下文、关系和计算的 AI 应用，从而实现更准确、更完整的输出。
通过从文档源系统继承的访问控制机制，对您的数据进行治理，贯穿至 AI 数据检索全流程，并辅以个人身份信息 (PII) 标注，规避敏感信息暴露风险。
在从 BI 到生成 AI 应用程序和智能体的广泛工作负载中检索该数据

所有这些均可在 IBM® watsonx.data 中完成，从而解锁企业非结构化数据，以便用于 AI 和传统分析，例如数据工程、BI 和 ML。

复杂分析工作量的速度和可扩展性

IBM® watsonx.data 现已将 Apache Gluten 加速的 Spark 作为其多种专用查询引擎之一，大幅提升了对计算密集型 Spark SQL 工作负载的处理性能。Apache Gluten 是一个高性能库，通过将执行任务卸载到 Velox（一种原生 C++ 执行引擎），来优化 Apache Spark SQL 的工作负载。这种整合为大规模数据分析提供了更快的查询处理和增强的资源效率。现在，组织能够以更高的速度和可扩展性以及更低的成本执行复杂的分析任务。

新的 DataStax NoSQL 数据库新增操作和矢量功能

IBM 最近收购了 DataStax，将一款基于 Apache Cassandra 构建的 NoSQL 矢量操作型数据存储引入 watsonx.data。watsonx.data 中的这一补充增强了我们的矢量功能，并增强了我们的检索增强生成和知识嵌入能力。

DataStax 专为读写型生成式 AI 应用及操作型工作负载优化设计，满足实时性能、高可用性与弹性扩展需求，为企业提供现代 AI 应用所需的极速响应、可靠运行及多模态支持能力。

DataStax 还与 Langflow 无缝连接，很快将作为 IBM® watsonx.ai 的一部分提供。Langflow 是一款开源工具，拥有超过 60,000 个 GitHub 星标，能够通过直观的低代码界面，帮助开发者原型设计、构建和部署检索增强生成和多智能体人工智能应用，从而减少开发阻力，加快实现价值的速度。

正式发布 Think 2025 预览版

我们在 Think 2025 大会上宣布了这些功能的封闭预览，同时与多位杰出嘉宾共同登台，他们在数据主题演讲、专题分享和技术演示环节中亮相，正在各自行业中引领数据与人工智能创新的发展方向。

Lockheed Martin 与 Meta 一起参加了主题演讲阶段。Lockheed 最近采用了升级版的 watsonx.data，使其 7 万名工程师、科学家和技术人员能够通过自然语言，从数百万份文档中获取答案和信息。Lockheed 公司科技和战略创新高级副总裁 John Clark 表示：“我们正全力提速创新与效率，推动解决方案走出实验室、走向实战部署，助力构建一个更安全、更有保障的世界。”

EY 最近推出了人工智能驱动的开创性全球税务合规解决方案，该解决方案由 watsonx 构建，旨在解决税务部门面临的最大挑战。EY 美洲间接税人工智能负责人 Christopher Aiken 表示：“EY 在 150 多个国家和地区提供税务服务，几乎在所有这些国家，我们的客户都在数据方面遇到困难。watsonx 将我们在数据清洗、丰富和质量审核上的人工投入减少了 30% 至 50%。”

USAA 正在利用生成式 AI 推动保险业的未来发展并改善客户体验。USAA 首席数据分析和 AI 官 Ramnik Bajaj 表示：“在保险行业，我们处理大量的非结构化数据。例如，房屋检查报告、警方报告和事故照片几乎不包含结构化数据。通过生成式 AI，我们有机会从这些非结构化数据中提取关键属性和洞察，使其对承保人、理赔人员和客户服务代表更易获取并发挥更大价值。”

立即开始使用 watsonx.data

您现在即可开始使用进化版的 watsonx.data，它已作为高级版的一部分提供。

了解更多

欢迎您免费试用，享受高达 2000 美元的礼金额度

联系我们开始使用