今天,IBM 正式推出了 IBM® watsonx.data 的进化版,这是唯一一款面向企业级 AI 与分析的混合型、开放式数据湖仓,现在已全面上市。
各大组织现在可以简化并扩展对非结构化和结构化数据的访问、准备和交付,从而支持更准确、更相关的生成式 AI 应用,扩展自助服务分析能力,并简化和扩展原本复杂的数据访问、数据增强和数据治理流程。
企业数据堪称利器,它能驱动精准且差异化的 AI,既与您所在行业及客户需求紧密相关,又能持续驱动竞争优势。然而,90% 的企业数据是非结构化数据,针对生成式 AI,这些数据在很大程度上仍然无法访问且未得到充分利用。2
现在,您可以访问、准备并交付企业级非结构化数据,通过 IBM® watsonx.data* 驱动比传统 RAG 方法高出 40% 准确率的 AI。Watsonx.data 独具以下优势:
现在,您可以扩大规模并实现自动化:
所有这些均可在 IBM® watsonx.data 中完成,从而解锁企业非结构化数据,以便用于 AI 和传统分析,例如数据工程、BI 和 ML。
IBM® watsonx.data 现已将 Apache Gluten 加速的 Spark 作为其多种专用查询引擎之一,大幅提升了对计算密集型 Spark SQL 工作负载的处理性能。Apache Gluten 是一个高性能库,通过将执行任务卸载到 Velox(一种原生 C++ 执行引擎),来优化 Apache Spark SQL 的工作负载。这种整合为大规模数据分析提供了更快的查询处理和增强的资源效率。现在,组织能够以更高的速度和可扩展性以及更低的成本执行复杂的分析任务。
IBM 最近收购了 DataStax,将一款基于 Apache Cassandra 构建的 NoSQL 矢量操作型数据存储引入 watsonx.data。watsonx.data 中的这一补充增强了我们的矢量功能,并增强了我们的检索增强生成和知识嵌入能力。
DataStax 专为读写型生成式 AI 应用及操作型工作负载优化设计,满足实时性能、高可用性与弹性扩展需求,为企业提供现代 AI 应用所需的极速响应、可靠运行及多模态支持能力。
DataStax 还与 Langflow 无缝连接,很快将作为 IBM® watsonx.ai 的一部分提供。Langflow 是一款开源工具,拥有超过 60,000 个 GitHub 星标,能够通过直观的低代码界面,帮助开发者原型设计、构建和部署检索增强生成和多智能体人工智能应用,从而减少开发阻力,加快实现价值的速度。
我们在 Think 2025 大会上宣布了这些功能的封闭预览,同时与多位杰出嘉宾共同登台,他们在数据主题演讲、专题分享和技术演示环节中亮相,正在各自行业中引领数据与人工智能创新的发展方向。
Lockheed Martin 与 Meta 一起参加了主题演讲阶段。Lockheed 最近采用了升级版的 watsonx.data,使其 7 万名工程师、科学家和技术人员能够通过自然语言,从数百万份文档中获取答案和信息。Lockheed 公司科技和战略创新高级副总裁 John Clark 表示:“我们正全力提速创新与效率,推动解决方案走出实验室、走向实战部署,助力构建一个更安全、更有保障的世界。”
EY 最近推出了人工智能驱动的开创性全球税务合规解决方案,该解决方案由 watsonx 构建,旨在解决税务部门面临的最大挑战。EY 美洲间接税人工智能负责人 Christopher Aiken 表示:“EY 在 150 多个国家和地区提供税务服务,几乎在所有这些国家,我们的客户都在数据方面遇到困难。watsonx 将我们在数据清洗、丰富和质量审核上的人工投入减少了 30% 至 50%。”
USAA 正在利用生成式 AI 推动保险业的未来发展并改善客户体验。USAA 首席数据分析和 AI 官 Ramnik Bajaj 表示:“在保险行业,我们处理大量的非结构化数据。例如,房屋检查报告、警方报告和事故照片几乎不包含结构化数据。通过生成式 AI,我们有机会从这些非结构化数据中提取关键属性和洞察,使其对承保人、理赔人员和客户服务代表更易获取并发挥更大价值。”