大约 80% 的企业数据是非结构化的，它们驻留在 PDF、电子邮件、协作平台和文档存储库中。然而，只有不到 1% 的数据是直接适合 AI 使用的格式。这一差距既代表了巨大的机会，也构成了企业在扩展 AI 计划时的关键挑战。

传统的非结构化数据准备方法正在限制企业的发展。手动数据处理流程需要 6 到 12 个月才能建立，而且脆弱易损，每遇到新的文档格式或源系统变更就可能出现故障。工程团队将宝贵的时间花在数据管道搭建上，而非 AI 创新。如果缺乏适当的结构和一致性，AI 模型将提供不可靠的结果，削弱信任并延长实现价值的时间。

IBM watsonx.data 作为业界唯一一款专为 AI 和分析而构建的混合开放式湖仓一体，可应对这一挑战。它可以简化结构化和非结构化数据的访问、准备和治理，帮助各组织为大规模生成式 AI 建立可信的数据基础。