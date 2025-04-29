标签
得益于 ChatGPT 和数十个其他基于基础模型构建的聊天机器人，几乎每个人都知道大型语言模型 (LLM)。那么，大型数据库模型 (LDM) 又如何呢？

IBM 基础设施高级副总裁 Ric Lewis 在 IBM 2025 投资者日活动上表示：“LDM 是经过调整的模型，专长是从大型数据集和交易流中提取洞察分析，而非处理人类语言和文本，后者是 LLM 和聊天机器人的专长领域。”

虽然 LLM 使用书籍、文章、维基百科和各种其他来源的公开数据进行训练，但其训练材料通常不包含企业内部的海量数据。事实上，目前只有 1% 的企业数据在大型语言模型中使用。

与此相反，LDM 则基于交易记录、产品信息、客户关系数据、培训日志和员工记录等企业数据来源进行培训。因此，企业可以使用 LDM 通过对话式提问，从数据库中未开发的 99% 的数据中挖掘出有意义的洞察，这一过程被称为语义搜索。语义搜索不仅限于匹配关键字，还包括了解用户搜索查询背后的含义和语境。

Lewis 在接受 IBM Think 采访时表示，“LDM 代表一种令人兴奋的全新方式，可以利用业务应用程序和交易流中嵌入的数据为企业提取新的洞察分析并创造新价值。”他解释道：“虽然 LDM 才刚刚兴起，但我们对其在指导代理应用程序和帮助企业提升结果方面的潜力持乐观态度”。他补充说，这些模型已被用来将 AI 融入交易流程。

小球在轨道上滚动的三维设计

LDM 的工作原理是什么？

假设一家零售企业希望找到平均消费能力和购买历史与一位名叫 Claire 的购物者相似的客户，Claire 最近来到商店并对一款新的美容产品表现出浓厚兴趣。按照传统方式，零售商的数据科学家会从定义管道开始，即将原始数据转化为正在考虑的特定业务问题的有用答案。接下来，他们会使用非常具体的术语来构建数据库查询，例如“查找所有居住在纽约、年龄在 20 岁至 40 岁之间、去年在美容产品上花费至少 1000 美元的客户。”

然后，数据科学家会提取必要的数据，将其加载到另一个平台，并在几周或几个月的时间里，确定数据库中的哪些客户类似于 Claire。

IBM Silicon Valley Lab 的 Db2 程序总监 Catherine Wu 告诉 IBM Think，完成传统数据库查询的流程非常繁琐，“公司大型机上存储着大量数据，但这些数据通常不是生成式 AI 的目标，企业也无法从中获得任何洞察分析。”

部分原因在于与将数据迁移到外部环境相关的成本和安全问题。Wu 说道，“有客户告诉我们，仅移动数据就占其 IT 成本的 30-40%。此外，一旦数据从大型机中移动出去，他们就无法跟踪数据的去向，这也是客户非常担心的问题。”

相比之下，LDM 允许用户更快、更轻松地搜索数据库并获得答案，无论数据库位于本地部署、云端还是两者的混合环境中都是如此。因此，上例中的零售商只需向数据库发起查询即可：“列出像 Claire 这样的前 100 名客户。”Wu 表示，不久之后，任何受过基本 SQL 培训的人都可以提取这些信息，而无需将数据移动到任何地方。IBM 于 2022 年推出了首款使用大型数据库模型的数据库产品，名为 SQL Data Insights (SQL DI)，它是位于 IBM Z 大型机上的 Db2 z/OS 数据库的一部分，该数据库为全球 70% 以上的金融交易（按价值计算）提供支持。

更小、更好、更快

Granite 技术产品管理总监 Kate Soule 在最近一期的 Mixture of Experts 播客中表示，LLM 往往显得“杀鸡用牛刀”。

IBM 的 Lewis 表示：“LDM 的训练和调优要求可以通过与 LLM 不同的基础设施来实现。要解决大多数企业试图解决的问题，并不需要大量的 GPU。与可能用于训练 LLM 的所有数据相比，企业交易数据库相对较小。”但是，Lewis 表示，特定于企业的数据可用来创建"特定的模型，从而以更高的成本效率，更有效地实现特定结果"。

IBM 的 SQL DI 可以将数据库列中的每个值（无论其数据类型如何）转换为文本令牌。IBM 杰出工程师 Akiko Hoshikawa 表示，“因此，该模型会将每条数据库记录视为一个类英文句子形式的无序词汇集合，其中每个令牌无论在记录中的位置如何，都与其他令牌保持着平等的关系”。接下来，SQL DI 会根据周围的列值（包括表行内和表行间的值）推导出重要的数据库值。通过这种方式训练模型，几乎任何人都可以对关系数据进行 AI 查询，直接检测并匹配数据库内语义相似的数据。

LDM 在保险、零售和欺诈检测中的应用

虽然许多公司正处于 LDM 概念验证阶段，但保险和零售领域的一些企业已经在使用这些工具来加快从数据库中提取价值的过程。

Thomas Baumann 是瑞士历史最悠久的保险公司 Swiss Mobiliar 的数据推广专家，他将 IBM 的 SQL DI 应用于公司的多个业务领域。Baumann 一开始使用 SQL DI 来帮助公司更好地制定汽车保险报价，以增加销售额。当销售人员与潜在的新投保人互动时，他们可以输入一个报价，而 LDM 会提取最相似的过往案例，以确定客户接受该报价的概率。

Baumann 在接受 IBM Think 采访时说道，“然后，用户可以更改一些参数，例如降低免赔额或提供更优惠的折扣，然后重新计算成功几率。报价变得更加复杂，但却比以往更加针对个人客户量身定制。”

将 IBM 的 SQL DI 用于 Swiss Mobiliar 的汽车保险产品时，该公司使用大约 1500 万条汽车保险报价数据记录来训练模型，每条记录包含数十个属性，例如人口统计信息、车辆数据和价格。Baumann 表示，销售人员可以在选择一个候选报价之前检查各个候选报价的成功几率，从而做出更科学的报价。

结果是，他们在六个月内将保险销售的成交率提高了 7%；Baumann 表示，如果不使用 LDM，大约需要两年时间才能实现这一改进。试点项目取得成功后，Swiss Mobiliar 现在将 LDM 应用于从建筑保险到家庭保险的所有保险产品（人寿保险除外）。

Baumann 表示：“SQL DI 的两大优点在于，它可以非常快速地将想法推进到预生产阶段，而且不需要将数据从一个平台移动到另一个平台。”

除了保险业之外，IBM 的 SQL DI 团队还与美国和欧洲的多家食品零售商合作，这些零售商希望利用 LDM 为客户提供更个性化的购物体验。例如，客户手中可能拿着一种谷物食品，并在数据库中进行语义查询，以查找味道相似但更营养健康的替代谷物食品。Hoshikawa 表示，用于提供建议的 LDM 就像是“更精密、更个性化的 Amazon 或 Netflix 推荐系统”。

除了面向客户的应用程序之外，企业还在许多 B2B 领域部署 LDM，例如异常检测和实时欺诈检测。例如，IBM 的 Hoshikawa 表示，任何签发合同的公司都可以使用 LDM 来快速识别异常合同。

与此同时，LDM 还可以支持更复杂的实时欺诈检测。除了识别不符合典型模式的交易之外，LDM 还可以查询数据库，以识别包含与可疑行为相关的各种属性的记录，例如缺少商业改进局报告或缺少实际地址的公司。

Lewis 认为，继 LLM 和 LDM 之后，还会涌现大量其他的专用模型。他表示，“我们相信，LDM 与 LLM 一样，是推动代理应用程序浪潮并帮助改善结果的宝贵工具。但是，我们不期望它们总是被孤立地使用。事实上，我们认为理想的情况是将 LDM 整合到企业数据模型中，并将其与 LLM 和其他适用模型相结合，从而为企业和社会大规模创造巨大的新价值。”

同样，Lewis 并不认为某个企业或组织一定会占据主导地位。Lewis 说：“不要以为只有一家公司，或者拥有最多服务器和最多 GPU 的公司，才能开发出堪比‘瑞士军刀’的万能模型。我相信并非如此。就像我认为我们可以通过利用不同领域主题专家的专业知识来获得最深入的洞察分析一样，我相信唯有将 LLM、LDM 与未来一系列专用模型相结合，才能带来真正全新的洞察分析以及真正优化的结果。”
