RAG 的秘诀:云服务如何在各行各业中启用生成式 AI 成果

2024 年 6 月 19 日

阅读时长 4 分钟

作者

Uwe Fassnacht

Product Director for IBM Cloud Code Engine

根据 IBM 的研究,约有 42% 的受访企业在其业务中使用了 AI。在所有用例中,我们中的许多人现在都非常熟悉自然语言处理 AI 聊天机器人,它们可以回答我们的问题并协助完成撰写电子邮件或论文等任务。然而,即使这些聊天机器人得到了广泛采用,企业仍然偶尔会遇到一些挑战。例如,这些聊天机器人可能会产生不一致的结果,因为它们从大型数据存储中提取的数据可能与当前的查询不相关。

值得庆幸的是,检索增强生成 (RAG) 已成为一种有前途的解决方案,可以为大型语言模型 (LLM) 锚定最准确、最新的信息。作为一种 AI 框架,RAG 致力于将模型锚定于知识源来补充 LLM 内部信息表示,从而提高 LLM 生成的回复的质量。IBM 于 2023 年 5 月推出了其新的 AI 产品组合 watsonx,该产品组合提供 RAG。

简单来说,利用 RAG 就像让模型参加开卷考试,因为您要求聊天机器人回答一个问题,并提供所有现成的信息。但是,RAG 是如何在基础设施层面运行的呢?通过混合使用平台即服务 (PaaS) 服务,RAG 可以轻松地成功运行,从而为使用 LLM 的各行各业的组织提供生成式 AI 结果。

PaaS 服务对 RAG 有何重要意义

企业级 AI,包括生成式 AI,需要高度可持续、计算和数据密集型的分布式基础设施。虽然 AI 是 RAG 框架的关键组件,但其他“成分”(如 PaaS 解决方案)也是其中不可或缺的一部分。这些产品,特别是无服务器和存储产品,在幕后勤奋运行,使数据能够更轻松地处理和存储,从而使聊天机器人能提供越来越准确的输出。

无服务器技术支持计算密集型工作,例如 RAG 带来的工作,可通过管理和保护它们周围的基础设施来提供支持。这为开发人员节省了时间,以便他们可以专注于编码。无服务器使开发人员能够构建和运行应用程序代码,而无需配置或管理服务器或后端基础设施。

如果开发人员正在将数据上传到 LLM 或聊天机器人,但不确定如何对数据进行预处理,使其处于正确的格式,或针对特定数据点进行筛选,则 IBM® Cloud Code Engine 可以为他们完成所有这些工作,简化从 AI 模型获取正确输出的总体过程。作为完全托管的无服务器平台,IBM Cloud Code Engine 可以通过管理和保护底层基础设施的自动化功能轻松扩展应用程序。

此外,如果开发人员正在上传 LLM 源,那么拥有高度安全、有弹性和持久的存储空间非常重要。这在金融服务、医疗保健和电信等受到严格监管的行业中尤其关键。

例如,IBM® Cloud Object Storage 提供安全性和数据耐久性,支持存储大量数据。凭借不可更改的数据保留和审计控制功能,IBM Cloud Object Storage 支持 RAG,帮助保护您的数据免受勒索软件攻击的篡改或操纵,并确保其符合合规性和业务要求。

借助 IBM 庞大的技术栈,包括 IBM Code Engine 和 Cloud Object Storage,各行各业的组织可以无缝利用 RAG,并专注于更有效地利用 AI 为其业务服务。

云和 AI 在实践中的力量

我们已经确定 RAG 对于实现生成式 AI 结果非常有价值,但在实践中它是什么样子的呢?

Blendow Group 是瑞典领先的法律服务提供商,处理各种各样的法律文件,剖析、总结和评估从法院判决到立法和判例法的文件。Blendow Group 的团队规模相对较小,因此需要一个可扩展的解决方案来帮助他们进行法律分析。Blendow Group 与 IBM Client Engineering 和 NEXER 合作,创建了一种创新的 AI 驱动工具,利用其全面的功能增强研究和分析,简化创建法律内容的过程,同时保持敏感数据的最高机密性。

利用包括 IBM Cloud Object Storage 和 IBM Code Engine 在内的 IBM 技术栈,量身定制了这款 AI 解决方案,以提高 Blendow 法律文件分析的效率和广度。

Mawson’s Huts Foundation 也是利用 RAG 实现更好 AI 成果的一个绝佳例子。该基金会的使命是保护 Mawson 的遗产,其中包括澳大利亚对南极 42% 的领土要求,并教育学童和其他人了解南极本身以及保护其原始环境的重要性。

借助在 IBM Cloud 上运行的人工智能驱动学习平台 The Antarctic Explorer,Mawson 让儿童和其他人无论身在何处都可以通过浏览器访问南极洲。用户可以通过基于浏览器的界面提交问题,学习平台利用 IBM watsonx Assistant 提供的人工智能驱动的自然语言处理功能来理解问题,并检索存储在 IBM Cloud Object Storage 中的相关媒体(视频、图像和文档),从而提供适当的答案。

通过将基础设施即服务产品与 watsonx 相结合,Mawson Huts Foundation 和 Blendow Group 都能通过简化管理和存储其中包含的数据的流程,从其 AI 模型中获得更深入的洞察分析。

利用云实现生成式 AI 成果

生成式 AI 和 LLM 已被证明具有改变各行各业组织的巨大潜力。无论是教育更广泛的人群还是分析法律文件,云中的 PaaS 解决方案对于 RAG 的成功和运行 AI 模型都至关重要。

在 IBM,我们认为 AI 工作量可能会构成任务关键型工作量的骨干,并最终容纳和管理最受信赖的数据,因此其周围的基础设施必须具备值得信赖且富有弹性的设计。借助 IBM Cloud,各行业企业使用 AI 可以获得更好的弹性、性能、安全性、合规性和总体拥有成本。了解更多关于 IBM Cloud Code EngineIBM Cloud Object Storage 的信息。

相关解决方案
IBM Red Hat OpenShift

Red Hat OpenShift on IBM Cloud 是一个完全托管的 OpenShift 容器平台 (OCP)。

探索 Red Hat OpenShift
容器解决方案

容器解决方案能够运行和扩展容器化工作负载,并实现安全性、开源创新和快速部署。

深入了解容器
云咨询服务

利用 IBM 的云咨询服务发掘新功能并提升业务敏捷性。了解如何通过混合云战略和专家合作共同制定解决方案、加快数字化转型并优化性能。

云服务
采取后续步骤

使用 IBM 的容器解决方案实现基础架构现代化。通过使用 IBM 的综合容器平台,跨环境灵活、安全、高效地运行、扩展和管理容器化工作负载。

深入了解容器解决方案 创建免费 IBM Cloud 帐户