推动更智能的数据增强:IBM 与 Tavily 合作打造智能体式 AI 解决方案

戴眼镜、身穿白衬衫、袖子挽起的男子使用笔记本电脑,画面右侧呈现数字化数据元素。

作者

Dean Sacoransky

Forward Deployed Engineer

Tavily

作为与 IBM 战略合作的第一步,Tavily 自豪地推出一款开源解决方案,将实时网页洞察引入 IBM® watsonx.ai Granite 模型,革新企业丰富和交互使用电子表格的方式。

这次发布只是开始。通过将 IBM 先进大语言模型的智能与 Tavily 的实时数据基础设施相结合,团队能够构建安全、适合生产环境且基于最新可信知识的人工智能应用,从而实现规模化的深度洞察与推理。

这种整合的 3 个主要优点

企业不仅需要强大的模型,更需要基于现实、适应其具体环境并符合不断变化的治理标准的输出。这正是该集成发挥优势的地方。

Tavily 是一个针对 LLM 和自主智能体优化的搜索平台,能够实现对网络数据的实时访问,弥合静态模型与其所处动态世界之间的差距。其强大的搜索、提取和爬取 API 能够实时提供高保真网络数据,专为与 LLM 的无缝集成而全新设计。

通过将 IBM watsonx.ai 的Granite 基础模型与 Tavily 的实时网页搜索 API 结合,组织可以:

  1. 将 AI 输出建立在当前可验证的信息基础上,弥补静态 LLM 的知识断层。
  2. 通过对每个丰富输出进行透明的来源引用,增强可审计性和信任度
  3. 大规模加速工作流,通过高速的研究与数据增强,在数秒内为智能体和自动化流程提供实时洞察。适配任何企业环境,得益于开放灵活的架构,支持专有数据、自定义搜索参数以及模型无关的设计。

此次整合体现了 IBM 致力于构建负责任且适合生产环境的人工智能的承诺,以及 Tavily 致力于让网络真正可为智能系统所用的使命。

增强智能搜索

Tavily 提供一套网络数据 API,包括实时网页搜索网页抓取、网页爬取以及文档摘要功能。主要功能包括:

  • 实时访问和浏览公共网络信息
  • 高级提取能力,用于检索和结构化数据
  • 可定制搜索参数,包括时间范围、网域等
  • 隐私至上的设计,安全、合规地处理数据,零数据保留和 PII 编辑
  • 企业级安全,用于检测和缓解提示注入攻击

解锁新的企业用例

通过将 LLM 与实时 Web 数据相结合,企业可解锁众多创新用例,包括但不限于:

  1. 市场调研团队可以快速填充公司简介,包括来自网络的实时收入估算、市场拓展新闻、领导层变动及相关报道(见示例)。
  2. 财务团队可以实时跟踪股票更新、竞争对手新闻或监管文件,从而保持领先地位,而无需在不同工具间切换。
  3. 业务分析师可以通过公司图表洞察来丰富 CRM 数据,从而增强潜在客户资格和个性化。

这些用例只是一个开始。为了赋能开发者和团队构建与扩展这些工作流,我们将该项目开源并高度可定制。

露天建筑

该开源项目为希望大规模实施智能体增强工作流的企业提供了参考架构。每一列都可以设计成独立的智能体单元,实现定制化处理。从简单查询到深入的上下文分析,均可根据任务的具体需求进行。

该架构是完全可扩展的,允许团队根据行业特定用例、专有数据源或内部合规性需求进行调整。我们希望 IBM 员工和更广泛的企业社区能够从这项工作中获得启发,从而构建跨垂直领域的强大、可投入生产的丰富解决方案。

其工作原理:

1. 输入电子表格:用户首先在电子表格中填写需要增强的实体或提示。

展示电子表格中数据录入过程的动态操作过程

2. 实时搜索:Tavily 的 API 可获取最新、可靠的网络数据。

3. LLM 处理:IBM 的 Granite 模型可处理、提取和结构化信息

4. 数据增强与导出:增强后的数据被填充到电子表格中,附带来源引用,并且可以导出为 CSV 文件。

展示电子表格数据导出为 CSV 文件的动态操作过程

架构图:

LangGraph 智能体架构图

智能数据的重要一步

IBM 与 Tavily 的合作代表了智能数据增强工作流的一大进步。通过将 Tavily 的精准搜索 API 与 IBM® watsonx.ai Granite 模型强大的自然语言理解相结合,组织可以直接在日常电子表格中规模化解锁更智能、更实时的洞察分析。

您可通过深入了解 GitHub 上的开源项目与演示程序,亲身体验此次集成的强大功能。

演示视频

深入了解 GitHub 项目

Tavily 产品概述