OpenAI 全新深度研究工具承诺，通过融合自动化处理与复杂推理功能，将原本需要数周的数据分析工作缩短至数小时。
该工具与传统 AI 助手不同，它可通过多步骤分析与交互式提问，生成结构化报告。OpenAI 表示，该工具专为金融、科学、政策、工程等领域从事高强度知识型工作的人员打造。此次发布标志着 OpenAI 向快速增长的 AI 驱动研究解决方案市场展开战略扩张。
IBM 首席研究员 Chuang Gan 表示：“这不仅仅是自动化的升级，更是以全新方式提升 AI 的高级推理能力。” 他目前正主导另一款名为 Satori 的系统开发。“通过大规模强化学习训练 AI 模型解决复杂问题，我们能够加快突破进程。若没有这种技术，这些突破可能需要耗费更长时间。”
提升 AI 科研能力的需求，引发了科技巨头之间愈演愈烈的竞争，各家企业均在竞相释放 AI 作为研究中坚力量的潜力。深度研究功能会将复杂查询拆解为多个小步骤，搜索网络资源，多次分析文档，并将信息整合为全面报告。与标准 AI 回答不同，深度研究会主动浏览在线资料，核查多个参考来源，迭代构建答案，同时通过可追溯的思维链展示推理过程。
该工具融合网页浏览、文档分析与专业功能，能够处理各类复杂任务。收到问题后，它会广泛搜索可用资源，跨多个参考来源验证信息，可处理的任务涵盖学术研究、市场分析、技术文档处理等多个场景。
OpenAI 称，深度研究在从大型文档中提取特定细节、对比不同来源信息、提供有据可查的结论等方面表现尤为突出。该系统目前仅向 Pro 用户开放，月度查询次数限制为 100 次，这也体现了其计算密集型的特点。OpenAI 表示，后续将逐步推广至其他订阅层级。
乔治城大学 McDonough School of Business 副研究教授 Timothy DeStefano 表示：“深度研究能在短短几分钟内，为知识密集型任务完成信息识别、评估、重新评估与整合，这些工作通常需要人类花费数小时才能完成。这有望显著提升用户工作效率，进而助力企业创新。”
不过他也指出，深度研究可能难以处理需要专有数据的问题，因此其效果取决于应用场景的具体数据需求。
“虽然每月 200 美元的定价对美国企业界的许多专业人士而言尚可承受，但对部分个人或企业来说可能成本过高，这可能会导致生产力差距，”他补充道。“此外，鉴于该工具的技能偏向性特征，它可能会加剧工资差距，这与上一轮数字革命中观察到的趋势相呼应。”
就在 OpenAI 扩展其深度研究计划的同时，IBM 正通过自身的 Granite 系列模型，采取另一种路径推进 AI 推理系统的发展。与此同时，Chuang Gan 及其他研究人员开发了开源 AI 框架 Satori，该框架通过自我反思能力提升推理效果。
与 OpenAI 用于训练 ChatGPT 的人类反馈强化学习 (RLHF) 类似，Satori 分两个阶段提升自身推理能力。首先，在小规模数据集上微调其分析框架。随后，利用强化学习在更大规模的数据集上优化推理过程。
“Satori 旨在增强 AI 开展科学发现与解决问题的能力,”Gan 解释道。“这不仅仅是自动化的升级，更是提升 AI 将所学知识应用于新领域的能力。”
Gan 表示，深度研究工具的问世与 Satori 的推出，凸显了业界对面向研究与商业应用的 AI 工具的关注度日益提升。在金融领域，AI 驱动型量化交易工具已能筛选海量数据集，比人类分析师更快地识别市场趋势。同样，AI 助手正在重塑法律研究流程，包括总结判例法、起草法律论据，甚至预测案件结果。
AI 驱动研究的最大市场之一是制药行业，相关企业正借助 AI 筛选新的候选药物。风险投资公司与私募股权投资者也在关注 AI 研究工具，以此简化尽职调查流程。企业无需花费数周时间分析财务报告、市场报告、财务状况及竞争格局，而是借助 AI 生成分析报告，突出核心风险与机遇。
OpenAI 进军这一领域，紧随 Microsoft 的 Copilot for Finance 与 Bloomberg 的 GPT 驱动金融助手之后，后两者均可自动化处理复杂的研究任务。与此同时，中国的 DeepSeek 采取了不同路径，推出了 DeepSeek-R1——一款专为数学、编码与语言领域深度推理打造的开源模型。与闭源竞争对手不同，DeepSeek-R1 可依据 MIT 许可证免费获取，是研究人员与企业的高性价比选择。随着 AI 驱动研究的热度攀升，这些竞争者正不断突破机器推理的边界，同时改变信息分析的模式。
一些专家警告，这类强大的自动化工具可能会带来意想不到的后果。IBM 高级研究科学家 Marina Danilevsky 在 IBM《Mixture of Experts》播客最新一期中表示：“稍有不慎，AI 就会变成‘科研鹦鹉’——只会重复已有内容，而非开展更深入的研究。”
AI 生成研究内容的可靠性是另一大需要考量的问题。IBM 高级研究科学家兼大师发明家 Nathalie Baracaldo Angel 强调，必须谨慎审核内容。“明确数据来源至关重要，” 她表示，“如果我们不将研究成果与特定系统关联，就可能放大主流观点，同时忽略那些能催生真正创新的异常信息。”
内容创作模式也可能因这类工具而发生转变。就像过去网站会针对搜索引擎做优化一样，研究人员及其他从业者可能会开始为适配 AI 摘要功能而调整自己的内容。“过去，SEO 是针对搜索引擎的优化，”Danilevsky 表示。“而现在，优化会转向针对智能体的 SEO。如果我的文档更可能被 OpenAI 的研究工具总结，我会更倾向于为适配 AI 读取而调整内容，而非针对人类读者定制。”
IBM 杰出工程师 Chris Hay 指出了这对知识创造的更广泛影响。他表示：“如果人们过度依赖 AI 生成的研究内容，可能会出现‘泡沫效应’——只有最常被引用的信息源会被反复强化。那些有价值但异常的洞察分析则可能被忽略。”
尽管深度研究工具、Satori 等 AI 驱动研究工具的前景可观，但专家提醒，仅靠自动化远远不够。虽然 AI 能处理海量数据、提炼洞见并优化自身推理，但人的参与依然至关重要，尤其是在探索新研究前沿、确保新颖洞见不被遗漏时。
Baracaldo Angel 表示：“要获取真正新颖的信息，确实需要人类参与其中。许多将成为组织前沿的项目，仍会需要人类参与并展开协作——我认为这正是其中的妙处所在。”
与 IBM 携手参与网络研讨会，在此期间我们将展示如何通过智能体 AI 计划实现真正的投资回报率，并提供跨行业、用例的示例，甚至还有 IBM 自身的成功案例。
IBM® Granite® 是一系列开放、高性能且值得信赖的 AI 模型，专为企业量身定制，并经过优化以扩展您的 AI 应用程序。深入了解语言、代码、时间序列和防护措施选项。
使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai，可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据，即可在很短的时间内构建 AI 应用程序。
借助 IBM 业界领先的 AI 专业知识和解决方案组合，让 AI 在您的业务中发挥作用。
IBM Consulting AI 服务有助于重塑企业利用 AI 实现转型的方式。