什么是 Claude AI？

作者

Staff writer

Staff Editor, AI Models

IBM Think

什么是 Claude AI？

Claude AI 是由研究公司 Anthropic 开发的生成式人工智能（AI）聊天机器人和大型语言模型（LLM）系列。Claude 擅长自然语言处理 (NLP)并且是多模态的，它接受文本、音频和视觉输入，可以回答问题、总结文档并生成长篇文本、图表、动画、程序代码等。

Claude 恪守 Anthropic 的宪制性 AI 理念：该公司认为，Claude 与 ChatGPT 和 Google 的 Gemini 等 AI 竞争模型不同，它是一种道德规范准则。宪制性 AI 理念侧重于 AI 安全，旨在引导 Claude 提供更有帮助的响应，同时避免 AI 偏见等有害行为。

Claude 3 于 2024 年 5 月发布，包括一个免费的和两个高级的 AI 聊天机器人。

Claude 3.5 Sonnet 是免费版本 Claude AI 的基础。它对速度的重视使其能够快速处理用户查询和其他需要紧急数据检索的任务。据 Anthropic 称，Claude 3.5 Sonnet 的速度是两款高级产品之一 Claude 3 Opus 的两倍。

Claude 3 Opus 是目前向 Claude Pro 用户提供的两种 Claude 模型之一。它提供深入的文档处理和内容生成服务，并专注于复杂的任务。虽然 Opus 的速度比 Claude 3.5 Sonnet 慢，但它出现幻觉的风险较低。幻觉是指当 AI 模型提供不正确的信息时，会将其误认为是正确的事实。

Claude 3 Haiku是 Claude 推出的第二款高级产品。在三个产品中，它规模最小，速度最快，非常适合用于总结长文档、实时客户服务和简单文本生成。

Claude 的用途是什么？

三个 Claude 3 模型都有自己的专门用例。一般来说，人们可以使用 Claude AI 来帮助完成广泛的任务，包括：

问题解答和研究
校对和编辑
文档摘要，包括 PDF 和 Word 文档
文本和内容生成
语言翻译
业务计划制定
图像和音频处理
代码片段生成和评论

与 Claude 2 和 1 不同，Claude 3 是多模态的：它可以处理图像和音频内容以及基于文本的提示。例如，Claude 3 可以根据图像生成电子商务产品描述。虽然 Claude 3 无法自行生成非文本内容，但其多模态整合是其能够与 GPT-4 竞争的几个新功能之一。

Claude AI 的工作原理是什么？

与 Gemini 和 OpenAI 的 ChatGPT 一样，Anthropic 的 Claude 系列 AI 系统基于转换器架构的神经网络。但与竞争对手不同，Claude 应用宪制性 AI 理念来规范自己的行为。

转换器模型善于将用户输入序列中相距较远的单词联系起来，从而更好地理解上下文并生成长篇响应。

宪制性 AI 理念是一套减少危害的指导原则，旨在使 Claude 更有益、风险更小。

什么是转换器模型？

转换器是一种为高性能自然语言处理而构建的 AI 模型。它们的工作原理是应用复杂的数学算法，从统计学角度预测用户查询最可能得到的回复。该工作流可以分为四个基本步骤。

转换器将用户查询分解为令牌。每个令牌代表一个完整单词或一个单词的一部分。AI 模型定价通常表示为每个令牌的成本。Claude Pro 的上下文窗口为 200,000 个令牌¹ ，这意味着它可以处理长度最多为 200,000 个令牌的用户查询。

每个令牌都通过数学过程绘制到三维向量空间中。被评估为含义更相似的令牌在空间中绘制得更紧密，从而帮助 LLM 理解用户输入。这个过程的结果称为矢量嵌入。
Claude 和 GPT-4 等转换器采用自注意力机制，根据用户查询和流程上下文中最相关的部分对资源进行自我引导。
该模型采用概率算法生成最有可能对输入做出的响应。Claude 等 AI 模型实际上并不“知道”任何事情，相反，它们只是将训练数据与先进的统计数据结合起来，根据提示产生最可能的结果。

什么是Constitutional AI？

Constitutional AI ²是由 AI 初创公司 Anthropic 创建的一套 AI 伦理和安全原则。在设计 Claude 时，Anthropic 收集了大约 1000 人的意见，让他们投票并提出伦理生成式 AI 运行和负责任 AI 的使用规则。这些规则的最终集合构成了 Claude 训练过程的基础。

Constitutional AI 的前三条规则是：

选择最不危险或仇恨的响应方式。
选择尽可能可靠、诚实和接近事实的回答。
选择最能传达明确意图的回答。

其他模型的内容由人类训练师在称为根据人类反馈进行强化学习（RLHF）的过程进行审查，Claude 也使用 RLHF 以及第二个 AI 模型进行训练。根据 AI 反馈进行强化学习（RLAIF）让“训练师”模型将 Claude 的行为与 Constitutional AI 进行比较，并相应地进行纠正。

RLAIF 自动化训练过程中的行为调整部分，使鼓励伦理行为变得成本更低、更高效。预期的结果是 Claude 会自我微调，学会避免有害提示，同时对它认为可以回答的提示生成有用的响应。

Anthropic AI 是什么？

Anthropic 是一家 AI 初创公司，由几位前 OpenAI 研究人员和高管（包括 Daniela 和 Dario Amodei 兄妹）于 2021 年创立。Amazon 和 Google 已分别向该公司投资数十亿美元，而 OpenAI 则继续得到 Microsoft 的支持。

Amodei 兄妹在 2021 年与 OpenAI 分道扬镳，那一年 OpenAI 发布了 GPT-3.5。这个 AI 模型至今仍然是免费 ChatGPT AI 工具的动力来源。Amodei 兄妹与其他前 OpenAI 研究人员一起创立了 Anthropic AI，并开始着手开发后来成为 Claude AI 的项目。

Anthropic 的标志性特点是其对伦理 AI 的声明性方法，这体现在 Constitutional AI 训练过程中。

Claude 与 ChatGPT 和 Gemini 的优势

在发布 Claude 3 时，Anthropic AI 进行了一系列 LLM 基准测试，以评估其模型与两个主要竞争对手 OpenAI 和 Google 的模型相比的表现。无论是在这些测试中，还是在其他方面，Claude 都展示了几个关键优势：

更大的上下文窗口
在多项测试中表现出色
不保留输入或输出数据

更大的上下文窗口

Claude 能够处理多达 20 万个令牌（约 350 页文本）的提示，这使得它在生成相关答案时可以记住并使用更多信息。相比之下，GPT-4 Turbo 和 GPT-4o 将用户限制在 12.8 万个令牌以内。

Claude 能够保留更多信息，允许用户创建详细、数据丰富的提示。输入序列中包含的数据越多，AI 模型的回答就越相关。

在多项测试中表现出色

当 Anthropic 在测试中将 Claude 3 与 GPT-4 和 Gemini 1.0³进行对比时，Claude 3 Opus 在所有选定的评估基准测试中都是表现最好的。Gemini 1.0 Ultra 在六项视觉测试中的四项中位居榜首，尽管 Claude 系列模型的表现相当接近。

然而，GPT-4o 和 Gemini 1.5 并未包含在测试范围内。当 OpenAI 在 2024 年 5 月公布 GPT-4o 时⁴，其基准测试显示，这一新的旗舰模型在六项测试中的五项中击败了 Claude 3 Opus。

不保留输入或输出数据

关注数据隐私的用户可能会欣赏 Anthropic 的数据保留政策⁵ ：他们声明所有用户输入和输出都会在 30 天后删除。Google 的 Gemini for Google 云数据政策⁶规定，该公司不会用用户提示来训练其模型。

相比之下，OpenAI 可能保留和使用用户数据⁷ 来进一步训练他们的模型。Google 的 Gemini 应用政策⁸ 允许公司保留用户数据，除非用户手动停用此选项。

Claude 的缺点

虽然与竞争对手相比，Claude 的整体表现很强劲，但它也有一些弱点，可能会阻碍其被大众广泛接受：

有限的图像生成能力
没有互联网浏览

有限的图像生成能力

与 GPT-4o 相比，Claude 创建图像的能力较差。虽然 Claude 可以生成交互式流程图、实体关系图和图形，但它无法生成完整的图像。

没有互联网浏览

由于 Microsoft 与 Bing 的集成，GPT-4 能够在回答用户查询时搜索互联网。虽然 Claude 会定期更新新的训练数据，但在 Anthropic 选择以同样的方式让 Claude 浏览互联网之前，其知识库总是落后几个月。

如何选择合适的 AI 基础模型

如何选择正确的方法来准备数据集和使用 AI 模型？如何使用模型选择框架来平衡性能要求？

资源

深入了解 IBM Granite

了解 IBM® Granite™，我们的开放式、性能出色和值得信赖的 AI 模型系列，专门为企业量身定制，并经过优化，可以帮助您扩展 AI 应用程序。深入了解语言、代码、时间序列和防护措施选项。

如何选择合适的 AI 基础模型

了解如何为您的用例选择最合适的 AI 基础模型。

探索大语言模型 (LLM) 的威力

深入阅读 IBM 开发人员文章、博客和教程，加深您对大语言模型 (LLM) 的了解。

CEO 的模型优化指南

了解如何使用最新的 AI 技术和基础架构，不断推动团队提高模型性能并超越竞争对手。

采用差异化方法提供 AI 基础模型

深入了解企业级基础模型的价值，利用这种模型可信、高性能且经济高效的特点，为所有行业服务。

解锁生成式 AI + ML 的强大功能

了解如何将生成式 AI、机器学习和基础模型整合到您的业务运营中，以提高绩效。

2024 年 AI 实际应用

了解我们对 2,000 家组织进行的关于他们的 AI 计划的调研，以发现哪些方法有效、哪些方法无效，以及如何才能取得领先。

脚注

1. How large is Claude Pro's Context Window? Anthropic, 2024

2. Collective Constitutional AI: Aligning a Language Model with Public Input, Anthropic, 17 October 2023

3. Introducing the next generation of Claude, Anthropic, 4 March 2024

4. Hello GPT-4o, OpenAI, 13 May 2024

5. How long do you store personal data?, Anthropic, 2024

6. How Gemini for Google Cloud uses your data, Google, 10 September 2024

7. How your data is used to improve model performance, OpenAI, 17 September 2024

8. Gemini Apps Privacy Hub, Google, 28 August 2024