Meta Llama 4 Maverick 和 Llama 4 Scout 现已入驻 watsonx.ai

watsonx.ai 主页演示

作者

Maryam Ashoori

VP of Product and Engineering, watsonx.governance

IBM

IBM 很高兴地宣布,Meta 的最新一代开放模型 Llama 4 现已入驻 watsonx.ai Llama 4 Scout 和 Llama 4 Maverick 是 Meta 发布的第一个专家混合 (MoE) 模型,提供前沿的多模态性能、高速度、低成本和行业领先的上下文长度。

Llama 4 的发布开创了 Llama 系列的新时代,引入了 Llama 架构的令人兴奋的演变和一种创新方法,该方法能够比传统训练方法更早地集成不同类型的数据模式(包括文本、图像、视频)模型。这两种新模型都支持各种各样的文本输入、文本输出和图像输入、文本输出用例。

随着 Meta 这些最新产品的推出,IBM 现在总共支持 watsonx.ai 提供的庞大基础模型库中的 13 个 Meta 模型。根据 IBM 的生成式 AI 的开放、多模型战略,我们将继续为平台客户提供当今市场上性能最高的开放模型。

高效架构

混合专家 (MoE) 架构旨在通过将模型神经网络层细分为多个“专家”,来平衡大型模型的知识容量与小型模型的推理效率。 MoE 并未为每个令牌激活每个模型参数,而是使用门控功能进行建模,该功能仅激活最适合处理该令牌的“专家”。

Llama 4 Scout 是两个新模型中较小的一个, 参数数为 109B,分为 16 个专家。在推理时,它的活动参数量仅为 17B,使其能够并行为更多用户提供服务。Llama 4 Scout 基于 40 万亿个数据令牌进行训练,其性能可与活动参数数量明显更大的模型相媲美或更高,同时保持较低的成本和延迟。尽管有这些精益计算要求,但 Llama 4 Scout 在编码、推理、长上下文和图像理解基准测试方面击败了同类模型。

Llama 4 Maverick 被划分为 128 个专家,利用其 400B 总参数的知识,同时保持与 Llama 4 Scout 相同的 17B 活动参数数。根据 Meta AI 的官方公告 ,Llama 4 Maverick 在各种多模态基准测试中“全面”击败了 OpenAI 的 GPT-4o 和 Google 的 Gemini 2.0 Flash,在推理和编码任务上的推理和编码性能可与规模大得多的 DeepSeek-V3 相媲美。

行业领先的上下文长度

此外,Llama 4 Scout 提供了 1000 万个令牌的行业最佳上下文窗口 ,同时在 大海捞针 (NiH) 等长期上下文基准测试中保持了出色的准确性。这一前所未有的飞跃为多文档摘要、海量代码库推理以及通过广泛用户活动记忆实现个性化带来了令人振奋的机遇。

正如 Meta 的公告所解释的那样,上下文长度的大规模扩展主要来自两项创新:使用没有位置嵌入的交错注意力层,以及模型注意力机制的推理时间温度缩放。这种被 Meta 称为“iRope”的新型架构代表了 Meta 朝着支持“无限”上下文长度的长期目标迈出的重要一步。

原生多模态

大型语言模型 (LLM) 通常只在文本数据上进行预训练,然后在后训练期间适应其他数据模态(例如图像数据),而 Llama 4 模型是根据“原生多模态”设计的。这使 Meta 能够使用大量未标记的文本、图像和视频数据一次性对模型进行联合预训练,通过不同来源的综合知识有效地丰富模型。

Llama 4 模型的训练在处理管道的早期阶段就加入了不同类型数据的“融合”,无缝集成文本和视觉令牌,使它们能够作为单个统一系统进行训练。因此,Llama 4 Maverick 和 Llama 4 Scout 在一系列图像理解任务中提供了出色的性能,既能够同时处理与多个图像相关的文本提示,也能够使用单个图像将模型响应锚定到特定区域以响应提示。

IBM watsonx 上的 Llama 4 模型

开发人员和企业可以从 IBM watsonx.ai丰富的基础模型目录中选择自己喜欢的 Llama 4 模型,然后在自己选择的云端、本地部署或边缘环境中进行微调、提炼和部署。 IBM 凭借其先进的 AI 基础架构、与代理框架的无缝整合以及与矢量数据库的兼容性,进一步增强了这种灵活性。

IBM watsonx 在企业级开发平台中通过一套代码、低代码和 no-code 工具简化开发流程,以支持整个 AI 生命周期,同时促进团队之间的协作。 IBM watsonx 还提供强大的端到端人工智能治理,确保负责任和加速的工作流。 IBM 与 Meta 携手合作,凭借其在科技转型方面深厚的专业知识,可提供量身定制的战略,以高效且有效地解决特定的企业需求。

了解如何在 watsonx.ai 上使用 Meta Llama 4 构建 AI 私人教练。

立即开始在 watsonx.ai 上使用 Llama 4 模型。