两年前 ChatGPT 的发布开启了 AI 的新篇章，其驱动力来自规模和复杂性前所未有的大语言模型。这些模型现已成为研究和商业领域的主导力量，但其中许多模型不公开其数据、完整的训练方案或检查点。这正是非营利组织 艾伦人工智能研究所 (Ai2) 的切入点。Ai2 由微软联合创始人 Paul Allen 于 2014 年创立。该研究组致力于在开源领域开发语言模型、多模态模型和评估框架。

近期，Ai2 发布了 Molmo 系列——一组旨在显著缩小开源与专有系统之间差距的尖端多模态 AI 模型。Ai2 表示：“即使是我们较小的模型，其性能也优于规模大十倍的竞争对手。”

早在九月，Ai2 就与 Contextual AI 联合发布了 OlmoE，这是一个拥有 10 亿活跃参数、总计 70 亿参数的 混合专家模型。它基于 5 万亿词元进行训练，并构建在融入了 Ai2 Dolma 项目经验的新数据组合之上。

我们在旧金山 PyTorch 大会主题演讲后，与 Ai2 NLP 研究高级总监 Hanna Hajishirzi 进行了对话，探讨开源模型与 AI 素养。