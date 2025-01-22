在 ChatGPT 及类似生成式 AI 应用普及的推动下，大型语言模型（LLM）在 AI 领域的讨论中占据主导地位。然而，小型语言模型（SLM）正逐渐兴起。SLM 更加紧凑高效，消耗更少内存和处理能力。这使它们非常适合资源受限的环境。
SLM 能够从海量数据中生成独特内容和洞察，吸引全球关注，推动新工具与应用程序发展，并进一步巩固其在企业领域的文化影响力。我们将与 IBM Research® 欧洲英国及爱尔兰区主任 Juan Bernabe Moreno 博士一起，深入探讨 SLM 如何助力企业采用 AI。
生成式人工智能（生成式 AI）为企业生产力带来巨大潜力。然而，在部署 AI 模型时，模型并不一定越大就越好。有两个主要问题阻碍企业采用大型语言模型。
首先，许多 LLM 是通用型的，其价值受到限制。所谓“平均”公司模型无效，因为不存在“平均”公司。有效的 AI 模型必须根据特定组织需求构建、调整并部署。
其次，许多专有 LLM 是“黑箱”，只有拥有公司能看到其内部组件，缺乏数据透明度，不利于利用企业数据进行调优，而 AI 的真正价值正体现在此。这使企业在没有洞察与控制的情况下，独自承担模型性能责任。
这些问题阻碍了对模型安全性的信任与理解。如果企业未能有效选择满足行业、法律及监管要求的生成式 AI 解决方案，就无法充分发挥生成式 AI 的潜力。
要实现生成式 AI 成功落地，企业需要三方面条件：
为满足这些需求并最大化 AI 价值，企业正转向 SLM，领略“小而强大”的力量。SLM 是通用型 LLM 的有力替代方案。
SLM 受到的关注和宣传较少，但对各类规模的组织而言都是极具吸引力的选择。其能源效率、数据透明度与卓越性能 — 往往可媲美甚至超越大型模型 — 使企业能够在不妨碍创新的前提下，负责任地采用生成式 AI。
一般而言，参数低于 300 亿的模型均被视为 SLM。其主要优势包括成本更低、能耗更少，以及数据透明度与完整性更高。新一代小型模型，如 IBM® Granite™，基于清理和筛选后的特定任务数据集构建，可降低偏差与不当输出风险，同时提升数据可视性。
这一可靠的基础模型可安全整合专有数据，从而释放 AI 的真正价值。IBM 为所有 Granite 模型提供知识产权（IP）保障，进一步增强企业将数据整合到模型中的信心。
IBM 认为，开源基础模型可助力组织构建专业化、数据驱动型模型。为此，IBM 开源了 Granite 系列可定制 SLM，并在透明、筛选过的数据集上进行训练。
将小型 Granite 模型与企业数据结合，可在特定任务上实现媲美大型模型的性能，同时成本仅为其一小部分。早期概念验证显示，IBM Granite 模型成本比大型前沿模型低 3 到 23 倍，同时在关键基准测试中性能可优于或与同等规模竞争者持平。
此外，IBM® 与 RedHat® 于 2024 年 5 月推出的 InstructLab 等新技术，可简化企业向 LLM 输入数据的过程。借助 InstructLab，企业可用远少于传统再训练的人工数据和计算资源定制 AI 模型。
包括 Granite 模型在内的 SLM 已经开始发挥作用。全球体育机构使用 Granite 模型，并结合自身领域数据调优，通过 AI 生成解说提升球迷体验。在内部，IBM 利用 Granite 模型为其人力资源（HR）服务平台 AskHR 提供支持。通过自然语言提示，IBM 员工可在同一平台访问 HR 服务，为员工和 HR 专员节省时间。
大型 LLM 并非享受生成式 AI 优势的唯一途径。更小、更易获取、专业化的模型，可在降低经济与环境成本的同时，提供所需的效率、可信度、灵活性和性能。
与 IBM 携手参与网络研讨会，在此期间我们将展示如何通过智能体 AI 计划实现真正的投资回报率，并提供跨行业、用例的示例，甚至还有 IBM 自身的成功案例。
IBM® Granite® 是一系列开放、高性能且值得信赖的 AI 模型，专为企业量身定制，并经过优化以扩展您的 AI 应用程序。深入了解语言、代码、时间序列和防护措施选项。
使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai，可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据，即可在很短的时间内构建 AI 应用程序。
借助 IBM 业界领先的 AI 专业知识和解决方案组合，让 AI 在您的业务中发挥作用。
IBM Consulting AI 服务有助于重塑企业利用 AI 实现转型的方式。