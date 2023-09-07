商用 AI 正迎来激动人心的时刻。随着我们在从客户服务到人力资源再到代码现代化等更广泛的领域应用这项技术，人工智能 (AI) 正在帮助越来越多的人更智能而非更辛苦地工作。商用 AI 革命才刚刚起步，提高生产力和创造力的潜力巨大。
但当今的 AI 是一个充满活力的领域，AI 平台必须体现这种活力，整合最新进展以满足当下和未来的需求。正因如此，我们在 IBM 不断为 AI 产品组合 IBM watsonx 添加强大的新功能。
今天，我们宣布了最新成员：一系列全新的 IBM 自研基础模型，将在我们的生成式 AI、基础模型和机器学习工作室 watsonx.ai 中提供。这些多尺寸基础模型统称为“Granite”，将生成式 AI 应用于语言和代码领域。正如花岗岩是一种坚固、多用途的材料，在建筑和制造业中有诸多应用一样，IBM 相信这些 Granite 模型将为您的业务带来持久价值。
但现在，让我们一起深入了解并解释我们是如何构建它们的，以及它们将如何帮助您将业务中的 AI 推向新高度。
由 IBM 研究院开发的 Granite 模型——包括 Granite.13b.instruct 和 Granite.13b.chat——采用了“解码器”架构。正是这种架构，赋予了当今大型语言模型预测序列中下一个单词的核心能力。
作为 130 亿参数的模型，Granite 模型比更大规模的模型更高效，可适配单个 V100-32GB GPU。它们对环境的影响也更小，同时在摘要、问答和分类等专业业务领域任务上表现出色。它们在各行业中具有广泛适用性，并支持其他自然语言处理任务，如内容生成、洞察提取、检索增强生成（通过将模型连接到外部知识源以提高回答质量的框架）以及命名实体识别（识别和提取文本中的关键信息）。
在 IBM，我们专注于构建面向业务的模型。Granite 系列模型也不例外，我们在总计 7 TB（预处理前）和 2.4 TB（预处理后）的多样化数据集上对其进行了训练，生成了 1 万亿个词元，即对模型具有语义意义的字符集合。我们的数据集选择针对商业用户的需求，包含以下领域的数据：
通过在面向企业的专业数据集上进行训练，我们确保模型熟悉这些行业的专业术语和行话，并基于相关的行业知识做出决策。
在商业世界中，信任是您开展业务的基石。“信任我们”并非有力的说辞，在 AI 领域尤其如此。作为开发企业级 AI 的先驱之一，IBM 的 AI 开发方法以植根于信任和透明承诺的核心原则为指导。IBM watsonx 产品让您超越 AI 使用者的角色，成为 AI 价值创造者。它提供了构建和测试基础模型与生成式 AI 的端到端流程——从数据收集开始，到用于追踪模型与应用负责任部署的控制点结束——专注于治理、风险评估、偏见缓解和合规。
由于 Granite 模型将供客户适配其自有应用，因此用于训练的每个数据集都需经过明确的治理、风险与合规 (GRC) 审查流程。我们制定了将数据纳入 IBM Data Pile 的治理程序，这些程序符合 IBM AI 伦理原则。满足数据的 GRC 标准贯穿训练数据的整个生命周期。我们的目标是建立一条可审计的链路，从训练好的基础模型一直追溯到用于训练该模型的特定数据集版本。
许多媒体（理所当然地）将关注点聚焦于生成式 AI 产生仇恨或诽谤性内容的风险。IBM 深知企业无法承担此类风险，因此 Granite 模型使用经过我们自有“HAP 检测器”审查的数据进行训练。该检测器一种经过 IBM 训练的语言模型，用于检测和根除仇恨和亵渎内容（故称“HAP”），其性能以内部及公共模型为基准。在对文档中的每个句子进行评分后，我们对句子和分数进行分析以探究其分布，从而确定需要过滤的句子比例。
除此之外，我们还采用一系列其他的质量衡量标准。我们查找并删除重复内容，以提高输出质量，并使用文档质量过滤器进一步删除不适合训练的低质量文档。我们还定期部署数据保护措施，包括监控那些已知盗版或发布其他冒犯性内容的网站，并避免使用这些网站。
由于生成式 AI 技术格局日新月异，我们的端到端流程将持续演进与改进，为企业带来可信赖的结果。
IBM 商用 AI 愿景的核心是赋能。每个组织都将部署 Granite 模型以实现其自身目标，每个企业也都有其自身需要遵从的规则，无论这些规则来自法律、社会规范、行业标准、市场需求还是架构要求。我们坚信，企业应被赋能，无论其工作负载位于何处，都能运用 watsonx 工具，依据自身的价值观（在一定范围内）个性化定制其模型。
但这还不是全部。无论在 WatsonX 中进行什么操作，您始终保留对数据的所有权。我们不会使用您的数据来训练我们的模型；您完全掌控您所构建的模型，并且可以将其部署到任何地方。
最初的 Granite 模型仅仅是个开始：我们计划推出更多其他语言的版本，更多由 IBM 训练的模型也正在筹备中。与此同时，我们持续向 watsonx 添加开源模型。我们最近宣布，IBM 现已向选定客户提供 Meta 的 Llama 2-chat 700 亿参数模型以供早期体验，并计划在 9 月下旬广泛提供。此外，IBM 将托管 StarCoder，这是一种大型代码语言模型，涵盖 80 多种编程语言、Git 提交、GitHub 问题和 Jupyter Notebook。
除了新模型，IBM 还将在 watsonx.ai studio 中推出新的互补功能。本月晚些时候将推出我们的 Tuning Studio 首个迭代版本，其中将包含提示调整。这是一种高效、低成本的方式，让客户能够通过在其自身可信数据上训练模型，使基础模型适应其独特的下游任务。我们还将推出合成数据生成器，它将协助用户根据自定义数据模式或内部数据集创建人工表格数据集。这一功能将使用户能够降低风险，为 AI 模型训练与微调或场景模拟提取关键洞见，从而增强决策能力，并加速产品上市进程。
Granite 基础模型及其他功能加入 watsonx，为商用 AI 开启了激动人心的新可能性。新的模型和工具带来新的想法和新的解决方案。而这一切最精彩的部分是什么？我们才刚刚开始。
关于 IBM 未来方向、意向的声明仅仅表示了目标和意愿而已，可能会随时更改或撤销，恕不另行通知。