自 2022 年 11 月发布以来，OpenAI 的 ChatGPT 通过展示生成式 AI 彻底改变我们生活和工作方式的潜力，俘获了消费者和企业领导者的想象力。随着其对社会影响的范围持续展开，商业和政府组织仍在竞相应对，制定关于员工使用该技术的政策，甚至限制访问 ChatGPT。
其中最审慎的组织一直在评估将 AI 应用于其组织的方式，并为已然到来的未来做准备。最先进的机构正在转变思维，从将 AI 视为事后的附加组件，转变为以 AI 为核心，对关键工作流进行重新构想。
全球生成式 AI 市场正接近一个拐点，其估值已达 80 亿美元，据估计，到 2030 年的复合年增长率将达到 34.6%。预计到那时将会有超过 8500 万个职位空缺，因此需要利用 AI 和自动化打造更智能的运营，以实现企业领导者和利益相关者所期望的效率、成效和体验。
生成式 AI 提供了一个极具吸引力的机会，可以增强员工能力并提高企业生产力。 但随着高管层领导者研究生成式 AI 解决方案， 他们也发掘出更多问题：哪些用例能为我的业务带来最大价值？哪种 AI 技术最适合我的需求？它安全吗？它具有可持续性吗？如何进行治理？以及我如何确保我的 AI 项目成功？
基于多年与基础模型合作的经验，IBM® Consulting、IBM® Technology 和 IBM® Research 已经形成了一个切实的 观点，即如何通过在全企业范围内负责任地部署 AI 来获取价值。
顾名思义，生成式 AI 能生成图像、音乐、语音、代码、视频或文本，也可以解读和操作已有数据。生成式 AI 并不是一个新概念：生成式 AI 背后的机器学习技术在过去十年中不断发展。最新方法基于一种名为“Transformer”的神经网络架构。将转换器架构与无监督学习相结合，出现了大型基础模型，其性能优于能够处理多种数据模态的现有基准。
这些大型模型被称为基础模型，因为它们可以作为开发更先进、更复杂模型的起点。通过基于基础模型进行构建，我们可以创建更专业化、更复杂的模型，以适应特定用例或领域。像 GPT-3、BERT、T5 或 DALL-E 这样的早期模型已经展示了可能性：输入简短的提示，系统就能根据您的参数生成一整篇文章或一幅复杂的图像。
大型语言模型 (LLM) 明确基于大量文本数据进行训练，用于自然语言处理任务，并包含大量参数，通常超过 1 亿个。它们能促进针对多种任务的自然语言文本处理与生成。每个模型都有其优势与劣势，选择使用哪一个取决于具体的 NLP 任务以及所分析数据的特征。为特定工作选择正确的 LLM 需要具备相关的专业知识。
BERT 旨在理解句子中词语之间的双向关系，主要用于任务分类、问答和命名实体识别。相比之下，GPT 是一种基于单向转换器的模型，主要用于文本生成任务，如语言翻译、摘要和内容创作。T5 同样是一种基于转换器的模型，但它与 BERT 和 GPT 的不同之处在于，它采用文本到文本的方式进行训练，并且可以针对各种自然语言处理任务进行微调，例如语言翻译、摘要和回答问题。
由于这些基础模型已经基于海量数据进行了预训练，它们在 AI 开发生命周期中带来了巨大的加速，使得企业能够专注于针对其特定用例进行模型微调。与为每个领域构建定制 NLP 模型相比，基础模型使企业能够将价值实现时间从数月缩短至数周。在与客户的合作中，IBM Consulting 观察到，在诸如呼叫中心转录摘要、评论分析等 NLP 用例中，价值实现时间减少了高达 70%。
考虑到训练和维护基础模型的成本，企业必须就如何根据其用例整合和部署它们做出选择。这涉及到与成本、工作量、数据隐私、知识产权和 安全相关的具体用例考量和决策点。企业可以通过权衡这些决策点，选择采用一种或多种部署方案。
基础模型将通过减少对标注数据的需求，极大地加速 AI 在业务中的采用，这将使企业更容易尝试 AI、构建高效的 AI 驱动自动化与应用程序，并在更广泛的任务关键型场景中部署 AI。IBM Consulting 的目标是在无缝的混合云环境中，将基础模型的力量带给每一家企业。
