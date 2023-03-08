顾名思义，生成式 AI 能生成图像、音乐、语音、代码、视频或文本，也可以解读和操作已有数据。生成式 AI 并不是一个新概念：生成式 AI 背后的机器学习技术在过去十年中不断发展。最新方法基于一种名为“Transformer”的神经网络架构。将转换器架构与无监督学习相结合，出现了大型基础模型，其性能优于能够处理多种数据模态的现有基准。

这些大型模型被称为基础模型，因为它们可以作为开发更先进、更复杂模型的起点。通过基于基础模型进行构建，我们可以创建更专业化、更复杂的模型，以适应特定用例或领域。像 GPT-3、BERT、T5 或 DALL-E 这样的早期模型已经展示了可能性：输入简短的提示，系统就能根据您的参数生成一整篇文章或一幅复杂的图像。

大型语言模型 (LLM) 明确基于大量文本数据进行训练，用于自然语言处理任务，并包含大量参数，通常超过 1 亿个。它们能促进针对多种任务的自然语言文本处理与生成。每个模型都有其优势与劣势，选择使用哪一个取决于具体的 NLP 任务以及所分析数据的特征。为特定工作选择正确的 LLM 需要具备相关的专业知识。

BERT 旨在理解句子中词语之间的双向关系，主要用于任务分类、问答和命名实体识别。相比之下，GPT 是一种基于单向转换器的模型，主要用于文本生成任务，如语言翻译、摘要和内容创作。T5 同样是一种基于转换器的模型，但它与 BERT 和 GPT 的不同之处在于，它采用文本到文本的方式进行训练，并且可以针对各种自然语言处理任务进行微调，例如语言翻译、摘要和回答问题。