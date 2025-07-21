预训练模型的主要优点在于，开发人员无需从零开始，而是可以使用那些已经学习过通用功能（例如，语言结构或视觉形状）的模型，并在更小的特定领域数据集上对其微调。微调是迁移学习的几种类型之一；而迁移学习则指使预训练模型适应新用途的一系列技术的总称。

使用预训练的模型可以加速开发进程，并允许初创公司等可能缺乏足够算力、数据或基础架构的小型实体，也能够体验最先进的模型。这就好比买一件成衣，然后根据穿着者的身材量身修改。

使用预训练模型意味着，从业者可以直接使用那些已经在现实场景中验证、基准测试和检验的架构。这可以降低风险，并有助于确保可靠性。热门的预训练模型通常附带详尽的文档、教程和代码，可用于根据具体项目需求来调整模型。

众多组织都在使用预训练的大型语言模型 (LLM) 来推运自然语言处理 (NLP) 用例，例如问答、情感分析、语义分割、生成式 AI等。这份详尽的 LLM 列表囊括了许多最受欢迎的选项。其他 AI 模型专攻于计算机视觉领域，如物体检测和图像分类模型。

对于基于图像的模型而言，最早出现且最具影响力的资源之一是 ImageNet，这一海量数据集已成为计算机视觉的行业基准。诸如 ResNet 和 Inception 等经 ImageNet 上训练的架构，是计算机视觉工作流的基础。这些模型擅长功能提取，能够识别对新图像分类有用的边缘、纹理和形状。