借助基于机器学习的自然语言处理 (NLP) 模型，企业可以加快流程、做出更准确的预测并从现有数据中发掘洞察分析。为了让贵公司的工作实现最大价值，根据公司的特定用例选择合适的基于机器学习的 NLP 服务非常重要。在 IBM，我们经常会遇到这样的问题：“机器学习模型如何知晓如何读取我的数据？”或者“机器学习模型如何知道要寻找什么？”答案取决于您使用的模型。
我们将探讨使用 NLP 构建机器学习解决方案的两种不同方法：开箱即用模型和定制化模型。当您需要快速发现一般性洞察分析时，您可能需要一个开箱即用的模型。当您的用例包含特定于行业或领域的数据（比如专业数据或术语）时，您需要定制化模型。
我们经常听说，构建基于文本的分析解决方案既繁琐又耗时。花费数小时整理文档、标记文本中的关键字或观点，并不是最有效率的做法。开箱即用或预训练的 NLP 模型可以为您自动执行这些任务。当时间有限或没有数据可供培训时，开箱即用的模型可提供巨大优势。它们可以有效实现快速概念验证，并且具有很高的投资回报率，尤其是当您需要了解文档中的类别或概念等更高级别的项目时。预构建模型通常使用通用数据源进行训练，往往不针对任何特定行业或领域进行定制。
当用例包含特定行业术语时，预训练模型可能只能满足部分需求。在不同的行业中，某些实体（人、地点、事件等）会有不同的含义，开箱即用的模型可能无法根据上下文捕捉到这些细微差别。例如，“premium”一词可能是指高端产品系列，也可能是指购买保险单时所支付的费用。在澳大利亚，支付的保险费用也被称为“cover”（保险保障）。
定制化模型可以接受训练，以便能够根据特定用例和行业领域来理解潜在的细微差别、含义和关系。如上所述，您可以告诉模型“premium”一词在您的业务领域中的含义。定制化模型可以通过多种方式构建，即使不是数据科学家或软件开发人员也能构建。借助无代码工具，您只需具备相应的专业领域知识即可。主题专家 (SME) 将定义模型中的重要信息，上传文档进行训练，然后选择这些文档中的具体示例（通常称为标注）。
您在文档上创建的标注为系统提供了具体示例，可作为模型学习的“标准答案”。无论是定义要从文档中提取的特定实体，还是定义它们之间的关系，在经过训练后，模型都将得到改进，这有助于确保模型的有效性。
将开箱即用的 NLP 模型与定制化 NLP 模型相结合，可以达到两全其美的效果。我们建议先训练模型来理解简单的组成元素，例如位置或组织。然后，按照这种方式逐步让 NLP 模型专注于对您的业务至关重要的部分，最终帮助您做出更明智的决策。
了解更多关于开箱即用 NLP 模型与自定义 NLP 模型的区别，或探索 Watson Natural Language Understanding 和 Watson Discovery ，构建您专属的基于机器学习的 NLP 模型。
IBM® Granite 是我们开放式、性能优异、值得信赖的 AI 模型系列，专门为企业量身定制，并经过优化，可以帮助您扩展 AI 应用。深入了解语言、代码、时间序列和防护措施选项。
使用 IBM® watsonx Orchestrate 轻松设计可扩展的 AI 助手和代理、自动执行重复任务并简化复杂流程。
通过强大灵活的库、服务和应用组合，加速实现人工智能的商业价值。
通过增加 AI 重塑关键工作流程和运营，最大限度提升体验、实时决策和商业价值。
使用 IBM® watsonx Orchestrate 轻松设计可扩展的 AI 助手和代理、自动执行重复任务并简化复杂流程。