通过代码部署人工智能服务
您可以构建一个定制的人工智能服务,从零开始为您的生成式人工智能应用程序量身定制。 例如,如果您正在部署使用检索增强生成(RAG)的资产,您可以捕获从人工智能服务中的基础文档中检索答案的逻辑。
通过代码部署人工智能服务的方法
您可以使用以下方法来编码和部署您的AI服务:
人工编码和部署人工智能服务
您可以创建一个包含人工智能服务和项目内连接的笔记本。 人工智能服务能够捕捉RAG应用程序的逻辑,并包含生成函数,这是一个可部署的代码单元。 生成函数被提升到了部署空间,用于创建部署。 部署以REST API端点形式公开,可供其他应用程序访问。 您可以向REST API端点发送请求,使用部署的AI服务进行推理。 已部署的人工智能服务处理请求并返回响应。
更多信息,请参阅 《人工编码和部署人工智能服务 》。
使用模板编码和部署人工智能服务
您可以使用预定义的模板在 watsonx.ai 中部署您的AI服务。 人工智能服务模板为人工智能应用提供了预先构建的基础,使开发人员能够专注于应用的核心逻辑,而不是从零开始。 通过提供预定义的结构、配置和工具集,人工智能服务模板简化了部署人工智能服务的流程,降低了出错的风险,并提高了人工智能开发和部署的整体效率和一致性。
更多信息,请参阅使用模板编码和部署AI服务。
使用CPDCTL对人工智能服务进行编码和部署
CPDCTL 是一款用于部署和管理人工智能服务的命令行工具。 它提供了一种简单、精简的部署人工智能服务的方式,无需手动配置,并降低了出错的风险。 使用CPDCTL部署AI服务的过程包括:通过安装CPDCTL和配置环境变量来准备环境,创建AI服务实例,上传AI服务代码,以及部署AI服务以使其可用。 部署过程通过运行一系列CPDCTL命令启动,包括创建AI服务实例、上传代码和部署AI服务。 部署的人工智能服务可通过REST API端点访问。
更多信息,请参阅 《使用CPDCTL编码和部署人工智能服务 》。
选择正确的部署方法
部署人工智能服务的方法有三种:手动编码、开发人员模板和CPDCTL。 每种方法都有其优点和缺点。 部署方法的选择取决于项目的具体需求和要求。 开发人员模板适用于定制需求有限的简单部署,而手动编码适用于定制需求较高的复杂部署。 CPDCTL适用于需要简单性和可扩展性的部署。
下表提供了三种部署人工智能服务的代码方法的对比总结:
| 方法 | 易于使用 | 定制 | 可伸缩性 | 上市时间 |
|---|---|---|---|---|
| 手动编码 | 难 | 完整 | 高 | 慢速 |
| 开发人员模板 | 轻松 | 受限 | 受限 | 快速 |
| CPDCTL | 轻松 | 受限 | 高 | 快速 |