IBM 被评为领导者

Gartner 公布了 2021 年数据科学和机器学习平台魔力象限。

从 AutoML 到 AutoAI

加速 AI 和模型生命周期管理

什么是 AutoML?自动化机器学习 (AutoML) 是将数据科学家在构建和训练机器学习模型(ML 模型)时必须完成的手动任务自动化的过程。 这些任务包括功能工程和选择,选择机器学习算法的类型;基于算法构建分析模型;超参数优化;根据测试过的数据集训练模型并运行模型以生成评分和结果。 研究人员开发了 AutoML,帮助数据科学家不必拥有深厚的 ML 模型专业知识即可构建预测模型。 AutoML 还将数据科学家从构建机器学习管道所涉及的机械任务中解放出来,使他们能够专注于提取解决重要业务问题所需的洞察。

什么是 AutoAI?AutoAI 是 AutoML 的变体。 它将模型构建自动化扩展到整个 AI 生命周期。 与 AutoML 一样,AutoAI 将智能自动化应用于构建预测性机器学习模型的步骤。 这些步骤包括为训练准备数据集;识别给定数据的最佳模型类型,如分类或回归模型;以及选择最有助于模型解决问题的数据列,即特征选择。 然后,自动化技术会测试各种超参数调优选项,以生成最佳结果,随后根据准确性和精确性等指标对模型候选管道进行排序。 性能最佳的管道可投入生产以处理新数据,并基于模型训练情况得出预测结果。

快速功能比较

AutoAI 与 AutoML

集成 AutoAI AutoML
数据准备
特征工程
超参数优化
自动化模型部署
一键式部署
模型测试和评分
代码生成
支持:
去偏和漂移缓解
模型风险管理
AI 生命周期管理
迁移学习
任何 AI 模型
高级数据精炼

为什么 AutoAI 很重要?

智能自动化为所有人赋能

如何使用 AutoAI?

构建 ModelOps

三名员工正在商议一份书面说明

构建 ModelOps

促进数据科学家与 DevOps 之间的协作,优化 AI 模型与应用的集成。

培养负责任、可解释的 AI

办公室里的员工看向桌面显示器的左侧

培养负责任、可解释的 AI

探索在生产 AI 中建立信任的重要性,同时更快地获得结果并管理风险和合规性。

自动进行时间序列预测

两名员工正拿着文件、看着笔记本电脑商议问题

自动进行时间序列预测

通过整合来自所有可能模型类别(而不只是某一类)的最佳性能模型,了解模型如何预测时间序列的未来值。

AutoAI 的功能

在模型生命周期中自动执行关键步骤

数据预处理

应用各种算法或预估程序来分析、清理和准备用于机器学习的原始数据。 根据数据类型(如分类或数字数据)自动检测特征并进行分类。 使用超参数优化确定缺失值插补、特征编码和特征缩放的最佳策略。

自动化模型选择

通过针对一小部分数据的候选算法测试和排名来选择模型。 对于最有希望的算法,逐渐增加子集的大小。 支持对大量候选算法进行排名,以选择与数据最为匹配的模型。

特征工程

将原始数据转换为最能代表问题的特征组合,实现最准确的预测。 以结构化、非详尽的方式探索各种特征构造选项,同时使用强化学习尽可能地逐步提高模型准确性。

超参数优化

在机器学习中使用模型训练和典型评分来提炼和优化模型管道。 根据性能选择要投入生产的最佳模型。

模型监视集成

通过模型输入和输出详细信息、训练数据和有效内容记录,集成对模型漂移、公平性和质量的监控。 实施被动或主动去偏,同时分析直接和间接偏差。

模型验证支持

使用模型和数据洞察进行扩展,并验证模型是否满足您的预期性能目标。通过测量模型质量和比较模型性能,不断改进模型。

发掘 AutoAI 的强大功能

IBM Watson Studio 中 AutoAI 的实际运用

AutoAI 配置

IBM Watson Studio 的截屏,显示了可在何处添加数据源并选择 AutoAI 实验的配置详细信息

AutoAI 配置

拖动 .csv 文件并选择要预测的列。

渠道排行榜

IBM Watson Studio 的截屏,显示了关系图和管道排行榜

渠道排行榜

对模型准确性进行排名并显示管道信息。

模型评估

IBM Watson Studio 的截屏,显示了管道的模型评估情况,包括模型评估指标列表

模型评估

查看准确率、精确率和召回率以评估模型。

模型部署

IBM Watson Studio 的截屏,显示了将测试提升到部署空间的位置

模型部署

将模型提升到部署空间。

客户成功案例

Regions 银行开发值得信赖的 AI

了解这家银行通过使用 IBM Cloud Pak for Data 分析数据、评估数据漂移和度量模型性能所获得的优势。

Highmark Health 将模型构建时间缩短 90%

了解该医疗保健网络如何构建预测模型,使用保险理赔数据来识别可能会患上败血症的患者。

Wunderman Thompson 重塑 AI

了解此营销传播机构如何使用 AutoAI 来驱动大容量预测并识别新客户。

为何选择 IBM 的 AutoAI

IBM 研究院的重点开发项目

IBM 研究团队致力于应用来自 AI、ML 和数据管理的最先进技术,加速和优化机器学习及数据科学工作流程的创建工作。 该团队围绕 AutoML 首先开展的工作集中在使用超频带/贝叶斯优化进行超参数搜索,以及使用超频带/ENAS/DARTS 进行神经结构搜索。

他们持续关注 AutoAI 开发,包括管道配置和超参数优化的自动化。 超参数优化算法是一项显著的增强功能,已针对模型训练和评分等成本函数评估进行了优化。 这有助于加速收敛,找到最佳解决方案。

IBM 研究院还应用自动化人工智能,帮助确保 AI 模型的可信度和可解释性。 借助 IBM Watson Studio 中的 AutoAI,用户可以直观查看流程的各个阶段,从数据准备到算法选择,再到模型创建。 此外,IBM AutoAI 还可以自动执行任务以持续改进模型,并通过其 ModelOps 功能使 AI 模型 API 更易于集成到应用中。 IBM 在 2021 年 Gartner 数据科学和机器学习平台魔力象限中被评为领导者,IBM Watson Studio 产品中 AutoAI 的演变对此起到了一定的作用。

深度探索

AutoML 和深度学习

深度学习是机器学习的一个子领域,以支持 AI 应用和服务而出名,这些应用和服务无需人工干预即可执行分析和物理任务。 深度学习的用例包括聊天机器人、医学影像识别技术和欺诈检测。 但是,与机器学习一样,设计和运行深度学习算法需要耗费大量人力和计算能力。

IBM 研究团队探索了深度学习领域最复杂耗时的流程之一: 通过名为神经结构搜索 (NAS) 的技术创建神经结构。 该团队审查了已开发的各种 NAS 方法,展示了各种方法的优势,目的是帮助从业人员选择适当的方法。 借助为机器学习模型寻找最佳性能架构的自动化方法,可以提高 AI 的民主化程度,但这一问题仍十分复杂且难以解决。

利用 IBM Watson Studio 中的深度学习服务,您仍然可以快速着手开展深度学习工作。 该服务可帮助您设计复杂的神经网络,然后大规模开展试验,部署优化的机器学习模型。 该服务旨在简化模型训练流程,同时还按需提供 GPU 计算集群,满足计算能力需求。 您还可以集成热门开源 ML 框架(如 TensorFlow、Caffe、Torch 和 Chainer),以在多个 GPU 上训练模型并加速取得结果。 在 IBM Watson Studio 上,您可以结合使用 AutoML、IBM AutoAI 和深度学习服务,以加快实验速度,分析结构化和非结构化数据,并更快部署更佳模型。

开源程序包

对 AutoML 的需求,最终导致了可供数据科学专家和非专家人群使用的开源软件的开发。 领先的开源工具包括 auto-sklearn、auto-keras 和 auto-weka。 IBM 研究院为 Lale(链接位于 IBM 外部)做出了贡献,后者是一种扩展了 scikit-learn 功能的 Python 库,它支持广泛的自动化功能,包括算法选择、超参数调优和拓扑搜索。 如 IBM 研究院的一篇论文(PDF, 1.1 MB) 中所述,Lale 可自动为确定的 AutoML 工具生成搜索空间。 实验显示,这些搜索空间利用最先进的工具取得了极具竞争力的成果,同时进一步提高了用途的广泛性。

文档和支持

文档

在 IBM Watson Studio 文档中快速寻找答案。

支持

在 IBM 技术支持的帮助下快速入门。

社区

获取 IBM Watson Studio 其他用户给出的技术小贴士。

AutoAI 入门

在 IBM Cloud Pak for Data 上通过 IBM Watson Studio 试用 AutoAI。