主页

topics

AutoML

什么是 AutoML?
深入了解 IBM 的 AutoML 解决方案 注册获取 AI 更新
包含云朵、饼图、象征符号图形的拼贴插图
什么是 AutoML?

无论是要构建分类器还是要训练回归,都可以将自动化机器学习(AutoML) 视为一个广义的搜索概念,以专门的搜索算法为 ML 管道的每个组件寻找最佳解决方案。

近年来,AutoML 已成为业界和学术届关于人工智能 (AI) 研究的热门话题。AutoML 在为受监管行业提供 AI 解决方案方面前景广阔,有望提供可解释、可再现的结果。即便用户不具备目前担任数据科学职位所需的理论背景,也能通过 AutoML 更多地参与 AI 开发。

当前原型数据科学管道中的每一步,例如数据预处理、特征工程和超参数优化,都必须由机器学习专家手动完成。相比之下,采用 AutoML 则可简化开发过程,只需几行代码即可生成所需代码,开始开发机器学习模型。

AutoML 可帮助构建一个系统,使自动化的三个关键方面(特征工程、超参数优化和神经架构搜索)实现自动化,这预示着在将来,“大众化”机器学习将成为现实。

面向企业的生成式 AI 和 ML

了解生成式 AI 的主要优势,以及组织如何将生成式 AI 和机器学习融入到业务中。

相关内容 注册以获取有关 AI 数据存储的电子书
AutoML 类型

 

在数据科学管道中,数据科学团队必须执行许多步骤才能构建预测模型。即使是经验丰富的数据科学家和 ML 工程师团队,也能从 AutoML 带来的更快速度和更高透明度中受益。数据科学家必须从假设开始,收集合适的数据集,尝试完成一些数据可视化工作,设计额外的功能来利用所有可用的信号,使用超参数(ibm.com 外部链接)训练模型,而且为了实现最先进的深度学习,他们还必须为深度神经网络设计最优架构 – 最好能在 GPU(如果可用)上运行。

 

自动化特征工程


数据特征是机器学习模型输入数据的一部分,特征工程是指数据科学家从现有数据中获取新信息的转换过程。特征工程是 ML 工作流中的关键增值过程之一,性能尚可的模型与性能出色的模型,其区别就在于特征的质量好坏。原始数据的这些数学转换被读取到模型中,作为机器学习过程的核心发挥作用。自动化特征工程 (AFE)(ibm.com 外部链接)是免除了手动操作而以机器方式探索可行特征组合空间的过程。

手动的特征工程是一种现代“炼金术”,在时间方面成本巨大:构建单个特征通常需要数小时,而最低精度分数所需的特征数量就可能达到数百个,更不用说生产级精度基线了。通过自动完成特征空间的探索,AutoML 可将数据科学团队在此阶段所花的时间从几天缩短到几分钟。

缩短数据科学家的手动干预时间并非自动化特征工程的唯一优点。生成的特征通常可清楚地进行解释。在医疗保健或金融等受到严格监管的行业中,这种可解释性十分重要,因为它可通过可解释性降低采用 AI 的障碍。此外,数据科学家或分析师可从这些特性的清晰度中受益,因为这些特征可让高质量模型更具吸引力和可操作性。自动生成的特性还有可能找到新的 KPI,以供组织进行监控并采取相应措施。一旦数据科学家完成特征工程,他们便须通过战略性特征选择来优化其模型。

 

自动化超参数优化


超参数是机器学习算法的一部分,如果要通过类比来理解它,最好将其看成用于微调模型性能的杠杆,只不过每一次增量调整往往会产生巨大的影响。在小规模数据科学建模中,可以轻松地手动设置超参数,并通过反复试错进行优化。

在深度学习应用场景中,超参数的数量呈指数级增长,以手动方式及时完成超参数的优化已经超出了数据科学团队的能力范围。自动化超参数优化 (HPO)(ibm.com 外部链接)可以减轻团队在整个事件空间中探索和优化超参数的繁重责任,让团队能够转而对特征和模型进行迭代与试验。

机器学习过程自动化的另一个优势在于,数据科学家现在可以专注于创建模型的原因,而不是创建模型的方式。考虑到许多企业可用的数据量极其庞大,而可以使用这些数据回答的问题也数不胜数,分析团队可以将注意力集中于应该优化模型的哪些方面上,例如在医疗检测领域,如何最大限度地减少误报就是一个典型问题。

神经架构搜索


深度学习中最复杂、最耗时的过程莫过于创建神经架构。数据科学团队要花费大量时间选择模型中合适的层以及最终往往仅用于权重的学习率,就像在许多语言模型中一样。神经架构搜索 (NAS)(ibmcom 外部链接)被描述为“使用神经网络来设计神经网络”,是 ML 中最明显受益于自动化的领域之一。

NAS 搜索首先选择要尝试的架构。NAS 的结果取决于评判每个架构所依据的指标。有几种常见的算法可用于神经架构搜索。如果潜在的架构数量很少,可以随机选择架构进行测试。基于梯度的方法则可将离散的搜索空间转化为连续的表示,事实已证明这种方法非常有效。数据科学团队还可以尝试进化算法,也就是随机评估架构并减缓应用变更,从而传播更成功的子架构,同时修剪不成功的子架构。

神经架构搜索是有望实现 AI 大众化的 AutoML 关键要素之一。但是,这些搜索往往伴随着非常高的碳足迹。对这些权衡的研究尚未完成,目前,生态成本优化是 NAS 方法中正在探索的领域。

相关链接 数据科学 机器学习 AutoAI
AutoML 使用战略

自动化机器学习听起来像是万能的技术解决方案,可供组织用来取代成本高昂的数据科学家,但事实上,使用自动化机器学习需要组织制定明智的战略。在设计试验、将结果转化为业务成果以及维护机器学习模型的整个生命周期方面,数据科学家发挥着举足轻重的作用。那么,跨职能团队如何利用 AutoML 优化时间利用率并缩短实现模型价值所需的时间呢?

融合 AutoML API 的最佳工作流是使用它并行处理工作负载,缩短需要大量手动操作的任务所用的时间。数据科学家不必花费数天时间进行超参数调整,而是可以同时在多种类型的模型上自动执行此过程,然后测试哪种模型的性能最高。

此外,还有一些 AutoML 功能可以让不同技能水平的团队成员现在也能为数据科学管道做出贡献。数据分析师即使没有 Python 专业知识,也可以借助工具包(例如 AutoAI - Watson Studio 中的工具),使用他们能够通过查询自行提取的数据,顺利训练预测模型。借助 AuotML,数据分析师现在可对数据进行预处理,构建机器学习管道,并生成经过充分训练的模型用于验证自己的假设,而无需数据科学团队面面俱到的关注。

AutoML 和 IBM Research

IBM 研究人员和开发人员为 AutoML 的成长和发展做出了贡献。IBM 通过多种方式帮助打造下一代 AI 方法,其中包括使用 IBM Watson 中的 AutoAI 正在进行的产品开发工作,以及 IBM 研究人员在开源自动化数据科学库 Lale(ibm.com 外部链接)方面的工作。虽然 Lale 是一个开源项目,但它实际上是 AutoAI 中许多功能的核心。

对于使用 Python 作为 ML 技术栈核心的数据科学团队,Lale 提供了一个半自动化库,可无缝集成到 scikit-learn(ibm.com 外部链接)管道中,与 auto-sklearn(ibm.com 外部链接)或诸如 TPOT(ibm.com 外部链接)之类的库不同。Lale 在自动化、正确性检查和互操作性方面超越了 scikit-learn。虽然 Lale 基于 scikit-learn 范式,但它不断从其他 Python 库以及 Java 和 R 等语言库吸纳更多转换器和运算符。

相关解决方案
watsonx.ai

在我们提供的面向 AI 构建者的下一代开发平台中,实验基础模型并自动构建机器学习模型。

深入了解 watsonx.ai 观看交互式演示
AutoAI

快速构建和训练高质量的预测模型。简化 AI 生命周期管理。

深入了解 AutoAI
IBM Watson Studio

在任何云端构建和扩展可信 AI。实现 ModelOps 的 AI 生命周期自动化。

了解 IBM Watson Studio
资源 使用 AutoML 在几分钟内找到并部署最佳模型

了解 Watson AutoAI(下一代 AutoML)如何发现并构建最适合组织数据的建模管道。

IBM Research:使用 Lale 逐步实现 AutoML

Lale 是与 sklearn 兼容的 AutoML 库。它是一个开源库,用于满足逐步实现机器学习自动化的需求,而不是提供一个黑匣 AutoML 工具。

使用 IBM Watson Studio 的 AutoAI 功能轻松创建最佳模型

IBM Watson Studio 是 IBM Cloud Pak for Data 上的一款功能强大、代码可选的数据科学工具。在这项动手实验中,您将亲身体验 Watson Studio 的 AutoAI 功能如何消除模型创建的复杂性。

采取后续步骤

使用面向 AI 构建器的新一代企业级开发平台 IBM watsonx.ai,可以训练、验证、调整和部署生成式 AI、基础模型和机器学习功能。使用一小部分数据,即可在很短的时间内构建 AI 应用程序。

深入了解 watsonx.ai 预约实时演示