IBM 獲選為領導者

Gartner 發表 2021 年 Magic Quadrant 資料科學與機器學習平台評鑑報告。

從 AutoML 到 AutoAI

加速 AI 與模型生命週期管理

何謂 AutoML?
自動化機器學習 (AutoML) 是自動完成資料科學家建置與訓練機器學習模型(ML 模型)時必須完成的手動作業的過程。 這些作業包括特性工程和選擇,選擇機器學習演算法的類型;根據演算法建立分析模型;超參數最佳化,訓練測試資料集上的模型,並執行模型以產生評分和發現項目。 研究人員開發 AutoML ,幫助資料科學家建立預測模型,而不必具有深度 ML 模型的專業知識。 AutoML 也讓資料科學家從參與建置機器學習流程管線的機械性反覆作業中釋放出來,讓他們能夠專注於擷取解決重要業務問題所需的洞察。

何謂 AutoAI?
AutoAI 是 AutoML 的一種變化。 它將模型建置自動化延伸至整個 AI 生命週期。 像 AutoML一樣,AutoAI 應用智慧自動化來建立預測機器學習模型的步驟。 這些步驟包括準備訓練的資料集;識別給定資料的最佳模型類型,例如分類或迴歸模型;以及選擇最能支援模型解決問題的資料直欄,稱為特性選擇。 自動化接著會測試各種超參數調整選項,以達到其產生的最佳結果,然後根據精確度和精準度等度量來對模型候選流程管線進行分級。 可將效能最佳的流程管線投入正式作業,以處理新資料,並根據模型訓練提供預測。

快速功能比較

AutoAI 與 AutoML 比較

整合 AutoAI AutoML
資料準備
功能工程
超參數最佳化
自動化模型部署
一鍵部署
模型測試及評分
產生程式碼
支援:
消除偏見和減少漂移
模型風險管理
AI 生命週期管理
轉移學習
任何 AI 模型
進階資料精煉

為什麼 AutoAI 很重要?

智慧型自動化可讓每一個人都擁有能力

如何使用 AutoAI?

建置 ModelOps

三名員工正在商討一份書寫筆記

建置 ModelOps

促進資料科學家與 DevOps 之間的協同作業,以最佳化的方式將 AI 模型整合到應用程式中。

Foster 負責,可解釋的 AI

在辦公室中查看桌面顯示器左側的員工

Foster 負責,可解釋的 AI

探索建立信任在正式作業 AI 中的重要性,同時更快取得結果並管理風險與合規性。

自動化時間序列預測

兩名員工使用筆記型電腦討論報告

自動化時間序列預測

瞭解模型如何從所有可能的模型類別(而不只是從單一類別)中納入最佳效能模型,以預測時間序列的未來值。

AutoAI 的特性

自動化模型生命週期中的重要步驟

資料前處理

應用各種演算法或預估器,以分析、清理和準備機器學習的原始資料。 根據資料類型(例如類別或數值)自動偵測及分類功能。 使用超參數最佳化,以判定遺漏值插補、特性編碼及特性調整的最佳策略。

自動化模型選擇

透過針對資料的小子集進行候選演算法測試及分級來選取模型。 逐漸增加子集的大小,以取得最有前景的演算法。 利用資料的最佳符合,對模型選擇進行了大量候選演算法的分級。

功能工程

將原始資料轉換為最能代表問題的特性組合,以達到最準確的預測。 以結構化、非詳盡的方式探索各種特性建構選擇,同時逐步使用補強學習來最大化模型的精確度。

超參數最佳化

在機器學習中使用模型訓練和評分標準來精簡並最佳化模型流程管線。 根據效能選擇要投入正式作業的最佳模型。

模型監視整合

透過模型輸入及輸出詳細資料、訓練資料及有效負載記載,整合對模型漂移、公平性和品質的監視。 在分析直接與間接偏見時,實作被動或主動消除偏見。

模型驗證支援

利用模型和資料洞察來延伸,並驗證您的模型是否符合預期的效能。透過測量模型品質和比較模型效能,持續改進模型。

獲得 AutoAI 的力量

在 IBM Watson Studio 中支援 AutoAI

AutoAI 配置

IBM Watson Studio 的擷取畫面,顯示您新增資料來源,並選取 AutoAI 實驗的配置詳細資料

AutoAI 配置

拖曳 .csv 檔案,並選取要預測的直欄。

流程管線排行榜

IBM Watson Studio 的擷取畫面,顯示關係對映和流程管線排行榜

流程管線排行榜

對模型精確度進行排名並顯示流程管線資訊。

模型評估

IBM Watson Studio 的擷取畫面,顯示流程管線的模型評估,其中包括模型評估測量清單

模型評估

檢閱精確度、精準度和查全率以評估模型。

模型部署

IBM Watson Studio 的擷取畫面,顯示您將測試提升至部署空間的位置

模型部署

將模型提升至部署空間。

客戶個案

地區銀行發展值得信賴的 AI

看看本銀行利用 IBM Cloud Pak for Data 來分析資料、評估資料漂移和測量模型效能的好處。

Highmark Health 將模型建置時間縮短了 90%

瞭解此醫療保健網路所建置的預測模型如何使用保險理賠資料,來識別可能患上敗血症的患者。

Wunderman Thompson 重新想像 AI

瞭解這個行銷傳播機構如何使用 AutoAI 來驅動高容量的預測,並識別新客戶。

為何選擇來自 IBM 的 AutoAI

IBM Research 的重點開發

IBM 研究團隊致力於應用來自 AI、ML 和資料管理的最先進技術,以加速並最佳化機器學習和資料科學工作流程的建立。團隊在 AutoML 方面的第一個重點是將 hyperband/Bayesian 最佳化用於超參數搜尋,和將 hyperband/ENAS/DARTS 用於神經架構搜尋。

他們繼續著重在 AutoAI 開發,包括流程管線配置和超參數最佳化的自動化。最顯著的增強是超參數最佳化演算法,針對成本函數評估(例如模型訓練和評分)進行最佳化。 這有助於加速聚合至最佳解決方案。

IBM Research 也在應用自動化人工智慧,以協助確保 AI 模型的可信度和可解釋性。藉由 IBM Watson Studio 中的 AutoAI ,使用者可看到流程每一階段的視覺化效果,從資料準備、演算法選擇到模型建立。 此外,IBM AutoAI 會自動執行持續改進模型的作業,並透過其 ModelOps 功能,更輕易地將 AI 模型 API 整合到應用程式中。在 IBM Watson Studio 產品中,AutoAI 的發展演進有助於 IBM 在 2021 Gartner Magic Quadrant 的資料科學與機器學習平台上被評為領導者。

更深入瞭解

AutoML 和深度學習

深度學習是機器學習的子欄位,已知會為執行分析及實體作業而不需要人為介入的 AI 應用程式及服務提供支援。 深度學習的範例使用案例包括聊天機器人、醫療影像識別技術及詐騙偵測。 然而,隨著機器學習、設計和執行深度學習演算法,需要大量的人力和強大的運算能力。

IBM Research 團隊在深度學習中探討其中一個最複雜和耗時的流程: 透過稱為神經架構搜尋 (NAS) 的技術來建立神經架構。 小組審查了開發的 NAS 方法,並提出了每個方案的好處,目標是幫助從業人員選擇適當的方法。 自動化的方法找出機器學習模式的最佳效能架構,可能導致 AI 更大眾化,但問題複雜難解。

在 IBM Watson Studio 內使用深度學習服務,您仍可以快速開始深度學習。這項服務可協助您設計複雜的神經網路,然後進行大規模實驗,以部署最佳化機器學習模型。此服務專門設計來簡化訓練模型的流程,也提供隨需應變 GPU 運算叢集來解決運算能力需求。您也可以整合 TensorFlow、Caffe、Torch 和 Chainer 等熱門開放原始碼 ML 架構,以訓練多個 GPU 上的模型並加速產生結果。在 IBM Watson Studio 上,您可以結合 AutoML、IBM AutoAI 及深度學習服務,以加速實驗、分析結構化和非結構化資料,以及更快部署更好的模型。

開放原始碼套件

對 AutoML 的需求導致開發可由資料科學專家和非專家使用的開放原始碼軟體。 領先的開放原始碼工具包括 auto-sklearn、auto-keras 和 auto-weka。 IBM Research 協助 Lale(IBM 外部鏈結),這是 Python 程式庫,它延伸 scikit-learn 的功能,以支援廣泛的自動化,包括演算法選擇、超參數調整和拓蹼搜尋。如來自 IBM Research 的論文 (PDF, 1.1 MB) 所述,Lale 的工作方式是自動產生已建立 AutoML 工具的搜尋空間。實驗證明,這些搜尋空間的成效與最先進的工具相比具有競爭力,同時提供更多的通用性。

文件和支援

說明文件

在 IBM Watson Studio 說明文件中快速尋找答案。

支援

開始使用 IBM 技術支援。

社群

從 IBM Watson Studio 的其他使用者身上取得技術情報。

開始使用 AutoAI

嘗試搭配 IBM Watson Studio on IBM Cloud Pak for Data 使用 AutoAI。