IBMがリーダーに

Gartner社が、データサイエンスと機械学習プラットフォーム分野の2021年マジック・クアドラントを発表しました。

AutoMLからAutoAIへ

AIとモデルのライフサイクル管理の加速

AutoMLとは自動化された機械学習(AutoML)は、機械学習モデル(MLモデル)を構築してトレーニングする際にデータサイエンティストが行わなければならない手動タスクを自動化するプロセスです。 これらのタスクには、フィーチャーのエンジニアリングと選択、機械学習アルゴリズムのタイプの選択、アルゴリズムに基づく分析モデルの構築、ハイパーパラメーターの最適化、テストされたデータ・セットでのモデルのトレーニング、スコアと検出結果の生成のためのモデルの実行が含まれます。 データサイエンティストが、MLモデルに関する深い専門知識なしに予測モデルを構築できるように、研究者がAutoMLを開発しました。 AutoMLはまた、機械学習のパイプライン構築に関わる決まりきったタスクからデータサイエンティストを解放して、重要なビジネス上の問題を解決するために必要な洞察を引き出すことに集中できるようにします。

AutoAIとは何ですか。AutoAIはAutoMLのバリエーションです。 モデル構築の自動化をAIライフサイクル全体に拡張します。 AutoMLと同様に、AutoAIは予測機械学習モデルを構築するステップにインテリジェントな自動化を適用します。 これらのステップには、トレーニング用のデータ・セットの準備、所定のデータに最適なモデル・タイプの識別(分類モデルまたは回帰モデルなど)、モデルが解決する問題を最適にサポートするデータ列の選択(フィーチャー選択と呼ばれます)が含まれます。 自動化は次に、モデル候補のパイプラインを生成して正確度や適合率などのメトリックに基づいてそれらをランク付けする際に、最適な結果を達成するためにさまざまなハイパーパラメーター調整オプションをテストします。 最高のパフォーマンスのパイプラインを実動に適用することで、新しいデータを処理し、モデル・トレーニングに基づいて予測を提供できます。

機能のクイック比較

AutoAIとAutoMLの比較

統合対象 AutoAI AutoML
データの準備
フィーチャー・エンジニアリング
ハイパーパラメーターの最適化
自動モデル・デプロイメント
ワンクリック・デプロイメント
モデルのテストとスコアリング
コードの生成
サポート対象:
バイアス緩和とドリフト軽減
モデル・リスク管理
AIライフサイクル管理
トランスファー・ラーニング
任意のAIモデル
高度なデータ加工(Data Refinery)

AutoAIが重要な理由

インテリジェントな自動化がすべてのユーザーを強化

AutoAIの活用方法

ModelOpsの構築

1つの書類を見て打ち合わせしている3人の従業員

ModelOpsの構築

データサイエンティストとDevOpsの間のコラボレーションを促進して、AIモデルのアプリケーションへの統合を最適化します。

責任ある説明可能なAIの育成

オフィスのデスクトップ・モニターの左方を見ている従業員

責任ある説明可能なAIの育成

実動AIにおける信頼性の構築の重要性を検討しながら、結果を迅速に取得し、リスクとコンプライアンスを管理します。

時系列予測の自動化

書類とノートPCを使用して打ち合わせしている2人の従業員

時系列予測の自動化

1つのクラスだけでなく、可能なすべてのモデル・クラスから最高のパフォーマンス・モデルを組み込むことによって、モデルが時系列の将来の価値を予測する方法を説明します。

AutoAIの機能

モデルのライフサイクルの主要なステップを自動化

データの前処理

機械学習用に生データを分析、クリーニング、準備するために、さまざまなアルゴリズムまたは推定法を適用します。 データ・タイプ(カテゴリーまたは数値など)に基づいて、自動的にフィーチャーを検出してカテゴリー化します。 ハイパーパラメーターの最適化を使用して、欠損値の補完、フィーチャーのエンコード、フィーチャーのスケーリングに関する最善の戦略を決定します。

自動モデル選択

データの小さいサブセットに対して候補アルゴリズムをテストしてランク付けすることにより、モデルを選択します。 最も有望なアルゴリズムに対して、サブセットのサイズを徐々に大きくします。 データに最適に一致するモデル選択のために、多数の候補アルゴリズムのランク付けを可能にします。

フィーチャー・エンジニアリング

最も正確な予測を実現するために、問題を最もよく表しているフィーチャーの組み合わせに生データを変換します。 強化学習を使用してモデルの精度の最大化を進めながら、構造化された消耗しない方法で、さまざまなフィーチャーの構築の選択肢を検討します。

ハイパーパラメーターの最適化

機械学習で標準的なモデル・トレーニングとスコアリングを使用して、モデル・パイプラインを精製して最適化します。 パフォーマンスに基づいて実動環境への導入に最適なモデルを選択します。

モデル・モニター統合

モデルの入出力の詳細、トレーニング・データ、ペイロード・ロギングによって、モデルのドリフト、公平性、品質に関するモニタリングを統合します。 直接と間接のバイアスを分析しながら、パッシブまたはアクティブなバイアス緩和を実施します。

モデル検証サポート

モデルとデータの洞察を使用して拡張し、モデルが期待どおりのパフォーマンスを達成するかどうかを検証します。モデルの品質を測定し、モデルのパフォーマンスを比較することで、モデルを継続的に改善します。

AutoAIのパワーを活用

IBM Watson StudioでのAutoAIの実例

AutoAIの構成

データ・ソースを追加し、AutoAIの実験のための構成の詳細を選択している、IBM Watson Studioのスクリーン・ショット

AutoAIの構成

.csvファイルをドラッグし、列を選択して予測します。

パイプラインのリーダーボード

関係マップとパイプラインのリーダーボードを表示しているIBM Watson Studioのスクリーン・ショット

パイプラインのリーダーボード

モデルの正確度をランク付けし、パイプライン情報を表示します。

モデルの評価

モデル評価指標のリストを含む、パイプラインのモデル評価を表示しているIBM Watson Studioのスクリーン・ショット

モデルの評価

正確度、適合率、再現率を検討してモデルを評価します。

モデルの導入

テストを導入スペースにプロモートしているところを示す、IBM Watson Studioのスクリーン・ショット

モデルの導入

モデルを導入スペースにプロモートします。

お客様導入事例

Regions銀行が信頼できるAIを開発

IBM Cloud Pak for Dataを使用してデータを分析し、データのドリフトを評価し、モデルのパフォーマンスを測定することによって、この銀行が得たメリットをご覧ください。

Highmark Health社がモデルの構築時間を90%削減

この医療ネットワークが保険請求データを使用する予測モデルを構築し、敗血症を起こしやすい患者を特定した方法をご覧ください。

Wunderman Thompson社がAIを再考

このマーケティング通信社がAutoAIを使用して大量の予測を推進し、新規顧客を特定している方法をご覧ください。

IBMのAutoAIをお勧めする理由

IBM Researchによる集中開発

IBM Researchチームは、AI、ML、データ管理からの最先端の技術を適用して、機械学習とデータサイエンスのワークフローの作成を迅速化して最適化することに取り組んでいます。 このチームのAutoMLに関する最初の取り組みは、ハイパーパラメーター探索にハイパーバンド/ベイジアン最適化を、ニューラル・アーキテクチャー探索にハイパーバンド/ENAS/DARTSを使用することに焦点を合わせました。

これまでに、パイプラインの構成とハイパーパラメーターの最適化の自動化を含む、AutoAIの開発に注力し続けてきました。 重要な機能拡張として、モデルのトレーニングやスコアリングなどのコスト機能評価用に最適化された、ハイパーパラメーター最適化アルゴリズムがあります。 これは最善の解決策への集中を促進するのに役立ちます。

また、IBM Researchは、AIモデルの信頼性と説明可能性を保証するために、自動化されたAIを適用しています。 IBM Watson StudioでAutoAIを使用すると、データ準備からアルゴリズム選択、モデル作成までのプロセスの各ステージの可視化を、ユーザーが見ることができます。 さらに、IBM AutoAIは、モデルを継続的に改善するためのタスクを自動化し、ModelOps機能を使用してAIモデルAPIをアプリケーションに統合しやすくします。 IBM Watson Studio製品内でのAutoAIの進化により、IBMはGartner社によるデータサイエンスと機械学習のプラットフォーム分野の2021年マジック・クアドラントでリーダーと評価されました。

詳細

AutoMLとディープ・ラーニング

ディープ・ラーニングは機械学習の1つのサブフィールドであり、人間の介入なしに分析的タスクや物理的タスクを実行するAIアプリケーションとサービスを支えることで知られています。 ディープ・ラーニングのユースケースの例には、チャットボット、医療用画像認識テクノロジー、不正検出などがあります。 しかし、機械学習と同様に、ディープ・ラーニング・アルゴリズムの設計と実行には、膨大な量の人間の労力と計算能力が必要となります。

IBM Researchチームは、ディープ・ラーニングにおいて最も複雑で時間のかかるプロセスの1つである、 ニューラル・アーキテクチャー検索(NAS)と呼ばれる技法によるニューラル・アーキテクチャーの作成を探究しました。 チームは、開発されたNASメソッドを検討し、実践者が適切な方法を選択できるように支援することを目的として、それぞれのメリットを提示しました。 機械学習モデルの最も優れたアーキテクチャーを見つけるためのアプローチを自動化することで、AIの民主化が促進される可能性がありますが、問題は複雑であり、解決するのは困難です。

IBM Watson Studio内でディープ・ラーニング・サービスを使用すれば、ディープ・ラーニングを迅速に開始できるようになります。 このサービスは、複雑なニューラル・ネットワークを設計し、その後大規模に実験して、最適化された機械学習モデルを導入するのを支援します。 このサービスは、モデルのトレーニングのプロセスを簡素化するよう設計されており、計算能力の要件に対応するためのオンデマンドのGPU計算クラスターも提供します。 また、人気のあるオープンソースMLフレームワーク(TensorFlow、Caffe、Torch、Chainerなど)を統合して、複数のGPU上でモデルをトレーニングし、結果を加速することもできます。 IBM Watson Studioでは、AutoML、IBM AutoAI、ディープ・ラーニング・サービスを組み合わせることで、実験を加速し、構造化データと非構造化データを分析し、より優れたモデルを迅速に導入できます。

オープンソース・パッケージ

AutoMLの需要の拡大によって、データサイエンスの専門家や専門家以外の人が利用できるオープンソース・ソフトウェアの開発が行われることになりました。 主なオープンソース・ツールには、auto-sklearn、auto-keras、auto-wekaなどがあります。 IBM Researchは、scikit-learn機能を拡張するPythonライブラリーであるLale(IBM外部へのリンク)に貢献し、アルゴリズム選択、ハイパーパラメーター調整、トポロジー検索などの、幅広い自動化をサポートしています。 IBM Researchからの資料(PDF、1.1 MB)に記載されているように、Laleは確立されたAutoMLツール用の検索スペースを自動的に生成することによって機能します。 これらの検索スペースは、多機能を提供しながら、最先端のツールと競争できる結果を達成することが実験により示されています。

資料とサポート

資料

IBM Watson Studioの資料で素早く答えを見つけることができます。

サポート

IBMからのテクニカル・サポートが受けられます。

コミュニティー

IBM Watson Studioの他のユーザーから技術的なヒントが得られます。

AutoAIの概要

IBM Cloud Pak for Data上のIBM Watson StudioでAutoAIをお試しください。