AutoAI モデルの作成
AutoAI は、データを自動的に準備し、アルゴリズムを適用し、データとユース・ケースに最適なモデル・パイプラインを作成します。 機械学習モデルとして保存できるモデル・パイプラインを生成する方法について説明します。
以下のステップに従って、データをアップロードします。AutoAI によって、データとユース・ケースに最適なモデルが作成されます。
入力データの収集
トレーニングデータを収集し、準備してください。 許可されているデータソースの詳細については、 「 AutoAI の概要」 を参照してください。
AutoAI ツールのオープン
ユーザーの利便性を考慮して、 AutoAI モデルの作成では、データの保管とモデルの結果の保存に、プロジェクトに関連付けられたデフォルトのストレージが使用されます。
プロジェクトを開いてください。
「アセット (Assets)」タブをクリックします。
新規 資産 > 機械学習モデルを自動的に構築する をクリックします。
実験の詳細の指定
実験の名前と説明を指定します。
計算構成を選択して、「作成」をクリックします。 計算構成は、実験を行うために割り振るコンピューティング・リソースを指定します。 サイズを大きくすると、トレーニング速度が向上しますが、大きなデータ・ソースの場合は必要になりますが、小さい構成よりもコストが高くなります。
プロジェクトからデータを選択するか、ファイルシステムまたはアセットブラウザからデータをアップロードし、 「続行」 をクリックしてください。 プレビューアイコンをクリックして、データを確認してください。 (オプション) トレーニング済みパイプラインをテストするためのホールドアウト・データとして 2 番目のファイルを追加します。
実験で予測するデータについて、「予測する列 (Column to predict)」を選択します。
AutoAI は、データ・セットのサブセットの分析に基づいて、デフォルトのモデル・タイプ (二項分類、多クラス分類、または回帰) を選択します。 2 つの値を取ることができるターゲット列の場合、「バイナリー」が選択されます。 多クラスには、 3 つ以上の値の離散セットがあります。 回帰には、目標列に連続型数値変数があります。 オプションで、この選択をオーバーライドできます。
注: 分類する値の制限は 200 です。 予測列に多数の固有値を持つ分類エクスペリメントを作成すると、リソースが大量に消費され、エクスペリメントのパフォーマンスとトレーニング時間に影響します。 エクスペリメントの品質を維持するために、
- AutoAI は、最適化のためのデフォルトの メトリック を選択します。 例えば、バイナリー分類モデルのデフォルトの メトリック は *Accuracy* です。
- デフォルトでは、トレーニング・データの 10% がモデルのパフォーマンスをテストするために保持されます。
(オプション): AutoAI 実行のオプションを表示またはカスタマイズするには、 「エクスペリメント設定」 をクリックします。 エクスペリメント設定について詳しくは、『 分類エクスペリメントまたは回帰エクスペリメントの構成』』を参照してください。
「実験の実行 (Run Experiment)」をクリックして、モデル・パイプラインの作成を開始します。
インフォグラフィックには、ご使用のデータ用のパイプラインの作成が示されます。 このフェーズの所要時間は、データ・セットのサイズによって異なります。 通知メッセージによって、処理時間が短くなるか長くなるかが通知されます。 パイプラインの構築中に、製品の他の部分で作業を行うことができます。
結果の表示
パイプライン生成プロセスが完了したら、ランク付けされたモデル候補を表示し、それらを評価してから、パイプラインをモデルとして保存できます。
次のステップ
-
- このビデオを視聴して、二項分類モデルの作成方法を確認してください
ビデオの特記事項: このビデオの一部の小さなステップおよびグラフィカル・エレメントは、ご使用のプラットフォームとは異なる場合があります。このビデオでは、この資料の コンセプト とタスクを視覚的に学習する方法を紹介します。