AutoAI モデルの作成

AutoAI は、データを自動的に準備し、アルゴリズムを適用し、データとユース・ケースに最適なモデル・パイプラインを作成します。 機械学習モデルとして保存できるモデル・パイプラインを生成する方法について説明します。

以下のステップに従って、データをアップロードします。AutoAI によって、データとユース・ケースに最適なモデルが作成されます。

  1. 入力データの収集
  2. AutoAI ツールのオープン
  3. モデルとトレーニング・データの詳細を指定し、 AutoAI を開始します
  4. 結果の表示

入力データの収集

トレーニングデータを収集し、準備してください。 許可されているデータソースの詳細については、 「 AutoAI の概要」 を参照してください。

AutoAI ツールのオープン

ユーザーの利便性を考慮して、 AutoAI モデルの作成では、データの保管とモデルの結果の保存に、プロジェクトに関連付けられたデフォルトのストレージが使用されます。

  1. プロジェクトを開いてください。

  2. 「アセット (Assets)」タブをクリックします。

  3. 新規 資産 > 機械学習モデルを自動的に構築する をクリックします。

注: AutoAI 資産 を作成すると、その資産は、 **AutoAI エクスペリメント** セクションのプロジェクトの 資産 ページに表示されるため、その資産に戻ることができます。

実験の詳細の指定

  1. 実験の名前と説明を指定します。

  2. 計算構成を選択して、「作成」をクリックします。 計算構成は、実験を行うために割り振るコンピューティング・リソースを指定します。 サイズを大きくすると、トレーニング速度が向上しますが、大きなデータ・ソースの場合は必要になりますが、小さい構成よりもコストが高くなります。

  3. プロジェクトからデータを選択するか、ファイルシステムまたはアセットブラウザからデータをアップロードし、 「続行」 をクリックしてください。 プレビューアイコンをクリックして、データを確認してください。 (オプション) トレーニング済みパイプラインをテストするためのホールドアウト・データとして 2 番目のファイルを追加します。

  4. 実験で予測するデータについて、「予測する列 (Column to predict)」を選択します。

    • AutoAI は、データ・セットのサブセットの分析に基づいて、デフォルトのモデル・タイプ (二項分類、多クラス分類、または回帰) を選択します。 2 つの値を取ることができるターゲット列の場合、「バイナリー」が選択されます。 多クラスには、 3 つ以上の値の離散セットがあります。 回帰には、目標列に連続型数値変数があります。 オプションで、この選択をオーバーライドできます。

      注: 分類する値の制限は 200 です。 予測列に多数の固有値を持つ分類エクスペリメントを作成すると、リソースが大量に消費され、エクスペリメントのパフォーマンスとトレーニング時間に影響します。 エクスペリメントの品質を維持するために、
      - AutoAI は、最適化のためのデフォルトの メトリック を選択します。 例えば、バイナリー分類モデルのデフォルトの メトリック は *Accuracy* です。
      - デフォルトでは、トレーニング・データの 10% がモデルのパフォーマンスをテストするために保持されます。
  5. (オプション): AutoAI 実行のオプションを表示またはカスタマイズするには、 「エクスペリメント設定」 をクリックします。 エクスペリメント設定について詳しくは、『 分類エクスペリメントまたは回帰エクスペリメントの構成』』を参照してください。

  6. 「実験の実行 (Run Experiment)」をクリックして、モデル・パイプラインの作成を開始します。

インフォグラフィックには、ご使用のデータ用のパイプラインの作成が示されます。 このフェーズの所要時間は、データ・セットのサイズによって異なります。 通知メッセージによって、処理時間が短くなるか長くなるかが通知されます。 パイプラインの構築中に、製品の他の部分で作業を行うことができます。

結果の表示

パイプライン生成プロセスが完了したら、ランク付けされたモデル候補を表示し、それらを評価してから、パイプラインをモデルとして保存できます。

次のステップ