IBMニュースレター
The DX Leaders
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
ブースティングでは、データのランダムなサンプルを選択し、モデルに合わせて準備し、連続的にトレーニングを行います。つまり、各モデルはその前のモデルの弱点を補おうとします。反復するたびに、個々の分類子の弱いルールが組み合わされて、1つの強力な予測ルールが形成されます。
アンサンブル学習は、1人の専門家の判断よりも大人数による意思決定の方が一般に優れていることを示唆する「群衆の叡智」の考え方に基づいています。アンサンブル学習はこの考えに従い、ベースとなる複数の学習器(モデル)を組み合わせたグループ(アンサンブル)を協調させることで、最終的な予測の精度を高めます。ベース学習器や弱学習器と呼ばれる単一のモデルは、単体では高バリアンスまたは高バイアスとなってうまく機能しない場合があります。しかし、複数の弱学習器を組み合わせると、バイアスやバリアンスが抑えられ、より強力な学習器が得られることから、モデルの性能が向上します。
アンサンブル学習の手法は、説明のために決定木がよく用いられます。決定木が剪定されていない場合には、このアルゴリズムは過学習(高バリアンスかつ低バイアス)を起こしやすくなります。逆に、例えば1レベルの決定木である決定株のように、決定木が非常に小さい場合には、学習不足(低バリアンスかつ高バイアス)となる可能性があります。トレーニング・データ・セットに対する過学習または学習不足が生じたアルゴリズムは、新しいデータ・セットに対して適切に汎用化できません。この問題に対処し、新しいデータ・セットに対するモデルの汎用化を可能にするために、アンサンブル学習の手法を利用します。決定木は高バリアンスまたは高バイアスとなる場合があります。しかし、バイアスとバリアンスのトレードオフにおける「スイート・スポット」を見つけるためにアンサンブル学習を活用するモデリング手法は、決定木だけではないという点に留意する必要があります。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
バギングとブースティングは、アンサンブル学習の主要な2つの手法です。こちらの研究が示すように、この2つの学習手法の主な違いはトレーニング方法にあります。バギングでは、弱学習器のトレーニングを並列的に実行します。一方ブースティングでは、直列的に学習を実行します。つまり、一連のモデルを構築する中で、新しいモデルの学習を反復するごとに、前のモデルで誤分類されたデータに重みを加えます。この重みの再配分は、性能向上の焦点となるパラメーターをアルゴリズムが特定するうえで役立ちます。このタイプの最初のアルゴリズムの1つであるAdaBoostは、最もよく使用されるブースティング・アルゴリズムの1つとなっています。AdaBoostは「アダプティブ・ブースティング・アルゴリズム」の略です。その他のブースティング・アルゴリズムには、XGBoost、GradientBoost、BrownBoostなどがあります。
バギングとブースティングのもう1つの違いは、その使用方法です。例えば、バギングの手法は通常、高バリアンスで低バイアスの弱学習器に対して用います。一方ブースティング手法は、低バリアンスで高バイアスの場合に活用されます。実際にはデータ・セットによって異なりますが、バギングは過学習を回避するために使用でき、ブースティング手法では過学習が発生しやすくなりますただし、パラメーターを調整することで問題を回避できます。
その結果、バギングとブースティングの実際の用途も異なります。バギングはローン承認プロセスや統計ゲノミクスに活用されてきましたが、ブースティングは画像認識アプリや検索エンジンでより多く使用されています。
ブースティングの手法は、弱学習器を繰り返し組み合わせて、より正確な結果を予測できる強学習器を構築することに重点を置いています。弱学習器は、無作為な推測よりもわずかに適切にデータを分類します。このアプローチは、予測の問題に対して確実な結果をもたらすだけでなく、画像検索などのタスクでニューラル・ネットワークやサポート・ベクター・マシンよりも優れた性能を発揮します。
ブースティング・アルゴリズムは、逐次プロセス中に弱学習器を作成、集約する方法が異なる場合があります。一般的なブースティング手法には次の3つがあります。
分類や回帰の問題にブースティングの手法を利用する場合、いくつかの重要なメリットと課題があります。
ブースティングの主要なメリットは次のとおりです。
ブースティングの主な課題は次のとおりです。
ブースティング・アルゴリズムは、次のような幅広い業界の人工知能プロジェクトに適しています。
医療:ブースティングは、心血管リスク因子やがん患者の生存率の予測など、医療データ予測の誤りを減らすために使用されます。例えば、研究では、アンサンブル法により、心血管疾患の予防的治療の恩恵を受ける可能性のある患者を特定する精度が大幅に向上すると同時に、他の患者への不必要な治療を回避できることが示されています。同様に、別の研究では、複数のゲノミクスプラットフォームにブースト適用することで、がんの生存時間予測を改善できることが判明しました。
AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。
業界をリードするIBMのAI専門知識とソリューション製品群を使用すれば、ビジネスにAIを活用できます。
AIの導入で重要なワークフローと業務を再構築し、エクスペリエンス、リアルタイムの意思決定とビジネス価値を最大化します。