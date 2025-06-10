不確実性には、主に、データ駆動型の不確実性とモデル駆動型の不確実性の2つのタイプがあります。いずれの場合でも、予測を行う前と行った後に、予測の信頼性を知ることが役に立ちます。

これは、およそプラスまたはマイナス1000回のオペレーションに失敗するまでにドアのヒンジが開閉できる回数を予測するモデルと考えることができます。また、今回ドアのヒンジを閉じると破損したという可能性を示すこともできます。

サンプリング・ベースの手法

サンプリング・ベースの手法は、あらゆる種類のモデルの複雑さに対応でき、直感的で包括的な不確実性の特徴付けができるため、不確実性の定量化に最も一般的に使用される手法の1つです。サンプリングによって多くのシナリオが生成されるため、現実世界のデータに適用したときにどのような結果が得られる可能性があるか、および予測がどの程度不確実であるかについての統計的な全体像を構築できます。これらの方法では、不確実性を分析的に計算するのではなく、多くのサンプルのアウトプットの統計分析を使用して不確実性の分布を特徴付けます。

モンテカルロ・シミュレーションは、最も一般的なアプローチの1つです。これは、ランダムに変化したインプットを使用して何千ものモデル・シミュレーションを実行し、可能な出力の範囲を確認します。これらは、可能なすべての値の範囲を確認するためにさまざまなモデルの信頼区間と出力を比較するパラメトリック・モデルで特に一般的です。

ラテン・ハイパーキューブ・サンプリングと呼ばれるモンテカルロ・シミュレーションのバリエーションは、インプット領域を適切にカバーしながら、必要な実行数が少なく、より効率的なバージョンです。

モンテカルロ・ドロップアウトは別の手法であり、予測中にドロップアウトをアクティブに保ち、複数のフォワード・パスを実行してアウトプットの分布を取得するものです。2ドロップアウトは主に正則化手法として使用され、機械学習モデルをファイン・チューニングするために使用される方法です。過剰適合や過小適合の問題を回避しながら、調整済み損失関数を最適化することを目的としています。

モンテカルロ・ドロップアウトは、テスト時にドロップアウトを適用し、異なるドロップアウト・マスクを使用して複数のフォワード・パスを実行します。これにより、モデルは単一点の推定ではなく、予測の分布を生成します。この分布は、予測に関するモデルの不確実性についての洞察を提供します。これは、ネットワークを複数回トレーニングする必要がなく、ニューラル・ネットワークを出力分布に導くための計算効率の高い手法です。

実際のモデルを何度も実行するのにコストがかかりすぎる場合、統計学者はガウス過程回帰（GPR）などの手法を使用して、簡略化された「代替」モデルを作成します。5GPRは、予測の確実性をモデル化するベイズ的アプローチであり、最適化、時系列予測、その他のアプリケーションにとって貴重なツールとなります。GPRは、結合ガウス分布を持つランダム変数の集合である「ガウス・プロセス」の概念に基づいています。

ガウス過程は関数の分布と考えることができます。GPRでは、関数全体に事前分布を配置し、観測されたデータを使用して事後分布を作成します。GPRを使用して不確実性を計算する際には、追加のトレーニングやモデルの実行が不要です。アウトプットは本質的に、分布を通じてモデルが推定値についてどの程度確実または不確実であるかを表しているからです。Scikit-learnのようなライブラリーでは、不確実性分析のためのGPRの実装を提供します。

サンプリング方法の選択は、モデルやシナリオにとって最も重要な特徴量によって異なります。ほとんどの実際のアプリケーションでは、複数のアプローチが組み合わされます。

ベイズ法

ベイズ統計は、ベイズの定理を使用して事前信念と観測データを組み合わせ、仮説の確率を更新する統計的推論へのアプローチです。ベイズ統計は、単一の固定値ではなく確率分布を割り当てることにより、不確実性に明示的に対処します。ベイズ法では、モデルパラメーターに対して単一の「最良」推定値を与えるのではなく、あり得る推定値の尤度の分布を提供します。

ベイズ推定は、新しいデータが利用可能になるたびに予測を更新するため、共変量を推定するプロセス全体に自然と不確実性が組み込まれます。マルコフ連鎖モンテカルロ（MCMC）法は、数学的解が複雑な場合にベイズ推定アプローチを導入するのに役立ちます。MCMCアプローチは、直接サンプリングできない複雑な高次元確率分布（特にベイズ推定における事後分布）からサンプリングします。

ベイズ・ニューラル・ネットワーク（BNN）は、ネットワークの重みを固定点推定ではなく確率分布として扱う従来のニューラル・ネットワークから脱却したものです。この確率的アプローチにより、原則に基づいた厳密な不確実性の定量化が可能になります。重みの単一点推定の代わりに、すべてのネットワーク・パラメーターにわたって確率分布を維持します。通常、予測には次のものが含まれます。

予測分布の平均および分散の推定

予測分布からのサンプル

分布から導出された信頼できる区間

PyMCやTensorflow-Probabilityなど、BNNを実装するための人気のあるオープンソース・ライブラリがいくつか存在します。

アンサンブル方式

アンサンブルベースの不確実性の定量化の中核となる考え方は、独立にトレーニングされた複数のモデルが予測で不一致を示した場合、この不一致は正解の不確実性を示すというものです。4逆に、アンサンブル内のすべてのモデルが一致した場合、予測の信頼度が高いことを示します。この直感は、アンサンブル予測の差異や広がりを通じて、具体的な不確実測定につながります。

f₁、f₂、...、fₙがインプットxに対するN個のアンサンブル・メンバーの推定値を表す場合、不確実性は次のように定量化できます。

V a r [ f ( x ) ] = 1 N ∑ i = 1 N ( f i ( x ) - f ¯ ( x ) ) 2

ここで、f̄(x)はアンサンブル平均です。複数の多様なモデル（異なるアーキテクチャー、トレーニング・データのサブセットまたは初期化）をトレーニングし、それらの予測を組み合わせます。こうした手法の主な欠点は計算コストです。複数のモデルをトレーニングして実行する必要があるということです。

コンフォーマル予測

共形予測は、不確実性を定量化するための手法です。これは、予測区間（回帰シナリオ用）または予測セット（分類アプリケーション用）を作成するための、配布に依存せず、モデルに依存しないフレームワークを提供します。3これにより、モデルまたはデータに関する最小限の仮定で有効なカバレッジが保証されます。これにより、共形予測は、特にブラックボックスで事前トレーニングされたモデルを使用する場合に役立ちます。

適合型予測には、広く適用できる特徴量がいくつかあります。例えば、データ・ポイントが独立して同一に分散されていることは必要なく、データ・ポイントが交換可能であることのみを必要とします。適合型予測はあらゆる予測モデルにも適用でき、モデルの許容可能な予測不確実性を設定できます。

たとえば、回帰タスクでは、95％のカバレッジを達成したい場合、モデルは真が出力間隔の95％に該当する範囲を出力する必要があることを意味します。このアプローチはモデルに依存せず、分類、線形回帰、ニューラル・ネットワーク、およびさまざまな時系列モデルの広範な種類とともにうまく機能します。

適合性予測を使用するには、データをトレーニング・セット、ベースライン・テスト・セット、および調整セットの3つのセットに分割します。キャリブレーションセットは、不適合スコアを計算するために使用され、多くの場合、s i として表されます。このスコアでは、予測がどれほど異常であるかを測定します。新しい入力があれば、これらのスコアに基づいて予測間隔を形成し、対象範囲を保証します。

分類タスクにおける共適合予測の非適合性スコアは、新しいインスタンスがトレーニング・セット内の既存のインスタンスからどの程度逸脱しているかを示す尺度です。これにより、新しいインスタンスが特定のクラスに属するかどうかが判断されます。マルチクラス分類の場合、これは通常1—特定ラベルの予測クラス確率という式で表されます。

s i = 1 - f ( x i ) [ y i ]

したがって、新しいインスタンスが特定のクラスに属する予測確率が高い場合、不適合スコアは低くなり、その逆も同様です。一般的なアプローチは、調整セット内の各インスタンスのs i スコアを計算し、スコアを低（確実）から高（不確実）まで分類することです。

95%のコンフォーマル・カバレッジを得るには、s i スコアの95% がより低くなる閾値qを計算します。新しいテスト例について、そのs iが 閾値qより小さい場合、ラベルを予測セットに含めます。

モデルのコンフォーマル・カバレッジが95%であることを保証する必要がある場合は、すべてのクラスの平均s i スコアを取得します。次に、データの95%を含むs i スコアのしきい値が見つかります。これにより、分類子がすべてのクラスの新しいインスタンスの95%を正確に識別していることを確認できます。

コンフォーマル予測によって複数のクラスが識別される場合があるため、これは分類器の精度とは少し異なります。マルチクラス分類器では、コンフォーマル予測によってすべてのクラスのカバレッジも表示されます。トレーニング・セット全体ではなく、個々のクラスに対してカバレッジ率を割り当てることができます。