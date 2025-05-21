偏りと分散のトレードオフの数学的基礎を掘り下げていきます。前の例で示したとおり、目的は予測値と実際の値の合計誤差を削減することです。この誤差は、バイアス、分散、不可逆誤差の3つのコンポーネントで構成されています。モデルの予想二乗予測誤差は次のように分析できます。

f^(x)

真関数：f(x)と比較すると、

ここでは、 f^(x)はトレーニング・データセットDから学習され、xは真の（未知の）関数です。

次に：

y=f(x)+ε,ε∼N(0,σ2)

関数 y=f(x)+ε の場合、誤差（ ε で表される）は平均0と分散 σ2 （ σ は分布の標準偏差

f^(x) は、インプット x でのモデルの予測値です。

複数の異なるトレーニング・データセット D とノイズ ε に対して期待値（または平均）が取得されます。記号Eは、「期待」または「期待値」を表すために使用され、分布の平均の真の値です。

ここでの関心は単一点 x において期待される予測誤差です：

ED,ε[(y-f^(x))2]

代入します：

y=f(x)+ε を示す）で正規分布します。

これを表す表現は次のとおりです。

=ED、ε[(f(x)+ε-f^(x))2]

正方形を広げると、

$=ED,ε[(f(x)-f^(x))2+2(f(x)-f^(x))ε+ε2]$

線形性を使用して期待値を分割します（線形性とは単純な代数概念、例：E[A+B]=E[A]+E[B]）。

=ED[(f(x)-f^(x))2]+2ED,ε[(f(x)-f^(x))ε]+Eε[ε2]

ここで、

E[ε]=0⇒E[(f(x)-f^(x))ε]=0

E[ε2]=σ2

結果す：

ED[(f(x)-f^(x))2]+σ2