機械学習を使用したモデリングは、不確実性のために存在します。入力を出力に完全にマッピングできれば、モデルは必要ありません。しかし、現実のデータは乱雑で、不完全で、ノイズが多いため、確実性ではなく尤度をモデル化します。確率について学ぶことで、機械学習と人工知能（AI）すべての基礎が築かれます。確率の理論は、美しくエレガントな方法でモデル化するために使用したデータを理解することを可能にします。これは、MLモデル予測の不確実性において重要な役割を果たします。統計モデルの尤度、確率、確実性を定量化するのに役立つため、作成した結果モデルを自信を持って測定できるようになります。確率の世界を掘り下げ、基礎を学ぶことで、すべての統計学習モデルの基礎とその予測がどのようになるかを確実に理解することができます。推論を行い、確率的な結果を生み出す方法を学びます。

一般的な分布を学習し、自信を持ってデータをモデル化するために、基本を理解し、いくつかの用語を解説します。

確率変数：ランダムな現象の結果を数値で表したもの。これは、可能な値がランダムなプロセスの数値結果である変数です。

離散確率変数：有限または可算的に無限の固定値を取り得る確率変数。例えば、コイン投げの結果（表：1、裏：0）や1時間に受信したスパムEメールの数などです。

連続確率変数：与えられた範囲内で任意の値を取り得る確率変数。例えば、人の身長、部屋の温度、降雨量などです。

事象：ランダムなプロセスによる1つ以上の結果の集合。例えば、サイコロを転がしてときに出る偶数（結果：2、4、6）や顧客離れ。

結果：ランダムな実験の可能性のある単一の結果。例えば、コインを投げると「表」または「裏」のいずれかが生成されます。

確率 P ( A ) ：イベントが発生する可能性を示す数値 A 0（不可能）から1（確実）の範囲で発生する

条件付き確率 P ( A | B ) ： イベントの発生確率。 A をイベントとします。 A すでに発生している特定の特徴量を用いて結果を予測することが多いため、MLではこのステップが非常に重要です。

確率とは、ある事象が起こる可能性を0（ありえない）から1（確実）までの間で測定します。

機械学習では、多くの場合条件付き確率の形式をとります。

例：ロジスティック回帰モデルでは、次のことができます。

> 「特定年齢=45歳、収入=6万米ドル、および前歴、

> 解約の確率は0.82です」

このサンプルは、顧客が解約することを意味するのではなく、トレーニング・データの統計パターンに基づく信念です。

生成AIが活躍する現代では、回帰などの確率モデルが、成果とアウトプットの決定に大きな役割を果たします。この役割は、多くの場合、ニューラル・ネットワークの層で活性化関数の形をとります。