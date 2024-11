スコアベースの生成モデル



Sohl-Dicksteinの研究とは別に、Yang SongとStefano Ermonは2019年の論文「Generative Modeling by Estimating Gradients of the Data Distribution」で、 ノイズ条件付きスコア・ネットワークと呼ばれる一種のエネルギー・ベース・モデル(リンク先はibm.com外)を開発しました。このアルゴリズムは、確率密度関数の対数の勾配 (∇ x )をモデル化したものです。(対数: l o g 、確率密度関数: P ( X ) )。確率密度関数の勾配は、次のように記述されます。 ∇ X log P ( X ) これはSteinスコア 、あるいはシンプルに「スコア関数」と呼ばれます。

従来の確率密度関数とは異なり、スコア関数は確率密度を直接モデル化したものではない(したがって全確率を 1 に正規化する必要がない)ため、正規化定数が必要ありません。代わりに、スコア・マッチングを通じたトレーニングを行います。 ここではモデルがパラメーターθを学習することで、 スコア(つまり勾配)が学習データのデータ分布 q ( x )と一致する p θ ( x )を得ることができます。

このようなスコアベースの生成モデル(SGM)のもう1つの利点は、尤度ベースのモデルとは異なり、 p θ ( x )のモデル・アーキテクチャーに多くの制限がかからないということです。

SongとErmonは、自分たちのモデルの性能を向上させる方法を模索し、偶然にもSohl-Dicksteinらが採用したのと同じ手法にたどり着きました。彼らの論文では、「ランダムなガウスノイズでデータを乱すと、データ分布はコアベースの生成モデリングにさらに適したものになる」と述べられています。彼らのモデルは、当初は画像セグメンテーションのために開発されたU-Net アーキテクチャを使用して構築され、同様にランジュバン動力学を応用してサンプルを生成していました。