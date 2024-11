基于分数的生成模型



与 Sohl-Dickstein 的论文无关,Yang Song 和 Stefano Ermon 在他们 2019 年的论文《Generative Modeling by Estimating Gradients of the Data Distribution》中开发了一种基于能量的模型(ibm.com 外部链接),称为噪声条件分数网络。他们的算法对对数 (log) 概率密度函数 p(x) 的梯度 (∇ x ) l o g 进行了建模。 p ( X ) 对数概率密度函数的梯度写为 ∇ X log p ( X ) ,该函数称为 Stein 分数或简称为“分数函数”。

与传统的概率密度函数不同,分数函数不需要归一化常数,因为它们不直接进行概率密度建模(因此不必将总概率归一化为 1)。相反,它们通过分数匹配进行训练:学习模型参数 θ,从而生成模型 p θ (x),其分数(换句话说,其梯度)与训练数据的数据分布 q(x) 相匹配。

这种基于分数的生成模型 (SGM) 的另一个优点是,与基于似然的模型不同,它们不会对 p θ (x) 的模型架构施加太多限制。

在探索提高模型性能的方法时,Song 和 Ermon 不约而同地采用了与 Sohl-Dickstein 等人相同的技术。他们的论文指出,“用随机高斯噪声扰动数据使得数据分布更适合基于分数的生成建模。”他们的模型使用U-Net 架构(最初为图像分割开发)构建而成,同样应用了朗之万动力学来生成样本。