Pada tahun 2020, Ho dkk mengusulkan penggunaan pendekatan Sohl-Dickstein untuk menghasilkan gambar berkualitas tinggi dengan menggunakan inferensi variasi dalam makalah penting mereka, “Denoising diffusion probabilistic models” (DDPM). Makalah mereka menunjukkan bahwa memaksimalkan batas bawah bukti (ELBO)—cara untuk menulis ulang masalah optimasi berbasis probabilitas agar dapat dilacak—untuk melatih model difusi pada dasarnya setara dengan kombinasi tujuan pencocokan skor yang digunakan untuk melatih SGM.
Menerapkan pendekatan Sohl-Dickstein dengan menggunakan pencocokan skor, Ho et al menunjukkan bahwa model probabilistik difusi dapat menghasilkan kualitas gambar yang bersaing dengan GAN, yang pada saat itu merupakan model yang paling canggih. Hubungan ini dieksplorasi lebih lanjut oleh Song, Ermon, Sohl-Dickstein, dan lainnya-termasuk Diederik P. Kingma, pencipta VAE-dalam makalah tahun 2021, “Score-Based Generative Modeling through Stochastic Differential Equations.”
Kemudian pada tahun yang sama, Dhariwal dan Nichol, dengan memanfaatkan insight dari makalah yang disebutkan sebelumnya, menerbitkan “Diffusion Models Beat GANs on Image Synthesis,” yang secara tegas menetapkan model difusi sebagai model mutakhir yang baru.
DDPM, alih-alih SGM, umumnya tetap menjadi mode dominan dari model difusi, meskipun dengan perbaikan yang dipelopori melalui penelitian berikutnya. Sebagai contoh, makalah tahun 2022 yang berpengaruh, “High-Resolution Image Synthesis with Latent Diffusion Models” menandai kemajuan penting dalam hal efisiensi dan efektivitas biaya.