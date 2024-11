Model generatif berbasis skor



Terlepas dari karya Sohl-Dickstein, Yang Song dan Stefano Ermon mengembangkan jenis model berbasis energi (tautan berada di luar ibm.com) yang disebut noise conditional score network dalam makalah mereka pada tahun 2019, “Generative Modeling by Estimating Gradients of the Data Distribution.” Algoritma mereka memodelkan gradien (∇ x ) logaritma ( l o g ) dari fungsi kerapatan probabilitas p ( X ) . Gradien fungsi kerapatan probabilitas log, ditulis sebagai ∇ X log p ( X ) disebut dengan skor Stein atau secara sederhana disebut “score function" atau fungsi skor.

Tidak seperti fungsi kepadatan probabilitas konvensional, fungsi skor tidak memerlukan konstanta normalisasi karena tidak secara langsung memodelkan kepadatan probabilitas (dan oleh karena itu tidak perlu menormalkan probabilitas total ke 1). Sebaliknya, fungsi ini dilatih melalui pencocokan skor: parameter model pembelajaran, θ, yang menghasilkan model p θ (x) yang skornya—dengan kata lain, gradiennya—cocok dengan distribusi data q(x) dari data pelatihan.

Manfaat lain dari model generatif berbasis skor (SGM) adalah, tidak seperti model berbasis peluang, model ini tidak memberikan banyak batasan pada arsitektur model p θ (x).

Saat menjelajahi cara-cara untuk meningkatkan kinerja model mereka, Song dan Ermon secara kebetulan menemukan teknik yang sama dengan yang digunakan oleh Sohl-Dickstein dkk. Makalah mereka mencatat bahwa “data yang terganggu oleh noise acak Gaussian membuat distribusi data lebih dapat diterima oleh pemodelan generatif berbasis skor.” Model mereka, yang dibangun menggunakan arsitektur U-Net yang awalnya dikembangkan untuk segmentasi gambar, juga menerapkan dinamika Langevin untuk menghasilkan sampel.