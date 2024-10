Ein Hindernis für die Verwendung der KL-Divergenz für die Variationsinferenz ist, dass der Nenner der Gleichung unlösbar ist, was bedeutet, dass eine direkte Berechnung theoretisch unendlich viel Zeit in Anspruch nehmen würde. Um dieses Problem zu umgehen und beide Schlüsselverlustfunktionen zu integrieren, nähern sich VAEs der Minimierung der KL-Divergenz an, indem sie stattdessen die Evidenzuntergrenze (ELBO) maximieren.

In der statistischen Terminologie bezieht sich die „Evidenz“ in „Evidenzuntergrenze“ auf p(x), die beobachtbaren Eingabedaten, für deren Rekonstruktion die VAE vordergründig verantwortlich ist. Diese beobachtbaren Variablen in den Eingabedaten sind die „Evidenz“ (Beweis) für die vom Autoencoder entdeckten latenten Variablen. Die „Untergrenze“ bezieht sich auf den ungünstigsten Schätzwert für die Log-Likelihood einer bestimmten Verteilung. Die tatsächliche Log-Likelihood kann höher sein als die ELBO.

Im Zusammenhang mit VAEs bezieht sich die Evidenzuntergrenze auf den ungünstigsten Schätzwert der Wahrscheinlichkeit (Likelihood), dass eine bestimmte A-posteriori-Verteilung – mit anderen Worten, eine bestimmte Ausgabe des Autoencoders, die sowohl durch den KL-Divergenz-Verlustterm als auch durch den Rekonstruktionsverlustterm bedingt ist – der „Evidenz“ der Trainingsdaten entspricht. Daher kann das Training eines Modells für die Variationsinferenz als Maxmierung der ELBO bezeichnet werden.