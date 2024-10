Como se comentó, el objetivo de la inferencia variacional es generar nuevos datos en forma de variaciones aleatorias de los datos de entrenamiento x. A primera vista, esto es relativamente sencillo: use una función ƒ que seleccione un valor aleatorio para la variable latente z, que el decodificador puede usar para generar una reconstrucción aproximada de x.

Sin embargo, una propiedad inherente de la aleatoriedad es que no se puede optimizar. No existe el “mejor” azar; un vector de valores aleatorios, por definición, no tiene derivativo—es decir, ningún gradiente que exprese ningún patrón en los resultados del modelo resultante—y, por lo tanto, no se puede optimizar mediante retropropagación por el uso de cualquier forma de descenso de gradiente. Esto significaría que una neural network que utiliza el proceso de muestreo aleatorio precedente no puede aprender los parámetros óptimos para realizar su tarea.

Para sortear este obstáculo, los VAEs utilizan el truco de reparametrización. El truco de reparametrización introduce un nuevo parámetro, ε, que es un valor aleatorio seleccionado de la distribución normal entre 0 y 1.

Luego reparametriza la variable latente z como z = μx + εσx. En términos más simples, elige un valor para la variable latente z comenzando con la media de esa variable (representada por μ) y desplazándola por un múltiplo aleatorio (representado por ε) de una desviación estándar (σ). Condicionado por ese valor específico de z, el decodificador genera una nueva muestra.

Dado que el valor aleatorio ε no se deriva de los parámetros del modelo del autocodificador y no tiene relación con ellos, se puede ignorar durante la retropropagación. El modelo se actualiza mediante algún tipo de descenso de gradiente—la mayoría de las veces a través de Adam (el enlace se encuentra fuera de ibm.com), un algoritmo de optimización basado en el gradiente también desarrollado por Kingma—para maximizar la ELBO.