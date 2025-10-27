Comprendamos la tarea de análisis de sentimiento que proporciona una explicación clara de la mecánica y los beneficios del prompt tuning. Supongamos que el objetivo es adaptar un modelo de 175 000 millones de parámetros para clasificar las reseñas de películas como "positivas" o "negativas". Un enfoque de ajuste preciso sería prohibitivamente caro y lento. Con prompt tuning, el proceso es el siguiente:



Comience con un modelo preentrenado congelado: la columna vertebral de 175 000 millones de parámetros permanece completamente intacta, preservando su vasto repositorio de conocimiento general aprendido durante el preentrenamiento.5



Añada prompts suaves: se adjunta un pequeño conjunto de vectores entrenables (por ejemplo, 20 tokens) a los embeddings de entrada de cada reseña de película. Estos vectores no son texto legible por humanos; son embeddings continuos que existen en el mismo espacio de alta dimensión que el vocabulario del modelo (por ejemplo, un espacio de 12 288 dimensiones para un modelo de esta escala). Mediante la optimización, estos vectores aprenden a codificar una señal continua y específica de la tarea que dirige el comportamiento del modelo.



Alimente la entrada: por ejemplo,

[Prompts suaves] ¡La película fue absolutamente fantástica!

En este ejemplo, supongamos que inicializamos 20 tokens de prompts suaves para una tarea de análisis de sentimiento. Después del entrenamiento, la entrada podría verse así internamente:

[<v1>, <v2>, <v3>, ... <v20>, The, movie, was, absolutely, fantastic, !]

Aquí, cada v1 es un vector de instrucción aprendido y de alta dimensión. El objetivo del entrenamiento es encontrar los valores óptimos para los vectores que guían el modelo congelado para clasificar correctamente el sentimiento del texto posterior.



Entrene solo los prompts suaves: mediante el uso de un conjunto de datos etiquetados de reseñas de películas, se inicia el proceso de entrenamiento. A través de la retropropagación, se calcula el gradiente de error, pero el paso de optimización solo actualiza los parámetros de los embeddings de prompts suaves. Este enfoque implica ajustar solo unos pocos miles de parámetros en lugar de los 175 000 millones de ponderaciones del modelo.5



Implemente con modularidad: una vez completado el entrenamiento, el conjunto resultante de 20 vectores constituye toda la adaptación específica de la tarea. Para adaptar el mismo modelo base para una tarea diferente, como la detección, uno simplemente entrena un nuevo conjunto de prompts suaves en un conjunto de datos y las intercambia en el momento de la inferencia.



Esta técnica ofrece beneficios sustanciales de eficiencia. En lugar de almacenar una copia completa e independiente del modelo para cada tarea (un modelo de 175 000 millones de parámetros puede requerir hasta 350 GB), es necesario almacenar los parámetros de instrucción específicos de la tarea, que pueden tener solo unos pocos KB de tamaño.1 Esta modularidad hace que el prompt tuning sea una solución práctica y rentable para la adaptación de modelos a gran escala.2