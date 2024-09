Los LLM se capacitan previamente mediante aprendizaje auto supervisado en un corpus masivo de datos sin etiquetar. Los modelos de lenguaje auto regresivos, como los modelos GPT de OpenAI, Gemini de Google o Llama de Meta, están capacitados para predecir simplemente la(s) siguiente(s) palabra(s) en una secuencia hasta que esté completa. En el entrenamiento previo, a los modelos se les proporciona el comienzo de una oración de muestra extraída de los datos de entrenamiento y se les asigna repetidamente la tarea de predecir la siguiente palabra en la secuencia hasta el final de la muestra. Para cada predicción, la siguiente palabra real de la oración de muestra original sirve como verdad fundamental.

Si bien este entrenamiento previo produce capacidades potentes de generación de texto, no proporciona ninguna comprensión real de la intención de un usuario. En un nivel fundamental, los LLM autorregresivos en realidad no responden a un aviso, sólo le anexantexto.Sin una orientación muy específica en forma de ingeniería rápida, un LLM pre entrenado (que no ha sido refinado) simplemente predice, de una manera gramaticalmente coherente, cuál podría ser la (s) siguiente (s) palabra (s) en una secuencia dada que es iniciada por el indicador. Si se le solicita “enséñame a hacer un currículum”, un LLM podría responder con “usar Microsoft Word”. Es una forma válida de completar la oración, pero no está alineada con el objetivo del usuario. Es posible que el modelo ya tenga un conocimiento sustancial de la redacción de un currículum extraído del contenido relevante incluido en su corpus previo al entrenamiento, pero sin refinar, podría no accederse a este conocimiento.

Por lo tanto, el proceso de refinamiento desempeña un papel crucial no solo en la adaptación de los modelos fundacionales para su tono y casos de uso únicos o los de su compañía, sino también para hacerlos adecuados para el uso práctico.