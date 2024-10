RAG conecta un LLM a almacenes de datos privados actuales que, de otro modo, serían inaccesibles para él. Los modelos RAG pueden devolver respuestas más precisas con el contexto agregado de los datos internos de lo que podrían hacerlo sin él.

Un modelo ajustado suele superar a su modelo base correspondiente, como GPT-3 o GPT-4, al aplicar su entrenamiento con datos específicos del dominio. El LLM perfeccionado tiene una mejor comprensión del dominio específico y su terminología, lo que le permite generar respuestas precisas.

Sin acceso continuo a nuevos datos, los modelos de lenguaje de gran tamaño se estancan. Los LLM modernos son redes neuronales masivas que requieren enormes conjuntos de datos y recursos computacionales para entrenar. Incluso los proveedores de LLM más grandes, como Meta, Microsoft y OpenAI, reentrenan periódicamente sus modelos, lo que hace que cualquier LLM quede obsoleto casi instantáneamente en el momento en que se lanza a la naturaleza.

Cuando los modelos no pueden aprender de los nuevos datos, a menudo alucinan o confabulan: un fenómeno que ocurre cuando los modelos de IA generativa "inventan" respuestas a preguntas que no pueden responder definitivamente. Los modelos de IA generativa emplean algoritmos estadísticos complejos para predecir las respuestas a las consultas de los usuarios. Si un usuario pregunta algo que la IA no puede encontrar fácilmente dentro de su conjunto de datos de entrenamiento, lo mejor que puede hacer es adivinar.