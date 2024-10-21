Fine-tuning significa dar a un modelo de IA suficientes datos adicionales para cambiar algunos de sus parámetros. El fine-tuning cambia permanentemente el comportamiento de un modelo, adaptándolo a un caso de uso o contexto particular. Además, es más rápido y barato que entrenar un modelo nuevo.

"Si tiene una red neuronal que tiene 100 capas diferentes, entrenarla significaría modificar las 100 capas", explica Choie. "El fine-tuning significaría que realmente está cambiando las últimas capas. Sigue modificando el modelo, pero no tiene que cambiarlo por completo porque ya está funcionando bien".

El fine-tuning requiere un poco más de inversión inicial que la ingeniería de prompts y la RAG. Es útil para convertir a un modelo más pequeño en un experto en un campo especializado. Por ejemplo, una compañía de seguros puede afinar un modelo para dominar el arte de procesar nuevas reclamaciones.

Varshney compara un modelo puesto a punto con un nuevo empleado recién salido de la escuela que recibe una formación intensiva. Puede que no tengan el conocimiento que tiene un polímata genio (o un gran modelo de IA de propósito general), pero son mucho mejores procesando afirmaciones que el polímata.

"No puede hacer sus impuestos ni redactar un contrato legal", dice Varshney, "pero si le pido que procese una reclamación, sabría cómo hacerlo de inmediato".

El uso de datos propietarios de esta manera puede ofrecer una ventaja competitiva significativa al familiarizar los modelos de IA con los procesos, productos, clientes y otros matices únicos de una empresa.

"Si tiene una IA cuyos principales usuarios son de una empresa en particular, es importante que la IA utilice datos de esa misma empresa", dice Choie.

Cuando los modelos de IA tienen acceso a datos propietarios, se basan en un contexto empresarial específico, lo que significa que sus resultados también se basan en ese contexto.

"Puedo coger un modelo de IA abierto, ajustarlo con mis propios datos y esa copia es exclusivamente mía", afirma Varshney. “Soy el propietario de la propiedad intelectual detrás de esto. Lo ejecuto en mi propia infraestructura”.

Como resultado, estos modelos pueden producir resultados más precisos y efectivos que los modelos estándar no aumentados que extraen de un cuerpo general de datos públicos.