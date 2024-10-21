El ajuste fino significa dar a un modelo de IA suficientes datos adicionales para cambiar algunos de sus parámetros. El refinamiento cambia permanentemente el comportamiento de un modelo, adaptándolo a un caso de uso o contexto particular. Además, es más rápido y barato que entrenar un modelo nuevo.

"Si tiene una red neuronal que tiene 100 capas diferentes, entrenarla significaría que está modificando las 100 capas", explica Choie. “El ajuste fino significaría que realmente estás cambiando las últimas capas. Todavía está modificando el modelo, pero no tiene que cambiarlo por completo porque ya está funcionando bien”.

El ajuste fino requiere un poco más de inversión inicial que la ingeniería rápida y el RAG. Es útil para convertir un modelo más pequeño en un experto en un dominio especializado. Por ejemplo, una compañía de seguros puede ajustar un modelo para dominar el arte de procesar nuevas reclamaciones.

Varshney compara un modelo bien ajustado con un nuevo empleado recién salido de la escuela y con una formación intensiva. Es posible que no tengan la amplitud de conocimientos que tiene un genio polímata (o un gran modelo de IA de propósito general), pero son mucho mejores para procesar reclamos que el polímata.

"No puede hacer sus impuestos o redactar un contrato legal", dice Varshney, "pero si le pido que procese un reclamo, sabría cómo hacerlo de inmediato".

El uso de datos propios de esta manera puede ofrecer una ventaja competitiva significativa al familiarizar a los modelos de IA con los procesos, productos, clientes y otros matices únicos de una empresa.

"Si tiene una IA cuyos principales usuarios son de una empresa en particular, es importante que la IA utilice datos de esa misma empresa", dice Choie.

Cuando los modelos de IA tienen acceso a datos de propiedad exclusiva, se basan en un contexto empresarial específico, lo que significa que sus resultados también se basan en ese contexto.

“Puedo tomar un modelo de IA abierto, ajustarlo con mis propios datos de propiedad exclusiva, y esa copia es exclusivamente mía”, dice Varshney. "Yo soy dueño de la propiedad intelectual que hay detrás. Lo ejecuto en mi propia infraestructura”.

Como resultado, estos modelos pueden producir resultados más precisos y efectivos que los modelos sin aumentar, ya que se basan en un conjunto general de datos públicos.