¿Qué es el aprendizaje por transferencia?

Autores

Jacob Murel Ph.D.

Senior Technical Content Creator

Business Development + Partnerships

IBM Research

¿Qué es el aprendizaje por transferencia?

El aprendizaje por transferencia es una técnica de machine learning en la que el conocimiento adquirido a través de una tarea o conjunto de datos se utiliza para mejorar el rendimiento del modelo en otra tarea relacionada y/o diferente conjunto de datos.¹ En otras palabras, el aprendizaje por transferencia utiliza lo aprendido en un entorno para mejorar la generalización en otro entorno.²

El aprendizaje por transferencia tiene muchas aplicaciones, desde resolver problemas de regresión en ciencia de datos hasta entrenar modelos de aprendizaje profundo. De hecho, resulta especialmente atractivo para estos últimos dada la gran cantidad de datos necesarios para crear redes neuronales profundas.

Los procesos de aprendizaje tradicionales construyen un nuevo modelo para cada nueva tarea, basado en los datos etiquetados disponibles. Esto se debe a que los algoritmos tradicionales de machine learning asumen que los datos de entrenamiento y de prueba proceden del mismo espacio de características, por lo que si la distribución de datos cambia, o el modelo entrenado se aplica a un nuevo conjunto de datos, los usuarios deben volver a entrenar un nuevo modelo desde cero, incluso si se intenta una tarea similar a la del primer modelo (por ej., clasificador de análisis de sentimientos de comentarios de películas frente a comentarios de canciones). Sin embargo, los algoritmos de aprendizaje por transferencia toman como punto de partida modelos o redes ya entrenados. Después aplica los conocimientos del modelo adquiridos en una tarea o datos de origen inicial (p. ej., clasificar los comentarios de películas) en función de una tarea o datos objetivo nuevos, aunque relacionados (p. ej., clasificar comentarios de canciones).³

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

Ventajas y desventajas del aprendizaje por transferencia

Ventajas

Costos computacionales. El aprendizaje por transferencia reduce los costos computacionales necesarios para construir modelos para nuevos problemas. Al reutilizar modelos previamente entrenados o redes previamente entrenadas para abordar una tarea diferente, los usuarios pueden reducir la cantidad de tiempo de entrenamiento del modelo, datos de entrenamiento, unidades de procesador y otros recursos computacionales. Por ejemplo, un menor número de épocas, es decir, pasa a través de un conjunto de datos— puede ser necesario para lograr una tasa de aprendizaje deseada. De esta manera, el aprendizaje por transferencia puede acelerar y simplificar los procesos de entrenamiento de modelos.
Tamaño del conjunto de datos. En particular, el aprendizaje por transferencia ayuda a aliviar las dificultades involucradas en la adquisición de grandes conjuntos de datos. Por ejemplo, los modelos de lenguaje de gran tamaño (LLM) requieren grandes cantidades de datos de entrenamiento para obtener un rendimiento óptimo. Los conjuntos de datos de calidad disponibles públicamente pueden ser limitados, y producir suficientes datos etiquetados manualmente puede llevar mucho tiempo y resultar costoso.
Generalización. Si bien el aprendizaje por transferencia ayuda a optimizar el modelo, puede aumentar aún más la generalización del modelo. Dado que el aprendizaje por transferencia implica el reentrenamiento de un modelo existente con un nuevo conjunto de datos, el modelo reentrenado constará de conocimientos adquiridos a partir de múltiples conjuntos de datos. Potencialmente mostrará un mejor rendimiento en una variedad más amplia de datos que el modelo base inicial capacitado con un solo tipo de conjunto de datos. Por lo tanto, el aprendizaje por transferencia puede inhibir el sobreajuste.⁴

Por supuesto, la transferencia de conocimientos de un dominio a otro no puede compensar el impacto negativo de los datos de mala calidad. Las técnicas de preprocesamiento y la ingeniería de características, como el aumento de datos y la extracción de características, siguen siendo necesarias cuando se emplea el aprendizaje por transferencia.

Desventajas

No se trata tanto de que haya desventajas inherentes al aprendizaje por transferencia como de que existan posibles consecuencias negativas derivadas de su aplicación incorrecta. El aprendizaje por transferencia funciona mejor cuando se cumplen tres condiciones:

Ambas tareas de aprendizaje son similares
Las distribuciones de datos de los conjuntos de datos de origen y destino no varían demasiado
Un modelo comparable se puede aplicar a ambas tareas

Cuando no se cumplen estas condiciones, el aprendizaje por transferencia puede afectar negativamente el rendimiento del modelo. La literatura se refiere a esto como transferencia negativa. La investigación en curso propone una variedad de pruebas para determinar si los conjuntos de datos y las tareas cumplen con las condiciones anteriores y, por lo tanto, no darán como resultado una transferencia negativa.⁵ La transferencia a distancia es un método desarrollado para corregir la transferencia negativa que resulta de una disimilitud demasiado grande en las distribuciones de datos de los conjuntos de datos de origen y destino.⁶

Tenga en cuenta que no existe una métrica estándar generalizada para determinar la similitud entre las tareas para el aprendizaje por transferencia. Sin embargo, algunos estudios proponen diferentes métodos de evaluación para predecir similitudes entre conjuntos de datos y tareas de machine learning y, por lo tanto, la viabilidad del aprendizaje por transferencia.⁷

AI Academy

Ponga la IA a trabajar para servicio al cliente

Vea cómo la IA generativa puede satisfacer a los clientes con una experiencia más fluida y aumentar la productividad de la organización en estas tres áreas clave: autoservicio, agentes humanos y operaciones del centro de contacto.

Ir al episodio

Tipos de aprendizaje por transferencia

Hay tres prácticas adyacentes o subentornos de aprendizaje por transferencia. Su distinción entre sí, así como la transferencia del aprendizaje de manera más amplia, se debe en gran medida a los cambios en la relación entre el dominio de origen, el dominio de destino y las tareas a completar. 8

Transferencia inductiva. Esto es cuando las tareas de origen y destino son diferentes, independientemente de cualquier diferencia o similitud entre los dominios de destino y de origen (es decir, conjuntos de datos). Esto puede manifestarse en los modelos de visión artificial cuando se adoptan arquitecturas previamente entrenadas para la extracción de características en grandes conjuntos de datos para un entrenamiento adicional en una tarea específica, como la detección de objetos. El aprendizaje multitarea, que consiste en aprender simultáneamente dos tareas diferentes (como la clasificación de imágenes y la detección de objetos) en el mismo conjunto de datos, puede considerar una forma de transferencia inductiva.⁹
Aprendizaje no supervisado Esto es similar a la transferencia inductiva, ya que las tareas de destino y origen son diferentes. Pero en la transferencia inductiva, los datos de origen y/o destino a menudo están etiquetados. Por su nombre, el aprendizaje por transferencia no supervisado no está supervisado , lo que significa que no hay datos etiquetados manualmente.¹⁰ En comparación, la transferencia inductiva puede considerarse aprendizaje supervisado. Una aplicación común del aprendizaje no supervisado es la detección de fraudes. Al identificar patrones comunes en un conjunto de datos de transacciones sin etiquetar, un modelo puede aprender a identificar comportamientos desviados como posibles fraudes.
Transferencia transductiva. Esto ocurre cuando las tareas de origen y destino son las mismas, pero los conjuntos de datos (o dominios) son diferentes. Más específicamente, los datos de origen generalmente se etiquetan mientras que los datos de destino no están etiquetados. La adaptación al dominio es una forma de aprendizaje transductivo, ya que aplica los conocimientos adquiridos al realizar una tarea en una distribución de datos hacia la misma tarea en otra distribución de datos.¹¹ Un ejemplo de aprendizaje por transferencia transductiva es la aplicación de un modelo de clasificación de textos entrenado y probado con comentarios de restaurantes para clasificar comentarios de películas.

Aprendizaje por transferencia frente a ajuste

El aprendizaje por transferencia es distinto del ajuste. Es cierto que en ambos casos se reutilizan modelos de machine learning preexistentes en lugar de formar modelos nuevos. Pero las similitudes terminan ahí. El perfeccionamiento se refiere al proceso de entrenamiento adicional de un modelo en un conjunto de datos de una tarea específica para mejorar el rendimiento en la tarea inicial específica para la que se construyó el modelo. Por ejemplo, se puede crear un modelo de detección de objetos de propósito general empleando conjuntos de imágenes masivos como COCO o ImageNet y, a continuación, capacitar el modelo resultante en un conjunto de datos más pequeño y etiquetado específico para la detección de autos. De este modo, el usuario puede ajustar un modelo de detección de objetos para detectar autos. Por el contrario, el aprendizaje por transferencia significa que los usuarios adaptan un modelo a un nuevo problema relacionado y no al mismo problema.

Transferir casos de uso de aprendizaje

Hay muchas aplicaciones del aprendizaje por transferencia en entornos de machine learning e inteligencia artificial del mundo real. Los desarrolladores y científicos de datos pueden emplear el aprendizaje por transferencia para ayudar en una gran variedad de tareas y combinarlo con otros enfoques de aprendizaje, como el aprendizaje de refuerzo.

Procesamiento del lenguaje natural

Un problema destacado que afecta el aprendizaje por transferencia en el NLP es la falta de coincidencia de características. Las características en diferentes dominios pueden tener diferentes significados y, por lo tanto, connotaciones (por ejemplo, luz significa peso y óptica). Esta disparidad en las representaciones de características afecta las tareas de clasificación de sentimientos, los modelos de lenguaje y más. Los modelos basados en el aprendizaje profundo, en particular, las incrustaciones de palabras, son prometedores para corregir esto, ya que pueden capturar adecuadamente las relaciones semánticas y las orientaciones para las tareas de adaptación del dominio.¹²

Visión artificial

Dada las dificultades para adquirir suficientes datos etiquetados manualmente para diversas tareas de visión artificial, una gran cantidad de investigaciones examinan las aplicaciones del aprendizaje por transferencia con redes neuronales convolucionales (CNN). Un ejemplo notable es ResNet, una arquitectura de modelo previamente capacitada que demuestra un rendimiento mejorado en tareas de clasificación de imágenes y detección de objetos.¹³ Investigaciones recientes estudian el renombrado conjunto de datos ImageNet para el aprendizaje por transferencia, argumentando que (en contra de la sabiduría popular de la visión por ordenador) solo se necesitan pequeños subconjuntos de este conjunto de datos para entrenar modelos generalizables confiables.¹⁴ Muchos tutoriales de aprendizaje por transferencia para la visión artificial emplean ResNet e ImageNet con la biblioteca keras de TensorFlow.

IBM® X-Force Threat Intelligence Index 2026

Obtenga insights para prepararse y responder a los ataques cibernéticos con mayor rapidez y eficacia con el IBM® X-Force Threat Intelligence Index.

¿Qué es el aprendizaje por transferencia?

Autores

¿Qué es el aprendizaje por transferencia?

Las últimas tendencias de IA presentadas por expertos

¡Gracias! Ya está suscrito.

Ventajas y desventajas del aprendizaje por transferencia

Ventajas

Desventajas

Ponga la IA a trabajar para servicio al cliente

Tipos de aprendizaje por transferencia

Aprendizaje por transferencia frente a ajuste

Transferir casos de uso de aprendizaje

Recursos