¿Qué es el aprendizaje federado?

Autores

Staff Writer

IBM Think

Staff Editor, AI Models

IBM Think

¿Qué es el aprendizaje federado?

El aprendizaje federado es un enfoque descentralizado para entrenar modelos de machine learning (ML). Cada nodo de una red distribuida entrena un modelo global con sus datos locales y un servidor central agrega las actualizaciones de los nodos para mejorar el modelo global.

Los modelos de inteligencia artificial (IA) requieren enormes volúmenes de datos. Estos conjuntos de datos suelen centralizarse en una única ubicación para el entrenamiento de modelos, lo que abre la posibilidad de que cualquier información de identificación personal (PII) contenida en los conjuntos de datos quede expuesta durante su transmisión o almacenamiento.

El aprendizaje federado ayuda a abordar estas preocupaciones, ya que la información confidencial permanece en el nodo, lo que ayuda a preservar la privacidad de los datos. También permite el aprendizaje colaborativo, ya que para perfeccionar los modelos de IA se utilizan diversos dispositivos y servidores.

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

Cómo funciona el aprendizaje federado

El aprendizaje federado consta de cuatro etapas principales:

Inicialización
Entrenamiento local
Agregación global
Iteración

Inicialización

El aprendizaje federado comienza con la inicialización de un modelo global de machine learning en un servidor central. Este modelo constituye la base del proceso de aprendizaje federado.

El servidor central distribuye el modelo global a los nodos cliente conectados, que pueden ser otros servidores o dispositivos periféricos, como teléfonos inteligentes y dispositivos de Internet de las cosas (IoT). También transmite información relevante, incluidas variables de configuración como los hiperparámetros y el número de épocas o pasadas completas por los datos de entrenamiento.

Entrenamiento local

Tras recibir el modelo global y todos los detalles necesarios, cada nodo cliente comienza el entrenamiento. El proceso es similar al de cualquier red neuronal: los nodos cliente entrenan el modelo únicamente mediante sus datos locales o del dispositivo.

Cuando han completado el número de épocas, los nodos cliente transmiten los parámetros o gradientes del modelo actualizados al servidor central; no se devuelven modelos locales completamente entrenados ni datos sin procesar.

Agregación global

El servidor central agrega todas las actualizaciones de los nodos cliente. Existen diferentes métodos de agregación, pero uno de los más utilizados es el promedio federado, que calcula la media ponderada de todas las actualizaciones. Estas actualizaciones combinadas se incorporan al modelo global.

Iteración

El servidor central distribuye de nuevo el nuevo modelo global a los nodos cliente conectados y el proceso de aprendizaje federado se repite hasta que el modelo alcanza la convergencia total o está completamente entrenado.

AI Academy

Conviértase en un experto en IA

Obtenga los conocimientos necesarios para priorizar las inversiones en IA que impulsan el crecimiento empresarial. Dé sus primeros pasos hoy mismo con nuestra AI Academy gratuita y lidere el futuro de la IA en su organización.

Vea la serie

Tipos de aprendizaje federado

El aprendizaje federado puede variar en función de la estructura de los conjuntos de datos o de la naturaleza de los nodos cliente. Por lo general, se clasifica en estas categorías:

Entre dispositivos
Entre silos
Horizontal
Vertical

Entre dispositivos

El aprendizaje federado entre dispositivos utiliza dispositivos con conectividad volátil y recursos informáticos limitados, como teléfonos móviles y dispositivos IoT. Este tipo de aprendizaje federado debe tener en cuenta las conexiones de red poco fiables y, dado que los nodos cliente solo pueden manejar pequeños conjuntos de datos, normalmente se necesitarán muchos dispositivos para el entrenamiento local.¹

Las empresas de comercio electrónico, por ejemplo, pueden entrenar un motor de recomendaciones con datos de usuarios en múltiples dispositivos para ofrecer recomendaciones de productos más personalizadas.¹

Entre silos

A diferencia del enfoque de aprendizaje federado entre dispositivos, el aprendizaje entre silos implica un número limitado de servidores o centros de datos con conectividad estable y recursos computacionales lo suficientemente potentes como para almacenar y procesar grandes volúmenes de datos. Los nodos de los clientes se tratan como silos que contienen datos personales, y estos datos no deben salir del sistema ni compartirse de forma externa por motivos de privacidad.¹

El aprendizaje federado entre silos puede ser valioso en sectores como el financiero y el sanitario. Por ejemplo, un consorcio de hospitales puede entrenar un modelo compartido con sus propios datos de pacientes para mejorar el diagnóstico o la predicción de ciertas enfermedades. Del mismo modo, una coalición de bancos puede entrenar un algoritmo común de machine learning mediante el uso de sus propios registros de transacciones para mejorar la detección del fraude.¹

Horizontal

En el aprendizaje federado horizontal, los conjuntos de datos de los nodos cliente comparten las mismas características o estructura, pero tienen muestras diferentes. Por ejemplo, las clínicas pueden entrenar un modelo analítico compartido porque cada una tiene las mismas variables para sus datos de ensayos clínicos, pero los valores para los pacientes que participan en los ensayos son distintos.

Vertical

Por el contrario, el aprendizaje federado vertical implica conjuntos de datos de nodos cliente que comparten las mismas muestras pero tienen una estructura o características diferentes. Por ejemplo, un comercio minorista y un banco podrían asociarse para hacer ofertas más personalizadas a los clientes, y entrenar un motor de recomendación común, ya que podrían tener los mismos datos de clientes pero información financiera y de compras variada.

Beneficios del aprendizaje federado

La naturaleza descentralizada del aprendizaje federado ofrece estas ventajas clave:

Eficiencia
Privacidad de datos mejorada
Mejora del cumplimiento

Eficiencia

El aprendizaje federado elimina la necesidad de acceder o transferir grandes conjuntos de datos. Esto conduce a una disminución de la latencia y una reducción del ancho de banda requerido para entrenar modelos de machine learning.

Privacidad de datos mejorada

La arquitectura de preservación de la privacidad de los sistemas de aprendizaje federado significa que los datos confidenciales nunca salen de un dispositivo. Esto ayuda a minimizar el riesgo de ciberataques o vulneraciones de datos.

La mayoría de los sistemas de aprendizaje federado también aplican técnicas criptográficas, como la privacidad diferencial y el cálculo multipartito seguro (SMPC), para reforzar la privacidad de los datos.

La privacidad diferencial añade ruido a las actualizaciones del modelo antes de transmitirlas al servidor central, mientras que el SMPC permite al servidor central realizar cálculos de agregación seguros sobre las actualizaciones cifradas del modelo. Estos métodos dificultan la ingeniería inversa o la distinción de qué nodo cliente contribuyó a una actualización, lo que refuerza la seguridad de datos.

Mejora del cumplimiento

Dado que los datos se conservan y procesan a nivel local, el aprendizaje federado puede ayudar a las empresas a cumplir la normativa de protección de datos. El cumplimiento es crucial para sectores como el financiero y el sanitario, que manejan datos privados.

Desafíos del aprendizaje federado

El aprendizaje federado supone un cambio transformador en el entrenamiento de los modelos de IA, pero también conlleva limitaciones. Estos son algunos desafíos asociados con el aprendizaje federado:

Ataques adversarios
Sobrecarga de comunicación
Heterogeneidad

Ataques adversarios

El aprendizaje federado es vulnerable a los ataques de envenenamiento de datos, en los que los actores de amenazas inyectan datos maliciosos durante el entrenamiento local o alteran las actualizaciones del modelo para que la transmisión comprometa o corrompa el modelo central.

La detección de anomalías, el entrenamiento de adversarios, los estrictos controles de acceso y otras medidas de seguridad pueden contribuir a la protección contra estos ataques.

Gastos generales de comunicación

Los intercambios regulares entre los nodos cliente y el servidor central pueden desembocar en cuellos de botella significativos. Para mejorar la eficacia de la comunicación, hay que considerar estrategias como la compresión de las actualizaciones del modelo antes de la transmisión, la cuantización y la sparsificación para retransmitir solo las actualizaciones esenciales. Estas estrategias deben equilibrarse con la disminución de precisión que conllevan.

Heterogeneidad

El diseño descentralizado del aprendizaje federado puede reforzar la diversidad de datos y ayudar a mitigar los sesgos. Sin embargo, esto también significa que los datos no se distribuyen de forma idéntica y pueden estar desequilibrados. Algunos dispositivos pueden tener más datos que otros, lo que sesga el modelo global hacia estos nodos con muchos datos.

Algunas formas de abordar esta heterogeneidad estadística son las metodologías o técnicas de muestreo que tienen en cuenta la variación en la distribución, la agrupación o clustering de nodos con distribuciones de datos similares durante el entrenamiento del modelo y los algoritmos de optimización como FedProx, dirigidos a redes heterogéneas.

La heterogeneidad de los sistemas también es un problema, ya que los dispositivos tienen diferentes capacidades informáticas. El entrenamiento local adaptativo se puede aplicar para adaptar el entrenamiento del modelo de acuerdo con lo que un nodo puede manejar.

Casos de uso de aprendizaje federado

El aprendizaje federado promete ayudar a resolver problemas del mundo real, con organizaciones que unen fuerzas incluso a través de fronteras y regiones geográficas. Estos son algunos sectores que pueden beneficiarse del aprendizaje federado:

Finanzas
Atención sanitaria
Venta minorista y fabricación
Gestión urbanística

Finanzas

Las instituciones financieras pueden trabajar juntas para diversificar los datos de los modelos de evaluación del riesgo crediticio, lo que permite un mejor acceso al crédito para los grupos desatendidos. También pueden utilizar el aprendizaje federado para proporcionar un asesoramiento bancario y de inversión más personalizado, y mejorar así la experiencia del usuario.

Sanidad

Los hospitales y las instituciones de investigación pueden entrenar modelos compartidos de deep learning que ayuden al descubrimiento de fármacos para enfermedades raras. Los sistemas de aprendizaje federado también pueden ayudar a encontrar mejores estrategias de tratamiento y mejorar los resultados de los pacientes de las comunidades infrarrepresentadas.

Comercio minorista y fabricación

Los minoristas pueden utilizar el aprendizaje federado para realizar un seguimiento de las ventas y el inventario en múltiples ubicaciones sin revelar ningún dato de los clientes, lo que les permite maximizar los niveles de existencias y reducir los desperdicios. Mientras tanto, los fabricantes pueden agregar datos de diferentes partes de la cadena de suministro para optimizar la logística.

Gestión urbanística

Las ciudades inteligentes pueden beneficiarse del aprendizaje federado para obtener conocimiento de los innumerables dispositivos y sensores repartidos por las zonas urbanas y, al mismo tiempo, mantener la privacidad de los datos de los residentes. Estos conocimientos se pueden utilizar para dirigir mejor el tráfico, por ejemplo, o para monitorizar las condiciones ambientales, como la contaminación del aire y el agua.

Marcos de aprendizaje federado

La implementación del aprendizaje federado para aplicaciones del mundo real puede ser compleja, pero existen varios marcos para entrenar modelos en datos descentralizados y optimizar los flujos de trabajo de servidores y clientes. Estos son algunos marcos de aprendizaje federado populares:

Flower
IBM® Federated Learning
NVIDIA FLARE
OpenFL
TensorFlow Federated

Flower

Flower es un marco de código abierto para la IA colaborativa y la ciencia de datos. Se puede utilizar para crear sistemas de IA federados con numerosos clientes conectados. Es compatible con la mayoría de los marcos de machine learning e interoperable con diversas plataformas de hardware y sistemas operativos.

IBM Federated Learning

IBM Federated Learning es un marco para el aprendizaje federado en entornos empresariales. Funciona con varios algoritmos de machine learning, incluidos los árboles de decisión, los clasificadores Naïve Bayes, las redes neuronales y el aprendizaje por refuerzo.

IBM Federated Learning también viene con una amplia biblioteca de métodos de fusión para combinar actualizaciones de modelos y admite varias técnicas de imparcialidad para ayudar a combatir el sesgo de la IA.

NVIDIA FLARE

NVIDIA FLARE (Federated Learning Application Runtime Environment) es un kit de desarrollo de software de código abierto e independiente del dominio para el aprendizaje federado.

Cuenta con flujos de trabajo de formación y evaluación integrados, algoritmos de preservación de la privacidad y algoritmos de aprendizaje para promediar federados y FedProx. NVIDIA FLARE también cuenta con herramientas de gestión para la orquestación y la monitorización.

OpenFL

OpenFL es un marco de aprendizaje federado de código abierto basado en Python creado originalmente por Intel y ahora bajo The Linux Foundation. OpenFL funciona con marcos de deep learning como PyTorch y bibliotecas de machine learning, como TensorFlow. Sus características de seguridad incluyen privacidad diferencial y soporte para entornos de ejecución de confianza basados en hardware.

TensorFlow Federated

TensorFlow Federated (TFF) es un marco de código abierto desarrollado por Google para el machine learning en datos descentralizados. Las interfaces de programación de aplicaciones (API) de TFF se dividen en 2 capas:

La API de aprendizaje federado es la capa de alto nivel que facilita la implementación de tareas de aprendizaje federado como el entrenamiento o la evaluación mediante el uso de modelos de machine learning existentes.
La API de núcleo federado es la capa de bajo nivel para construir nuevos algoritmos de aprendizaje federado.

Ciencia de datos y MLOps para líderes de datos

Manténgase alineado con otros líderes en los 3 objetivos clave de MLOps y la IA fiable: la confianza en los datos, la confianza en los modelos y la confianza en los procesos.

Recursos

Explore IBM Granite

IBM Granite es nuestra familia de modelos de IA abiertos, eficaces y de confianza, adaptados a la empresa y optimizados para escalar sus aplicaciones de IA. Explore las opciones de idioma, código, series de tiempo y salvaguardas.

IA en Acción 2024

Hemos encuestado a 2000 organizaciones sobre sus iniciativas de IA para descubrir qué funciona, qué no y cómo puede adelantarse.

Desbloquee el poder de la IA generativa + ML

Aprenda a incorporar la IA generativa, el machine learning y los modelos fundacionales en sus operaciones empresariales para mejorar el rendimiento.

Cómo elegir el modelo fundacional adecuado

Aprenda a seleccionar el modelo fundacional de IA más adecuado para su caso de uso.

¿Qué es el machine learning (ML) o aprendizaje automático?

El machine learning es una rama de la IA y la informática que se centra en el uso de datos y algoritmos para que la IA imite el modo en que aprenden los humanos.

Cómo prosperar en la era de la IA con seguridad y confianza

Profundice en los tres elementos cruciales de una estrategia de IA sólida: crear una ventaja competitiva, ampliar la IA en toda la empresa y promover una IA fiable.

Soluciones relacionadas

IBM watsonx.ai

Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai

Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.

Explore las soluciones de IA

Consultoría y servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA

Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida de desarrollo de la IA. Produzca potentes soluciones de IA con interfaces intuitivas, flujos de trabajo y acceso a API y SDK estándar del sector.

Notas a pie de página

Vínculos externos a ibm.com

¹ Cross-silo and cross-device federated learning on Google Cloud. Google Cloud. 3 de junio de 2024.

¿Qué es el aprendizaje federado?

¿Qué es el aprendizaje federado?

Las últimas tendencias en IA, presentadas por expertos

¡Gracias! Está suscrito.

Cómo funciona el aprendizaje federado

Inicialización

Entrenamiento local

Agregación global

Iteración

Conviértase en un experto en IA

Tipos de aprendizaje federado

Entre dispositivos

Entre silos

Horizontal

Vertical

Beneficios del aprendizaje federado

Eficiencia

Privacidad de datos mejorada

Mejora del cumplimiento

Desafíos del aprendizaje federado

Ataques adversarios

Gastos generales de comunicación

Heterogeneidad

Casos de uso de aprendizaje federado

Finanzas

Sanidad

Comercio minorista y fabricación

Gestión urbanística

Marcos de aprendizaje federado

Flower

IBM Federated Learning

NVIDIA FLARE

OpenFL

TensorFlow Federated

Share

Recursos

Notas a pie de página