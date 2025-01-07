¿Se pregunta qué esperar de la IA de código abierto en 2025? A continuación, se presentan algunos acontecimientos que podrían marcar el rumbo del año que viene.
En los últimos años, los modelos de IA han sido el centro de atención. Pero en 2025, los expertos dicen que la conversación se moverá más cerca de los sistemas de IA de código abierto.
"Lo que veremos es un cambio hacia los sistemas de IA, y no solo los modelos", dice Anastasia Stasenko, cofundadora de pleias, una startup francesa que lanzó recientemente Common Corpus, el mayor conjunto de datos multilingüe abierto para el entrenamiento de LLM, así como modelos entrenados exclusivamente en datos abiertos.
“De lo que los proveedores van a impulsar el valor son realmente los sistemas que se basan en diferentes tipos de modelos de código abierto”, afirma. “Será impulsado por las integraciones, por más verticales. No es solo un modelo, es un sistema”. Stasenko señala los elementos más allá de los modelos que alimentan un sistema más amplio, como los clasificadores y los analizadores. "No se trata solo de los modelos".
Otra conversación importante en 2024 fue el ROI para las empresas que invierten en IA. Este año, la investigación sugiere que veremos una correlación más directa entre el retorno de la inversión (ROI) y la IA de código abierto.
En un estudio de IBM de más de 2400 encargados de tomar decisiones de TI, el 51 % de las empresas que utilizan herramientas de código abierto vieron un ROI positivo, en comparación con solo el 41 % de las que no.
"El software de código abierto puede darle la capacidad de aprovechar la IA de una manera rentable para su negocio y que le brinda la velocidad que está buscando", dice JJ Asghar, promotor de desarrollo de IBM Research.
Linux Foundation, conocida por apoyar proyectos importantes como Kubernetes, Open Source Security Foundation (OpenSSF) y PyTorch, también destacó los beneficios del código abierto para la transparencia y la eficiencia de costos en un informe reciente.
"Las empresas se benefician del acceso gratuito a potentes marcos que eliminan los altos costos iniciales y permiten una fácil personalización, lo que permite a las organizaciones de todos los tamaños innovar y escalar", explica Ibrahim Haddad, vicepresidente de programas estratégicos de Linux Foundation.
Con la aprobación de la Ley de IA de la UE en 2024, podemos continuar esperando que la IA ética siga siendo un tema de discusión y debate.
Haddad cree que la gobernanza y la regulación de la IA desempeñarán un papel crucial en la configuración del desarrollo de la IA de código abierto. “La Ley de IA de la UE impulsará las prácticas éticas de IA, generando la transparencia, la equidad y la rendición de cuentas en los proyectos de código abierto”, dice Haddad. "Esperamos que esto impulse una mayor colaboración en la detección de sesgos y las herramientas de auditoría ética".
Stasenko dice que ve “aumentar la aceptabilidad social y la transparencia para la IA” como una “oportunidad de negocio en sí misma”. Plantea el ejemplo de casos de uso de alto valor y sensibles en industrias como la atención médica y los servicios financieros, y agrega que la transparencia será una piedra angular de una gestión de riesgos sólida.
"Las empresas necesitan una forma segura y privada de inferir con la IA", dice Asghar. "Los principales actores en el espacio que no son de código abierto dicen que no toman sus datos, pero las empresas no pueden confiar en eso". Asghar agrega que los modelos abiertos como IBM Granite 3.1 pueden ayudar a las empresas a aprovechar la IA de una manera segura y privada. "Esto es increíblemente poderoso", dice.
Muchas empresas han introducido con éxito modelos de lenguaje pequeños en los últimos dos años. Y esos modelos son cada vez más inteligentes. Tomemos, por ejemplo, los modelos Llama de Meta: la empresa lanzó recientemente Llama 3.3 70B, un modelo de solo texto que ofrece un rendimiento similar al modelo 3.1 405B lanzado solo cinco meses antes.
“Esto también aplica a nivel generacional”, afirma Sy Choudhury, director de alianzas de IA en Meta. “Esperamos que estos niveles de avances continúen, lo que beneficiará a todos al reducir costos y la potencia del sistema al ofrecer casos de uso basados en IA generativa tanto a consumidores como a empresas”.
Matt White, director ejecutivo de PyTorch Foundation, está de acuerdo. “Creo que la tendencia más generalizada en la IA de código abierto para 2025 será mejorar el rendimiento de los modelos más pequeños y llevar los modelos de IA al límite”, dice, y agrega que los modelos más pequeños también pueden ayudar a garantizar una menor dependencia de sistemas externos.
“Hay muchos problemas difíciles en el campo del aprendizaje profundo”, afirma White. “Esperamos que haya innovaciones que reduzcan el tamaño de los modelos y, al mismo tiempo, mantengan el rendimiento, haciéndolos más receptivos y manteniendo actualizado el conocimiento del modelo, sin depender de sistemas externos”.
Stasenko enfatiza que si 2024 fue el año del auge de los modelos más pequeños, 2025 será el año de apoyarse en las capacidades de cada modelo, con un enfoque en la eficiencia energética. “Esta es la única manera”, dice.
Los modelos multimodales, o modelos que pueden procesar múltiples y diferentes tipos de medios, como texto, videos, imágenes y audio, también serán mejores y más ubicuos en 2025, dicen los expertos. Y eso incluye las versiones de código abierto.
"El auge de la funcionalidad multimodal continuará el próximo año", dice Choudhury de Meta. “Hoy en día, la mayoría de los modelos que mezclan texto, imagen y voz son una fusión de múltiples modelos de IA, pero esto está a punto de cambiar”. Choudhury predice que las arquitecturas futuras serán multimodales de forma nativa en dos o más dimensiones, lo que conducirá a algunos casos de uso nuevos “alucinantes”. “Imagine que puede hacerle una pregunta a un modelo sobre una imagen usando solo su voz, y puede responder perfectamente a través de voz, texto o una imagen. ¿O qué tal responder de nuevo con los tres al mismo tiempo?”
¿La IA de código abierto impulsará más innovación en 2025? Haddad, de Linux Foundation, así lo cree. Y a medida que los modelos de IA se vuelven más complejos, cree que las organizaciones desbloquearán la innovación a través de la colaboración con colaboradores externos.
“Con código abierto, los desarrolladores de todo el mundo pueden compartir su experiencia, lo que lleva a un rápido progreso y mejoras continuas en la infraestructura de IA generativa”, afirma. “Por ejemplo, en Linux Foundation IA & Data, tenemos más de 100 000 desarrolladores que contribuyen a nuestros 68 proyectos alojados, provenientes de más de 3000 organizaciones. No hay ninguna organización que pueda igualar ese nivel de experiencia y escala.
Arnaud Le Hors, miembro sénior del personal técnico de tecnologías abiertas en IBM Research, también contempla que las colaboraciones entre grandes empresas en LLM sean cada vez más comunes.
"Todavía hay competencia y una carrera para lanzar los modelos de mayor rendimiento", dice Le Hors. "Pero podemos imaginar grandes corporaciones colaborando en modelos fundacionales en el futuro".
