Mientras las empresas tecnológicas invierten miles de millones en inteligencia artificial, una estrategia contraintuitiva está ganando adeptos: regalar el código. El mover a los modelos de IA de código abierto refleja la creciente presión para frenar los costes de desarrollo y, al mismo tiempo, acelerar los avances en un campo en el que el talento y la potencia de cálculo tienen un precio elevado.
El panorama de IA está cambiando a medida que empresas como IBM, Meta y Mistral AI adoptan el desarrollo de código abierto, poniendo la tecnología de IA sofisticada a disposición de desarrolladores e investigadores. Si bien este enfoque podría democratizar el acceso y acelerar los avances a través de la colaboración, los críticos advierten que podría permitir a los malos actores hacer un uso indebido o modificar la tecnología con fines perjudiciales.
Sus defensores afirman que el desarrollo de la IA en código abierto hace posible que investigadores y desarrolladores de todo el mundo inspeccionen, modifiquen y mejoren la tecnología. Este enfoque de colaboración ya ha producido avances significativos en la eficacia de los modelos. Por ejemplo, los nuevos modelos de IA Granite 3.0 de IBM logran un rendimiento comparable al de sistemas más grandes y requieren solo una fracción de los recursos informáticos.
IBM está lanzando sus modelos Granite 3.0 como software de código abierto bajo la licencia Apache 2.0, adoptando un enfoque marcadamente diferente al de los desarrolladores que mantienen sus sistemas de IA privados. La empresa construyó sus modelos utilizando conjuntos de datos públicos como GitHub Code Clean y StarCoder, lo que les permitió evitar los problemas de derechos de autor que han llevado a demandas contra empresas de IA que entrenan sus modelos con contenido protegido, como el caso actual de News Corp contra Perplexity.
La versión incluye modelos de lenguaje 8B y 2B enfocados en tareas empresariales como generación aumentada por recuperación y clasificación, junto con variantes especializadas para la instrucción y la monitorización de seguridad. Los modelos, compatibles con 116 lenguajes de programación y entrenados en 3-4 terabytes de tokens, están disponibles a través de múltiples plataformas, como Hugging Face, GitHub e IBM watsonx.ai. Los modelos oscilan entre 3 y 34 mil millones de parámetros y pueden utilizarse para aplicaciones comerciales y de investigación sin restricciones en versiones nominalmente de "código abierto".
"Contar con esa diversidad de pensamiento y contribuir a este ecosistema abierto es una propuesta mucho más emocionante que mantener nuestros modelos encerrados en una caja", afirma Kate Soule, directora del programa Data and Model Factory de IBM Research. "Queremos que la comunidad lo utilice".
El movimiento de código abierto también ha cobrado impulso en Europa, donde Mistral AI se ha convertido en líder de sectores. La startup con sede en París ha lanzado modelos cada vez más capaces que los desarrolladores pueden descargar y modificar libremente.
La estrategia de código abierto crea un intercambio bidireccional: las empresas comparten modelos de IA que solo los grandes bolsillos podrían construir, al tiempo que obtienen conocimientos de miles de desarrolladores a medida que encuentran nuevos usos para la tecnología. Muchos argumentan ahora que restringir el acceso significa perderse esta innovación colectiva.
"Imagínese que existe algún pequeño y novedoso ajuste en la arquitectura de su modelo que, incluso dejando todo lo demás sin cambios, mejoraría significativamente el rendimiento general", afirma Dave Bergmann, redactor sénior de IBM Think. "Si publica su modelo solo como peso abierto y se niega a revelar información y código para su arquitectura, es posible que nunca se dé cuenta de la oportunidad que hay ahí. Pero si 20 000 personas manipulan el código de su modelo, alguien lo detectará”.
El lanzamiento por parte de Meta de sus modelos Llama de código abierto supuso un punto de inflexión importante. Significaba que una de las mayores empresas tecnológicas ofrecía a investigadores y pequeñas organizaciones acceso a tecnología avanzada de IA que nunca podrían permitirse construir de forma independiente.
"Creemos firmemente que la IA de código abierto es buena para todos, empezando por los desarrolladores, que pueden tomar estos modelos y ajustarlos, entrenarlos, afinarlos y utilizarlos donde quieran", afirmó Amit Sangani, director sénior de Ingeniería de Socios de IA en Meta, durante una reciente reunión de la Alianza de IA. “Cuanto más abierto sea el código de la IA, más transparente y más segura se vuelve. Se analiza ampliamente, y eso es algo bueno, porque cuando se encuentran problemas, las personas, incluida Meta, realizan correcciones.
A pesar de las ventajas, la tecnología de IA de código abierto podría conllevar riesgos. Algunos observadores afirman que los modelos de IA de código abierto pueden modificarse más fácilmente con fines dañinos, como generar desinformación o crear malware. La falta de control centralizado significa que incluso si los desarrolladores originales se adhieren a altos estándares éticos, las versiones modificadas de sus modelos podrían no hacerlo.
No obstante, las ganancias de eficiencia demostradas por modelos como Granite 3.0 apuntan a un futuro potencial en el que las capacidades de IA sean más accesibles para las organizaciones con recursos limitados. Las pequeñas empresas que no pueden permitirse ejecutar modelos de lenguaje masivos podrían implementar alternativas más pequeñas, eficientes y de código abierto adaptadas a sus necesidades específicas.
“El código abierto permitirá más innovación en más lugares”, afirma Dave Nielsen, director de la comunidad de AI Alliance. "Y eso solo generará más entusiasmo para más empresarios y más clientes, y generará más ingresos".
