Mientras las empresas tecnológicas invierten miles de millones en inteligencia artificial, una estrategia contraria a la intuición está ganando terreno: regalar el código. El movimiento a modelos de IA de código abierto refleja la creciente presión para reducir los costos de desarrollo, al tiempo que acelera los avances en un campo donde el talento y la potencia informática tienen un precio elevado.
El ámbito de la IA está cambiando a medida que empresas como IBM, Meta y Mistral AI adoptan el desarrollo de código abierto, poniendo la tecnología de IA a disposición de desarrolladores e investigadores de manera gratuita. Si bien este enfoque podría democratizar el acceso y acelerar los avances a través de la colaboración, los críticos advierten que podría permitir que los actores maliciosos hagan un mal uso o modifiquen la tecnología con fines dañinos.
Los defensores afirman que el desarrollo de IA de código abierto permite a investigadores y desarrolladores de todo el mundo examinar, modificar y mejorar la tecnología. Este enfoque colaborativo ya ha producido avances significativos en la eficiencia del modelo. Por ejemplo, los nuevos modelos de IA Granite 3.0 de IBM logran un rendimiento comparable al de sistemas más grandes y requieren solo una fracción de los recursos informáticos.
IBM está lanzando sus modelos Granite 3.0 como software de código abierto bajo la licencia Apache 2.0, adoptando un enfoque marcadamente diferente al de los desarrolladores que mantienen sus sistemas de IA privados. La empresa construyó sus modelos utilizando conjuntos de datos públicos como GitHub Code Clean y StarCoder, lo que les permitió evitar los problemas de derechos de autor que han llevado a demandas contra empresas de IA que entrenan sus modelos con contenido protegido, como el caso actual de News Corp contra Perplexity.
La versión incluye modelos de lenguaje 8B y 2B enfocados en tareas empresariales como generación aumentada por recuperación, junto con variantes especializadas para la instrucción y el monitoreo de seguridad. Con compatibilidad para 116 lenguajes de programación y entrenados en 3-4 terabytes de tokens, los modelos están disponibles a través de múltiples plataformas, incluidas Hugging Face, GitHub e IBM watsonx.ai. Los modelos oscilan entre 3 y 34 000 millones de parámetros y se pueden utilizar para aplicaciones comerciales y de investigación sin restricciones en versiones nominalmente de "código abierto".
"Tener esa diversidad de pensamiento y contribuir como parte de este ecosistema abierto es una propuesta mucho más emocionante que mantener nuestros modelos cerrados en una caja", dice Kate Soule, directora de programa de fábrica de datos y modelos de IBM Research. “Queremos que la comunidad lo use”.
El movimiento de código abierto también ha cobrado impulso en Europa, donde Mistral AI se ha convertido en líder de la industria. La startup con sede en París ha lanzado modelos cada vez más capaces que los desarrolladores pueden descargar y modificar libremente.
La estrategia de código abierto crea un intercambio bidireccional: las empresas comparten modelos de IA que solo los bolsillos más profundos podrían crear, al tiempo que obtienen insights de miles de desarrolladores que encuentran nuevos usos para la tecnología. Muchos argumentan ahora que restringir el acceso significa perderse esta innovación colectiva.
"Imagínese que existe algún pequeño ajuste novedoso en la arquitectura de su modelo que, incluso dejando todo lo demás sin cambios, mejoraría significativamente el rendimiento general", dice Dave Bergmann, escritor sénior de IBM Think. “Si lanza su modelo solo como peso abierto y se niega a divulgar información y código para su arquitectura, es posible que nunca se dé cuenta de la oportunidad allí. Pero si 20 000 personas juegan con el código de su modelo, alguien lo detectará”.
El lanzamiento por parte de Meta de sus modelos Llama de código abierto supuso un importante punto de inflexión. Significaba que una de las mayores empresas tecnológicas ofrecía a investigadores y pequeñas organizaciones acceso a tecnología avanzada de IA que nunca podrían permitirse construir de forma independiente.
"Creemos fundamentalmente que el código abierto de IA es bueno para todos, empezando por los desarrolladores que pueden tomar estos modelos y ajustarlos, entrenarlos, destilarlos y usarlos donde quieran", dice Amit Sangani, director sénior de ingeniería de socios de IA en Meta, durante una reunión reciente de la AI Alliance. “Cuanto más de código abierto es la IA, más transparente y segura se vuelve. Se analiza ampliamente, y eso es bueno, porque cuando se encuentran problemas, las personas, incluida Meta, los arreglan”.
A pesar de las ventajas, la tecnología de IA de código abierto podría conllevar riesgos. Algunos observadores dicen que los modelos de IA de código abierto se pueden modificar más fácilmente con fines dañinos, como generar desinformación o crear malware. La falta de control centralizado significa que incluso si los desarrolladores originales se adhieren a altos estándares éticos, es posible que las versiones modificadas de sus modelos no lo hagan.
No obstante, las ganancias de eficiencia demostradas por modelos como Granite 3.0 apuntan a un futuro potencial en el que las capacidades de IA se vuelven más accesibles para las organizaciones con recursos limitados. Las pequeñas empresas que no pueden permitirse el lujo de ejecutar modelos de lenguaje masivo podrían desplegar alternativas más pequeñas, más eficientes y de código abierto adaptadas a sus necesidades específicas.
"El código abierto va a permitir más innovación en más lugares", dice Dave Nielsen, director de la comunidad de IA Alliance. "Y eso generará más entusiasmo para más empresarios y más clientes, y generará más ingresos".
Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM® watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.