IBM está lanzando sus modelos Granite 3.0 como software de código abierto bajo la licencia Apache 2.0, adoptando un enfoque marcadamente diferente al de los desarrolladores que mantienen sus sistemas de IA privados. La empresa construyó sus modelos utilizando conjuntos de datos públicos como GitHub Code Clean y StarCoder, lo que les permitió evitar los problemas de derechos de autor que han llevado a demandas contra empresas de IA que entrenan sus modelos con contenido protegido, como el caso actual de News Corp contra Perplexity.

La versión incluye modelos de lenguaje 8B y 2B enfocados en tareas empresariales como generación aumentada por recuperación, junto con variantes especializadas para la instrucción y el monitoreo de seguridad. Con compatibilidad para 116 lenguajes de programación y entrenados en 3-4 terabytes de tokens, los modelos están disponibles a través de múltiples plataformas, incluidas Hugging Face, GitHub e IBM watsonx.ai. Los modelos oscilan entre 3 y 34 000 millones de parámetros y se pueden utilizar para aplicaciones comerciales y de investigación sin restricciones en versiones nominalmente de "código abierto".

"Tener esa diversidad de pensamiento y contribuir como parte de este ecosistema abierto es una propuesta mucho más emocionante que mantener nuestros modelos cerrados en una caja", dice Kate Soule, directora de programa de fábrica de datos y modelos de IBM Research. “Queremos que la comunidad lo use”.

El movimiento de código abierto también ha cobrado impulso en Europa, donde Mistral AI se ha convertido en líder de la industria. La startup con sede en París ha lanzado modelos cada vez más capaces que los desarrolladores pueden descargar y modificar libremente.

La estrategia de código abierto crea un intercambio bidireccional: las empresas comparten modelos de IA que solo los bolsillos más profundos podrían crear, al tiempo que obtienen insights de miles de desarrolladores que encuentran nuevos usos para la tecnología. Muchos argumentan ahora que restringir el acceso significa perderse esta innovación colectiva.

"Imagínese que existe algún pequeño ajuste novedoso en la arquitectura de su modelo que, incluso dejando todo lo demás sin cambios, mejoraría significativamente el rendimiento general", dice Dave Bergmann, escritor sénior de IBM Think. “Si lanza su modelo solo como peso abierto y se niega a divulgar información y código para su arquitectura, es posible que nunca se dé cuenta de la oportunidad allí. Pero si 20 000 personas juegan con el código de su modelo, alguien lo detectará”.