Alors que les entreprises technologiques investissent des milliards dans l'intelligence artificielle, une stratégie contre-intuitive gagne du terrain : donner le code. Le passage à des modèles d'IA open source reflète la pression croissante exercée pour maîtriser les coûts de développement tout en accélérant les avancées dans un domaine où les talents et la puissance de calcul ont un coût élevé.
La situation de l'IA évolue à mesure que des entreprises telles qu'IBM, Meta et Mistral AI adoptent le développement open source, mettant ainsi gratuitement à la disposition des développeurs et des chercheurs une technologie d'IA sophistiquée. Si cette approche pourrait démocratiser l'accès et accélérer les avancées grâce à la collaboration, les critiques soulignent qu'elle pourrait permettre à des acteurs malveillants d'utiliser ou de modifier la technologie à des fins nuisibles.
Les partisans affirment que le développement open source de l'IA permet aux chercheurs et aux développeurs du monde entier d'examiner, de modifier et d'améliorer cette technologie. Cette approche collaborative a déjà permis de réaliser des progrès significatifs en matière d'efficacité des modèles. Par exemple, les nouveaux modèles IA Granite 3.0 d’IBM offrent des performances comparables à celles des systèmes plus grands tout en ne nécessitant qu’une fraction des ressources informatiques.
IBM publie ses modèles Granite 3.0 en tant que logiciels open source sous la licence Apache 2.0, adoptant ainsi une approche sensiblement différente de celle des développeurs qui gardent leurs systèmes d'IA confidentiels. L’entreprise a construit ses modèles en utilisant des jeux de données publics tels que GitHub Code Clean et StarCoder, ce qui lui permet d’éviter les problèmes de droits d’auteur qui ont conduit à des poursuites contre des sociétés d’IA qui entraînent leurs modèles sur des contenus protégés, comme l’affaire en cours qui oppose News Corp à Perplexity.
La version inclut les modèles de langage 8B et 2B axés sur des tâches d’entreprise telles que la génération augmentée de récupération et la classification, ainsi que des variantes spécialisées pour l’instruction et la surveillance de la sécurité. Prenant en charge 116 langages de programmation et entraînés sur 3 à 4 téraoctets de tokens, les modèles sont disponibles via de multiples plateformes, notamment Hugging Face, GitHub et IBM watsonx.ai. Les modèles comportent de 3 à 34 milliards de paramètres et peuvent être utilisés pour la recherche et les applications commerciales sans restriction dans des versions nominalement « open source ».
« Disposer de cette diversité de pensée et contribuer à cet écosystème ouvert est une proposition bien plus intéressante que de garder nos modèles enfermés dans une boîte », explique Kate Soule, directrice du programme Data and Model Factory chez IBM Research. « Nous voulons que la communauté l’utilise. »
Le mouvement open source a également pris de l'ampleur en Europe, où Mistral AI s'est imposé comme un leader du secteur. La start-up basée à Paris a publié des modèles de plus en plus performants que les développeurs peuvent télécharger et modifier librement.
La stratégie open source crée un échange bidirectionnel : les entreprises partagent des modèles d'IA que seules les grandes entreprises peuvent se permettre de développer, tout en bénéficiant des connaissances de milliers de développeurs qui trouvent de nouvelles utilisations à cette technologie. Beaucoup affirment aujourd'hui que restreindre l'accès revient à passer à côté de cette innovation collective.
« Imaginez qu'il existe une petite modification innovante à apporter à l'architecture de votre modèle qui, même en laissant tout le reste inchangé, améliorerait considérablement les performances globales », explique Dave Bergmann, rédacteur principal chez IBM Think. « Si vous publiez votre modèle uniquement en tant que poids ouvert et refusez de divulguer des informations et le code de son architecture, vous pourriez ne jamais saisir cette opportunité. Mais si 20 000 personnes manipulent le code de votre modèle, quelqu'un finira par la repérer. »
La sortie par Meta de ses modèles Llama open source a marqué un tournant important. Cela signifie que l'une des plus grandes entreprises technologiques a permis aux chercheurs et aux petites organisations d'accéder à une technologie d'IA avancée qu'ils n'auraient jamais pu se permettre de mettre au point de manière indépendante.
« Nous sommes convaincus que l'IA open source est bénéfique pour tous, à commencer par les développeurs qui peuvent utiliser ces modèles, les peaufiner, les entraîner, les distiller et les utiliser où ils le souhaitent », a déclaré Amit Sangani, directeur principal de l'ingénierie des partenaires IA chez Meta, lors d'une récente réunion de l'AI Alliance. « Plus l’IA est open source, plus elle devient transparente et sûre. Elle fait l'objet d'un examen minutieux, ce qui est une bonne chose, car lorsque des problèmes sont détectés, les personnes concernées, y compris Meta, les corrigent. »
Malgré ses avantages, la technologie d'IA open source peut comporter des risques. Certains observateurs affirment que les modèles d’IA open source peuvent être plus facilement modifiés à des fins nuisibles, comme la génération de désinformation ou la création de logiciels malveillants. L'absence de contrôle centralisé implique que, même si les développeurs originaux respectent des normes éthiques élevées, les versions modifiées de leurs modèles pourraient ne pas en faire autant.
Néanmoins, les gains d'efficacité démontrés par des modèles tels que Granite 3.0 laissent entrevoir un avenir où les capacités de l'IA deviendront plus accessibles aux entreprises disposant de ressources limitées. Les petites entreprises qui n'ont pas les moyens de se doter de modèles linguistiques volumineux pourraient envisager des alternatives open source plus petites et plus efficaces, adaptées à leurs besoins spécifiques.
« L'open source va favoriser davantage d'innovation dans un plus grand nombre de domaines », déclare Dave Nielsen, directeur de la communauté AI Alliance. « Cela va susciter davantage d'enthousiasme chez les entrepreneurs et les clients, et générer plus de revenus. »
