Les grands modèles de langage (LLM) ont dominé les débats autour de l’IA, alimentés par la popularité de ChatGPT et des applications d’IA générative similaires. Cependant, les petits modèles de langage (SLM) sont en plein essor. Plus compacts et plus efficaces, les SLM consomment moins de mémoire et de puissance de traitement, ce qui les rend mieux adaptés aux environnements à ressources limitées.
Leur capacité à produire du contenu unique et des informations à partir de vastes jeux de données a captivé le monde entier et donné vie à de nouvelles applications, consolidant encore leur impact culturel, notamment dans l’entreprise. Découvrons aux côtés du Dr Juan Bernabe Moreno, directeur d’IBM Research Europe pour le Royaume-Uni et l’Irlande, comment les SLM peuvent favoriser l’adoption de l’IA par les entreprises.
L’intelligence artificielle générative recèle un potentiel de productivité important pour les entreprises. Cependant, lorsqu’il s’agit d’implémenter des modèles d’IA, voir plus grand n’est pas toujours la meilleure idée. Deux problèmes majeurs empêchent l’adoption des LLM par les entreprises.
Tout d’abord, de nombreux LLM sont à usage général, ce qui limite leur valeur. Les modèles d’entreprise « moyens » ne sont pas efficaces, car il n’existe pas d’entreprise « moyenne ». Pour être efficaces, les modèles d’IA doivent être créés, optimisés et déployés pour répondre aux besoins spécifiques de chaque entreprise.
Deuxièmement, de nombreux LLM exclusifs sont des « boîtes noires », un modèle fermé dont seule l’entreprise qui le possède peut percevoir les composantes. Ces modèles offrent peu de transparence sur les données et gênent l’ajustement avec les données d’entreprise, où réside la véritable valeur de l’IA. Les entreprises responsables de la performance des modèles n’ont donc ni visibilité ni contrôle.
Ces problèmes entravent la confiance et la compréhension de la sécurité des modèles. Si elles ne choisissent pas efficacement les solutions d’IA générative pour répondre aux exigences industrielles, légales et réglementaires, les entreprises ne peuvent pas utiliser pleinement la puissance de l’IA générative.
Pour une utilisation réussie de l’IA générative, les entreprises ont besoin de 3 éléments :
Pour répondre à ces besoins et maximiser la valeur de l’IA, les entreprises se tournent vers les SLM et découvrent le pouvoir du petit. Les SLM offrent une alternative intéressante aux LLM à usage général.
Les SLM ont reçu beaucoup moins d’attention et d’ovation, mais ils constituent une option intéressante pour les entreprises de toutes tailles. Leur efficacité énergétique, la transparence des données et leurs performances, souvent équivalentes ou supérieures à celles des modèles plus grands, laissent le champ libre à une adoption responsable de l’IA générative sans entraver l’innovation.
En général, tout ce qui comporte moins de 30 milliards de paramètres est considéré comme un SLM. Les principaux avantages incluent la baisse des coûts, la réduction de la consommation d’énergie et l’amélioration de la transparence et de l’intégrité des données. Une nouvelle génération de modèles plus petits, tels qu’IBM® Granite, construits sur des ensembles de données nettoyés et filtrés pour des tâches spécifiques, réduit les risques tels que les biais et les résultats inappropriés tout en augmentant la visibilité des données.
Ce modèle de base fiable permet une intégration en toute confiance des données propriétaires, libérant la véritable valeur de l’IA. IBM fournit une garantie de propriété intellectuelle (PI) pour tous les modèles Granite, renforçant ainsi la confiance dans la fusion de leurs données avec les modèles.
IBM estime que les modèles de base open source permettent aux entreprises de créer des modèles spécialisés, infusés de données. Pour ce faire, IBM a conçu Granite, une famille de SLM personnalisables open source formés sur des jeux de données transparents et filtrés.
Associer un petit modèle Granite avec des données d’entreprise permet d’obtenir des performances spécifiques aux tâches rivalisant avec les modèles plus grands, à un coût nettement inférieur. Les premières preuves de concept montrent que les modèles IBM Granite coûtent nettement moins cher (entre 3 et 23 fois moins) que les grands modèles de frontière, tout en surpassant ou en comparant leurs concurrents de taille similaire sur des critères de référence clés.
En outre, de nouvelles techniques telles qu’ InstructLab, introduites par IBM et RedHat en mai 2024, simplifient l’intégration des données d’entreprise dans les LLM. InstructLab permet aux entreprises de personnaliser leurs modèles d’IA en utilisant bien moins d’informations humaines et de ressources qu’une tâche de réentraînement classique.
Les SLM, notamment les modèles Granite, ont déjà un impact. Les institutions sportives du monde entier utilisent des modèles Granite, adaptés à leurs propres données de domaine, pour améliorer l’expérience des fans grâce à des commentaires générés par l’IA. En interne, IBM utilise des modèles Granite pour alimenter sa plateforme de services de ressources humaines AskHR. En utilisant des prompts en langage naturel, les utilisateurs d’IBM peuvent accéder aux services RH en un seul endroit, ce qui permet aux employés et aux professionnels des RH de gagner du temps.
Les grands LLM ne sont pas le seul moyen de tirer avantage de l’IA générative. Des modèles spécialisés, plus petits et plus accessibles, offrent l’efficacité, la confiance, la flexibilité et les performances nécessaires à un coût moindre, tant sur le plan financier qu’environnemental.
