Les grands modèles de langage (LLM) sont des modèles de fondation qui utilisent l’intelligence artificielle (IA), l’apprentissage profond et d’immenses jeux de données, y compris des sites Web, des articles et des livres, pour générer du texte, traduire d’une langue à l’autre et rédiger de nombreux types de contenu. Il existe deux types de modèles d'IA générative : les grands modèles linguistiques propriétaires et les grands modèles linguistiques open source.
Dans cette vidéo, Martin Keen explique brièvement les grands modèles de langage, comment ils sont liés aux modèles de fondation, comment ils opèrent et comment ils peuvent être utilisés pour résoudre divers problèmes métier.
Les LLM propriétaires appartiennent à une entreprise et ne peuvent être utilisés que par les clients qui achètent une licence. La licence peut restreindre l’utilisation du LLM. D'autre part, les LLM open source sont gratuits et accessibles à tous, pouvant être utilisés à toutes fins, modifiés et distribués.
Le terme « open source » fait référence au code du LLM et à l’architecture sous-jacente accessibles au public, ce qui signifie que les développeurs et les chercheurs sont libres d’utiliser, d’améliorer ou de modifier le modèle.
Auparavant, il semblait que plus un LLM était grand, mieux c’était, mais les entreprises se rendent compte aujourd’hui que le coût de la recherche et de l’innovation peut être prohibitif. En réponse, un écosystème de modèles open source a commencé à se montrer prometteur et à remettre en question le modèle de gestion des LLM.
Les entreprises qui ne disposent pas en interne de compétences en machine learning peuvent utiliser des LLM open source, qui offrent transparence et flexibilité, au sein de leur propre infrastructure, que ce soit dans le cloud ou sur site. Elles ont ainsi un contrôle total sur leurs données et signifie que les informations sensibles restent au sein de leur réseau. Tout cela permet de réduire le risque de fuite de données ou d’accès non autorisé.
Un LLM open source offre de la transparence sur son fonctionnement, son architecture, ses données et ses méthodologies d’entraînement, et sur son utilisation. La possibilité d'inspecter le code et d'avoir une visibilité sur les algorithmes permet à une entreprise de gagner en confiance, facilite les audits et contribue à garantir le respect des normes éthiques et légales. De plus, l'optimisation efficace d'un LLM open source peut réduire la latence et augmenter les performances.
Ils sont généralement beaucoup moins coûteux à long terme que les LLM propriétaires, car ils ne nécessitent pas de frais de licence. Cependant, le coût d'exploitation d'un LLM inclut les coûts liés à l'infrastructure cloud ou sur site, et ceux-ci impliquent généralement un coût initial de déploiement important.
Les LLM open source pré-entraînés permettent un ajustement précis. Les entreprises peuvent ajouter des fonctionnalités au LLM qui apportent un avantage à leur utilisation spécifique, et les LLM peuvent également être entraînés sur des jeux de données spécifiques. Apporter ces modifications ou spécifications à un LLM propriétaire nécessite de collaborer avec un fournisseur et implique des coûts en termes de temps et d'argent.
Alors que les LLM propriétaires impliquent qu'une entreprise doit s'appuyer sur un seul fournisseur, un LLM open source permet à l'entreprise de tirer parti des contributions de la communauté, de plusieurs fournisseurs de services et éventuellement d'équipes internes pour gérer les mises à jour, le développement, la maintenance et l'assistance. L’open source permet aux entreprises d’expérimenter et d’utiliser les contributions de personnes ayant des perspectives différentes. Cela peut aboutir à des solutions permettant aux entreprises de rester à la pointe de la technologie. Cela permet également aux entreprises utilisant des LLM open source de mieux contrôler leur technologie et leurs décisions concernant la manière dont elles l’utilisent.
Newsletter sectorielle
Obtenez des informations sur les actualités les plus importantes et les plus intrigantes en matière d’intelligence artificielle. Abonnez-vous à notre newsletter hebdomadaire Think. Lire la Déclaration de confidentialité d’IBM.
Vous recevrez votre abonnement en anglais. Vous trouverez un lien de désabonnement dans chaque newsletter. Vous pouvez gérer vos abonnements ou vous désabonner ici. Consultez la Déclaration de confidentialité d’IBM pour plus d’informations.
Les entreprises peuvent utiliser des modèles LLM open source pour créer pratiquement n'importe quel projet utile à leurs employés ou, lorsque la licence open source le permet, qui peut être proposé sous forme de produits commerciaux. En voici quelques exemples :
Les modèles LLM open source vous permettent de créer une application avec des capacités de génération de langage, telles que la rédaction d’e-mails, d’articles de blog ou de récits créatifs. Un LLM comme le Falcon-40B, proposé sous licence Apache 2.0, peut répondre à un prompt en proposant des suggestions de texte de haute qualité que vous pouvez ensuite affiner et peaufiner.
Les LLM open source entraînés sur les langages de code et de programmation existants peuvent aider les développeurs à créer des applications et à trouver les erreurs et les défauts liés à la sécurité.
Les LLM open source vous permettent de créer des applications qui offrent des expériences d’apprentissage personnalisées, qui peuvent être personnalisées et adaptées à des styles d’apprentissage particuliers.
Un outil LLM open source qui résume des articles longs, des actualités, des rapports de recherche et plus encore peut faciliter l’extraction de données clés.
Ces systèmes sont capables de comprendre et de répondre à des questions, de formuler des suggestions et d'engager une conversation en langage naturel.
Les LLM open source qui s’entraînent sur des jeux de données multilingues peuvent fournir des traductions précises et fluides dans de nombreux langages.
Les LLM peuvent analyser le texte pour déterminer le ton relatives aux émotions ou aux sentiments, ce qui est précieux pour gérer la réputation de la marque et analyser les commentaires des clients.
Les LLM peuvent être utiles pour identifier et filtrer les contenus en ligne inappropriés ou nuisibles, ce qui contribue grandement à maintenir un environnement en ligne plus sûr.
Un grand nombre d’entreprises utilisent des LLM open source. Par exemple, IBM et la NASA ont développé un LLM open source entraîné sur des données géospatiales pour aider les scientifiques et leurs organisations à lutter contre le changement climatique.
Les éditeurs et les journalistes utilisent des LLM open source en interne pour analyser, identifier et résumer les informations sans partager les données propriétaires en dehors de la salle de rédaction.
Certaines entreprises de santé utilisent des LLM open source dans leurs logiciels de santé, notamment les outils de diagnostic, l’optimisation des traitements et les outils gérant les informations sur les patients, la santé publique et plus.
Le LLM open source FinGPT a été développé spécifiquement pour le secteur financier.
L'Open LLM Leaderboard a pour objectif de suivre, de classer et d'évaluer les LLM et les chatbots open source selon différents critères de référence.
Bien que les résultats du LLM semblent fluides et fiables, il peut y avoir des risques, notamment celui de fournir des informations basées sur des « hallucinations », ainsi que des problèmes liés aux préjugés, au consentement ou à la sécurité. La sensibilisation à ces risques constitue une réponse à ces questions relatives aux données et à l'IA.
Les modèles IA, en particulier les LLM, seront l’une des technologies les plus révolutionnaires de la prochaine décennie. Étant donné que les nouvelles réglementations relatives à l'IA imposent des directives concernant son utilisation, il est essentiel non seulement de gérer et de réglementer les modèles d'IA, mais également, et tout aussi important, de réglementer les données intégrées à l'IA.
Afin d'aider les organisations à répondre à ces besoins et à multiplier l'impact de l'IA, IBM propose watsonx, notre plateforme d'IA et de données prête à l'emploi pour les entreprises. Ainsi, watsonx offre aux organisations la possibilité de :
La fonctionnalité de recherche conversationnelle d'IBM Watsonx Assistant s'appuie sur ses intégrations préconfigurées, son cadre d'intégrations low-code (lien externe à ibm.com) et son expérience de création sans code. Les développeurs et les utilisateurs professionnels peuvent automatiser les réponses aux questions grâce à la recherche conversationnelle, ce qui leur permet de se consacrer à la création de flux transactionnels à plus forte valeur ajoutée et d'expériences en ligne intégrées avec leurs assistants virtuels.
Au-delà de la recherche conversationnelle, watsonx Assistant poursuit sa collaboration avec IBM Research et watsonx afin de développer des modèles d'apprentissage automatique watsonx personnalisés, spécialisés dans la classification, le raisonnement, l'extraction d'informations, la synthèse et d'autres cas d'utilisation conversationnelle. Watsonx Assistant a déjà réalisé des avancées majeures en matière de capacité à comprendre les clients en utilisant de grands modèles linguistiques en toute simplicité.
Modèles de langage open source de petite taille, conçus pour offrir performance et transparence à un prix compétitif.
Mettez l’IA au service de votre entreprise en vous appuyant sur l’expertise de pointe d’IBM dans le domaine de l’IA et sur son portefeuille de solutions.
Réinventez les workflows et les opérations critiques en ajoutant l’IA pour optimiser les expériences, la prise de décision et la valeur métier en temps réel.