Très connus pour avoir contribué à introduire l’IA générative auprès du grand public, les LLM présentent également un grand intérêt pour les entreprises qui cherchent à intégrer l’intelligence artificielle dans leurs fonctions et à multiplier les cas d’utilisation.

En dehors du contexte de l’entreprise, on pourrait croire que les LLM sont sortis de nulle part, en même temps que d’autres avancées en matière d’IA générative. Pourtant, cela fait des années que bon nombre d’entreprises, dont IBM, mettent en œuvre les LLM à différents niveaux pour améliorer la compréhension du langage naturel (NLU) et le traitement automatique du langage naturel (TAL). Parallèlement, d’autres avancées ont été réalisées : machine learning, modèles de machine learning, algorithmes, réseaux neuronaux et modèles de type « transformateur » qui fournissent l’architecture de ces systèmes d’IA.

Les LLM représentent une catégorie de modèles de fondation qui sont entraînés à l’aide de vastes quantités de données afin de fournir les fonctionnalités essentielles pour gérer une multitude de cas d’utilisation et d’applications, et accomplir un grand nombre de tâches. Cette approche est aux antipodes de celle qui consiste à créer et à entraîner des modèles spécifiques à chaque domaine, pour chaque cas d’utilisation, qui est à proscrire à bien des égards (principalement le coût et l’infrastructure), qui freine les synergies et peut même engendrer une baisse des performances.

Les LLM représentent une avancée majeure en matière de TAL et d’intelligence artificielle, et sont facilement accessibles au public grâce à des interfaces telles que Chat GPT-3 et GPT-4 d’Open AI, désormais intégrées par Microsoft. Parmi les autres exemples, citons les modèles Llama de Meta et les modèles BERT/RoBERTa (représentations d’encodeur bidirectionnel à partir de transformateurs) et PaLM de Google. IBM a récemment lancé sa série de modèles Granite sur la plateforme watsonx.ai, devenue l’épine dorsale de l’IA générative qui alimente d’autres produits IBM tels que watsonx Assistant et watsonx Orchestrate.

En bref, les LLM sont conçus pour comprendre et générer des textes en langage humain, ainsi que d’autres formes de contenu, grâce aux énormes quantités de données utilisées pour les entraîner. Ils ont la capacité de saisir le contexte, de générer des réponses cohérentes et contextuellement pertinentes, de traduire en langues autres que l’anglais, de résumer un texte, de répondre à des questions (conversation générale et FAQ), et même d’accélérer l’écriture créative et les tâches de génération de code.

Tout cela est possible grâce aux milliards de paramètres qui leur permettent de saisir des schémas linguistiques complexes et de réaliser un large éventail de tâches ayant trait au langage. Les LLM sont en train de révolutionner les applications dans divers domaines, des chatbots à la traduction en passant par les assistants virtuels, la production de contenu et la recherche.

Parce qu’ils ne cessent d’évoluer et de s’améliorer, les LLM promettent de changer notre façon d’interagir avec la technologie et d’accéder à l’information. Leur rôle dans le paysage numérique moderne est donc fondamental.