Comme leur nom l’indique, les modèles d’IA générative génèrent du texte, des images, du code ou d’autres réponses en fonction du prompt de l’utilisateur. Les organisations qui les utilisent correctement peuvent constater une myriade d’avantages, depuis une efficacité opérationnelle accrue et une prise de décision améliorée jusqu’à la création rapide de contenu marketing. Mais qu’est-ce qui soutient la fonctionnalité générative de ces modèles et, en fin de compte, leurs avantages pour l’organisation ?
C’est là que les modèles de fondation entrent en scène. C’est le moteur sous-jacent qui confère aux modèles génératifs les capacités améliorées de raisonnement et d’apprentissage profond qui font défaut aux modèles de machine learning traditionnels. Associés à des magasins de données, les modèles de fondation permettent de créer et de personnaliser des outils d’IA générative dans les organisations de tous secteurs cherchant à optimiser l’assistance client, le marketing, les RH (y compris l’acquisition de talents) et les fonctions informatiques.
Également appelé « transformer », un modèle de fondation est un algorithme d’IA entraîné sur de vastes quantités de données couvrant des domaines étendus. Le terme « modèle de fondation » a été inventé par le Stanford Institute for Human-Centered Artificial Intelligence en 2021.
Les modèles de fondation reposent sur une architecture de modèle de réseau de neurones : ils traitent les informations de la même manière que le cerveau humain. Les modèles de fondation peuvent être entraînés pour effectuer des tâches telles que la classification des données, l’identification d’objets dans les images (vision par ordinateur) et le traitement automatique du langage naturel (NLP) (compréhension et génération de texte) avec un degré élevé de précision. Ils peuvent également suivre un apprentissage auto-supervisé pour se généraliser et appliquer leurs connaissances à de nouvelles tâches.
Au lieu de consacrer du temps et des efforts à entraîner un modèle de A à Z, les data scientists peuvent s’appuyer sur des modèles de fondation préentraînés pour créer ou personnaliser des modèles d’IA adaptés à un cas d’utilisation spécifique. Un modèle de fondation pourrait par exemple servir de base à un modèle d’IA générative qui serait ensuite affiné à l’aide de jeux de données supplémentaires dans l’objectif d’identifier des méthodes plus sûres et plus rapides pour fabriquer un certain type de produit.
Certains modèles de fondation spécifiques, connus sous le nom de grands modèles de langage (LLM), sont entraînés sur de grandes quantités de données textuelles pour des tâches de NLP. BERT (Bi-directional Encoder Representations from Transformers) est l’un des premiers modèles de fondation de ce type à avoir été développés. Google crée le modèle open source BERT en 2018. Il est préentraîné sur un large corpus de données en langue anglaise avec auto-supervision et peut être utilisé pour une variété de tâches :
Les modèles de fondation utilisés pour l’IA générative se distinguent des modèles de machine learning traditionnels, car ils peuvent être entraînés sur de grandes quantités de données non étiquetées pour prendre en charge des applications qui génèrent du contenu ou exécutent des tâches.
Par ailleurs, les modèles de machine learning traditionnels sont généralement entraînés pour une seule tâche sur des données étiquetées, par exemple en utilisant des images étiquetées de voitures pour entraîner le modèle à reconnaître les voitures dans les images non étiquetées.
Le studio watsonx.ai d’IBM propose une suite de modèles de fondation dédiés au langage et au code, chacun portant un nom de code sur le thème de la géologie, et pouvant être personnalisé pour des tâches d’entreprise variées. Tous les modèles watsonx.ai sont entraînés sur le data lake organisé et axé sur l’entreprise d’IBM.
Slate fait référence à une famille de modèles encodeurs uniquement, qui, bien que non génératifs, sont rapides et efficaces pour de nombreuses tâches de NLP d’entreprise.
Les modèles Granite s’appuient sur une architecture de type GPT basée sur un décodeur uniquement pour les tâches génératives.
Les modèles Sandstone utilisent une architecture encodeur-décodeur et sont bien adaptés à un affinage sur des tâches spécifiques.
Les modèles Obsidian utilisent une nouvelle architecture modulaire développée par IBM Research, offrant une grande efficacité d’inférence et des niveaux de performance élevés pour toute une variété de tâches.
Sans un accès sécurisé à des connaissances fiables et propres à un domaine, les modèles de fondation seraient bien moins dignes de confiance et bénéfiques pour les applications d’IA d’entreprise. Heureusement, des magasins de données peuvent servir de référentiels sécurisés et permettre aux modèles de fondation d’étendre à la fois leur taille et leurs données d’entraînement.
Les magasins de données adaptés à l’IA générative d’entreprise sont construits sur une architecture de data lakehouse ouverte, alliant les qualités d’un data lake et d’un entrepôt de données. Cette architecture permet de réaliser des économies grâce à un stockage d’objets à faible coût et de partager de grands volumes de données via des formats de table ouverts comme Apache Iceberg, conçus pour des analyses haute performance et un traitement des données à grande échelle.
Les modèles de fondation peuvent interroger de très grands volumes de données propres à un domaine dans un conteneur évolutif et rentable. Et parce combinés au cloud, ces types de magasins de données permettent une évolutivité pratiquement illimitée, les lacunes des modèles de fondation sont réduites, voire éliminées au fil du temps avec l’ajout de données supplémentaires. Plus ce manque de connaissances est comblé, plus le modèle de fondation devient fiable et plus sa portée est grande.
Avec les magasins de données, les data scientists disposent d’un référentiel qu’ils peuvent utiliser pour collecter et nettoyer les données utilisées pour entraîner et affiner les modèles de fondation. Et les magasins de données qui s’appuient sur des infrastructures cloud et des infrastructures de cloud hybride tierces pour le traitement de grands volumes de données sont critiques à la rentabilité de l’IA générative.
Lorsque les modèles de fondation peuvent accéder aux informations de plusieurs magasins de données et qu’ils sont affinés afin d’utiliser ces informations pour effectuer différentes tâches et générer des réponses, les outils d’IA générative qui en résultent peuvent apporter les avantages suivants aux organisations :
Les data scientists peuvent utiliser des modèles préentraînés pour déployer efficacement des outils d’IA dans diverses situations critiques.
Les développeurs peuvent accélérer la rédaction, le test et la documentation à l’aide d’outils d’IA qui génèrent des extraits de code personnalisés.
Les dirigeants peuvent recevoir des résumés de rapports volumineux générés par l’IA, tandis que les nouveaux employés peuvent consulter des versions concises de documents d’intégration et d’autres documents.
Les organisations peuvent utiliser des outils d’IA générative pour l’automatisation de diverses tâches, notamment :
Les équipes marketing peuvent utiliser des outils d’IA générative pour créer du contenu sur un large éventail de sujets. Elles peuvent également traduire des supports marketing dans plusieurs langues de manière rapide et précise.
Les chefs d’entreprise et autres parties prenantes peuvent effectuer des analyses assistées par l’IA pour interpréter de grandes quantités de données non structurées, leur permettant de mieux comprendre le marché, l’analyse des sentiments liée à leur réputation, etc.
IBM aide les organisations à décupler l’impact de l’IA dans leur activité avec watsonx, son portefeuille de produits d’IA. Ce portefeuille intègre trois produits puissants :
Découvrez comment les PDG peuvent trouver un équilibre entre la valeur que l’IA générative peut créer, l’investissement qu’elle exige et les risques qu’elle introduit.
Apprenez des concepts fondamentaux et développez vos compétences grâce à des ateliers pratiques, à des cours, à des projets guidés, à des essais et à d’autres ressources.
Découvrez comment intégrer en toute confiance l’IA générative et le machine learning dans votre entreprise.
Vous voulez obtenir un meilleur retour sur vos investissements dans l’IA ? Découvrez comment la mise à l’échelle de l’IA générative dans des domaines clés favorise le changement en aidant vos meilleurs éléments à créer et à fournir de nouvelles solutions innovantes.
Nous avons interrogé 2 000 entreprises à propos de leurs initiatives d’IA pour découvrir ce qui fonctionne, ce qui ne fonctionne pas et comment progresser.
IBM Granite est notre famille de modèles d’IA ouverts, performants et fiables, conçus pour les entreprises et optimisés pour dimensionner vos applications d’IA. Explorez les options de langage, de code, de séries temporelles et de garde-fous.
Découvrez comment choisir le modèle de fondation d’IA le mieux adapté à votre cas d’utilisation.
Explorez les trois éléments clés d’une stratégie d’IA réussie : créer un avantage concurrentiel, étendre l’IA à l’ensemble de l’entreprise et faire progresser l’IA digne de confiance.
Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.
Mettez l’IA au service de votre entreprise en vous appuyant sur l’expertise de pointe d’IBM dans le domaine de l’IA et sur son portefeuille de solutions.
Réinventez les workflows et les opérations critiques en ajoutant l’IA pour optimiser les expériences, la prise de décision et la valeur métier en temps réel.