Les modèles de fondation et les magasins de données libèrent le potentiel de l’IA générative

1er août 2023

Temps de lecture : 4 min.

Auteur

IBM Data and AI Team

Comme leur nom l’indique, les modèles d’IA générative génèrent du texte, des images, du code ou d’autres réponses en fonction du prompt de l’utilisateur. Les organisations qui les utilisent correctement peuvent constater une myriade d’avantages, depuis une efficacité opérationnelle accrue et une prise de décision améliorée jusqu’à la création rapide de contenu marketing. Mais qu’est-ce qui soutient la fonctionnalité générative de ces modèles et, en fin de compte, leurs avantages pour l’organisation ?

C’est là que les modèles de fondation entrent en scène. C’est le moteur sous-jacent qui confère aux modèles génératifs les capacités améliorées de raisonnement et d’apprentissage profond qui font défaut aux modèles de machine learning traditionnels. Associés à des magasins de données, les modèles de fondation permettent de créer et de personnaliser des outils d’IA générative dans les organisations de tous secteurs cherchant à optimiser l’assistance client, le marketing, les RH (y compris l’acquisition de talents) et les fonctions informatiques.

Les modèles de fondation : la force motrice de l’IA générative

Également appelé « transformer », un modèle de fondation est un algorithme d’IA entraîné sur de vastes quantités de données couvrant des domaines étendus. Le terme « modèle de fondation » a été inventé par le Stanford Institute for Human-Centered Artificial Intelligence en 2021.

Les modèles de fondation reposent sur une architecture de modèle de réseau de neurones : ils traitent les informations de la même manière que le cerveau humain. Les modèles de fondation peuvent être entraînés pour effectuer des tâches telles que la classification des données, l’identification d’objets dans les images (vision par ordinateur) et le traitement automatique du langage naturel (NLP) (compréhension et génération de texte) avec un degré élevé de précision. Ils peuvent également suivre un apprentissage auto-supervisé pour se généraliser et appliquer leurs connaissances à de nouvelles tâches.

Au lieu de consacrer du temps et des efforts à entraîner un modèle de A à Z, les data scientists peuvent s’appuyer sur des modèles de fondation préentraînés pour créer ou personnaliser des modèles d’IA adaptés à un cas d’utilisation spécifique. Un modèle de fondation pourrait par exemple servir de base à un modèle d’IA générative qui serait ensuite affiné à l’aide de jeux de données supplémentaires dans l’objectif d’identifier des méthodes plus sûres et plus rapides pour fabriquer un certain type de produit.

Certains modèles de fondation spécifiques, connus sous le nom de grands modèles de langage (LLM), sont entraînés sur de grandes quantités de données textuelles pour des tâches de NLP. BERT (Bi-directional Encoder Representations from Transformers) est l’un des premiers modèles de fondation de ce type à avoir été développés. Google crée le modèle open source BERT en 2018. Il est préentraîné sur un large corpus de données en langue anglaise avec auto-supervision et peut être utilisé pour une variété de tâches :

  • Analyse des sentiments des clients/du public
  • Réponse aux questions dans le cadre du service client
  • Prédiction de texte à partir de données d’entrée
  • Génération de texte basée sur les prompts de l’utilisateur
  • Résumé de documents volumineux complexes

Modèles de fondation et modèles de machine learning traditionnels

Les modèles de fondation utilisés pour l’IA générative se distinguent des modèles de machine learning traditionnels, car ils peuvent être entraînés sur de grandes quantités de données non étiquetées pour prendre en charge des applications qui génèrent du contenu ou exécutent des tâches.

Par ailleurs, les modèles de machine learning traditionnels sont généralement entraînés pour une seule tâche sur des données étiquetées, par exemple en utilisant des images étiquetées de voitures pour entraîner le modèle à reconnaître les voitures dans les images non étiquetées.

Des modèles de fondation qui créent de la valeur pour l’entreprise

Le studio watsonx.ai d’IBM propose une suite de modèles de fondation dédiés au langage et au code, chacun portant un nom de code sur le thème de la géologie, et pouvant être personnalisé pour des tâches d’entreprise variées. Tous les modèles watsonx.ai sont entraînés sur le data lake organisé et axé sur l’entreprise d’IBM.

Disponible : Slate

Slate fait référence à une famille de modèles encodeurs uniquement, qui, bien que non génératifs, sont rapides et efficaces pour de nombreuses tâches de NLP d’entreprise.

Bientôt disponible : Granite

Les modèles Granite s’appuient sur une architecture de type GPT basée sur un décodeur uniquement pour les tâches génératives.

Bientôt disponible : Sandstone

Les modèles Sandstone utilisent une architecture encodeur-décodeur et sont bien adaptés à un affinage sur des tâches spécifiques.

Bientôt disponible : Obsidian

Les modèles Obsidian utilisent une nouvelle architecture modulaire développée par IBM Research, offrant une grande efficacité d’inférence et des niveaux de performance élevés pour toute une variété de tâches.

Connexion des modèles de fondation à des magasins de données pour une IA générative efficace

Sans un accès sécurisé à des connaissances fiables et propres à un domaine, les modèles de fondation seraient bien moins dignes de confiance et bénéfiques pour les applications d’IA d’entreprise. Heureusement, des magasins de données peuvent servir de référentiels sécurisés et permettre aux modèles de fondation d’étendre à la fois leur taille et leurs données d’entraînement.

Les magasins de données adaptés à l’IA générative d’entreprise sont construits sur une architecture de data lakehouse ouverte, alliant les qualités d’un data lake et d’un entrepôt de données. Cette architecture permet de réaliser des économies grâce à un stockage d’objets à faible coût et de partager de grands volumes de données via des formats de table ouverts comme Apache Iceberg, conçus pour des analyses haute performance et un traitement des données à grande échelle.

Les modèles de fondation peuvent interroger de très grands volumes de données propres à un domaine dans un conteneur évolutif et rentable. Et parce combinés au cloud, ces types de magasins de données permettent une évolutivité pratiquement illimitée, les lacunes des modèles de fondation sont réduites, voire éliminées au fil du temps avec l’ajout de données supplémentaires. Plus ce manque de connaissances est comblé, plus le modèle de fondation devient fiable et plus sa portée est grande.

Avec les magasins de données, les data scientists disposent d’un référentiel qu’ils peuvent utiliser pour collecter et nettoyer les données utilisées pour entraîner et affiner les modèles de fondation. Et les magasins de données qui s’appuient sur des infrastructures cloud et des infrastructures de cloud hybride tierces pour le traitement de grands volumes de données sont critiques à la rentabilité de l’IA générative.

Les avantages métier des modèles de fondation et des magasins de données

Lorsque les modèles de fondation peuvent accéder aux informations de plusieurs magasins de données et qu’ils sont affinés afin d’utiliser ces informations pour effectuer différentes tâches et générer des réponses, les outils d’IA générative qui en résultent peuvent apporter les avantages suivants aux organisations :

Efficacité et productivité accrues

Science des données

Les data scientists peuvent utiliser des modèles préentraînés pour déployer efficacement des outils d’IA dans diverses situations critiques.

Développement

Les développeurs peuvent accélérer la rédaction, le test et la documentation à l’aide d’outils d’IA qui génèrent des extraits de code personnalisés.

Communications internes

Les dirigeants peuvent recevoir des résumés de rapports volumineux générés par l’IA, tandis que les nouveaux employés peuvent consulter des versions concises de documents d’intégration et d’autres documents.

Opérations

Les organisations peuvent utiliser des outils d’IA générative pour l’automatisation de diverses tâches, notamment :

  • Classification et catégorisation des données
  • Communications avec les clients
  • Acheminement des messages vers le service approprié pour des temps de réponse plus rapides
  • Génération de rapports
  • Organisation de réunions et prise de rendez-vous

Génération de contenu plus rapide

Les équipes marketing peuvent utiliser des outils d’IA générative pour créer du contenu sur un large éventail de sujets. Elles peuvent également traduire des supports marketing dans plusieurs langues de manière rapide et précise.

Des analyses plus précises

Les chefs d’entreprise et autres parties prenantes peuvent effectuer des analyses assistées par l’IA pour interpréter de grandes quantités de données non structurées, leur permettant de mieux comprendre le marché, l’analyse des sentiments liée à leur réputation, etc.

IBM, modèles de fondation et magasins de données

IBM aide les organisations à décupler l’impact de l’IA dans leur activité avec watsonx, son portefeuille de produits d’IA. Ce portefeuille intègre trois produits puissants :

  • Le studio watsonx.ai dédié aux nouveaux modèles de fondation, à l’IA générative et au machine learning
  • Le magasin de données spécialisé watsonx.data, reposant sur une architecture de lakehouse ouverte
  • La boîte à outils watsonx.governance, pour accélérer la création de workflows d’IA responsables, transparents et explicables
 
Solutions connexes
IBM watsonx.ai

Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.

Découvrir watsonx.ai
Solutions d’intelligence artificielle

Mettez l’IA au service de votre entreprise en vous appuyant sur l’expertise de pointe d’IBM dans le domaine de l’IA et sur son portefeuille de solutions.

Découvrir les solutions d’IA
Services d’IA

Réinventez les workflows et les opérations critiques en ajoutant l’IA pour optimiser les expériences, la prise de décision et la valeur métier en temps réel.

Découvrir les services d’IA
Passez à l’étape suivante

Bénéficiez d’un accès centralisé aux fonctionnalités couvrant le cycle de développement de l’IA. Produisez des solutions IA puissantes offrant des interfaces conviviales, des workflows et un accès à des API et SDK conformes aux normes du secteur.

Découvrir watsonx.ai Réserver une démo en direct