Balises

Les modèles de diffusion défient GPT alors qu’émerge l’IA nouvelle génération

Publié le 10 mars 2025

Arrière de la tête d’une personne regardant l’écran d’un ordinateur pendant qu’elle programme

Auteur

Staff Writer

IBM

Une nouvelle classe de modèles d’IA remet en question la domination des systèmes de type GPT, promettant des alternatives plus rapides, moins coûteuses et potentiellement plus puissantes.

Inception Labs, une start-up fondée par des chercheurs de Stanford, a récemment lancé Mercury, un modèle de langage basé sur la diffusion (dLLM) qui affine des phrases entières à la fois, plutôt que de prédire les mots un par un. Contrairement aux grands modèles de langage (LLM) traditionnels, qui utilisent une approche autorégressive (générant un mot à la fois, sur la base du texte précédent), les modèles de diffusion améliorent le texte de manière itérative, par affinement.

« Les dLLM repoussent les limites du possible », explique Stefano Ermon, professeur d’informatique à l’université de Stanford et cofondateur d’Inception Labs, à IBM Think. « Mercury offre une vitesse et une efficacité inégalées, et, en tirant parti d’une plus grande puissance de calcul pendant les tests, les dLLM établiront également la norme en matière de qualité et amélioreront la satisfaction globale des clients pour les applications de pointe et d’entreprise. »

Benjamin Hoover, ingénieur de recherche chez IBM, voit l’avenir se dessiner : « Dans deux ou trois ans, la plupart des gens commenceront à passer aux modèles de diffusion, dit-il. Quand j’ai vu le modèle d’Inception Labs, j’ai compris que cela allait arriver plus tôt que prévu. »

L’avantage du modèle de diffusion

Les modèles de diffusion ne suivent pas les mêmes règles que l’IA traditionnelle. Les modèles autorégressifs comme GPT construisent des phrases mot par mot, en prédisant un token à la fois. Si un modèle génère la phrase « À qui de droit », il prédit « À », puis « qui », puis « de droit », et ainsi de suite, étape par étape. Les modèles de diffusion inversent le processus. Au lieu d’assembler le texte de manière séquentielle, ils commencent par une version approximative et bruyante d’un passage entier, puis l’affinent en plusieurs étapes. Imaginez un artiste qui esquisse un contour approximatif avant d’affiner les détails, plutôt que de dessiner chaque élément dans l’ordre. En considérant la phrase dans son ensemble, les modèles de diffusion peuvent générer des réponses plus rapidement, souvent avec plus de cohérence et de précision que les LLM traditionnels.

M. Hoover considère cette technologie comme une version moderne d’un concept plus ancien. « Les modèles de diffusion sont fondamentalement des mécanismes de correction d’erreurs, explique-t-il. Ils fonctionnent en commençant par une entrée bruyante, puis en supprimant progressivement le bruit jusqu’à obtenir la sortie souhaitée. »

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA  

La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets.

Surmonter la barrière de la langue

Les modèles de diffusion ont été largement employés dans la génération d’images, avec des modèles tels que DALL·E, Stable Diffusion et Midjourney qui transforment des images bruitées en visuels de haute qualité. Cependant, l’application de cette approche au texte est plus complexe, car le langage exige un respect strict de la grammaire et de la syntaxe.

« De nombreuses tentatives d’application des modèles de diffusion à la génération de texte ont échoué par le passé, explique M. Ermon. Ce qui a permis à Mercury de réussir là où d’autres ont échoué, ce sont des innovations exclusives dans les algorithmes d’apprentissage et d’inférence. Contrairement aux images, qui peuvent être progressivement nettoyées pour obtenir des formes reconnaissables, le langage suit des règles grammaticales rigides qui rendent le raffinement itératif plus difficile. »

M. Hoover cite Mercury d’Inception Labs comme un excellent exemple de la manière dont les modèles de diffusion comblent l’écart. « Ce modèle a prouvé que la diffusion pouvait tenir la route et qu’elle était en fait plus rapide et plus efficace que les modèles autorégressifs comparables. »

L’avenir de la diffusion

L’efficacité des LLM basés sur la diffusion pourrait bouleverser le déploiement de l’IA, en particulier dans les applications d’entreprise où le coût et la vitesse sont importants. Les LLM traditionnels nécessitent une puissance de calcul considérable, ce qui rend leur fonctionnement coûteux. Les modèles de diffusion promettent d’offrir des performances similaires ou supérieures à un coût nettement inférieur. Les modèles de diffusion sont souvent plus efficaces car ils affinent des séquences entières en parallèle plutôt que de générer chaque mot étape par étape comme les LLM traditionnels, ce qui réduit la charge de calcul.

« Nos clients et les premiers utilisateurs développent des applications basées sur les dLLM dans des domaines tels que le support client, la vente et les jeux, explique M. Ermon. Ils rendent leurs applications plus réactives, plus intelligentes et moins coûteuses. »

M. Hoover envisage un impact encore plus large. « À l’heure actuelle, l’IA est limitée par sa consommation d’énergie, explique-t-il. Les grands modèles consomment énormément d’énergie. Cependant, les modèles de diffusion fonctionnent différemment, ce qui leur confère une efficacité bien supérieure. À long terme, nous pourrions voir des systèmes d’IA basés sur la diffusion fonctionner sur du matériel analogique, ce qui réduirait considérablement les coûts énergétiques. »

L’informatique analogique, qui traite les informations à l’aide de signaux électriques continus plutôt que d’opérations binaires, est depuis longtemps présentée comme une solution potentielle au problème énergétique de l’IA. M. Hoover estime que les modèles de diffusion sont particulièrement bien adaptés à cette approche.

« Ces modèles sont intrinsèquement interprétables, explique-t-il. Cela signifie que nous pouvons mapper leurs calculs internes directement sur des circuits analogiques, ce qui est beaucoup plus difficile à faire avec les architectures traditionnelles d’apprentissage profond. »

AI Academy

Devenir un expert en IA

Obtenez les connaissances nécessaires pour privilégier les investissements dans l’IA qui favorisent la croissance commerciale. Lancez-vous dès aujourd’hui avec notre AI Academy gratuite et menez l’avenir de l’IA au sein de votre organisation.

Regarder la série

Réalisez votre ROI dès maintenant : le guide pratique de l’IA agentique

Découvrez comment dimensionner l’IA agentique pour un ROI mesurable dans toute l’entreprise. Ce protocole décrit les principaux obstacles qui limitent l’impact, explique comment mesurer efficacement le ROI et fournit un cadre pour favoriser une adoption réussie à l’échelle de l’entreprise.

Ressources

L’entreprise en 2030 : conçue pour l’innovation perpétuelle

Découvrez nos cinq prédictions sur ce qui définira les entreprises les plus performantes en 2030 et les étapes que les dirigeants peuvent suivre pour obtenir un avantage axé sur l’IA.

Devenez un expert en IA générative

Apprenez des concepts fondamentaux et développez vos compétences grâce à des ateliers pratiques, à des cours, à des projets guidés, à des essais et à d’autres ressources.

Mettre l’IA au travail : mise en place d'un retour sur investissement grâce à l'IA générative

Vous voulez obtenir un meilleur retour sur vos investissements dans l’IA ? Découvrez comment la mise à l’échelle de l’IA générative dans des domaines clés favorise le changement en aidant vos meilleurs éléments à créer et à fournir de nouvelles solutions innovantes.

Des projets d’IA aux bénéfices : comment l’IA agentique génère des résultats financiers

Découvrez comment les organisations passent du lancement d'initiatives pilotes d'IA disparates à l'application de l'IA pour stimuler la transformation au cœur de leurs opérations.

L'IA générative expliquée

Techsplainers d’IBM détaille les bases de l’IA générative, des concepts clés aux cas d’utilisation réels. Des épisodes clairs et rapides vous permettent d'apprendre rapidement les principes fondamentaux.

Le guide du PDG sur l’IA générative

Découvrez comment les PDG peuvent trouver un équilibre entre la valeur que l’IA générative peut créer, l’investissement qu’elle exige et les risques qu’elle introduit.

Centre de développement watsonx ®

Découvrez les outils et ressources essentiels pour accélérer votre prochain projet. Commencez et découvrez toute la gamme de modèles pris en charge par IBM.

La vérité sur le succès de l’IA générative

Découvrez les avantages des plateformes d'IA qui permettent de personnaliser les modèles de fondation grâce à la technologie, aux processus et aux bonnes pratiques afin de vous aider à mettre en œuvre facilement le cycle de vie de l'IA générative.

Découvrir IBM Granite

IBM Granite® est notre famille de modèles IA ouverts, performants et fiables, conçus pour le business et optimisés pour dimensionner vos applications d'IA. Découvrez les modèles pour le langage, le code, les séries temporelles et les barrières de sécurité.

Choisir le bon modèle de fondation

Découvrez comment choisir le modèle de fondation d’IA le mieux adapté à votre cas d’utilisation.

Comment prospérer en toute confiance dans cette nouvelle ère de l’IA

Explorez les trois éléments clés d’une stratégie d’IA réussie : créer un avantage concurrentiel, étendre l’IA à l’ensemble de l’entreprise et faire progresser l’IA digne de confiance.

Solutions connexes

IBM watsonx.ai

Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.

Découvrir watsonx.ai

Solutions d’intelligence artificielle

Mettez l’IA au service de votre entreprise en vous appuyant sur l’expertise de pointe d’IBM dans le domaine de l’IA et sur son portefeuille de solutions.

Découvrir les solutions d’IA

Services d’IA

Réinventez les workflows et les opérations critiques en ajoutant l’IA pour optimiser les expériences, la prise de décision et la valeur métier en temps réel.

Découvrir les services d’IA

Passez à l’étape suivante

Bénéficiez d’un accès centralisé aux fonctionnalités couvrant le cycle de développement de l’IA. Produisez des solutions IA puissantes offrant des interfaces conviviales, des workflows et un accès à des API et SDK conformes aux normes du secteur.

Les modèles de diffusion défient GPT alors qu’émerge l’IA nouvelle génération

L’avantage du modèle de diffusion

Les dernières actualités et informations en matière d’IA

Surmonter la barrière de la langue

L’avenir de la diffusion

Devenir un expert en IA

Share

Ressources

Les dernières actualités et informations en matière d’IA