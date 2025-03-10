Une nouvelle classe de modèles d’IA remet en question la domination des systèmes de type GPT, promettant des alternatives plus rapides, moins coûteuses et potentiellement plus puissantes.

Inception Labs, une start-up fondée par des chercheurs de Stanford, a récemment lancé Mercury, un modèle de langage basé sur la diffusion (dLLM) qui affine des phrases entières à la fois, plutôt que de prédire les mots un par un. Contrairement aux grands modèles de langage (LLM) traditionnels, qui utilisent une approche autorégressive (générant un mot à la fois, sur la base du texte précédent), les modèles de diffusion améliorent le texte de manière itérative, par affinement.

« Les dLLM repoussent les limites du possible », explique Stefano Ermon, professeur d’informatique à l’université de Stanford et cofondateur d’Inception Labs, à IBM Think. « Mercury offre une vitesse et une efficacité inégalées, et, en tirant parti d’une plus grande puissance de calcul pendant les tests, les dLLM établiront également la norme en matière de qualité et amélioreront la satisfaction globale des clients pour les applications de pointe et d’entreprise. »

Benjamin Hoover, ingénieur de recherche chez IBM, voit l’avenir se dessiner : « Dans deux ou trois ans, la plupart des gens commenceront à passer aux modèles de diffusion, dit-il. Quand j’ai vu le modèle d’Inception Labs, j’ai compris que cela allait arriver plus tôt que prévu. »