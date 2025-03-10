Una nueva clase de modelos de IA desafía el dominio de los sistemas de estilo GPT, prometiendo alternativas más rápidas, baratas y potencialmente más potentes.

Inception Labs, una startup fundada por investigadores de Stanford, lanzó recientemente Mercury, un modelo de lenguaje basado en la difusión (dLLM) que refina frases enteras a la vez, en lugar de predecir las palabras una por una. A diferencia de los modelos lingüísticos grandes (LLM) tradicionales, que utilizan un enfoque autorregresivo(generan una palabra a la vez, basándose en el texto anterior), los modelos de difusión mejoran el texto de forma iterativa, mediante el refinamiento.

“Los dLLM amplían la frontera de posibilidades”, Stefano Ermon, profesor de informática de la Universidad de Stanford y cofundador de Inception Labs, le dice a IBM Think. "Mercury proporciona una velocidad y eficiencia inigualables y, al aprovechar más computación en tiempo de prueba, los dLLM también establecerán el listón de la calidad y mejorarán la satisfacción general del cliente para las aplicaciones edge y empresariales".

El ingeniero de investigación de IBM,Benjamin Hoover ve lo que se avecina: "Es solo cuestión de dos o tres años antes de que la mayoría de la gente comience a usar modelos de difusión", dice. “Cuando vi el modelo de Inception Labs, me di cuenta de que esto sucederá más pronto de lo esperado”.