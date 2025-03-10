Una nueva clase de modelos de IA está desafiando el dominio de los sistemas de estilo GPT, prometiendo alternativas más rápidas, baratas y potencialmente más potentes.

Inception Labs, una empresa emergente fundada por investigadores de Stanford, lanzó recientemente Mercury, un modelo de lenguaje basado en la difusión (dLLM) que refina frases enteras a la vez, en lugar de predecir palabras una por una. A diferencia de los modelos de lenguaje de gran tamaño (LLM) tradicionales, que utilizan un enfoque autorregresivo(que genera una palabra a la vez, en función del texto anterior), los modelos de difusión mejoran el texto de forma iterativa, a través del refinamiento.

"Los dLLMs amplían la frontera de posibilidades", dice Stefano Ermon, profesor de informática en la Universidad de Stanford y cofundador de Inception Labs, a IBM Think. "Mercury proporciona una velocidad y eficiencia inigualables y, al aprovechar más cómputo en tiempo de prueba, los dLLM también establecerán el estándar de calidad y mejorarán la satisfacción general del cliente para las aplicaciones empresariales y edge".

El ingeniero de investigación de IBM,Benjamin Hoover, ve la evidencia: "Es solo cuestión de dos o tres años antes de que la mayoría de las personas comiencen a usar modelos de difusión", dice. “Cuando vi el modelo de Inception Labs, me di cuenta de que esto sucederá más temprano que tarde”.