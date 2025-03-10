Eine neue Klasse von KI-Modellen stellt die Dominanz von GPT-ähnlichen Systemen infrage und verspricht schnellere, günstigere und potenziell leistungsfähigere Alternativen.

Inception Labs, ein von Forschern aus Stanford gegründetes Start-up, hat kürzlich Mercury veröffentlicht, ein diffusionsbasiertes Sprachmodell (dLLM), das ganze Phrasen auf einmal verfeinert, anstatt Wörter einzeln vorherzusagen. Im Gegensatz zu traditionellen Large Language Models (LLMs), die einen autoregressiven Ansatz nutzen – bei dem jeweils ein Wort auf Basis des vorangegangenen Textes generiert werden – verbessern Diffusionsmodelle den Text iterativ durch Verfeinerung.

„dLLMs erweitern die Grenzen des Möglichen“, so Stefano Ermon, ein Informatikprofessor der Stanford University und Mitbegründer von Inception Labs, gegenüber IBM Think. „Mercury bietet unübertroffene Geschwindigkeit und Effizienz, und durch die Nutzung von mehr Rechenleistung während der Testzeit werden dLLMs auch die Messlatte für Qualität höher legen und die allgemeine Kundenzufriedenheit für Edge- und Unternehmensanwendungen verbessern.“

Engineer Benjamin Hoover bei IBM Research sieht die Zeichen an der Wand: „Es ist nur eine Frage von zwei oder drei Jahren, bis die meisten Menschen auf Diffusionsmodelle umsteigen“, sagt er. „Als ich das Modell von Inception Labs sah, wurde mir klar: ‚Das wird eher früher als später passieren.‘“