더 빠르고 저렴하며 잠재적으로 더 강력한 대안을 약속하는 새로운 종류의 AI 모델이 GPT 스타일 시스템의 지배력에 도전하고 있습니다.

스탠포드 출신 연구자들이 설립한 스타트업인 Inception Labs는 최근 단어를 하나씩 예측하는 것이 아니라 전체 구문을 한 번에 다듬는 확산 기반 언어 모델(dLLM)인 Mercury를 출시했습니다. 앞의 텍스트를 기반으로 한 번에 한 단어씩 생성하는 자기회귀 방식을 사용하는 기존의 대규모 언어 모델(LLM)과 달리, 확산 모델은 세분화를 통해 반복적으로 텍스트를 개선합니다.

스탠포드 대학교의 컴퓨터 과학 교수이자 Inception Labs의 공동 창립자인 Stefano Ermon은 IBM Think와의 대화에서 "dLLM은 가능성의 경계를 확장한다"고 말했습니다. “Mercury는 타의 추종을 불허하는 속도와 효율성을 제공하며, 더 많은 테스트 시간 컴퓨팅을 활용함으로써 DLMS는 품질의 기준을 설정하고 엣지 및 엔터프라이즈 애플리케이션의 전반적인 고객 만족도를 향상시킬 것입니다.”

IBM 리서치 엔지니어인 Benjamin Hoover는 "대다수의 사람들이 확산 모델을 사용하게 되기까지 2~3년밖에 남지 않았습니다."라며, "Inception Labs의 모델을 보고 '이것이 조만간 일어날 일'이라는 생각이 들었습니다."라고 말했습니다.