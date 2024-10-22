2년 전 ChatGPT의 출시는 전례 없는 규모와 복잡성을 가진 대규모 언어 모델이 주도하는 AI의 새로운 장을 열었습니다. 이러한 모델은 현재 연구와 비즈니스의 최전선에 있지만, 많은 모델이 데이터, 전체 학습 레시피, 체크포인트를 공개하지 않습니다. 여기서 비영리 단체 Allen Institute for Artificial Intelligence(Ai2)가 등장합니다. Ai2는 Microsoft 공동 창립자 Paul Allen이 2014년에 설립했습니다. 이 연구 그룹은 오픈 소스에서 언어 모델, 멀티모달 모델 및 평가 프레임워크를 연구합니다.

최근 Ai2는 개방형 시스템과 독점 시스템 간의 격차를 크게 좁히는 것을 목표로 하는 최첨단 멀티모드 AI 모델 제품군인 Molmo를 출시했습니다. Ai2는 “우리의 더 작은 모델조차도 경쟁 모델보다 10배 뛰어난 성능을 냅니다.”라고 말합니다.

9월 초, Ai2는 Contextual AI와 공동 개발한 활성 파라미터 10억 개, 총 파라미터 70억 개 규모의 전문가 혼합 모델인 OlmoE를 공개했습니다. 5조 토큰을 기반으로 트레이닝되었으며 Ai2의 Dolma에서 얻은 교훈을 통합한 새로운 데이터 믹스를 기반으로 구축되었습니다.

샌프란시스코에서 열린 PyTorch 컨퍼런스에서 기조 연설을 마친 후 Ai2의 NLP 연구 선임 책임자인 Hanna Hajishirzi와 이야기를 나누며 오픈 소스 모델과 AI 리터러시에 대해 논의했습니다.