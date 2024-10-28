IBM은 Apache 2.0 라이선스에 따라 Granite 3.0 모델을 오픈 소스 소프트웨어로 출시하고 있으며, 이는 AI 시스템을 비공개로 유지하는 개발자들과는 현저히 다른 접근 방식을 취합니다. 또한 GitHub Code Clean, StarCoder 같은 공개 데이터 세트를 사용해 모델을 구축했는데, 이는 News Corp가 Perplexity를 상대로 한 현재 소송과 같이 AI 회사가 보호된 콘텐츠로 모델을 학습시키는 AI 회사에 대한 소송으로 이어진 저작권 문제를 피할 수 있었습니다.

이 릴리스에는 명령 및 보안 모니터링을 위한 특수 변형과 함께 검색, 증강 생성 및 분류와 같은 엔터프라이즈 작업에 초점을 맞춘 8B 및 2B 언어 모델이 포함됩니다. 116개의 프로그래밍 언어를 지원하고 3~4테라바이트의 토큰으로 훈련된 이 모델은 Hugging Face, GitHub 및 IBM watsonx.ai를 포함한 여러 플랫폼에서 사용할 수 있습니다. 모델의 범위는 3~34억 개에 달하며 명목상 '오픈 소스' 릴리스에서 제한 없이 연구 및 애플리케이션에 사용할 수 있습니다.

IBM Research의 데이터 및 모델 팩토리 프로그램 디렉터인 Kate Soule은 "이러한 개방형 에코시스템의 일부로서 다양한 사고를 하고 기여하는 것은 모델을 폐쇄적인 상자에 보관하는 것보다 훨씬 더 흥미로운 제안입니다."라고 말합니다. "우리는 커뮤니티가 오픈 소스 모델을 사용하기를 바랍니다."

오픈 소스 운동은 Mistral AI가 업계 리더로 부상한 유럽에서도 탄력을 받았습니다. 파리에 본사를 둔 이 스타트업은 개발자가 자유롭게 다운로드하고 수정할 수 있는 점점 더 뛰어난 기능을 갖춘 모델을 출시했습니다.

오픈 소스 전략은 양방향 교환을 창출합니다. 기업은 돈이 많은 사람만이 구축할 수 있는 AI 모델을 공유하는 동시에 기술의 새로운 용도를 찾는 수천 명의 개발자로부터 인사이트를 얻습니다. 현재 많은 사람들은 액세스를 제한하는 것은 이러한 집단적 혁신의 기회를 놓치는 것이라고 주장합니다.

IBM Think의 선임 라이터인 Dave Bergmann은 "모델 아키텍처에 작고 새로운 조정이 있다고 상상해 보세요. 다른 모든 것은 변경하지 않더라도 전반적인 성능이 크게 향상됩니다."라고 말합니다. "모델을 공개 가중치로만 공개하고 해당 아키텍처에 대한 정보와 코드 공개를 거부하면 기회를 놓칠 수도 있습니다. 하지만 20,000명이 모델 코드를 작업하다 보면 누군가는 발견할 것입니다."