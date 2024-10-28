기술 기업들이 인공 지능에 수십억 달러를 쏟아붓는 가운데, 코드 공개라는 반직관적인 전략이 주목받고 있습니다. 오픈 소스 AI 모델로 전환하는 것은 개발 비용을 억제하는 동시에 인재와 컴퓨팅 파워에 막대한 비용이 드는 이 분야에서 혁신을 가속화해야 한다는 압박이 커지고 있음을 반영합니다.
IBM, Meta, Mistral AI와 같은 회사가 오픈 소스 개발을 채택하여 개발자와 연구원이 정교한 AI 기술을 무료로 사용할 수 있게 됨에 따라 AI 환경이 변화하고 있습니다. 이러한 접근 방식은 협업을 통해 액세스를 민주화하고 혁신을 가속화할 수 있지만, 악의적인 행위자가 유해한 목적으로 기술을 오용하거나 수정할 수 있다고 경고합니다.
지지자들은 오픈 소스 AI 개발을 통해 전 세계 연구자와 개발자가 기술을 검사, 수정 및 개선할 수 있다고 말합니다. 이러한 협업 접근 방식은 이미 모델 효율성에서 상당한 발전을 가져왔습니다. 예를 들어, IBM의 새로운 Granite 3.0 AI 모델은 훨씬 더 적은 컴퓨팅 리소스만 사용하면서도 대규모 시스템에 필적하는 성능을 달성합니다.
IBM은 Apache 2.0 라이선스에 따라 Granite 3.0 모델을 오픈 소스 소프트웨어로 출시하고 있으며, 이는 AI 시스템을 비공개로 유지하는 개발자들과는 현저히 다른 접근 방식을 취합니다. 또한 GitHub Code Clean, StarCoder 같은 공개 데이터 세트를 사용해 모델을 구축했는데, 이는 News Corp가 Perplexity를 상대로 한 현재 소송과 같이 AI 회사가 보호된 콘텐츠로 모델을 학습시키는 AI 회사에 대한 소송으로 이어진 저작권 문제를 피할 수 있었습니다.
이 릴리스에는 명령 및 보안 모니터링을 위한 특수 변형과 함께 검색, 증강 생성 및 분류와 같은 엔터프라이즈 작업에 초점을 맞춘 8B 및 2B 언어 모델이 포함됩니다. 116개의 프로그래밍 언어를 지원하고 3~4테라바이트의 토큰으로 훈련된 이 모델은 Hugging Face, GitHub 및 IBM watsonx.ai를 포함한 여러 플랫폼에서 사용할 수 있습니다. 모델의 범위는 3~34억 개에 달하며 명목상 '오픈 소스' 릴리스에서 제한 없이 연구 및 애플리케이션에 사용할 수 있습니다.
IBM Research의 데이터 및 모델 팩토리 프로그램 디렉터인 Kate Soule은 "이러한 개방형 에코시스템의 일부로서 다양한 사고를 하고 기여하는 것은 모델을 폐쇄적인 상자에 보관하는 것보다 훨씬 더 흥미로운 제안입니다."라고 말합니다. "우리는 커뮤니티가 오픈 소스 모델을 사용하기를 바랍니다."
오픈 소스 운동은 Mistral AI가 업계 리더로 부상한 유럽에서도 탄력을 받았습니다. 파리에 본사를 둔 이 스타트업은 개발자가 자유롭게 다운로드하고 수정할 수 있는 점점 더 뛰어난 기능을 갖춘 모델을 출시했습니다.
오픈 소스 전략은 양방향 교환을 창출합니다. 기업은 돈이 많은 사람만이 구축할 수 있는 AI 모델을 공유하는 동시에 기술의 새로운 용도를 찾는 수천 명의 개발자로부터 인사이트를 얻습니다. 현재 많은 사람들은 액세스를 제한하는 것은 이러한 집단적 혁신의 기회를 놓치는 것이라고 주장합니다.
IBM Think의 선임 라이터인 Dave Bergmann은 "모델 아키텍처에 작고 새로운 조정이 있다고 상상해 보세요. 다른 모든 것은 변경하지 않더라도 전반적인 성능이 크게 향상됩니다."라고 말합니다. "모델을 공개 가중치로만 공개하고 해당 아키텍처에 대한 정보와 코드 공개를 거부하면 기회를 놓칠 수도 있습니다. 하지만 20,000명이 모델 코드를 작업하다 보면 누군가는 발견할 것입니다."
Meta가 오픈 소스 Llama 모델을 출시한 것은 중요한 전환점이었습니다. 이는 기술 분야의 가장 큰 회사 중 하나가 연구원과 소규모 조직이 독립적으로 구축할 수 없는 고급 AI 기술에 대한 액세스를 제공한다는 것을 의미했습니다.
Meta의 AI 파트너 엔지니어링 수석 디렉터인 Amit Sangani는 최근 열린 AI Alliance 모임에서 "우리는 오픈 소스 AI가 개발자들을 시작으로 모두에게 유익하다고 근본적으로 믿습니다. 개발자들은 이러한 모델을 가져와서 원하는 대로 미세 조정하고, 훈련시키고, 정제하고, 활용할 수 있기 때문입니다."라고 말했습니다. "오픈 소스 AI가 많을수록 AI는 더 투명해지고 안전해집니다. 또한 광범위 검토를 받을 수 있는데, 이는 좋은 일입니다. 문제가 발견되면 Meta를 포함한 사람들이 문제를 해결할 것이기 때문입니다."
이러한 장점에도 불구하고 오픈 소싱 AI 기술에는 위험이 따를 수 있습니다. 일부 관찰자들은 오픈 소스 AI 모델이 허위 정보를 생성하거나 멀웨어를 만드는 등 해로운 목적으로 더 쉽게 수정될 수 있다고 말합니다. 중앙 집중식 제어 기능이 없기 때문에 원래 개발자가 높은 윤리 기준을 준수하더라도 모델의 수정된 버전이 준수하지 않을 수 있습니다.
그럼에도 불구하고 Granite와 같은 모델에서 입증된 효율성 향상은 제한된 리소스로 조직이 AI 기능에 더 쉽게 액세스할 수 있게 되는 잠재적인 미래를 시사합니다. 대규모 언어 모델을 실행할 여력이 없는 중소기업은 특정 요구 사항에 맞는 더 작고 효율적인 오픈 소스 대안을 배포할 수 있습니다.
AI Alliance 커뮤니티 디렉터인 Dave Nielsen은 "오픈 소스는 더 많은 곳에서 더 많은 혁신을 가능하게 할 것입니다."라고 말합니다. "그리고 이는 더 많은 기업가와 고객에게 더 많은 흥미를 불러일으킬 것이며 더 많은 수익을 창출할 것입니다."
AI 빌더를 위한 차세대 엔터프라이즈 스튜디오인 IBM watsonx.ai로 생성형 AI, 파운데이션 모델 및 머신 러닝 기능을 학습, 검증, 조정 및 배포하세요. 적은 데이터로 짧은 시간 내에 AI 애플리케이션을 구축하세요.