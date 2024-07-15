AI를 장악하기 위한 경쟁에서는 일반적으로 클수록 좋습니다. 더 많은 데이터와 더 많은 매개변수는 더 강력할 뿐만 아니라 더 효율적이고 빠르며 일반적으로 더 작은 시스템보다 더 적은 오류를 생성하는 더 큰 AI 시스템을 만듭니다.

뉴스 헤드라인을 장식하는 기술 기업들은 이러한 추세를 뒷받침합니다. Microsoft CTO인 Kevin Scott은 Chat GPT-5를 구동하는 슈퍼컴퓨터에 대해 "방금 배포한 시스템은 규모 면에서 고래만큼 큽니다."라고 말합니다. Scott은 지난 5월 말 열린 회사의 최근 빌드 이벤트에서 Open AI의 최신 버전의 생성형 AI 챗봇에 대해 논의했습니다. "고래 크기의 슈퍼컴퓨터로도 엄청난 양의 AI를 구축할 수 있다는 것이 밝혀졌습니다."

한편, NVIDIA의 시가총액은 6월에 3조 달러를 돌파했습니다. 이 칩 제조업체는 점점 더 대형화되는 언어 모델, 슈퍼컴퓨터, 전 세계적으로 급증하는 데이터 센터를 구동하는 칩을 생산하면서 어지러울 정도로 빠른 속도로 성장하고 있습니다.

하지만 더 큰 것이 항상 더 나은가요? 관점에 따라 달라집니다. 대규모 언어 모델을 개발하는 회사의 경우 대부분의 경우 규모를 확장하는 것이 유리합니다. 하지만 기업들이 과대광고와 AI가 진정한 가치를 더할 수 있는 부분을 분리하려 할 때, 점점 더 큰 언어 모델이 항상 더 나은 기업 솔루션으로 이어질 것이라는 점은 명확하지 않습니다.

IBM의 Mixture of Experts 팟캐스트의 최근 에피소드에서 IBM의 생성형 AI 연구 프로그램 디렉터인 Kate Soule은 앞으로 "가치의 대부분을 추출하기 위해 현재의 100배에 달하는 모델은 필요하지 않을 것"이라고 말했습니다. 이미 AI 투자에 대한 수익을 얻고 있는 많은 기업들이 분류 및 요약과 같은 작업에 AI를 사용하고 있으며, 이는 현재 언어 모델의 전체 용량을 사용하지도 않습니다.