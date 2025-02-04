AI 군비 경쟁은 더 이상 수십억 달러 규모의 거대 기업만을 위한 것이 아닙니다.
OpenAI, Google, Microsoft와 같은 회사는 인공 지능 관련 논의의 헤드라인을 장식하고 있습니다. 하지만 최근 DeepSeek 모델에서 볼 수 있듯이, 오픈 소스 혁신의 새로운 물결이 경쟁의 장을 평탄화하고 있습니다. 이 모델의 성공은 소기업이 점점 더 AI의 주요 업체에 도전할 수 있다는 추세를 명확하게 보여줍 니다.
IBM Research의 AI 모델 부사장인 David D. Cox는 “이는 우리가 이미 알고 있는 것을 뒷받침할 뿐”이라고 말합니다. "훌륭한 모델을 구축하는 데 수십억, 수백억 달러가 필요하다고 생각하지 않습니다. DeepSeek는 오픈 소스 접근 방식이 이를 따라잡고 있다는 증거이며, 이는 좋은 일입니다."
AI 연구원들은 계산 비용을 증가시키지 않으면서 모델을 더욱 강력하게 만들기 위해 끊임없이 경쟁하고 있습니다. 하드웨어의 한계와 에너지 소비에 대한 우려가 커지면서 효율성을 개선하는 혁신이 성능 향상만큼 중요해지고 있습니다.
"너무 오랫동안 AI 경쟁은 더 큰 모델이 더 나은 결과를 가져오는 규모의 게임이었습니다."라고 IBM의 CEO Arvind Krishna는 LinkedIn에 썼습니다. "하지만 AI 모델이 크고 비싸야 한다는 물리 법칙은 없습니다. 훈련 및 추론 비용은 해결해야 할 또 다른 기술 과제일 뿐입니다."
DeepSeek의 AI 효율성 혁신은 멀티헤드 잠재 어텐션(MLA)이라는 새로운 기법에서 나옵니다. 이 방법은 AI 모델이 정보를 처리하고 저장하는 방식을 바꿉니다. 주요 개선 사항은 MLA가 AI 시스템이 효율적으로 작동하는 데 필수적인 KV 캐시라는 것의 크기를 줄인다는 점입니다. Cox에 따르면, AI 시스템은 이를 통해 메모리를 덜 사용하고 더 쉽게 성장할 수 있습니다.
Cox는 “DeepSeek는 이 부분이 참 우수합니다.”라고 말합니다. "KV 캐시 크기를 줄이면 모델이 더 빠르게 실행되고 더 적은 리소스를 사용할 수 있으므로, 이는 매우 중요합니다."
DeepSeek를 통해 혁신이 배가되었습니다. IBM Research의 수석 연구원 Prasanna Sattigeri는 DeepSeek가 효율성과 구조적 개선 측면에서 혁신을 가져왔다고 지적했습니다.
Sattigeri는 “DeepSeek는 대규모 AI 훈련에서 종종 병목 현상을 초래하는 GPU 간 통신을 최적화했습니다.”라며, "이를 통해 구형 하드웨어를 사용하여 효과적으로 학습할 수 있게 되었는데, 이는 놀라운 엔지니어링 성과입니다."라고 설명했습니다.
그러나 다른 야심 찬 엔지니어링 프로젝트와 마찬가지로 이러한 도약에는 비용이 따랐습니다. DeepSeek는 또한 OpenAI의 o1 추론 확장 접근 방식에 사용된 것과 유사한 강화 학습(RL) 기법을 활용했습니다. 이는 여러 번의 반복을 통해 성공적인 아웃풋을 강화하여 모델의 성능을 개선하는 방법입니다. 그러나 Cox는 DeepSeek의 구현으로 인해 함수 호출 기능이 약해지고 안전 정렬 문제가 발생하는 등의 문제가 발생했다고 지적합니다.
그는 "큰 진전이지만, 아직은 난항도 있습니다."라며, "이 모델은 추론 작업에서는 환상적이지만 다른 영역에서는 타격을 입었습니다."라고 덧붙였습니다.
여러 발전 덕분에 대규모 AI 모델을 더 쉽게 구축할 수 있게 되었지만, 경쟁력을 유지하는 데 필요한 엄청난 컴퓨팅 성능이라는 더 큰 과제가 남아 있습니다. 라이스 대학교의 컴퓨터 과학 부교수인 Xia “Ben” Hu는 DeepSeek가 AI 개발에 있어 보다 효율적인 진전이라고 인정합니다. 그러나 그는 방대한 컴퓨팅 리소스에 대한 액세스가 여전히 경쟁을 주도하는 AI 인프라의 전반적인 전력 역학을 근본적으로 변화시키지는 못한다고 지적합니다.
“DeepSeek는 중국의 대규모 벤처 펀드의 지원을 받고 있으며 수만 개의 GPU에 액세스할 수 있습니다.”라고 Hu는 말합니다. "이는 여전히 많은 소규모 스타트업에게 큰 장벽입니다."
그러나 Hu는 가장 중요한 변화는 엔터프라이즈 AI 도입에 있을 것으로 예측합니다. "석유 및 가스, 제조 등 기존 산업은 자체 AI 솔루션 개발을 주저했습니다."라고 그는 말합니다. "비용이 절감되고 오픈 소스 모델이 개선되면서 한때 외부 AI 서비스에 의존했던 기업들은 이제 특정 요구 사항에 맞는 사내 모델 구축을 고려하고 있습니다."
이의 의미는 하나의 모델을 넘어섭니다. 오픈 소스 AI 프로젝트가 증가함에 따라 소규모 스타트업도 이제 대규모 데이터 센터와 막대한 예산이 필요했던 툴에 액세스할 수 있게 되었습니다. Cox는 OpenAI와 경쟁사들이 오랫동안 자금이 넉넉한 기업만이 AI를 주도할 수 있는 '필연적인 분위기'를 예상해 왔다고 말했습니다. 하지만 DeepSeek와 다른 모델들이 등장하면서 이러한 개념이 깨지기 시작했습니다.
"우리는 이 분야에서 훨씬 더 광범위한 플레이어가 경쟁할 수 있는 변화를 목격하고 있습니다."라고 Cox는 말합니다. "500만 달러를 가진 사람이 하룻밤 사이에 최고 수준의 모델을 구축할 수 있는 것은 아닙니다. 하지만 자금력이 풍부한 스타트업과 중견기업은 어떨까요? 물론 가능하죠."
연구원들은 또한 원시 컴퓨팅 성능보다는 효율성에 초점을 맞추고 있습니다. Cox와 그의 연구팀은 AI가 처리 리소스를 사용하는 방법을 보다 선별적으로 선택할 수 있도록 하는 Mixture of Experts 접근 방식에 초점을 맞췄습니다.
"Mixture of Experts는 퍼즐의 한 조각일 뿐이며, 앞으로 더 많은 방법이 등장할 것입니다."라고 그는 말하며, AI의 미래는 고급 칩에 대한 액세스가 아니라 기존 하드웨어를 더 스마트하게 사용하는 방법에 달려 있을 수 있음을 시사했습니다.
Sattigeri는 이러한 혁신 중 하나로 실제 데이터를 모방한 인공적으로 생성된 정보, 즉 합성 데이터의 부상을 강조했습니다. "DeepSeek와 같은 모델이 등장하면서 AI가 생성한 합성 데이터를 사용하여 모델을 보다 효율적으로 개선하고 학습시키는 방향으로의 전환이 이루어지고 있습니다."라고 그는 말합니다. "이를 통해 비용이 크게 절감되며, 더 많은 플레이어가 고품질 AI에 액세스할 수 있습니다."
AI 개발의 접근성이 향상되면서 경쟁의 미래에 대한 새로운 질문이 제기되고 있습니다. 인프라와 컴퓨팅 성능에 따라 승자가 결정될까요, 아니면 빠르게 혁신할 수 있는 능력이 가장 가치 있는 자산이 될까요? Cox에 따르면 이 두 가지가 혼합된 형태가 경쟁의 미래라고 할 수 있습니다.
"여전히 인프라와 훌륭한 인재가 필요하지만, OpenAI와 Google이 보유한 해자는 그들이 내세우고 싶어 하는 만큼 깊지 않습니다."라고 그는 말합니다. "이 분야에서는 비밀은 비밀로 남아 있지 않습니다. 아이디어는 확산되고 사람들은 이를 중심으로 움직입니다. 수렴이 빠르게 이루어지고 있습니다."
Hu는 AI 개발에는 여전히 네 가지 중요한 구성 요소가 필요하다고 덧붙였습니다. "최고의 AI 기업은 이 네 가지를 모두 갖추고 있습니다. DeepSeek는 처음 두 가지를 타파하고 있지만, 계산과 배포에서는 여전히 주요 업체가 우위입니다."
보다 효율적인 기술을 통해 AI 기업이 점점 더 많아지고 있는 상황은 단순히 경쟁만을 위한 것이 아니라 창의적인 혁명을 촉발할 수 있습니다. 더 많은 기업이 수십억 달러의 예산 없이 AI를 개발할 수 있다면, 소수의 기업 의제가 아닌 다양한 관점을 통해 혁신을 주도할 수 있을 것이라고 Cox는 말합니다. 이는 더 많은 맞춤형 AI 솔루션과 전문화된 모델, 그리고 더 역동적인 시장을 의미합니다.
"혁신은 더 빠르고, 더 안전하고, 더 포용적인 방식으로 이루어질 것입니다."라고 Cox는 말했습니다. "몇 명의 플레이어가 조건을 설정하는 단일 문화를 벗어나면 다양한 접근 방식이 번성하는 것을 볼 수 있을 것입니다."
Cox는 오픈 소스 AI에 전념하고 있는 IBM의 경우 DeepSeek의 부상이 이러한 접근 방식을 검증한다고 말했습니다. "사실 우리에게는 좋은 일입니다."라고 그는 말합니다. "이는 개방형 모델이 작동할 수 있고 이에 대한 수요가 있다는 것을 증명합니다. 사람들이 더 많이 기여할수록 모두가 더 많은 혜택을 누릴 수 있습니다."
Hu는 소규모 기업들이 입지를 확보하는 동안 주요 기업들은 이에 적응하고 있다고 지적합니다. "Amazon, Meta, Microsoft는 가만히 앉아서 오픈 소스가 자신들의 지분을 차지하도록 내버려 두지 않을 것입니다."라고 그는 말합니다. "이러한 선도적인 기업들은 인프라와 데이터에 대한 통제를 유지하면서 오픈 소스 모델을 통합하는 방법을 찾기 위해 열심히 노력하고 있습니다."
그 다음에는 어떤 일이 일어날까요? Cox와 다른 전문가들은 AI 개발이 완전히 자유롭지는 않을 것이라고 말하지만, 소규모 기업이 더 이상 기술 대기업의 손아귀에 종속되지 않는다는 것은 분명합니다. 오픈 소스 도구는 발전을 가속화하고 있으며, 이러한 변화를 수용하는 기업이 가장 큰 혜택을 누릴 수 있습니다.
"이는 지속적인 추세의 일부입니다."라고 Cox는 말합니다. "DeepSeek로 시작된 건 아니며, DeepSeek로 끝나지도 않을 것입니다. 분명히 이로 인해 눈을 뜬 사람들이 있습니다."
