중국 스타트업 DeepSeek의 AI 모델인 DeepSeek-R1은 지난주 출시된 지 몇 시간 만에 AI 오픈 소스 플랫폼 Hugging Face에서 가장 많이 다운로드되고 활성화된 모델 차트 1위에 올랐습니다. 또한 투자자들이 NVIDIA와 같은 칩 제조업체의 가치 평가와 미국 AI 대기업이 AI 비즈니스를 확장하기 위해 기울이고 있는 막대한 투자를 재고하게 되면서 금융 시장에 충격을 주었습니다.

왜 이렇게 떠들썩할까요? "DeepSeek-R1"이라는 디지털 어시스턴트는 수학 및 코딩 작업의 특정 AI 벤치마크에서 OpenAI의 o1과 동일한 성능을 발휘하며, 훨씬 적은 수의 칩으로 학습되었으며 약 96% 더 저렴하다고 회사 측은 설명합니다.

IBM AI 하드웨어의 수석 연구원이자 관리자인 Kaoutar El Maghraoui는 "DeepSeek는 확실히 AI 환경을 재편하여 오픈 소스에 대한 야망과 최첨단 혁신으로 거대 기업에 도전하고 있습니다."라고 말합니다.

한편, TikTok을 소유한 중국 기술 대기업인 ByteDance는 최근 특정 벤치마크에서 OpenAI의 GPT-4o, Anthropic의 Claude 및 Google의 Gemini를 능가하는 자체 추론 에이전트인 UI-TARS를 발표했습니다. ByteDance의 에이전트는 그래픽 인터페이스를 읽고 추론하고 자율적인 단계별 조치를 취할 수 있습니다.

스타트업부터 기존의 거대 기업에 이르기까지 중국 AI 기업들은 미국 라이벌과의 격차를 줄이고 있는 것으로 보입니다. 이는 기본 소프트웨어 코드를 오픈 소스로 공개하거나 다른 기업 및 소프트웨어 개발자와 공유하려는 의지 덕분입니다. "DeepSeek는 커뮤니티 전반에 걸쳐 매우 강력한 모델을 확산시킬 수 있었습니다."라고 IBM의 Granite 모델 수석 기술 제품 관리자인 Abraham Daniels는 말합니다. DeepSeek-R1은 무제한 상업적 사용을 허용하는 MIT 라이선스에 따라 Hugging Face에서 제공됩니다. "DeepSeek는 AI 민주화를 실제로 가속화할 수 있습니다."라고 그는 말합니다.

지난 여름, 중국 기업 Kuaishou는 OpenAI의 Sora와 비슷하지만 일반인이 사용할 수 있는 동영상 생성 도구를 공개했습니다. Sora는 작년 2월에 공개되었지만 12월에야 완전 출시되었고, 그마저도 ChatGPT Pro 구독자가 모든 기능을 이용할 수 있었습니다. Hugging Face의 개발자들은 중국 기술 대기업인 Tencent와 Alibaba의 새로운 오픈 소스 모델도 도입했습니다. Meta가 Llama 모델을 오픈 소스로 공개한 반면, OpenAI와 Google은 모두 모델 개발에 있어 주로 비공개 소스 방식을 추구했습니다.

오픈 소스라는 장점 외에도, DeepSeek 엔지니어들은 미국 경쟁업체들이 시스템을 학습시키기 위해 사용하는 고도로 전문화된 NVIDIA 칩의 일부만 사용했습니다. 예를 들어, DeepSeek 엔지니어들은 모델 출시와 함께 발표한 연구에 따르면, DeepSeek-V3 모델을 학습시키기 위해 단 2,000개의 GPU(그래픽 처리 장치) 또는 칩만 필요하다고 밝혔습니다.