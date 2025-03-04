2025년 1월 20일의 헤드라인을 읽었다면 하늘이 무너진다고 생각했을지도 모릅니다. 중국 기반 DeepSeek가 R1 대규모 언어 모델(LLM)을 출시했는데, 이 모델은 출시 직후부터 가장 많이 다운로드되고 활성화된 모델 중 하나가 됐습니다.

중국 항저우에 본사를 두고 자사 이름으로 모델을 출시한 AI 연구소가 미국의 주요 모델보다 훨씬 적은 비용(560만 달러)과 훨씬 적은 컴퓨팅 리소스와 NVIDIA 칩에 대한 더 낮은 접근성으로 모델을 제작했다는 사실이 흥미를 불러일으켰습니다.

사람들은 막대한 자금을 지원받는 미국 AI 기업 중 일부가 도태될 것이라는 우려를 공공연하게 드러냈습니다. DeepSeek는 다른 회사보다 NVIDIA 칩을 적게 사용했기 때문에 NVIDIA의 주가가 하락했습니다. 그러나 이는 칩 제조업체의 운명에 대해 실질적으로 걱정하기보다는 뉴스에 대한 즉각적인 반응에 가까웠습니다.

기술 및 비즈니스 기자들은 이를 기존 질서에 충격을 주는 소식으로 받아들였습니다. 하지만 저를 비롯한 다른 AI 전문가들이 DeepSeek의 R1 발표를 보고 놀랐던 것은 모두가 놀라워하는 모습뿐이었습니다.

DeepSeek는 새로운 모델이지만, 시장에 새로 진입한 모델이라고 볼 수는 없습니다. 특히 12월에 출시된 V3 모델을 비롯해 중국 시장에서 가치 있는 오픈 소스 모델을 생산한 풍부한 이력을 보유하고 있습니다. 실제로 이러한 실험실을 구축하는 방법에 대해 자세히 알아보고자 하는 사람들을 위해 교육을 제공하는 기술 문서를 함께 공개했습니다. V3 모델은 더 놀라웠지만, 확실히 별다른 주목을 받지 못했습니다.

물론 DeepSeek의 R1 모델은 AI 툴이 사용자의 요청에 응답할 뿐만 아니라 독립적으로 작동하여 해당 사용자에게 서비스를 제공하며 에이전틱 AI의 미래를 위한 기반이 될 수 있는 생성형 AI 도구 의 또 다른 예입니다.

IBM은 설계상 이러한 모든 모델과 파트너 관계를 맺고 사용하며, 오픈 소스 운동의 열렬한 지지자이자 엔지니어이기도 합니다. R1과 같은 오픈 소스 모델이 많은 찬사를 받는 것은 업계에 큰 힘이 됩니다.

DeepSeek가 잘 알려진 모델에 비해 적은 비용으로 자사의 모델과 동급 또는 더 나은 모델을 생산하는 것을 보고 대형 업체들이 약간 당황했다는 것은 이해할 만합니다. 하지만 오픈 소스 커뮤니티의 목적은 바로 이런 것입니다.

DeepSeek R1의 발표는 두 가지 세계의 이야기를 보여줍니다. 금융 시장은 혼란에 빠질 것으로 예상되는 반면, AI 전문가들은 기술 혁신과 이를 통해 얼마나 더 효율적이고 강력한 최신 모델에 정보를 제공할 수 있는지에 대해 열광했습니다.