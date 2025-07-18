1월 20일에 출시된 강력하면서도 비용 효율적인 AI 추론 모델 DeepSeek-R1은 실리콘 밸리와 월 스트리트 모두를 흥분시켰습니다. 이유가 무엇일까요? OpenAI 및 Anthropic과 같은 최고의 모델만큼 추론할 수 있지만 컴퓨팅을 훨씬 적게 사용하고 학습 및 사용 비용도 훨씬 적게 드는 것으로 알려졌기 때문입니다. 이 모델은 지난달에만 Hugging Face에서 80만 회 이상 다운로드되었습니다.
"정신이 번쩍 들었죠."라고 팔로알토에 본사를 둔 투자회사 AMINO Capital의 창립자이자 매니징 파트너 Larry Li는 IBM Think와의 최근 인터뷰에서 회상했습니다. 그는 새로운 기술은 종종 "역엔지니어링"되는 경우가 많며, "하지만 아무도 그렇게나 잘할 줄은 몰랐습니다."라고 덧붙였습니다.
"세계에서 혁신이 가능한 유일한 나라는 미국 뿐이라는 내러티브가 완전히 뒤집혔습니다."라고 Cathay Innovation의 C.Lab 대표 Matthieu Soulé는 말했습니다. C.Lab은 EU와 아시아, 중국을 포함한 AI 혁신에 투자하는 펀드입니다.
많은 사람들이 DeepSeek의 성공이 업계와 전 세계 AI 경쟁에 더 광범위한 혁명을 일으킬 것이라고 예측했습니다. 6개월 후, 우리는 그러한 예측이 실현되었는지 확인하고 싶었습니다.
DeepSeek-R1이 출시되었을 당시 인터뷰했던 전문가들 및 몇 명의 다른 전문가들과 이야기를 나누며 전체적인 상황을 파악했습니다.
DeepSeek-R1이 출시된 후 며칠 동안 많은 사람들이 회사가 최종 모델에 가까운 모델을 훈련하는 데 든 비용뿐만 아니라 전체 비용을 정확하게 계산하고 보고했는지 및 어떤 회사의 어느 구성 요소를 사용했는지에 대한 우려를 제기했습니다. 과연 DeepSeek는 정말 혁명적인 일을 해냈을까요, 아니면 점진적인 발전에 그쳤을까요?
IBM 수석 연구원인 Kaoutar El Maghraoui와 같은 이들은 진정한 혁신은 '아키텍처 효율성' 또는 '전문가의 조합, 강화 학습 전략, 하드웨어-소프트웨어 코드 설계 및 기타 다양한 최적화 요령'과 같은 기술을 결합하는 것이라고 생각합니다. 이는 대부분 기존 기술을 영리하고 효과적으로 구현한 것입니다.” 라고 El Maghraoui는 최근 IBM Think와의 인터뷰에서 말했습니다.
그럼에도 불구하고 전반적으로 전문가들은 DeepSeek-R1이 몇 가지 주요 방식으로 글로벌 AI 환경을 변화시켰다는 데 동의합니다. 첫째로 많은 사람들은 미국 AI 기업이 보완하기가 거의 불가능한 '해자'를 갖고 있다는(즉, 경쟁에서 앞서 있다는) 것을 당연하게 생각했습니다. DeepSeek는 개발자와 소기업이 자체 LLM을 개발하기 위한 도구에 액세스하는 장벽을 낮추면서 이러한 가정을 반박했습니다.
IBM의 수석 기술 제품 관리자인 Abraham Daniels는 인터뷰에서 “개발자와 사용자는 이제 훨씬 적은 비용으로 OpenAI의 o1과 동일한 유형의 기능을 이용할 수 있다”고 말했습니다.
DeepSeek가 모델을 오픈 소스화한 점은 접근성을 높이는 데 큰 역할을 했습니다. IBM and AI Alliance의 AI 오픈 전략 담당 이사인 Anthony Annunziata는 "DeepSeek 이후 오픈 소스에 대한 관심이 높아졌으며, AI Alliance에 대한 기여도 증가했습니다."라고 말합니다. AI Alliance는 개방적이고 안전한 AI를 만들기 위해 노력하는 조직의 국제적인 네트워크로, IBM과 Meta에 의해 설립되었습니다.
"유럽 전역, 베트남, 인도, 일본에는 인공 지능에 대한 주권적 통제권을 유지하여 미국이나 여타 지역과는 다른 자체적인 문화적, 사회적, 경제적 요구 사항에 맞게 인공 지능을 형성하고자 하는 지역 AI 기업이 많습니다."라고 Annunziata는 설명했습니다.
자체 개발 AI 연구를 보호하는 것은 최우선 과제입니다. "정부가 해외 AI의 영향을 피할 수 있는 방법을 모색하는 실질적인 디지털 주권 추진이 이루어지고 있습니다."라고 El Maghroui는 말했습니다.
현지 언어를 기반으로 LLM을 만드는 것은 많은 기업가에게 동기를 부여합니다. "유틸리티 측면에서 AI는 각 국가 또는 지역이 최소한 행동에 영향을 미치는 측면에서 발언권을 가질 수 있는 자체 언어 모델을 갖기를 원하는 방향으로 나아가고 있습니다."라고 Li는 말했습니다.
예를 들어, 일본은 최근 AI 진흥법을 제정하여 기술 진흥을 적극적으로 지원하고 있습니다. 6월 말, 현지 기업가들의 관심이 높은 두 가지 분야인 AI 주권과 제조업에서의 AI에 집중하기 위해 일본에 새로운 AI Alliance 지부가 출범했습니다. 언어는 AI 시스템 제어에 큰 역할을 하며, 예를 들어 2024년 말에는 학계와 산업계의 연구자 1,500명 이상이 힘을 합쳐 강력하고 개방적인 일본어 모델을 개발하고 있습니다.
많은 국내 AI 모델과 기업가들도 지역의 경제적 이익을 우선시합니다. 일본의 경우, Mitsubishi Electric과 Panasonic을 비롯하여 AI Alliance에 가입한 많은 회사가 일본 경제의 특히 큰 부분을 차지하는 제조 및 산업 사용 분야를 대상으로 AI 모델을 개발하고 있습니다.
반면 딥 러닝과 AI를 사용하여 고급 소프트웨어를 개발하는 일본 하드웨어 및 소프트웨어 회사인 Preferred Networks의 CTO 겸 공동 설립자인 Daisuke Okanohara는 현지 모델에 대한 수요도 증가하고 있다고 말합니다. 5월에 Preferred Networks는 온프레미스에서 실행할 수 있고 일본어와 영어로 학습할 수 있는 컴팩트 모델인 PLaMo의 두 번째 버전을 출시했습니다.
Okanohara는 IBM Think와의 인터뷰에서 "전반적인 성능은 선구적인 모델만큼의 경쟁력을 갖추지 못했지만, 특정 작업에서는 뛰어납니다."라고 말했습니다. "80~300억 개의 매개변수가 있는 모델과 같은 소규모 모델 사용 사례에서는 여러 일본어 작업에서 CLANG, GPT-4o mini 및 유사 모델보다 뛰어난 성능을 발휘합니다."
베트남에서도 기업가적인 LLM 활동이 활발하게 이루어지고 있으며, AI Alliance는 올해 6월에 베트남에 지부를 개설했습니다. Annunziata는 기업가들이 베트남어 모델을 개발하는 것 외에도 AI 모델을 사용하여 AI를 구동하는 새로운 종류의 칩을 개발하는 데 집중하고 있다고 말합니다.
DeepSeek가 많은 현지 기업가들에게 영감을 준 또 다른 이유는 여러 국가에서 보안 및 개인정보 보호 문제를 이유로 DeepSeek-R1 사용을 금지하거나 제한했기 때문입니다. DeepSeek는 이탈리아, 호주, 한국과 캐나다에서는 금지되었으며, 미국 여러 주(특히 정부 사이트)에서도 제한되었습니다. 이는 현지 기업가들이 오픈 소스 도구를 사용하여 특정 지역에서 사용할 수 있는 보다 안전한 모델을 만들도록 동기를 부여하는 흥미로운 파급 효과를 가져왔습니다.
기술 기업가이자 VC인 Kai-Fu Lee가 새로 설립한 기술 회사인 01.AI는 기업의 절반이 국영이고 민간 대기업이 규모를 확장할수록 정부의 영향력 아래 놓일 수 있는 중국에서 매우 어렵기로 악명 높은 기업용 AI의 B2B 시장을 개척하고자 합니다. Lee는 지난 가을 검색 엔진과 오픈 소스 동영상 생성 모델인 Allegro 등 여러 제품을 출시한 회사인 Rhymes AI를 설립한 바 있습니다.
"저희는 실용적인 관점으로 봤을 때 저희 모델들이 매우 우수하다고 생각합니다. 하지만 여전히 많은 비즈니스와 기업에서 사용하기가 쉽지 않은데, 바로 이 문제를 해결하려고 노력하고 있습니다.” 라고 01.AI의 공동 설립자인 Anita Huang은 IBM Think와의 인터뷰에서 말했습니다. "특히 중국 기업 시장에서 빠진 부분은 Windows나 대규모 언어 모델에 해당하는 미들웨어 계층이라고 생각합니다." 현재 이 회사의 엔터프라이즈 플랫폼은 DeepSeek 및 Alibaba의 Qwen과 같은 모델을 사용합니다.
DeepSeek 출시 직후, 많은 사람들은 DeepSeek가 연쇄적 사고 추론이 업계를 장악할 수 있는 길을 열었다고 예측했습니다. 그러나 이후 업계는 변화했습니다. 새로운 연구에 따르면 추론 모델은 비용과 리소스를 많이 사용하며 이러한 모델에서 유용성을 찾는 경우 많은 작업에 반드시 필요하지 않습니다.
아마도 가장 과대 포장된 부분은 저렴한 라이선스 비용(허용적인 MIT 라이선스를 통해 라이선스가 부여됨)을 고려하여 기업에서 DeepSeek를 도입하는 것이었을 것입니다.
"실제로 기업의 도입은 여전히 매우 제한적이며, 대부분 그 이유는 데이터 프라이버시 보장, 규정 준수, 거버넌스 및 보안 부족입니다."라고 El Maghraoui는 말합니다.
적어도 미국의 대부분의 기업은 관리형 또는 감사 가능한 솔루션을 제공하는 공급업체를 고수하고 있습니다.
따라서 Annunziata는 "혁신이 놀라운 곳에서 일어난다는 것을 사람들이 알고 있다는 것은 좋은 일이지만, 전체 AI 산업과 더 광범위한 시장은 일부 사람들의 예측처럼 바뀌지 않았습니다."라고 말했습니다. 대신 "오픈 소스 기업은 오픈 소스에 대한 투자를 두 배로 늘리고 있고, 대규모 독점 기업은 인재 확보에 집중하고 있으며, 경쟁사를 확보하거나 경쟁자를 둔화시키는 데 더욱 중점을 두고 있고, 점점 더 많은 비용을 모델에 쏟아붓고 있습니다."
Daniels는 궁극적으로 DeepSeek의 가장 큰 유산은 특정 목적에 맞는 소규모 모델의 사례를 만드는 것일 수 있다고 말합니다.
"DeepSeek는 AI 경쟁의 문을 열었고 소규모 언어 모델을 새로운 전쟁터로 만들었습니다."라고 그는 말했습니다. "고성능의 소규모 언어 모델은 대규모 모델보다 더 효율적으로 학습할 수 있으며, 기업의 사용 사례를 더 잘 해결할 수 있습니다."
추론, 계획, 작업 실행이 가능한 자율 AI 시스템인 AI 에이전트는 2025년에 기업 전반에 걸쳐 폭발적으로 확대되었으며, 이러한 사용 사례 중 하나에 해당합니다. 보다 작은 모델은 더 효율적이고 리소스 소모가 더 적으며 특정 작업에 맞게 조정할 수 있기 때문에 에이전트형 AI 시스템에 더 적합한 경우가 많습니다.
IBM의 저명한 엔지니어인 Chris Hay는 Mixture of Experts의 최근 에피소드에서 이렇게 말했습니다. "에이전트를 실행하려면 모델이 작고 빠르며 린해야 합니다."
