요즘에는 거의 모든 기술 대기업이 자체 맞춤형 실리콘 칩을 개발하거나 기존 칩 제조업체의 인수를 모색하는 것으로 보입니다. 이유가 무엇일까요? IBM Consulting의 부사장 겸 수석 파트너인 Shobhit Varshney는 다양한 AI 애플리케이션을 구동하는 데 필요한 칩 수가 급증함에 따라 자체적으로 칩을 생산하면 비용을 절감하고 AI 시스템의 성능을 향상할 수 있다고 말합니다.
그는 IBM의 Mixture of Experts 팟캐스트 최근 에피소드에서 "소프트웨어의 아키텍처와 함께 작동하도록 하드웨어의 아키텍처를 최적화하면 놀라운 효과를 볼 수 있습니다."라며, "총 비용과 지연 시간을 줄이는 동시에 처리량을 늘릴 수 있죠."라고 말했습니다.
기업들은 칩을 자체 생산함으로써 AI 칩 시장의 70~95%를 장악하고 있는 칩 제조업체 NVIDIA에 대한 의존도를 줄일 수 있습니다. 하지만 이것이 전부는 아니라고 IBM 리서치의 수석 연구 과학자이자 매니저인 Kaoutar El Maghraoui는 IBM Think와의 인터뷰에서 말했니다. NVIDIA에 대한 의존도를 줄이는 것은 "권력의 중심이 한 거물에서 다른 거물로 이동하는 것"에 불과하다고 El Maghraoui는 말했습니다.
Varshney는 최근 몇 년 동안 NVIDIA가 장악하고 있는 설계 프로세스에 대한 기업의 통제력이 강화되더라도 기업들은 여전히 TSMC(Taiwan Semiconductor Manufacturing Company Limited)에 크게 의존할 것이라고 말합니다. TSMC는 스마트폰에서 군사 장비에 이르기까지 다양한 사용 분야를 위해 전 세계의 AI 칩의 대다수를 제조합니다.
Varshney는 TSMC를 "권력의 정점"이라고 말합니다. "모두가 칩을 설계하지만, 현재 업계 전체의 중심은 TSMC입니다."
실리콘 밸리의 칩 경쟁은 생성형 AI 애플리케이션이 기술 기업들의 수요에 부응하기 오래 전부터 진행되어 왔습니다. 2015년, Google이 설계한 텐서 프로세싱 유닛(TPU)이라는 칩을 탑재한 Google의 AI 시스템 AlphaGo가 고대 중국 게임 바둑에서 인간 프로 기사를 이겼습니다. 이후 Google은 데이터 센터의 AI 시스템을 구동하기 위해 자체 설계한 일련의 칩을 공개했습니다. 가장 최근인 2024년 12월, Google은 양자 컴퓨팅을 위한 새로운 AI 칩인 Willow를 발표했습니다. Google에 따르면, Willow는 표준 벤치마크 계산을 5분 이내에 완료할 수 있습니다. 이는 오늘날 가장 빠른 슈퍼컴퓨터조차 10셉틸리언, 즉 1025년이 걸리는 작업입니다.
Google이 AlphaGo를 출시할 무렵, IBM의 연구원들도 AI 하드웨어 구축을 모색하기 시작했습니다. IBM은 2021년까지 뉴욕주 올버니에 AI 하드웨어 센터를 열어 더 광범위한 AI 하드웨어-소프트웨어 에코시스템을 구축했으며, 2022년에는 IBM의 새로운 Telum 마이크로프로세서 칩을 통해 가치 기준 전 세계 트랜잭션의 약 70%를 실행하는 메인프레임인 AI 추론을 IBM Z에 도입했습니다. 2024년 말, IBM은 엔터프라이즈 사용자를 위한 IBM Z 메인프레임에 생성형 AI를 도입한 새로운 Spyre 액셀러레이터 칩을 발표했습니다.
한편, AWS는 적어도 2018년부터 AI 프로젝트를 위한 자체 컴퓨터 칩을 개발해 왔습니다. 2024년 AWS 연례 행사에서 Amazon은 파트너인 Anthropic의 대규모 언어 모델과 결합하여 고객에게 제공하는 최신 맞춤형 Trainium3 AI 칩을 발표했습니다. Apple을 비롯한 많은 기업이 AWS의 AI 칩을 채택했으며, 특히 AWS 2024에서는 Apple이 공급업체 중 한 곳을 언급하는 드문 순간이 연출되어 이목이 집중되었습니다.
오랫동안 게임 기능을 구동하는 칩을 만들어 온 기술 대기업 Microsoft는 이에 질세라 2023년 Meta가 자체 실리콘 칩 계획을 발표한 것과 비슷한 시기에 자체 맞춤형 AI 칩을 발표했습니다. OpenAI는 가장 최근에 맞춤형 실리콘 칩 제조에 합류했지만, 아직 공식 발표는 하지 않았습니다. 자세한 내용은 공개되지 않았지만, 이달 초 Reuters의 보도에 따르면 OpenAI는 2025년에 TSMC를 통해 칩을 제작할 계획으로 칩 설계를 마무리하고 있다고 합니다.
최근 칩 경쟁이 격화되는 이유는 무엇인가요? IBM의 Varshney는 기업이 필요한 사용 사례에 맞게 특정 언어 모델에 맞게 칩을 맞춤화하면 비용을 절감하고 지연 시간을 개선하거나 한 네트워크에서 다른 네트워크로의 데이터 이동 속도를 높일 수 있다고 말합니다. 그는 예를 들어 과거에는 기업이 사기 탐지를 수행하고 수신 인보이스를 검토할 때 양이 많고 매우 짧은 지연 시간이 필요했기 때문에 기존 컴퓨팅 기술을 사용했습니다. Varshney는 또한 이 작업을 하루에 백만 번 이상 수행해야 했기 때문에 비용이 정말 빠르게 증가했다고 밝혔습니다.
하지만 이제 기업은 특정 모델에 맞춰 칩을 최적화할 수 있으므로 대량 사용 사례의 비용이 절감되고 이러한 솔루션을 대규모 생산에 사용하는 것이 더 비용 효율적입니다. "따라서 기업의 관점에서 볼 때 사용 사례는 변하지 않습니다."라고 Varshney는 말했습니다. "하지만 이제 우리는 이전에는 ROI가 존재하지 않았던 대규모의 사용 사례를 공략하기 시작했습니다."
점점 더 많은 기술 회사가 사내에서 칩을 설계하고 있는 상황에서 TSMC는 어떻게 경쟁사 대비 우위를 유지할까요? 첫째, 이 회사의 접근 방식은 처음부터 다른 기술 회사와 달랐습니다. IBM의 El Maghraoui에 따르면, TSMC는 전용 파운드리로서 칩을 설계하지 않고 다른 회사의 칩만 제조합니다. 시간이 지날수록 다양한 칩을 제조하는 데 드는 비용이 점점 더 증가함에 따라 TSMC에 칩 제조를 아웃소싱하는 기업이 증가하고 있습니다.
반도체 연구 및 분석 회사인 SemiAnalysis의 설립자 Dylan Patel은 최근 팟캐스트 인터뷰에서 동시에 개별 칩 제조 비용 또한 급증했다고 밝혔습니다. Patel은 TSMC가 칩 제조에 집중해 왔으며, 기업 고객의 칩 제조를 매우 쉽게 만들어 주었다고 말합니다.
그는 "반도체 제조는 매우 구식이고 어렵습니다."라며, "역할이 매우 전문화되어 있기 때문에 진입 장벽이 [대부분의 기술 기업보다] 훨씬 높습니다."라고 설명했습니다. 마지막으로, Patel은 TSMC 직원들은 자신의 업무에 큰 자부심을 갖고 있다며, "그들은 공장에서 주당 80시간씩 일하고, 지진과 같은 사건이 발생하면 한밤중에도 출근할 것입니다. 자신만이 특정 장비를 수리할 수 있기 때문입니다."라고 덧붙였습니다.
TSMC의 공식을 따라하기 어려운 또 다른 이유는 네덜란드의 ASML이라는 또 다른 초전도체 대기업이 만든 고도로 전문화된 첨단 칩 제조 기계 수십 대를 구매하는 데 수십억 달러를 투자했기 때문입니다.
ASML은 매우 짧은 파장의 빛을 대량으로 생성하여 작고 복잡한 디자인을 마이크로칩에 인쇄하는 극자외선 리소그래피(EUV)를 개척했습니다. ASML의 칩 제조 기계 가격은 대당 1억 8,300만 달러에서 3억 8,000만 달러 사이입니다. 세계 최초의 EUV 장비 중 하나는 2014년 NY CREATES가 소유 및 운영하며 IBM Research가 주된 파트너인 Albany Nanotech Complex에 설치되었습니다.
이후 IBM Research와 파트너들은 EUV 리소그래피를 개발하고 최적화하기 위한 에코시스템을 구축했으며, 이를 통해 IBM과 다른 기업들은 트랜지스터 크기를 머리카락보다 수만 배 더 얇은 수 나노미터로 줄일 수 있었습니다.
ASML과 IBM과 같은 파트너가 점점 더 작은 칩을 인쇄하기 위해 계속 노력하고 있지만, TSMC는 칩 제조사로서의 지위를 유지할 것입니다. SemiAnalysis의 Patel은 TSMC의 관여를 문제로 여기지 않습니다. Patel은 "반드시 의존성을 없애는 것만은 아니라고 생각합니다."라며, "이로 인해 TSMC가 미국 내에 제조 시설을 건설하게 되겠죠."라고 말했습니다. 2020년 TSMC는 미국에 칩 제조 시설을 건설할 것이라고 발표했으며, 이후 애리조나에 칩 제조시설 3곳을 설립하기 위해 650억 달러를 투자했습니다. 2024년 4분기부터 미국 최초의 TSMC 칩 제조시설에서 칩 생산이 시작되었습니다.
El Maghraoui와 같은 전문가들은 기업들이 AI를 구동하는 칩의 새로운 재료를 찾기 위해 AI를 사용할 가능성이 있다고 보고 있습니다. 이에 따라 IBM과 Meta의 새로운 모델은 연구자들이 미래의 경쟁의 장을 평준화할 수 있는 칩 제조를 위한 새로운 재료를 발견하는 데 도움이 될 수 있습니다.
"이러한 모델을 오픈 소스화하면 혁신을 가속화하고 협업을 촉진하며 완전히 새로운 반도체 개발을 촉진할 수 있습니다."라고 El Maghraoui는 말했습니다.
예를 들어, IBM Research의 재료 파운데이션 모델(FM4M) 프로젝트에 속한 팀은 AI를 사용하여 동일하거나 더 나은 성능을 달성하면서도 환경에 미치는 영향을 줄일 수 있는 새로운 칩을 설계하고 있다고 IBM의 지속 가능한 소재 전략 공동 책임자인 Jed Pitera는 말했습니다. 그는 특정 칩을 생산하는 데 사용되는 전력과 물, 그리고 이 과정에서 발생하는 탄소 배출을 논하며 "칩 제조시설에서 10가지 유형의 칩을 만드는 경우, 각 칩의 총 풋프린트는 얼마일까요?"라고 물었습니다.
Pitera는 "칩 A의 총 풋프린트를 알면 칩 제조 방법을 변경하여 환경에 미치는 영향을 최소화하면서 동일한 성능을 유지할 수 있습니다."라며, “환경에 미치는 영향이 감소하면 비용도 감소하겠죠.”라고 말했습니다.
