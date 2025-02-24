실리콘 밸리의 칩 경쟁은 생성형 AI 애플리케이션이 기술 기업들의 수요에 부응하기 오래 전부터 진행되어 왔습니다. 2015년, Google이 설계한 텐서 프로세싱 유닛(TPU)이라는 칩을 탑재한 Google의 AI 시스템 AlphaGo가 고대 중국 게임 바둑에서 인간 프로 기사를 이겼습니다. 이후 Google은 데이터 센터의 AI 시스템을 구동하기 위해 자체 설계한 일련의 칩을 공개했습니다. 가장 최근인 2024년 12월, Google은 양자 컴퓨팅을 위한 새로운 AI 칩인 Willow를 발표했습니다. Google에 따르면, Willow는 표준 벤치마크 계산을 5분 이내에 완료할 수 있습니다. 이는 오늘날 가장 빠른 슈퍼컴퓨터조차 10셉틸리언, 즉 1025년이 걸리는 작업입니다.

Google이 AlphaGo를 출시할 무렵, IBM의 연구원들도 AI 하드웨어 구축을 모색하기 시작했습니다. IBM은 2021년까지 뉴욕주 올버니에 AI 하드웨어 센터를 열어 더 광범위한 AI 하드웨어-소프트웨어 에코시스템을 구축했으며, 2022년에는 IBM의 새로운 Telum 마이크로프로세서 칩을 통해 가치 기준 전 세계 트랜잭션의 약 70%를 실행하는 메인프레임인 AI 추론을 IBM Z에 도입했습니다. 2024년 말, IBM은 엔터프라이즈 사용자를 위한 IBM Z 메인프레임에 생성형 AI를 도입한 새로운 Spyre 액셀러레이터 칩을 발표했습니다.

한편, AWS는 적어도 2018년부터 AI 프로젝트를 위한 자체 컴퓨터 칩을 개발해 왔습니다. 2024년 AWS 연례 행사에서 Amazon은 파트너인 Anthropic의 대규모 언어 모델과 결합하여 고객에게 제공하는 최신 맞춤형 Trainium3 AI 칩을 발표했습니다. Apple을 비롯한 많은 기업이 AWS의 AI 칩을 채택했으며, 특히 AWS 2024에서는 Apple이 공급업체 중 한 곳을 언급하는 드문 순간이 연출되어 이목이 집중되었습니다.

오랫동안 게임 기능을 구동하는 칩을 만들어 온 기술 대기업 Microsoft는 이에 질세라 2023년 Meta가 자체 실리콘 칩 계획을 발표한 것과 비슷한 시기에 자체 맞춤형 AI 칩을 발표했습니다. OpenAI는 가장 최근에 맞춤형 실리콘 칩 제조에 합류했지만, 아직 공식 발표는 하지 않았습니다. 자세한 내용은 공개되지 않았지만, 이달 초 Reuters의 보도에 따르면 OpenAI는 2025년에 TSMC를 통해 칩을 제작할 계획으로 칩 설계를 마무리하고 있다고 합니다.

최근 칩 경쟁이 격화되는 이유는 무엇인가요? IBM의 Varshney는 기업이 필요한 사용 사례에 맞게 특정 언어 모델에 맞게 칩을 맞춤화하면 비용을 절감하고 지연 시간을 개선하거나 한 네트워크에서 다른 네트워크로의 데이터 이동 속도를 높일 수 있다고 말합니다. 그는 예를 들어 과거에는 기업이 사기 탐지를 수행하고 수신 인보이스를 검토할 때 양이 많고 매우 짧은 지연 시간이 필요했기 때문에 기존 컴퓨팅 기술을 사용했습니다. Varshney는 또한 이 작업을 하루에 백만 번 이상 수행해야 했기 때문에 비용이 정말 빠르게 증가했다고 밝혔습니다.

하지만 이제 기업은 특정 모델에 맞춰 칩을 최적화할 수 있으므로 대량 사용 사례의 비용이 절감되고 이러한 솔루션을 대규모 생산에 사용하는 것이 더 비용 효율적입니다. "따라서 기업의 관점에서 볼 때 사용 사례는 변하지 않습니다."라고 Varshney는 말했습니다. "하지만 이제 우리는 이전에는 ROI가 존재하지 않았던 대규모의 사용 사례를 공략하기 시작했습니다."