책상 아래에 들어갈 정도로 작은 슈퍼컴퓨터는 기업이 인공 지능을 다루는 방식을 바꿀 수 있습니다.
지난주 CES 2025에서 NVIDIA는 자사의 새로운 GB10 Grace Blackwell Superchip을 탑재한 개인용 AI 슈퍼컴퓨터인 Project DIGITS를 발표했습니다. 가격은 미화 3,000 달러부터 시작하여 5월에 출시되는 이 시스템은 최대 2000억 개의 매개변수로 AI 모델을 실행할 수 있으며 AI 컴퓨팅 성능을 제공합니다.
"AI는 모든 산업의 모든 애플리케이션에서 주류가 될 것입니다."라고 NVIDIA의 창립자 겸 CEO인 젠슨 황(Jensen Huang)이 보도 자료에서 말했습니다. "Project DIGITS를 통해 Grace Blackwell Superchip은 수백만 명의 개발자에게 제공됩니다.", "모든 데이터 과학자, AI 연구원 및 학생의 책상 위에 AI 슈퍼컴퓨터를 배치하여 이들이 AI 시대에 참여하고 AI 시대를 형성할 수 있도록 힘을 실어 줍니다."
데스크톱 디바이스는 128GB의 통합 메모리와 최대 4TB의 스토리지를 제공하며, 클라우드 지연 없이 즉시 데이터 처리가 필요한 기업을 대상으로 합니다. 두 시스템을 함께 연결하여 최대 4,050억 개의 매개변수 모델을 처리할 수 있습니다.
"제조가 이루어지고 있는 와중에 바로 옆에서 계산을 해야 하는 공장 현장의 산업 애플리케이션을 생각해 보세요." IBM® Consulting의 부사장인 IBM의 쇼빗 바르쉬니(Shobhit Varshney)가 최근 Mixture of Experts 팟캐스트에서 말했습니다. "서버나 클라우드 API를 호출한 후 응답을 받는 데 많은 지연 시간이 소요됩니다."
보안에 민감한 작업으로 인해 로컬 처리 기능에 대한 수요가 증가하고 있습니다. 바르쉬니는 이것이 필수적인 여러 시나리오를 설명했습니다. "특히 민감한 정보와 관련된 데이터인 경우 데이터가 외부로 유출되지 않도록 해야 합니다."라고 이어서 말합니다. "현장에서 보다 전술적인 작업을 수행하는 방위 애플리케이션도 마찬가지입니다. 서버에 연결되지 않은 지역에 있을 수도 있기 때문에 특정 장소에 있는 모든 드론에서 들어오는 모든 이미지를 계산할 수 있어야 합니다."
Project DIGITS 시스템은 Linux 기반 NVIDIA DGX OS에서 실행되므로 사용자가 로컬에서 개발한 다음 클라우드 또는 데이터센터 인프라에 배포할 수 있습니다. 소프트웨어 회사 KX의 CEO인 아쇼크 레디(Ashok Reddy)는 제조 시설이 "엣지 컴퓨팅을 기반으로 한 실시간 모니터링, 예측 유지보수 및 프로세스 최적화"를 구현할 수 있다고 말합니다. 금융 회사는 "전례 없는 속도로 실시간 거래, 위험 관리 및 예측 인사이트"를 얻을 수 있는 도구를 확보하게 됩니다. 한편, 의료 기관은 "고급 AI 분석을 통해 진단, 영상 분석, 신약 개발을 가속화"하기 위해 이 기술을 활용할 수 있다고 레디는 말합니다. 이 시스템은 "실시간 의사 결정 및 저지연 분석'을 위해 '대량의 정형 및 비정형 데이터"를 즉시 처리합니다.
펜실베이니아 대학교 공학과 교수인 벤자민 리(Benjamin Lee)는, NVIDIA의 슈퍼컴퓨터를 개별 작업이 아니라 하나의 일 전체를 관리하는 시스템인 에이전틱 AI로의 더 큰 변화의 일환으로 보고 있다고 말했습니다.
"그러면 지능형 AI가 해당 일을 완료하는 데 필요한 일련의 작업을 전략화하고 결정합니다."라고 리는 말합니다. 이어서 이 접근 방식은 "사람이 모델에 개별 작업을 요청하는 대신 에이전트에게 대규모 작업을 요청할 수 있게 함으로써 생산성을 크게 향상할 수 있습니다."라고 덧붙입니다.
바르쉬니는 NVIDIA가 최근 미화 7억 달러 규모의 Run AI 인수를 통해 기술을 오픈소스화했다고 언급합니다. "이들은 업계 전체가 물리적 AI, 에이전틱 AI 및 자율 주행 시대에 더 가까워지도록 노력하고 있습니다."라고 바르쉬니는 말합니다. "각각의 분야에서 중추적인 역할을 하고 싶어 합니다."
가격 인하가 전체 제품 라인에 걸쳐 파급되었습니다. "작년에 40 시리즈 칩의 가격은 미화 1,600달러였습니다."라고 바르쉬니는 말합니다. "얼마 전 미화 550달러에 동일한 컴퓨팅 성능을 제공하는 제품을 출시했습니다."
가격 인하는 기술 발전을 시사합니다. "GPU 설계는 대체로 정의되어 있으며 성능, 에너지 및 비용 측면에서 적극적으로 최적화되어 있지 않습니다."라고 리는 말합니다. 하지만 NVIDIA는 "다른 칩 설계사보다 훨씬 일찍 그 지점에 도달하여 성능과 비용 모두에서 경쟁할 수 있게 되었다"고 리는 말합니다.
"모델은 특정 작업에 특화되어 훨씬 적은 계산과 훨씬 적은 에너지로 동일한 답을 계산할 수 있습니다."라고 리는 말합니다. "그러면 에이전트는 각 작업에 적합한 전문 모델을 선택하는 방법을 배울 수 있는데, 이는 사람이 하기에는 어려울 수도 있는 일입니다."
전문 컴퓨팅을 향한 이러한 움직임은 현재의 한계에서 극적인 전환을 의미합니다. "우리는 모바일 기기에서 실행되는 작고 귀여운 모델들 때문에 제약을 받아왔습니다"라고 바르쉬니는 말합니다. "NVIDIA는 컴퓨팅을 전기 콘센트에 꽂는 것처럼 쉽게 접근할 수 있도록 하고 이를 민주화하고 싶지만, 전 세계 전력 공급의 패권을 잡고 싶어합니다."
