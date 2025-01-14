Superkomputer yang pas di bawah meja dapat mengubah cara perusahaan menangani kecerdasan buatan.
Di CES 2025 pekan lalu, NVIDIA mengumumkan Project DIGITS, superkomputer AI pribadi yang menampilkan fitur Superchip GB10 Grace Blackwell baru perusahaan. Sistem, yang mulai dari USD 3.000 dan diluncurkan pada bulan Mei, dapat menjalankan model AI dengan hingga 200 miliar parameter dan memberikan petaflop kinerja komputasi AI.
“AI akan menjadi mainstream di setiap aplikasi untuk setiap industri,” Jensen Huang, pendiri dan CEO NVIDIA, mengatakan dalam rilis berita. “Dengan Project DIGITS, Grace Blackwell Superchip datang ke jutaan pengembang,” “Menempatkan superkomputer AI di meja setiap ilmuwan data, peneliti AI, dan siswa memberdayakan mereka untuk terlibat dan membentuk era AI.”
Perangkat desktop mengemas 128 GB memori terpadu dan penyimpanan hingga 4 TB, menargetkan perusahaan yang membutuhkan pemrosesan data instan tanpa penundaan cloud. Dua sistem dapat terhubung bersama untuk menangani model hingga 405 miliar parameter.
“Pikirkan tentang aplikasi industri, di mana di lantai pabrik Anda ingin komputasi berada tepat di samping tempat proses manufaktur berlangsung,” kata Shobhit Varshney, Wakil Presiden IBM Consulting, dalam episode terbaru podcast Mixture of Experts. "Ada banyak latensi antara memanggil server, atau API cloud, dan mendapatkan respons kembali. "
Operasi yang sensitif terhadap keamanan mendorong permintaan akan kemampuan pemrosesan lokal. Varshney menguraikan beberapa skenario di mana ini penting. " Anda ingin memastikan bahwa data, terutama jika terkait dengan sesuatu yang sensitif, tidak meninggalkan tempat Anda, " katanya. " Hal yang sama berlaku untuk aplikasi pertahanan, di mana Anda melakukan sesuatu yang lebih taktis di lapangan. Anda ingin dapat menghitung semua gambar yang masuk dari semua drone di tempat tertentu, karena Anda mungkin berada di wilayah di mana Anda bahkan tidak memiliki koneksi server. "
Sistem Project DIGITS berjalan pada OS NVIDIA DGX berbasis Linux, memungkinkan pengguna mengembangkan secara lokal dan kemudian menerapkan ke cloud atau pusat data. Fasilitas manufaktur dapat menerapkan “pemantauan waktu nyata, pemeliharaan prediktif, dan pengoptimalan proses yang didukung oleh komputasi edge,” kata Ashok Reddy, CEO perusahaan perangkat lunak KX. Perusahaan keuangan mendapatkan alat untuk “perdagangan real-time, manajemen risiko, dan insight prediktif dengan kecepatan yang belum pernah terjadi sebelumnya.” Sementara itu, organisasi perawatan kesehatan dapat memanfaatkan teknologi untuk “diagnostik yang dipercepat, pencitraan, dan pengembangan obat melalui analitik AI canggih,” kata Reddy. Sistem memproses “volume besar data terstruktur dan tidak terstruktur secara instan” untuk “pengambilan keputusan real-time dan analitik latensi rendah.”
Profesor teknik Universitas Pennsylvania Benjamin Lee mengatakan dia melihat superkomputer NVIDIA sebagai bagian dari pergeseran yang lebih luas menuju AI agen, di mana sistem mengelola seluruh pekerjaan daripada tugas individu.
“AI cerdas kemudian akan menyusun strategi dan menentukan serangkaian tugas yang diperlukan untuk menyelesaikan pekerjaan itu,” kata Lee, menambahkan bahwa pendekatan ini “dapat secara signifikan meningkatkan produktivitas dengan memungkinkan manusia untuk meminta pekerjaan besar dari agen daripada meminta tugas individu dari model.”
Varshney mencatat bahwa teknologi sumber terbuka NVIDIA dari akuisisi Run AI senilai USD 700 juta baru-baru ini. “Mereka berusaha memastikan bahwa seluruh industri pindah lebih dekat ke AI fisik dan AI agen dan era mengemudi otonom ini,” kata Varshney, “Mereka ingin menjadi tulang punggung di masing-masing dari mereka.”
Pemotongan harga bergelombang di seluruh lini produk. “Tahun lalu, 40 seri chip mereka dulunya bernilai USD 1.600,” kata Varshney. “Mereka baru saja merilis yang baru dengan spesifikasi setara seharga USD 550.”
Penurunan harga menunjukkan kemajuan teknis. “Desain GPU sebagian besar didefinisikan dan tidak dioptimalkan secara agresif untuk kinerja, energi, dan biaya,” kata Lee. Namun, ada kemungkinan bahwa NVIDIA telah mencapai titik itu “jauh lebih awal daripada desainer chip lainnya, memungkinkannya untuk bersaing dalam kinerja dan biaya,” kata Lee.
“Model dapat dikhususkan untuk tugas-tugas tertentu, menghitung jawaban yang sama dengan perhitungan yang jauh lebih sedikit dan energi yang jauh lebih sedikit,” kata Lee. “Agen kemudian dapat belajar memilih model khusus yang tepat untuk setiap tugas, sesuatu yang mungkin sulit dilakukan manusia.”
Dorongan menuju komputasi khusus ini menandai pergeseran dramatis dari keterbatasan saat ini. “Kami telah dibatasi oleh beberapa model kecil lucu yang berjalan di perangkat seluler,” kata Varshney. “Mereka ingin membuat komputasi mudah diakses dan didemokratisasi seperti mencolokkan ke listrik, tetapi mereka ingin menjadi negara adidaya listrik di seluruh dunia.”
