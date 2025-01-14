Seorang balita tahu untuk tidak membuat tumpukan balok yang lebih besar di atas balok yang lebih kecil. Robot? Tidak begitu. Setidaknya sampai sekarang.
Model AI tradisional unggul dalam memproses teks dan data digital, tetapi berjuang dengan fisika dasar yang dipahami anak-anak secara alami. NVIDIA bertujuan untuk mengubahnya dengan NVIDIA Cosmos, platform baru yang diumumkan di CES 2025 yang mengajarkan mesin bagaimana dunia fisik bekerja.
Teknologi ini berpusat pada "model duni", sistem AI yang membentuk representasi internal struktur, dinamika, dan hubungan sebab-akibat. Model-model ini dapat mengubah cara robot dan kendaraan otonom menavigasi lingkungan dunia nyata dan membantu di bidang-bidang seperti prediksi cuaca dan kedokteran.
"Model dunia secara fundamental mengubah cara sistem memandang dan berinteraksi dengan lingkungan mereka," kata Juan Bernabé-Moreno, Direktur IBM® Research di Eropa untuk Irlandia dan Inggris. "Alih-alih hanya memetakan input ke output, model ini membentuk representasi internal yang menangkap struktur, dinamika, dan hubungan sebab-akibat. Ini memungkinkan penanganan data tidak terstruktur dengan lebih lancar, beradaptasi dengan kondisi yang tidak terlihat dan membuat kesimpulan berdasarkan contoh atau instruksi langsung yang lebih sedikit."
Platform Cosmos mencakup model dasar yang dapat menghasilkan simulasi berbasis fisika untuk melatih sistem AI, bersama dengan alat canggih yang menurut NVIDIA dapat memproses dan memberi label 20 juta jam video hanya dalam dua minggu menggunakan platform Blackwell—tugas yang akan memakan waktu lebih dari tiga tahun dengan pemrosesan CPU tradisional.
Sementara model AI lainnya menghasilkan teks atau gambar, Cosmos berfokus pada interaksi berbasis fisika di lingkungan industri dan mengemudi. Pengembang dapat menyesuaikan sistem dengan data mereka, seperti rekaman dari robot gudang atau test drive otonom. Platform ini telah menarik mitra seperti Uber, yang melihatnya sebagai jalur cepat potensial untuk kendaraan otonom.
NVIDIA merilis model di bawah lisensi terbuka melalui platform seperti Hugging Face. CEO Jensen Huang mengatakan itu sebagai momen potensial "ChatGPT" untuk robotika, menyarankan model dasar dapat mendemokratisasikan AI fisik, seperti bagaimana model bahasa besar (LLM) mengubah pembuatan teks.
Armand Ruiz, VP Produk IBM® Software di yang berfokus pada platform AI, mempertimbangkan proyek Cosmos dalam posting LinkedIn, menyebut sistem pelatihan robot sebagai mahakarya teknis.”. Sistem sumber terbuka, yang dilatih pada 20 juta jam rekaman dunia nyata, mewakili upaya Nvidia untuk membuat model dasar untuk gerakan dan interaksi robot.
"Yang terbaik adalah proyek ini adalah sumber terbuka!" Ruiz menulis, mencatat bahwa Cosmos dapat menyimulasikan skenario seperti kotak jatuh di gudang dan memungkinkan perusahaan untuk menyesuaikan pelatihan dengan data mereka sendiri. Sistem ini bekerja dengan platform simulasi Isaac NVIDIA, meskipun kinerja dunia nyata masih harus diuji.
Para peneliti IBM® menggunakan konsep ini dalam forecasting melalui model dasar Prithvi-Climate-and-Weather mereka. "Metode ini mempelajari dinamika fisik proses global sistem atmosfer," Moreno mengatakan. "Metode ini juga dapat digunakan untuk menghasilkan simulasi yang sesuai dengan fisik dan tugas forecasting multi-granular, serta menurunkan skala ke beberapa resolusi."
Tiga perusahaan telah melompat ke sandbox: Uber, pembuat robot Figure AI, dan pengembang kendaraan otonom Waabi telah menandatangani untuk menerapkan teknologi tersebut. Platform ini dilengkapi dengan lisensi model terbuka untuk penyesuaian.
Kepala ilmuwan AI Meta, Yann LeCun, telah menjelaskan bahwa model dunia adalah sistem yang mengamati lingkungannya dan memprediksi apa yang mungkin terjadi selanjutnya, mengingat pengetahuannya saat ini dan faktor-faktor yang tidak diketahui yang dapat mempengaruhi hasil di masa depan. Dia mencatat bahwa model bahasa AI saat ini menggunakan versi yang lebih sederhana dari pendekatan ini: mereka hanya melihat informasi masa lalu untuk membuat prediksi, tanpa memperhitungkan kemungkinan tindakan yang berbeda atau variabel yang tidak diketahui.
Kemampuan model dunia untuk mensimulasikan skenario sebelum implementasi dunia nyata dapat menghemat uang perusahaan dan kecelakaan dalam robotika.
"Model dunia memungkinkan mesin untuk merencanakan gerakan dan interaksi dalam ruang simulasi, sering disebut 'kembaran digital', sebelum mencobanya di dunia fisik," Moreno mengatakan. " Ini secara dramatis mengurangi coba-coba yang mahal, mengurangi risiko keselamatan dan mempercepat pembelajaran untuk tugas-tugas seperti perakitan industri, logistik gudang, atau robotika berorientasi layanan. "
Moreno menunjukkan bahwa prinsip-prinsip simulasi yang sama ini juga telah menarik perhatian para peneliti medis, yang melihat peluang dalam pengembangan obat dan pengobatan penyakit.
" Dalam perawatan kesehatan, model dunia menyatukan data dari berbagai domain—genomik, proteomik, transkriptomik, dan kimia—untuk menangkap kompleksitas sistem biologis dalam skala besar, " Moreno mengatakan. " Pandangan holistik ini memberdayakan para peneliti dan dokter untuk mengungkap pola tersembunyi dalam kumpulan data biomedis besar, memungkinkan tugas-tugas seperti prediksi gangguan gen, klasifikasi keadaan penyakit, dan pemodelan respons terapi. "
Namun, mencapai aplikasi perawatan kesehatan yang ambisius ini membutuhkan sumber daya komputasi yang luar biasa. Melatih model-model ini menuntut Power dan Sumber daya yang besar, bahkan dengan perangkat keras khusus. Kumpulan pertama model Cosmos masuk ke katalog API NVIDIA tahun ini, bersama alat untuk memproses data video.
Investasi dalam otot komputasi dapat membuka pintu baru di seluruh industri. Melalui model dunia AI, organisasi dapat membuat kembar virtual dari operasi mereka untuk menguji perubahan signifikan sebelum implementasi dengan aman. Simulasi canggih ini memungkinkan perusahaan untuk bereksperimen dengan pengaturan yang berbeda—apakah mereka merencanakan tata letak gudang baru, atau menambahkan robot ke alur kerja mereka—tanpa mengganggu bisnis dunia nyata mereka.
"Pendekatan gen AI tradisional biasanya beroperasi pada data tekstual atau murni digital, tidak memiliki kapasitas untuk bernalar tentang objek dan kekuatan fisik," Moreno mengatakan. "Dengan mengodekan aturan yang mengatur interaksi dunia nyata, model dunia dapat mensimulasikan dan memprediksi hasil di luar teks atau gambar."
Pelajari bagaimana CEO dapat menyeimbangkan nilai generatif AI yang dapat diciptakan dengan investasi yang dibutuhkan dan risiko yang ditimbulkannya.
Belajar konsep dasar dan bangun keterampilan Anda dengan laboratorium praktis, kursus, proyek terpandu, uji coba, dan lainnya.
Pelajari cara menggabungkan AI generatif dan machine learning dengan percaya diri ke dalam bisnis Anda.
Ingin mendapatkan laba yang lebih baik atas investasi AI Anda? Pelajari bagaimana meningkatkan AI gen di berbagai bidang utama mendorong perubahan dengan membantu para pemikir terbaik Anda membangun dan memberikan solusi baru yang inovatif.
Kami menyurvei 2.000 organisasi tentang inisiatif AI mereka untuk mengetahui apa yang berhasil, apa yang tidak, dan cara Anda untuk maju.
IBM Granite adalah rangkaian model AI kami yang terbuka, berkinerja, dan tepercaya, yang dirancang untuk bisnis dan dioptimalkan untuk menskalakan aplikasi AI Anda. Jelajahi opsi bahasa, kode, deret waktu, dan batasan.
Pelajari cara memilih model dasar AI yang paling sesuai untuk contoh penggunaan Anda.
Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.
Gunakan AI di bisnis Anda dalam perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.
Temukan kembali alur kerja dan operasi yang penting dengan menambahkan AI untuk memaksimalkan pengalaman, pengambilan keputusan secara real-time, dan nilai bisnis.
Dapatkan akses satu atap ke kemampuan yang mencakup siklus hidup pengembangan AI. Hasilkan solusi AI yang kuat dengan antarmuka ramah pengguna, alur kerja yang efisien, serta akses ke API dan SDK berstandar industri.