Saat ini, sepertinya hampir setiap raksasa teknologi sedang mengembangkan chip silikon kustom sendiri, atau mengincar pembuat chip yang ada untuk diakuisisi. Mengapa? Karena jumlah chip yang dibutuhkan untuk memberi daya pada serangkaian aplikasi AI yang rumit sangat banyak, memproduksi chip sendiri dapat mengurangi biaya dan meningkatkan kinerja sistem AI, kata Shobhit Varshney, VP dan Senior Partner di IBM Consulting.
“Ketika Anda mengoptimalkan arsitektur perangkat keras untuk bekerja dengan arsitektur perangkat lunak, itu membuat keajaiban,” katanya dalam episode terbaru podcast Mixture of Experts IBM®. “Ini mengurangi total biaya dan latensi sambil meningkatkan throughput.”
Dengan memproduksi chip secara internal, perusahaan juga mengurangi ketergantungan mereka pada pembuat chip NVIDIA, yang menguasai sekitar 70 hingga 95%pasar chip AI. Namun, ini bukanlah keseluruhan cerita, kata Kaoutar El Maghraoui, seorang Ilmuwan Riset Utama dan Manajer di IBM® Research, dalam sebuah wawancara dengan IBM® Think. Mengurangi ketergantungan pada NVIDIA hanya menggeser “pusat kekuasaan pindah dari satu raksasa ke raksasa lainnya,” katanya.
Bahkan ketika perusahaan mengambil kendali lebih besar atas proses desain, yang telah didominasi NVIDIA dalam beberapa tahun terakhir, perusahaan masih akan sangat bergantung pada Taiwan Semiconductor Manufacturing Company Limited (TSMC), kata Varshney. TSMC memproduksi sebagian besar chip AI secara global untuk berbagai aplikasi, dari smartphone hingga peralatan militer.
TSMC adalah “gorila 100 pon,” kata Varshney. “Semua orang merancang chip, tetapi TSMC adalah jantung dari seluruh industri pada saat ini.”
Perlombaan chip di Silicon Valley telah berlangsung sejak lama sebelum aplikasi AI generatif meningkatkan selera perusahaan teknologi untuk mereka. Pada tahun 2015, sistem AI Google AlphaGo, yang ditenagai oleh chip desain Google yang dikenal sebagai unit pemrosesan tensor (TPU), mengalahkan pemain manusia profesional di game Tiongkok kuno Go. Sejak itu, Google telah meluncurkan serangkaian chip yang dirancang sendiri untuk memberi daya pada sistem AI di pusat datanya. Baru-baru ini, pada Desember 2024, Google mengumumkan chip AI baru untuk komputasi quantum bernama Willow . Perusahaan mengatakan Willow dapat menyelesaikan tolok ukur standar dalam waktu kurang dari 5 menit—yang akan memakan salah satu superkomputer tercepat saat ini 10 septiliun, atau 1025, tahun.
Sekitar waktu yang sama ketika Google meluncurkan AlphaGo, para peneliti di IBM® mulai menyelidiki pembuatan perangkat keras AI juga. Pada tahun 2021, IBM® telah membuka Pusat Perangkat Keras AI di Albany, New York, untuk menciptakan ekosistem perangkat keras-perangkat lunak AI yang lebih luas, dan pada tahun 2022, chip mikroprosesor Telum baru IBM telah membawa inferensi AI ke IBM® Z, mainframe yang menjalankan sekitar 70% transaksi dunia berdasarkan nilai. Pada akhir tahun 2024, IBM® mengumumkan chip akselerator Spyre baru, yang membawa AI generatif ke mainframe IBM® Z untuk pengguna perusahaan.
Sementara itu, AWS telah mengerjakan chip komputernya sendiri untuk proyek-proyek AI setidaknya sejak tahun 2018. Maju cepat ke acara tahunan AWS 2024, di mana Amazon mengumumkan chip AI Trainium3 kustom terbarunya, yang diperkenalkan kepada pelanggan bersama dengan model bahasa besar milik Anthropic, mitranya. Banyak perusahaan telah menggunakan chip AI AWS, termasuk Apple, yang menarik perhatian di AWS 2024 karena ini adalah momen langka di mana Apple membahas salah satu vendornya.
Tidak kalah, Microsoft, yang telah membuat chip untuk memberi daya pada fungsi gamenya selama bertahun-tahun, mengumumkan chip AI kustom sendiri pada tahun 2023, sekitar waktu yang sama raksasa teknologi Meta mengumumkan rencana chip silikonnya sendiri. OpenAI adalah yang terbaru untuk bergabung dengan pesta silikon khusus, meskipun belum membuat pengumuman resmi. Meskipun tidak ada rincian yang dibagikan secara publik, Reuters melaporkan awal bulan ini bahwa OpenAI sedang menyelesaikan desain chipnya, dengan rencana untuk mulai membuatnya melalui TSMC pada tahun 2025.
Mengapa perlombaan chip meningkat baru-baru ini? Varshney dari IBM® mengatakan bahwa ketika perusahaan dapat menyesuaikan chip ke model bahasa tertentu untuk contoh penggunaan yang mereka butuhkan, mereka dapat memotong biaya, meningkatkan latensi atau mempercepat pergerakan data dari satu jaringan ke jaringan lainnya. Dia menunjuk ke sebuah contoh: secara historis, ketika perusahaan melakukan deteksi penipuan dan memeriksa faktur masuk, mereka menggunakan teknik komputasi klasik karena volumenya tinggi, dan mereka membutuhkan latensi yang sangat cepat. “Mereka juga harus melakukan ini jutaan kali sehari, jadi biayanya akan bertambah dengan sangat cepat,” kata Varshney.
Sekarang perusahaan dapat mengoptimalkan chip mereka untuk model tertentu, biaya contoh penggunaan volume tinggi turun, dan menjadi lebih hemat biaya untuk menggunakan solusi ini dalam produksi dalam skala besar. “Jadi dari perspektif perusahaan, contoh penggunaan tidak berubah,” kata Varshney. “Tapi sekarang kita mulai mengejar volume tinggi di mana sebelumnya ROI tidak ada.”
Mengingat semakin banyak perusahaan teknologi yang merancang chip di rumah, bagaimana TSMC mempertahankan keunggulannya dari pesaing? Pertama-tama, pendekatan perusahaan sejak awal berbeda dari perusahaan teknologi lainnya. Mereka adalah pengecoran khusus, yang berarti mereka tidak merancang chip apa pun tetapi hanya memproduksi chip untuk perusahaan lain, kata El Maghraoui dari IBM®. Selama bertahun-tahun, semakin banyak perusahaan yang mengalihdayakan manufaktur chip mereka ke TSMC karena meningkatnya biaya pembuatan rangkaian chip yang semakin beragam.
Pada saat yang sama, biaya pembuatan chip individu meroket, kata Dylan Patel, pendiri SemiAnalysis, sebuah perusahaan riset dan analisis semikonduktor, dalam sebuah wawancara podcast baru-baru ini. TSMC telah berfokus pada fabrikasi chip dan telah membuatnya sangat mudah bagi pelanggan perusahaan mereka, kata Patel.
“Manufaktur semikonduktor sangat kuno dan sulit,” jelasnya. "Hambatan untuk masuk jauh lebih tinggi [daripada kebanyakan perusahaan teknologi], karena perannya sangat terspesialisasi." Akhirnya, karyawan TSMC sangat bangga dengan pekerjaan mereka, kata Patel. “Mereka akan bekerja 80 jam seminggu di pabrik, dan jika ada yang salah, seperti gempa bumi, mereka akan muncul di tengah malam” karena mereka adalah satu-satunya yang dapat memperbaiki peralatan tertentu, katanya.
Alasan lain mengapa sulit untuk meniru formula TSMC adalah karena mereka telah menginvestasikan miliaran dolar untuk membeli lusinan mesin pembuat chip canggih khusus yang dibuat oleh raksasa superkonduktor lain, perusahaan Belanda ASML..
ASML memelopori litografi ultraviolet ekstrem (EUV), yang pada dasarnya menghasilkan panjang gelombang cahaya yang sangat pendek dalam jumlah besar untuk mencetak desain kecil dan kompleks pada microchip. Mesin-mesin pembuat chip ASML masing-masing berharga antara 183 juta USD dan 380 juta USD. Salah satu mesin EUV pertama di dunia dipasang pada tahun 2014 di Albany Nanotech Complex, yang dimiliki dan dioperasikan oleh NY CREATES dan IBM® Research adalah mitra jangkar.
Sejak itu, IBM® Research dan mitranya telah membangun ekosistem untuk mengembangkan dan mengoptimalkan litografi EUV, yang telah memungkinkan IBM® dan lainnya untuk mengecilkan ukuran transistor menjadi hanya beberapa nanometer, puluhan ribu kali lebih tipis dari sehelai rambut.
Sementara ASML dan mitra seperti IBM® terus bekerja untuk mencetak chip yang lebih kecil dan lebih kecil, TSMC akan tetap dalam persamaan sebagai perakit chip. Patel dari SemiAnalysis tidak melihat keterlibatan TSMC sebagai masalah. “Saya tidak berpikir itu benar-benar menghilangkan ketergantungan,” katanya. “Saya pikir itu membuat TSMC dibangun di AS.” TSMC mengumumkan pada tahun 2020 bahwa mereka akan membangun pabrik chip di AS, dan sejak itu, raksasa manufaktur telah menginvestasikan 65 miliar USD untuk mengembangkan tiga pabrik chip di Arizona. Pada kuartal keempat tahun 2024, produksi chip dimulai di pabrik chip TSMC pertama di Amerika Serikat.
Para pakar seperti El Maghraoui melihat janji bagi perusahaan dalam menggunakan AI untuk menemukan bahan baru untuk chip untuk memberi daya AI. Untuk itu, model-model baru dari IBM® dan Meta dapat membantu para peneliti menemukan material baru untuk fabrikasi chip yang dapat menyamakan kedudukan di masa depan.
“Ketika kami membuka sumber model-model ini, kami mempercepat inovasi, mendorong kolaborasi, dan mempromosikan pengembangan semikonduktor yang sama sekali baru,” kata El Maghraoui.
Sebagai contoh, sebuah tim dalam proyek model dasar untuk material milik IBM® Research (FM4M) sedang menggunakan AI untuk merancang chip baru yang dapat mencapai kinerja yang sama atau lebih baik namun dengan jejak lingkungan yang lebih kecil, kata Jed Pitera, Co-Lead Strategi IBM® untuk Material Berkelanjutan. “Jika saya memiliki fab, dan saya membuat sepuluh jenis chip yang berbeda, berapa total jejak dari setiap chip?” katanya, mengacu pada Power dan air yang digunakan, dan emisi yang dihasilkan membuat chip tertentu.
“Ketika kita mengetahui total jejak chip A, kita dapat mulai berpikir tentang mengubah cara kita membuat chip, sehingga mereka masih mencapai kinerja yang sama tetapi dengan dampak lingkungan yang diminimalkan,” kata Pitera. “Ketika jejak lingkungan turun, biaya pindah ke arah yang sama.”
Temukan bagaimana infrastruktur hybrid cloud dapat mendukung strategi AI Anda. Pelajari dari pakar IBM cara mengubah teknologi yang ada menjadi sistem yang tangkas dan siap AI, yang mendorong inovasi dan efisiensi di seluruh operasi bisnis Anda.
Jelajahi bagaimana solusi hybrid cloud dapat mengoptimalkan operasi bisnis Anda yang didorong oleh AI. Pelajari studi kasus dan solusi unggulan untuk melihat bagaimana perusahaan menggunakan hybrid cloud IBM demi mencapai efisiensi, skalabilitas, dan keamanan yang lebih besar.
Pelajari tentang perbedaan utama antara infrastruktur sebagai layanan (IaaS), platform sebagai layanan (PaaS), dan perangkat lunak sebagai layanan (SaaS). Jelajahi bagaimana setiap model cloud menyediakan berbagai tingkat kontrol, skalabilitas, dan manajemen untuk memenuhi kebutuhan bisnis yang berbeda.
Temukan biaya tersembunyi dari peningkatan skala AI generatif dan pelajari dari pakar cara membuat investasi AI Anda lebih efisien dan berdampak.
Pelajari dasar-dasar manajemen TI, termasuk alasan pentingnya bagi organisasi modern dan berbagai fitur utama untuk memastikan operasi yang lancar dan efisien di seluruh sistem teknologi.
IBM Cloud Infrastructure Center adalah platform perangkat lunak yang kompatibel dengan OpenStack untuk mengelola infrastruktur cloud pribadi di IBM zSystems dan IBM LinuxONE.
Temukan server, penyimpanan, dan perangkat lunak yang dirancang untuk hybrid cloud dan strategi AI perusahaan Anda.
Temukan solusi infrastruktur cloud yang tepat untuk kebutuhan bisnis Anda dan tingkatkan sumber daya sesuai permintaan.
Ubah infrastruktur perusahaan Anda dengan solusi hybrid cloud yang siap AI dari IBM. Temukan server, penyimpanan, dan perangkat lunak yang dirancang untuk mengamankan, menskalakan, dan memodernisasi bisnis Anda atau mengakses insight pakar demi meningkatkan strategi AI generatif Anda.