Tujuh hari setelah peluncuran, agen multifungsi baru Manus AI masih menarik perhatian dan menjadi berita utama. Perusahaan yang dikembangkan oleh perusahaan rintisan Tiongkok Butterfly Effect, mengklaim bahwa 2 juta orang berada dalam daftar tunggu untuk agen tujuan umum. Manus masih hanya dapat diakses melalui undangan, yang semakin meningkatkan antusiasme, meskipun kode undangan dapat dibeli di pasar penjualan kembali dan media sosial seharga ribuan dolar.
Dan ambisi Manus mungkin lebih besar daripada sekadar menciptakan antusiasme dan perbandingan dengan model lain dari Tiongkok, DeepSeek, yang mengirimkan gelombang kejutan di seluruh dunia teknologi dan keuangan awal tahun ini. Dua hari yang lalu, Manus AI mengumumkan kemitraan strategis dengan tim Qwen dari Alibaba, sebuah langkah yang dapat membantu perusahaan rintisan ini merespons lonjakan lalu lintas dan memperluas basis penggunanya, terutama di Tiongkok.
Tetapi apakah Manus lebih dari sekadar demo model luar biasa yang menjadi viral, memerlukan pengamatan lebih jauh. “Contoh penggunaan, demo, POC [bukti konsep] sangat berbeda dari apa yang dapat Anda integrasikan dalam arsitektur perusahaan, bukan?” kata Vyoma Gajjar, AI Technical Solution Architect di IBM, dalam episode terbaru Mixture of Experts.
Untuk menskalakan aplikasi dunia nyata, kami membutuhkan “agen khusus dan hemat biaya yang dikonfigurasi khusus untuk penggunaan perusahaan,” kata Maryam Ashoori dari IBM, Director of Product Management untuk watsonx.ai dalam sebuah wawancara dengan IBM® Think.
Manus membuat banyak pengguna terpesona karena dapat dengan cepat menjalankan berbagai tugas rumit mulai dari menganalisis stok hingga menjadwalkan perjalanan hingga mengevaluasi asuransi, semuanya tanpa input selain prompt.
“Manus adalah pengalaman otomatisasi yang sangat bagus di mana Anda dapat mengobrol dengan model, dan model memiliki akses ke 29 alat, dan mengatur permintaan Anda dan memberi Anda masukan progresif yang sangat bagus tentang bagaimana ia melakukan tugas itu,” jelas Chris Hay, Distinguished Engineer di IBM, dalam sebuah wawancara dengan Think.
Beberapa bulan terakhir telah ditandai dengan rilis banyak alat AI dan fitur baru, menggarisbawahi selera yang meningkat untuk agen yang mendukung pengguna dalam berbagai tugas (pikirkan Operator dari OpenAI, atau berbagai fitur riset mendalam yang baru-baru ini ditambahkan ke banyak LLM).
“Manus adalah perpaduan bagus antara pencarian mendalam, riset mendalam, dan penelusuran. Agen ini juga memiliki akses ke alat lain,” kata Hay.
Inovasi nyata Manus mungkin menyatukan banyak alat menarik (editor, browser, terminal) dalam pengalaman yang ramah pengguna, yang, menurut Hay, menggambarkan rilis publik pertama ChatGPT lebih dari dua tahun yang lalu. Pada saat itu — dan untuk pertama kalinya — interaksi dengan AI menjadi dapat diakses oleh siapa saja yang memiliki koneksi internet, tanpa gelar ilmu komputer.
Manus menggunakan beberapa model AI, terutama perangkat lunak Claude, Qwen, dan Browser Use dari Anthropic yang membantu agen AI mengakses situs web. Browser Use menikmati efek halo dari kesuksesan minggu peluncuran Manus yang kemudian juga menjadi viral.
Tapi apakah ada yang akan membicarakan Manus bulan depan? Hay memprediksi, “Dalam seminggu, seseorang akan membuat ulang Manus hanya dengan sumber terbuka, yang menurut saya bagus. OpenAI akan merespons dan semua orang akan memiliki jenis pengalaman yang setara.”
Meskipun Manus telah menarik minat konsumen, adopsi perusahaan untuk jenis agen umum otonom ini mungkin akan meniti jalan yang lebih panjang, jika mesin ini memang masuk akal. Agen penggerak LLM yang telah menarik begitu banyak perhatian dalam 12 bulan terakhir sebagian besar dilatih pada data yang tersedia untuk umum. Sebaliknya, hanya 1% dari data perusahaan saat ini digunakan dalam model bahasa besar.
99% data yang tidak ditangkap merupakan tambang emas bagi perusahaan yang ingin menggunakan LLM dan agen untuk buka nilai dalam data tersebut. Akan tetapi, agen AI perusahaan umumnya digunakan secara berbeda dibandingkan agen AI pribadi. Misalnya, perorangan mungkin menggunakan agen yang dibangun oleh perusahaan seperti Manus AI atau OpenAI untuk menjadwalkan penerbangan atau meninjau resume mereka.
Sebaliknya, perusahaan sering mencari sistem agen yang dibangun dengan alat sumber tertutup atau terbuka yang telah disesuaikan untuk kebutuhan bisnis spesifik mereka agar seefisien mungkin (pikirkan Agentforce dari Salesforce atau watsonx Orchestrate dari IBM). Perusahaan juga memiliki sejumlah besar data yang tidak ingin mereka pindahkan dari lokasinya demi alasan keamanan. Agen perusahaan ini biasanya didukung oleh model bahasa yang lebih kecil dan sesuai dengan tujuan, seperti seri Granite dari IBM, yang menyimpan data yang diperlukan di lokasi.
Apakah Manus memiliki ambisi AI perusahaan masih belum jelas, namun mitranya yang baru diumumkan, Alibaba, jelas memilikinya. Pada bulan Januari, Alibaba mengumumkan asisten baru, Qwen 2.5 Max, yang berjalan pada arsitektur mixture of experts (MoE), pendekatan efisien yang sering kali menarik bagi perusahaan.
Dengan arsitektur MoE, model hanya mengaktifkan subjaringan tertentu yang diperlukan untuk tugas tertentu alih-alih mengaktifkan seluruh neural networks. Akibatnya, arsitektur MoE sangat mengurangi biaya komputasi selama prapelatihan dan mencapai kinerja yang lebih cepat selama waktu inferensi.
Apakah otonomi AI sejati dicapai dengan agen AI pribadi atau agen AI perusahaan masih harus diamati. Sementara itu Manus terus memicu perdebatan.
“Manus memang sedikit mengguncang banyak hal. Tetapi banyak juga yang bersikap skeptis di komunitas AI,” kata Kaoutar El Maghraoui, Principal Research Scientist dan Manajer di IBM dalam episode Mixture of Experts baru-baru ini. “Pertanyaan besar di sini adalah, dapatkah Manus benar-benar merombak otonomi AI? Atau apakah ini hanya langkah lain dalam perlombaan AI yang sedang berlangsung antara Timur dan Barat?"
