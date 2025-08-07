Kecerdasan Buatan

Enam perubahan strategis untuk membangun AI agen dengan model kecil, cepat, dan terbuka

Penyusun

Laura Langendorf

Laura Langendorf

Rogerio Gonçalves

AI/ML Ops Brand Content Strategist

Aturan lama dalam pengembangan perangkat lunak perusahaan—seperti peta jalan enam hingga dua belas bulan, infrastruktur berat di awal, dan rilis monolitik—tidak lagi mampu mengikuti dunia baru yang didorong oleh gen AI. Saatnya membuang aturan lama, menemukan kembali pendekatan pengembangan Anda dan memikirkan kembali bagaimana Anda membangun aplikasi Anda, mengikuti enam mantra ini:

1. Membangun model yang sesuai untuk bisnis yang memberikan ROI lebih cepat

Mari kita mulai dengan inti dari aplikasi apa pun: model di belakangnya. Tetapi, tidak setiap masalah AI membutuhkan model dengan ratusan miliar parameter. Model kecil yang disetel domain sering kali menyamai atau melebihi model besar generik pada tugas-tugas tertentu, memberikan akurasi yang sebanding dengan biaya yang lebih murah dan inferensi yang lebih cepat. Dengan memusatkan perhatian pada ringkasan dan analisis teks, pembuatan kode, QA dokumen atau masalah cakupan yang baik lainnya, tim pengembangan dapat:

  • Mengurangi biaya inferensi yang lebih rendah per kueri, membuatnya layak secara ekonomis untuk armada agen yang besar
  • Mengurangi latensi hingga hitungan respons subdetik, penting untuk alur kerja interaktif dan proses yang melibatkan manusia
  • Menerapkan di lingkungan hybrid atau edge untuk menghindari biaya keluar cloud sambil menjaga kedaulatan data dan kepatuhan

Memilih model yang tepat bukan tentang mengejar jumlah parameter tertinggi—melainkan tentang menilai biaya per penggunaan, latensi nilai, dan kecocokan untuk metrik tugas sejak hari pertama.

2. Membuat platform yang tangkas dan ekosistem yang terbuka

Keberhasilan Gen AI bergantung pada lebih dari sekadar memilih model. Dibutuhkan pemilihan model yang tepat untuk tugas dan melengkapinya dengan alat, platform, dan praktik pengembangan yang mengubah AI menjadi hasil bisnis nyata. Pengembang dan manajer mereka harus mendorong investasi di:

  • Model-model AI sumber terbuka yang menghindari penguncian dan menumbuhkan komunitas pengembang yang dinamis
  • Arsitektur pabrik mikro, yang melibatkan tim kecil yang merakit dan mengelola kumpulan model, templat, dan praktik terbaik untuk setiap contoh penggunaan inti
  • Alur kerja modular, yang memungkinkan Anda untuk merangkai model ringan dan aturan bisnis sebagai layanan mikro, memungkinkan iterasi cepat, integrasi berkelanjutan, dan rollback yang mulus

Pendekatan modular dan terbuka ini memadatkan program percontohan menjadi beberapa minggu daripada berbulan-bulan, memungkinkan tim untuk membuat agen baru dalam hitungan menit dan melepaskan potensi transformatif gen AI di seluruh perusahaan.

3. Menanamkan AI yang bertanggung jawab dari bawah ke atas

AI yang bertanggung jawab bukanlah suatu pemikiran lain; melainkan tertanam dalam setiap tahap pengembangan. Membangun aplikasi ini berarti bahwa pengembang perlu menjaga fokus yang konsisten pada:

  1. Pemilihan model dan transparansi pelatihan: Pilih model yang dilatih pada kumpulan data terbuka dan dapat diaudit yang selaras dengan nilai-nilai perusahaan dan persyaratan peraturan.
  2. Ketelitian rekayasa data: Lacak silsilah, dokumentasikan transformasi, dan pertahankan alur yang jelas dan dapat dijelaskan dari data mentah ke output model.
  3. Tata kelola yang melibatkan manusia: Menanamkan titik pemeriksaan ulasan dan ambang batas kinerja yang memicu peringatan atau eskalasi, meningkatkan kepatuhan dan kualitas.

Dengan standardisasi tata kelola pada sumbernya, tim pengembangan dapat membantu mengurangi bias, melindungi privasi, dan menumbuhkan kepercayaan, meletakkan dasar untuk penerapan gen AI yang berkelanjutan dan scalable.

4. Mengoperasionalkan AI agen melalui siklus hidup penuh

Setelah fondasi Anda siap dengan model yang cepat dan cocok untuk bisnis, pipeline modular, dan praktik pengembangan yang bertanggung jawab, langkah logis berikutnya dalam pedoman baru adalah mengoperasionalkan AI melalui agen. Inisiatif ini kemungkinan merupakan topik diskusi aktif di seluruh organisasi Anda dan di sinilah teori menjadi dampak yang terukur.

Agen AI adalah “pekerja” semi-otonom yang mengulas masukan, bernalar tentang tugas dan bertindak—dalam kolaborasi dengan manusia dan agen lainnya. Mengintegrasikan agen-agen ini ke dalam alur kerja perusahaan akan mendorong peningkatan produktivitas yang terukur.

Berikut ini adalah fase-fase siklus hidup:

  1. Desain: Tentukan peran agen yang jelas (misalnya, "ekstraktor kode", "generator uji", "penganalisis kepatuhan").
  2. Bangun: Kumpulkan alur model khusus dan ramping, dan kodekan aturan bisnis untuk setiap fase.
  3. Menerapkan: Mengatur agen pada platform pusat dengan pemantauan, penelusuran, dan perjanjian tingkat layanan.
  4. Operasikan dan perbaiki: Kumpulkan masukan, latih ulang atau konfigurasikan ulang agen dan terus mengukur laba atas investasi (ROI).

5. Memasangkan agen dengan model yang tepat untuk memaksimalkan nilai

Kunci untuk menempatkan agen agar bekerja dalam skala besar terletak pada seberapa efektif Anda memasangkannya dengan model cepat yang dibangun untuk bisnis, membuat siklus hidup agen tidak hanya mungkin, tetapi juga produktif. Pendekatan ini membutuhkan praktik desain, orkestrasi, dan pengukuran yang cermat yang menyelaraskan komponen teknis dengan hasil bisnis. Berikut ini cara agar integrasi itu berhasil:

  • Pilih model yang tepat: Tolok ukur model kecil pada tugas-tugas utama (misalnya, kode-ke-teks, pembuatan SQL, ekstraksi entitas) dan bandingkan latensi dan biaya per 1.000 token.
  • Bangun factory dan orkestrasi: Kelompokkan agen-agen terkait ke dalam factory khusus untuk contoh penggunaan inti (misalnya mainframe perbankan, mesin asuransi).
  • Atur dan pantau: Sediakan UI/API terpusat untuk akses agen, dan lacak metrik kinerja (latensi, kesalahan), pembuatan versi (ID agen), dan titik pemeriksaan yang melibatkan manusia.
  • Ukur nilai: Tentukan KPI yang jelas — seperti jam pengembangan yang disimpan, peningkatan kualitas kode, dan pengurangan biaya — dan gunakan dasbor untuk memantau waktu memodernisasi dan utang teknologi yang dibayarkan.

6. Menskalakan model kecil yang cepat untuk mendorong dampak perusahaan

Ketika satu model cepat dan ringkas hanya membutuhkan persentase kecil dari model bahasa besar, menambahkan agen tambahan menjadi biaya yang kecil. Ekonomi proliferasi ini berarti:

  • Skala cepat: Puluhan—atau bahkan ratusan—agen khusus dapat beroperasi secara bersamaan tanpa menghabiskan anggaran.
  • Kontrol blast-radius: Kontainer ringan dan penerapan terisolasi kesalahan memastikan bahwa kegagalan agen individu tidak mengalir ke pemadaman di seluruh sistem.
  • Pengoptimalan berkelanjutan: Dasbor pemantauan yang sadar biaya melacak penggunaan CPU/GPU, penggunaan inferensi per agen, dan KPI kinerja—mendorong penyempurnaan yang sedang berlangsung.

Perusahaan yang memanfaatkan keunggulan skala ini dapat lebih cepat meningkatkan skala dari PoC ke produksi di seluruh perusahaan. Inisiatif ini buka manfaat penuh gen AI — dari mengurangi biaya dan mempercepat waktu ke pasar hingga meningkatkan kualitas, pengambilan keputusan, dan efisiensi tim.

Dari pergeseran strategis ke transformasi berkelanjutan

Merangkul enam mantra ini bukan hanya tentang membangun AI yang lebih baik—ini tentang membentuk kembali bagaimana inovasi terjadi dan di mana kecerdasan hidup di dalam perusahaan.

Beralih dari eksperimen ke transformasi. Siklus pengembangan berubah dari bulan ke minggu. Agen AI berkembang dari prototipe yang menjanjikan menjadi operator penting bisnis. Dan inovasi menjadi dapat diprediksi — bukan outlier yang beruntung, tetapi proses berulang yang tertanam dalam setiap sprint produk dan keputusan bisnis.

Enterprise AI akan membentuk perbatasan berikutnya dengan:

  • Arsitektur yang dapat disusun: Komponen yang tangkas dan dapat digunakan kembali yang memungkinkan tim untuk menerapkan dan mengulang dengan cepat tanpa harus mengulang dari awal.
  • Orkestrasi yang sadar biaya: Sistem AI yang memantau sendiri efisiensi dan secara dinamis mengoptimalkan kinerja, anggaran, dan kepatuhan.
  • Kecerdasan hibrida: Kolaborasi yang mulus antara manusia dan agen AI—dengan tata kelola, transparansi, dan kepercayaan di pusatnya.
  • Model yang disetel industri dalam skala besar: Alih-alih LLM satu ukuran yang cocok untuk semua, organisasi mengoperasionalkan armada model khusus domain yang disesuaikan dengan kebutuhan mereka yang tepat.

Enterprise AI bergerak dari bidikan bulan terpusat ke utilitas terdesentralisasi—dari satu model besar ke banyak model berukuran tepat, tertanam di seluruh fungsi. Organisasi yang menang tidak hanya membangun model yang lebih cerdas; mereka membangun sistem, tim, dan strategi yang lebih cerdas.

Dengan merangkul enam perubahan strategis ini, Anda tidak hanya memodernisasi tumpukan pengembangan Anda — Anda juga melindungi bisnis Anda di masa depan.

Sumber daya

Agen: watsonx Developer Hub

Memulai dengan membangun dan menerapkan agen menggunakan watsonx.ai.
Laporan Omdia tentang kecerdasan yang diberdayakan: Dampak agen AI

Temukan cara Anda dapat membuka potensi penuh gen AI dengan agen AI.

Panduan pembeli Agen AI 2025

Selami panduan komprehensif ini menguraikan contoh penggunaan utama, kemampuan inti, dan rekomendasi langkah demi langkah untuk membantu Anda memilih solusi yang tepat untuk bisnis Anda.
Tutorial InstructLab

Bentuk AI generatif dengan memberikan kontribusi kepada LLM dengan cara yang terbuka dan dapat diakses.
Komunitas AI IBM

Bergabung dengan komunitas bagi arsitek dan pembangun AI untuk belajar, berbagi ide, dan terhubung dengan orang lain.
Bayangkan kembali produktivitas bisnis dengan agen AI dan asisten AI

Jelajahi perbedaan antara agen AI dan asisten AI dan pelajari bagaimana keduanya dapat menjadi agen perubahan untuk produktivitas perusahaan.
Rewind 2024: Terobosan dalam model AI, agen, perangkat keras, dan produk

Akankah 2025 menjadi tahun agen AI? Di episode kali ini dari Mixture of Experts, kami akan membicarakan model AI, agen, perangkat keras, dan rilis produk dengan beberapa pakar industri terkemuka.

Cara agen AI menemukan kembali produktivitas

Pelajari cara menggunakan AI agar lebih kreatif dan efisien. Mulai beradaptasi dengan masa depan yang melibatkan kerja sama dengan agen AI.
Solusi terkait
Pengembangan agen AI IBM 

Bantu pengembang untuk membangun, menerapkan, dan memantau agen AI dengan studio IBM watsonx.ai.

 Jelajahi watsonx.ai
Agen AI dan asisten IBM

Ciptakan produktivitas inovatif dengan salah satu rangkaian kemampuan paling komprehensif di industri untuk membantu bisnis membangun, menyesuaikan, dan mengelola agen dan asisten AI. 

 Jelajahi agen AI
IBM Granite

Raih penghematan biaya lebih dari 90% dengan model Granite yang lebih kecil dan terbuka, yang dirancang untuk efisiensi pengembang. Model yang sesuai dengan kebutuhan perusahaan ini memberikan kinerja luar biasa terhadap tolok ukur keamanan dan di berbagai tugas perusahaan, mulai dari keamanan siber hingga RAG.

 Jelajahi Granite
Ambil langkah selanjutnya

Otomatisasi alur kerja yang kompleks dan ciptakan produktivitas inovatif dengan salah satu rangkaian kemampuan paling komprehensif di industri untuk membantu bisnis membangun, menyesuaikan, dan mengelola agen dan asisten AI. 

 Jelajahi pengembangan agen watsonx.ai Temukan watsonx Orchestrate