Dari layanan mikro ke agen AI: Evolusi arsitektur aplikasi

Beberapa Rekan Berbagi Ide di Kantor Modern

Arsitektur aplikasi kembali mencapai titik balik. Agen AI muncul sebagai blok bangunan yang kuat untuk sistem modern, melengkapi, memperluas, atau bahkan menggantikan layanan mikro tradisional.

Pergeseran arsitektur ini mempertahankan pola dasar komponen yang dapat dikomposisi sambil memberikan keuntungan yang signifikan dalam kecepatan pengembangan, kemampuan beradaptasi, dan kemampuan integrasi. Organisasi yang membangun aplikasi baru dengan kerangka kerja agen memposisikan diri mereka untuk keunggulan kompetitif dalam lingkungan teknologi yang berkembang pesat.

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru  

Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan.

Perjalanan evolusi arsitektur

Sejarah arsitektur aplikasi mengungkapkan pola dekomposisi yang konsisten menuju komponen yang makin cerdas.

1990-an: Aplikasi monolitik
Sistem basis kode tunggal mendominasi komputasi perusahaan, menciptakan tantangan operasional yang signifikan:

Penerapan membutuhkan siklus pengujian yang ekstensif
Skalabilitas menuntut duplikasi sistem penuh
Perubahan di satu area berisiko merusak fungsi yang tidak terkait
Siklus pengembangan berlangsung selama berbulan-bulan atau bertahun-tahun

Awal tahun 2000-an: Arsitektur berorientasi layanan (SOA)
SOA mengatasi keterbatasan monolitik dengan menguraikan aplikasi menjadi layanan yang selaras dengan bisnis:

Arsitektur baru meningkatkan kemampuan penggunaan kembali dan integrasi
Layanan tetap relatif berat
Kompleksitas orkestrasi menciptakan sistem yang rapuh
Siklus pengembangan diukur dalam bulan

2010-an: Layanan mikro
Arsitektur layanan mikro memecah aplikasi menjadi unit-unit yang lebih kecil dan dapat digunakan secara independen:

Setiap layanan mikro beroperasi secara mandiri
Layanan dikomunikasikan melalui antarmuka pemrograman aplikasi (API) yang terdefinisi dengan baik
Komponen diskalakan secara independen
Teknologi kontainerisasi menyederhanakan penerapan
Siklus pengembangan dipadatkan menjadi hitungan minggu

Mixture of Experts | 12 Desember, episode 85

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.

Tonton semua episode Mixture of Experts

Agen AI: Paradigma arsitektur baru

Batas terdepan arsitektur saat ini memiliki fitur agen AI: komponen cerdas, otonom yang meningkatkan kemampuan mikro layanan tradisional. Perbedaan utama meliputi:

Karakteristik	Layanan Mikro	Agen AI
Model pemrograman	Mengamanatkan aturan dan logika yang eksplisit	Menawarkan model hybrid: inti yang dikompilasi dengan lapisan penalaran
Kemampuan beradaptasi	Membutuhkan perubahan kode	Menggabungkan pengoptimalan dengan penalaran dinamis
Integrasi	Menggunakan kontrak API	Menggunakan mode ganda: Kontrak API dengan pemahaman semantik
Penanganan kesalahan	Memiliki respons yang telah diprogram sebelumnya	Memiliki jalur yang dioptimalkan dengan fallback adaptif
Upaya pengembangan	Membutuhkan upaya tingkat tinggi (kode tujuan tunggal)	Lebih strategis (jalur penting ditambah antarmuka penalaran)

Layanan mikro pemrosesan pembayaran tradisional membutuhkan ribuan baris kode untuk menangani validasi, pemrosesan, status kesalahan, dan integrasi. Sebaliknya, agen AI berkinerja tinggi menggabungkan komponen yang telah dikompilasi sebelumnya untuk jalur penting dengan kemampuan penalaran untuk keputusan yang kompleks. Pendekatan hybrid ini membantu memastikan keandalan kinerja dan kecerdasan adaptif.

Misalnya, implementasi agen Semantic Kernel di C# dengan kompilasi ahead-of-time (AOT) menunjukkan bahwa sistem agen produksi dapat mencocokkan atau melebihi layanan mikro tradisional dalam kinerja sambil menambahkan kemampuan penalaran yang berharga.

Kerangka kerja agen: Orkestrasi modern

Sama seperti layanan mikro yang memerlukan platform orkestrasi yang mendasarinya, agen AI membutuhkan kerangka kerja agen khusus. Solusi modern seperti Semantic Kernel dan LangChain Enterprise menyediakan infrastruktur yang diperlukan ini untuk koordinasi agen dengan kinerja Kelas Enterprise.

Kerangka kerja ini memberikan kemampuan di luar orkestrasi layanan tradisional dengan tetap mempertahankan standar kinerja kelas Enterprise yang diharapkan:

Fondasi berkinerja tinggi: Kerangka kerja agent dibangun di atas bahasa yang dikompilasi dengan kompilasi AOT untuk eksekusi latensi rendah yang dapat diprediksi.
Desain hemat memori: Kerangka kerja agent dioptimalkan untuk sistem throughput tinggi untuk membantu memastikan konsumsi sumber daya minimal.
Pemrosesan semantik: Agen mengalokasikan sumber daya komputasi berdasarkan kompleksitas tugas.
Integrasi Enterprise: Kerangka kerja agen menyediakan konektor yang aman tipe ke sistem yang ada dengan penegakan kontrak yang kuat.
Perencanaan hybrid: Jalur kinerja penting kerangka kerja agen menggunakan logika yang dikompilasi sementara skenario kompleks menggunakan AI untuk penalaran.

Manfaat bisnis praktis

Pergeseran ke arsitektur agen memberikan keuntungan yang terukur, seperti:

Kinerja dengan kecerdasan: Agen AI yang dirancang dengan baik memberikan kinerja yang unggul. Agen yang dikompilasi dapat mencapai throughput yang lebih tinggi daripada layanan mikro tradisional dan menambahkan alasan untuk deteksi penipuan yang kompleks.
Keandalan kelas Enterprise: Kerangka kerja memungkinkan Integrasi yang kuat. Sistem rantai pasokan dapat memproses ribuan transaksi dan menangani inkonsistensi data dengan lancar.
Penanganan kesalahan yang unggul: Agen AI menggabungkan jalur pemulihan dengan penalaran. Sistem pemrosesan pesanan mempertahankan ketersediaan tinggi melalui jalur penanganan kesalahan yang dioptimalkan dan alasan untuk kegagalan baru.
Arsitektur siap masa depan: Organisasi mendapat manfaat hari ini sambil memposisikan untuk besok. Agen yang dikompilasi dengan lapisan penalaran mengoptimalkan kinerja saat ini dan membuka jalan bagi kemajuan AI di masa depan.

Strategi implementasi: Pendekatan yang mengutamakan kinerja

Organisasi membutuhkan strategi implementasi praktis yang mempertahankan standar perusahaan sambil menangkap manfaat AI:

Pembuatan profil kinerja: Mengidentifikasi layanan mikro dengan jalur penting kinerja dan poin keputusan kompleks yang akan mendapat manfaat dari kemampuan penalaran.
Desain arsitektur: Membuat desain agen yang memisahkan jalur penting kinerja (diimplementasikan dalam kode yang dikompilasi) dari komponen penalaran yang menangani kasus tepi.
Pemilihan kerangka kerja: Mengevaluasi kerangka kerja agen berdasarkan tolok ukur kinerja, kompatibilitas bahasa dengan sistem yang ada dan opsi kompilasi.
Peningkatan tim: Membangun tim teknik yang menggabungkan keahlian pengembangan perangkat lunak tradisional dengan keahlian teknik AI.
Penerapan sistematis: Menerapkan dan uji tolok ukur kinerja yang ketat di samping kemampuan penalaran.

Menerapkan pendekatan yang mengutamakan kinerja dapat membantu organisasi mencapai manfaat operasional sambil membangun kemampuan AI strategis.

Evaluasi dan pengembangan berbasis evaluasi

Rekayasa kualitas agen AI menuntut pendekatan yang berbeda secara fundamental dari pengujian perangkat lunak tradisional. Perusahaan terkemuka dalam arsitektur agen telah memelopori pengembangan berbasis eval-driven, sebuah metodologi yang memastikan agen memenuhi persyaratan fungsional dan standar penalaran.

Kerangka kerja eval

Evaluasi adalah rangkaian pengujian khusus yang dirancang untuk menilai perilaku agen di berbagai dimensi:

Evaluasi fungsional: Memverifikasi kemampuan bisnis inti melalui pernyataan input/output.
Evaluasi penalaran: Menilai kualitas keputusan dan pendekatan pemecahan masalah.
Evaluasi perilaku: Menguji keselarasan dengan pedoman organisasi dan standar etika.
Evaluasi kinerja: Mengukur waktu respons, throughput, dan penggunaan sumber daya.
Evaluasi musuh: Menantang agen dengan kasus-kasus tepi dan mode kegagalan potensial.

Data internal di beberapa penyedia cloud, data, dan AI menunjukkan pengurangan yang signifikan dalam insiden produksi setelah menerapkan evaluasi multidimensi untuk sistem agen mereka.

Menerapkan pengembangan berbasis evaluasi

Proses pengembangan yang matang yang didorong oleh evaluasi mencakup elemen-elemen kunci ini:

1. Protokol definisi evaluasi

Mulailah dengan mendefinisikan ekspektasi di semua dimensi. Untuk setiap agen:

Dokumentasikan fitur inti yang diharapkan dengan kriteria keberhasilan yang jelas
Tentukan pola penalaran yang harus ditunjukkan oleh agen
Tetapkan batas perilaku dan pagar pembatas
Tetapkan ambang kinerja berdasarkan persyaratan bisnis

2. Pipeline evaluasi berkelanjutan

Bangun pipeline otomatis yang menjalankan evaluasi di seluruh siklus pengembangan:

Evaluasi pra-commit mengidentifikasi masalah sebelum integrasi kode
Evaluasi integrasi memverifikasi interaksi agen
Tes evaluasi staging dengan data produksi
Pemantauan produksi terus-menerus memvalidasi agen yang diterapkan

3. Pembuatan tes dinamis

Bergerak melampaui kasus uji statis dengan skenario yang dihasilkan secara dinamis:

Gunakan model bahasa besar (LLM) untuk membuat beragam kasus uji yang menekankan penalaran agen
Hasilkan variasi kasus tepi yang diketahui
Simulasikan input baru berdasarkan pola produksi

4. Evaluasi kolaboratif manusia-AI

Gabungkan pengujian otomatis dengan keahlian manusia:

Peninjau pakar mengevaluasi penalaran agen pada skenario kompleks
Peneliti UX menilai kualitas interaksi manusia dan agen
Spesialis domain memverifikasi kebenaran logika bisnis

5. Pencegahan regresi

Cegah regresi kemampuan dengan:

Rangkaian evaluasi komprehensif yang berkembang seiring setiap masalah yang ditemukan
Perbandingan A/B antara versi agen
Pemantauan berkelanjutan terhadap indikator kinerja utama

Sebuah studi tahun 2024 dari The Stanford Institute for Human-Centrated AI (HAI) menemukan bahwa perusahaan yang menggunakan kerangka kerja evaluasi komprehensif mengalami siklus pengembangan 65% lebih cepat dan pembatalan rilis produksi 42% lebih sedikit.

Studi kasus: Implementasi layanan keuangan

10 bank global teratas menerapkan pengembangan berbasis evaluasi untuk agen layanan pelanggan mereka dengan hasil yang mengesankan.

Pendekatan mereka berpusat pada kerangka kerja evaluasi tiga tingkat: rangkaian pengujian otomatis untuk validasi fungsional, penilaian untuk skenario keputusan yang kompleks dan ulasan pakar untuk interaksi berisiko tinggi.

Kerangka kerja tersebut mengungkap masalah halus yang mungkin akan terlewatkan oleh pengujian tradisional. Misalnya, seorang agen menyetujui permohonan pinjaman sesuai dengan kebijakan, tetapi menggunakan alasan yang secara tidak sengaja memperkuat bias dalam kasus-kasus yang berada di ambang batas, suatu masalah yang diidentifikasi oleh evaluasi penalaran mereka sebelum implementasi.

Strategi pengoptimalan biaya untuk arsitektur agen

Kelangsungan ekonomi arsitektur agen tergantung pada strategi manajemen biaya yang efektif. Sementara agen AI memberikan nilai bisnis yang signifikan, pengelolaan biaya operasional tetap menjadi faktor keberhasilan yang penting.

Tantangan ekonomi

Mengenai biaya, organisasi menghadapi dua pertimbangan utama:

Biaya token: Setiap interaksi dengan model dasar menimbulkan biaya token yang cepat menumpuk dalam skala besar. Jaringan agen kompleks dengan penalaran multi-langkah dapat menghasilkan token 10-15x lebih banyak daripada panggilan API langsung serupa.

Biaya komputasi: Menjalankan inferensi, terutama untuk penalaran yang canggih, menuntut sumber daya komputasi yang besar. Kluster GPU lokal untuk inferensi biasanya memerlukan investasi awal yang ekstensif. Inferensi berbasis cloud dapat menimbulkan biaya bulanan mulai dari USD 10.000 hingga USD 50.000 untuk penerapan skala kecil hingga sedang.

Pendekatan pengoptimalan yang efektif

Organisasi-organisasi terkemuka telah mengembangkan pendekatan sistematis untuk mengelola biaya-biaya ini.

1. Optimasi arsitektur

Desain agen hybrid yang merutekan keputusan kompleks ke model dasar
Kuantisasi model untuk penerapan produksi
Caching strategis tanggapan untuk kueri umum

JPMorgan Chase mengurangi biaya inferensi mereka sebesar 67% melalui arsitektur hybrid yang memproses 89% transaksi melalui jalur deterministik, mengalokasikan sumber daya LLM untuk skenario yang kompleks.

2. Penyetelan rekayasa prompt untuk efisiensi

Presisi dalam desain instruksi untuk meminimalkan penggunaan token
Pemangkasan kontekstual yang menghilangkan informasi yang tidak perlu
Pengoptimalan format respons untuk mengurangi generasi token

3. Optimasi inferensi

Implementasi cache Key-Value (KV) untuk interaksi berulang
Pemrosesan batch untuk operasi yang tidak sensitif terhadap waktu
Mengatur ukuran infrastruktur penerapan dengan pola beban kerja

4. Implementasi RAG

Generasi dengan dukungan pengambilan data untuk mengurangi ukuran konteks
Optimasi basis data vektor untuk akses informasi yang efisien
Teknik penyulingan konteks yang memampatkan informasi yang relevan

5. Penyetelan untuk spesialisasi domain

Pembuatan model spesifik domain dengan jumlah parameter yang lebih sedikit
Penyulingan model umum menjadi varian khusus yang efisien
Pendekatan penyetelan yang efisien secara parameter seperti LoRA dan QLoRA

Laporan ekonomi AI McKinsey 2024 menyatakan bahwa menerapkan tiga atau lebih strategi ini mengurangi biaya operasional AI mereka rata-rata 62% sambil mempertahankan atau meningkatkan kemampuan sistem.

Tantangan implementasi

Arsitektur agen memperkenalkan pertimbangan implementasi baru.

Kompleksitas orkestrasi
Mengoordinasikan agen otonom membutuhkan pendekatan yang berbeda dari orkestrasi layanan mikro tradisional:

Pengambilan keputusan yang terdesentralisasi membutuhkan koordinasi yang canggih
Beberapa agen harus bekerja untuk mencapai tujuan bersama
Status sistem menjadi lebih kompleks dengan perubahan yang tidak sinkron

Kerangka kerja modern mengatasi tantangan ini melalui sistem prioritas dan konteks bersama. Kernel Semantik Microsoft mengimplementasikan orkestrasi yang menyeimbangkan otonomi agen dengan koherensi sistem.

Observabilitas dan pemantauan
Pendekatan pemantauan tradisional harus berevolusi:

Sistem perlu menangkap jalur penalaran dan kriteria keputusan
Analisis perilaku membantu mengidentifikasi pola di seluruh interaksi agen
Pemantauan prediktif mengantisipasi kondisi sistem yang potensial

Keamanan dan tata kelola
Arsitektur agen memperkenalkan dimensi keamanan baru:

Mekanisme untuk memverifikasi instruksi agen selaras dengan kebijakan organisasi
Sistem untuk memvalidasi tindakan agen sebelum eksekusi
Kemampuan untuk memeriksa penalaran agen untuk kepatuhan

Membandingkan layanan mikro versus sistem agen: Contoh penggunaan praktis

Untuk menggambarkan perbedaan antara layanan mikro dan arsitektur agen, pertimbangkan platform perdagangan jasa keuangan.

Implementasi layanan mikro tradisional:

Layanan rekening mengelola informasi dan saldo konsumen
Layanan perdagangan menjalankan pesanan berdasarkan permintaan eksplisit
Layanan data pasar memberikan harga saat ditanyakan
Layanan notifikasi mengirimkan peringatan setelah peristiwa yang telah ditentukan sebelumnya
Layanan manajemen risiko menerapkan pemeriksaan berbasis aturan

Ketika seorang pelanggan melakukan transaksi, sistem mengikuti jalur yang telah ditentukan sebelumnya, dengan setiap langkah terjadi ketika secara eksplisit dipicu.

Implementasi agen:

Agen portofolio terus memantau kepemilikan dan menyarankan peluang penyeimbangan
Agen eksekusi perdagangan memilih waktu optimal berdasarkan kondisi pasar
Agen penilaian risiko secara proaktif mengevaluasi volatilitas pasar
Agen komunikasi menyampaikan informasi yang relevan melalui saluran yang dipilih

Dalam praktiknya, implementasi agen menciptakan pengalaman pelanggan yang berbeda secara fundamental. Ketika volatilitas pasar meningkat, agen penilaian risiko mungkin secara mandiri menyesuaikan batas perdagangan dan memberi tahu agen portofolio, yang menganalisis kepemilikan pelanggan untuk potensi kerentanan. Sistem menunjukkan kecerdasan di luar apa yang dikodekan secara eksplisit.

Memandang ke depan: Rekayasa platform untuk skala agen

Perkembangan dari monolit ke layanan ke layanan mikro ke agen mengikuti pola historis yang jelas. Setiap evolusi membawa komponen yang lebih terperinci dengan meningkatnya kecerdasan dan otonomi.

Organisasi yang menerapkan arsitektur agen dalam skala besar harus mengadopsi prinsip-prinsip rekayasa platform untuk mencapai kualitas, efisiensi biaya, dan tata kelola yang konsisten di seluruh portofolio aplikasi.

Adopsi berbasis platform

Organisasi yang berpikiran maju menggunakan platform pengembang internal (IDP) untuk mempercepat adopsi agen.

Infrastruktur agen standar

Templat agen yang telah dikonfigurasi sebelumnya dengan pemantauan bawaan
Pola implementasi jalur emas untuk tipe agen umum
Penerapan layanan mandiri dengan gerbang kualitas otomatis

Observabilitas terpadu

Pemantauan terpusat kinerja dan perilaku agen
Penelusuran dan visualisasi interaksi lintas agen
Deteksi anomali otomatis dengan analisis akar masalah

Fokus pengalaman pengembang

Alat layanan mandiri untuk pengembangan dan pengujian agen
Lingkungan pengembangan terintegrasi dengan debugging agen khusus
Pemeriksaan kepatuhan otomatis selama pengembangan

Tata kelola dalam skala besar

Manajemen dan penegakan kebijakan terpusat
Evaluasi otomatis perilaku agen terhadap standar
Jejak audit yang komprehensif untuk semua tindakan agen

Laporan rekayasa platform Gartner 2024 menyatakan bahwa pendekatan platform yang matang menghasilkan waktu pemasaran 3,2 kali lebih cepat untuk kemampuan agen baru dan kepuasan pengembang 76% lebih tinggi.

Organisasi sekarang menghadapi pilihan: memimpin dalam mengadopsi arsitektur agen untuk contoh penggunaan yang sesuai atau mengikuti pesaing yang menangkap keuntungan awal. Bukti menunjukkan bahwa penggerak awal yang menerapkan pendekatan berbasis platform mendapatkan keunggulan kompetitif yang substansif dalam kecepatan pengembangan, fleksibilitas sistem, dan kemampuan teknis.

Pelajari lebih lanjut dan bicaralah dengan pakar AI IBM Consulting®

Sumber daya

Mencapai ROI: Agen AI dalam Bisnis Anda

Bergabunglah dengan IBM untuk webinar di mana kami mendemonstrasikan cara menemukan ROI nyata melalui inisiatif AI agen, dengan contoh penggunaan di seluruh industri, kasus, dan bahkan kisah sukses IBM sendiri.

IBM dinobatkan sebagai Pemimpin dalam Ilmu Data & Machine Learning

Pelajari alasan IBM diakui sebagai Pemimpin dalam Gartner® Magic Quadrant™ 2025 untuk Ilmu Data dan Platform Machine Learning.

Dari proyek AI hingga keuntungan: Bagaimana AI agen dapat mempertahankan pengembalian keuangan

Pelajari bagaimana organisasi beralih dari meluncurkan AI dalam uji coba yang berbeda menjadi menggunakannya untuk mendorong transformasi pada intinya.

Tingkatkan keahlian AI Anda

Akses katalog lengkap kami yang terdiri dari lebih dari 100 kursus online dengan membeli langganan individu atau multi-pengguna hari ini, yang memungkinkan Anda untuk memperluas keterampilan Anda di berbagai produk kami dengan harga murah.

Jelajahi IBM Granite

IBM® Granite adalah rangkaian model AI terbuka, berkinerja, dan tepercaya yang dirancang untuk bisnis dan dioptimalkan untuk menskalakan aplikasi AI Anda. Jelajahi opsi bahasa, kode, deret waktu, dan batasan.

IBM AI Academy

Dipandu oleh pemimpin terkemuka IBM, kurikulum dirancang untuk membantu pemimpin bisnis dalam mendapatkan pengetahuan yang diperlukan demi memprioritaskan investasi AI untuk mendorong pertumbuhan.

Cara Kerja AI 2024

Kami menyurvei 2.000 organisasi tentang inisiatif AI mereka untuk mengetahui apa yang berhasil, apa yang tidak, dan cara agar Anda sukses menerapkannya.

Panduan CEO 2025: 5 perubahan pikiran untuk meningkatkan pertumbuhan bisnis

Terapkan lima pola pikir ini untuk menghadapi ketidakpastian, mendorong transformasi bisnis, dan mempercepat pertumbuhan dengan bantuan AI agen.

Buka kekuatan AI generatif dan ML

Pelajari cara menggabungkan AI generatif dan machine learning dengan percaya diri ke dalam bisnis Anda.

Cara berkembang di era baru AI ini dengan kepercayaan dan keyakinan

Pelajari tiga elemen penting dari strategi AI yang kuat: menciptakan keunggulan kompetitif, meningkatkan skala AI di seluruh bisnis, dan mengembangkan AI yang tepercaya.

Solusi terkait

IBM® watsonx.ai

Latih, validasi, lakukan tuning, dan terapkan AI generatif, model dasar, dan kemampuan machine learning dengan IBM watsonx.ai, studio perusahaan generasi berikutnya untuk pembangun AI. Bangun aplikasi AI dalam waktu singkat, dengan sedikit data.

Jelajahi watsonx.ai

Solusi kecerdasan buatan (AI)

Manfaatkan AI di bisnis Anda dengan perpaduan antara keahlian AI terdepan di industri dari IBM dan portofolio solusi Anda.

Jelajahi solusi AI

Konsultasi dan layanan kecerdasan buatan (AI)

Layanan IBM Consulting AI membantu merancang ulang cara kerja bisnis dengan AI untuk transformasi.

Jelajahi layanan AI

Ambil langkah selanjutnya

Dapatkan akses ke berbagai kemampuan dalam satu alat untuk seluruh siklus pengembangan AI. Hasilkan solusi AI yang kuat dengan antarmuka ramah pengguna, alur kerja yang efisien, serta akses ke API dan SDK berstandar industri.

Jelajahi watsonx.ai

Pesan demo langsung