Agen AI ada di sekitar kita. Sistem ini secara mandiri melakukan tugas dengan intervensi manusia yang terbatas, sering kali dengan cara yang hampir tidak kita sadari.
Pertimbangkan kendaraan otonom: mereka merasakan lingkungan mereka, mengevaluasi konteks dan membuat keputusan sepersekian detik secara real time. Mereka menavigasi bukan karena seseorang menuliskan kode kaku untuk setiap skenario yang mungkin, tetapi karena mereka terus menafsirkan sinyal dan beradaptasi saat lingkungan berubah.
Sekarang bayangkan membawa tingkat kecerdasan yang sama ke program data perusahaan. Ribuan kumpulan data. Jutaan catatan. Miliaran keputusan berbasis data yang dibuat.
Manajemen data agen (ADM) memungkinkan tingkat orkestrasi ini. Melalui kemampuan pengambilan keputusan dari agen yang didukung AI, perusahaan mulai menemukan kembali cara mereka memproses, mengatur, dan menggunakan data mereka.
Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.
Manajemen data agen menggunakan agen AI untuk mengoordinasikan dan mengoptimalkan program data perusahaan lengkap.1 Ini termasuk:
Alih-alih mengandalkan alur kerja yang kaku, ADM menggunakan agen khusus untuk menghadirkan kecerdasan pada setiap tahap siklus data. Sistem ini dapat menafsirkan maksud, menentukan data dan kebijakan apa yang terlibat dan mengadaptasi operasi secara otomatis saat kondisi berubah.
Banyak dari kemampuan ini diaktifkan oleh model bahasa besar (LLM), yang menyediakan lapisan penalaran di dalam agen. LLM menggunakan pemrosesan bahasa alami untuk menafsirkan maksud dan menerjemahkannya ke dalam strategi data yang terkoordinasi—mirip dengan cara alat seperti ChatGPT atau Google Gemini menafsirkan prompt. Mereka menggunakan metadata, garis keturunan data, machine learning dan business rules untuk menentukan data apa yang relevan, bagaimana data harus divalidasi dan diatur, dan bagaimana data harus dipersiapkan untuk analitik hilir.
Dari sana, sistem agen menguraikan langkah-langkah yang diperlukan untuk menyelesaikan tugas data. Itu mungkin melibatkan mengakses sumber, menegakkan kebijakan, mengoptimalkan beban kerja, mengelola perilaku penyimpanan dan, pada akhirnya, menghasilkan output tepercaya.
Apa yang membedakan manajemen data agen dari manajemen data tradisional adalah adaptif diri, berkembang berdasarkan konteks. Ini terus belajar dari sinyal dan menyesuaikan saat kondisi berubah daripada memperlakukan alur kerja sebagai artefak tetap.
Misalnya, manajer rantai pasokan mungkin memberikan instruksi “memantau umpan yang masuk dan menyelesaikan catatan duplikat saat muncul.” Saat pesanan baru tiba, sistem yang digerakkan oleh AI menafsirkan maksud dan menyesuaikan rencananya secara real time, menggabungkan catatan, menandai inkonsistensi, dan mendelegasikan tugas ke agen saat kondisi berubah.
Meskipun masih merupakan pendekatan yang baru, organisasi sudah menggunakan ADM untuk meningkatkan keandalan data dan efisiensi operasional mereka:
Perusahaan menghasilkan lebih banyak data di lebih banyak sistem daripada sebelumnya. Namun, seiring dengan meningkatnya volume dan arsitektur yang makin hybrid dan terdistribusi, banyak organisasi masih kesulitan untuk mengubah data kompleks tersebut menjadi insight yang dapat diandalkan dan real-time. Faktanya, 76% bisnis mengakui bahwa mereka telah membuat keputusan tanpa melihat data karena terlalu sulit untuk diakses.
Pendekatan manajemen data tradisional sangat bergantung pada manual, campur tangan manusia, sehingga lambat beradaptasi ketika skema berubah, metrik berevolusi, atau logika operasional bergeser. Manajemen data agen mendapatkan momentum karena alamat beberapa tekanan sistemik yang pendekatan lama tidak dapat diimbangi oleh:
Hybrid cloud, multicloud, dan gudang data terdistribusi menciptakan rantai ketergantungan yang sulit untuk dipertahankan. Proses manual sulit untuk ditingkatkan ketika kumpulan data dan antarmuka pemrograman aplikasi (API) berkembang setiap hari.
Kualitas data yang buruk datang dengan biaya: KPI palsu, forecasting yang tidak selaras, dan data pelanggan yang ketinggalan zaman yang berdampak pada sistem hilir. Risiko meningkat, terutama di industri yang sangat diatur seperti jasa keuangan dan perawatan kesehatan.
Bisnis saat ini berjalan pada analisis real-time dan sistem AI, yang membutuhkan data real-time yang akurat untuk memenuhi harapan. Ketika pipeline macet atau gagal secara diam-diam, latensi menumpuk, pengambilan keputusan melambat dan efisiensi operasional menurun.
Ketika permintaan akan data meledak, tim data terpusat—masih bergantung pada integrasi dan pengiriman manual—berjuang untuk mengimbangi, makin memperlambat pengambilan keputusan di seluruh organisasi.
Ketika pemantauan data sebagian besar bersifat manual, masalah cenderung muncul hanya setelah proses hilir terpengaruh, memaksa tim data untuk menghabiskan waktu yang tidak proporsional untuk debugging reaktif alih-alih pekerjaan bernilai lebih tinggi.
Program data modern juga menghadapi tantangan data struktural yang tidak dapat diperbaiki oleh pendekatan manual. Lebih dari 50% organisasi mengandalkan tiga atau lebih alat integrasi data, menciptakan alur kerja yang terfragmentasi dan logika yang tidak konsisten di seluruh tim. Fragmentasi itu mengalir ke masalah yang lebih luas: pemeriksaan kualitas terjadi terlambat, aturan tata kelola melayang di seluruh sistem, pemutusan garis keturunan tidak terdeteksi dan definisi semantik tidak sinkron. Pada kenyataannya, 77% organisasi tidak memiliki bakat untuk mengelola kerumitan tersebut.
Tekanan-tekanan ini secara langsung berdampak pada tim data. Insinyur menghabiskan 10–30% waktu mereka untuk mengungkap masalah data dan 10–30% lainnya menyelesaikannya—lebih dari 770 jam per tahun per insinyur, atau lebih dari USD 40.000 dalam tenaga kerja yang terbuang. Sementara itu, analis dan pengguna bisnis menunggu rata-rata 1-4 minggu untuk mendapatkan data yang mereka butuhkan karena tugas-tugas integrasi terkotak-kotak atau terhenti.
Manajemen data agen mewakili pergeseran dalam cara perusahaan memastikan akurasi, kualitas, dan integritas data dalam skala besar. Alih-alih membuat skrip setiap transformasi atau mempertahankan aturan yang kaku, organisasi dapat memperkenalkan agen AI untuk menskalakan pembuatan pipeline, merampingkan operasi data, mengurangi hambatan, dan mempertahankan data berkualitas tinggi dengan intervensi manual yang jauh lebih sedikit. Dengan operasi yang lebih efisien dan data tepercaya di seluruh siklus hidup, tim data dapat fokus pada strategi daripada mengerjakan ulang.
Manajemen data agen menyatukan empat komponen inti—masing-masing diaktifkan oleh lapisan model AI, agen, dan teknologi semantik yang terkoordinasi:
Ketika pengguna memberikan prompt atau permintaan, agen menggunakan kemampuan penalarannya untuk menafsirkan maksud. Ini merancang rencana yang menguraikan aset data yang diperlukan, aturan tata kelola, pertimbangan semantik, validasi dan langkah-langkah operasional. Agen lain kemudian menilai rencana ini dari domain masing-masing — mengkonfirmasi model yang diperlukan, business rules, garis keturunan, dependensi, dan metadata katalog sebelum tindakan apa pun dimulai.
Orkestrasi ini secara signifikan mengurangi kebutuhan tim untuk menyatukan proses secara manual di seluruh siklus hidup data, mempersingkat waktu hingga data untuk analitik, dan menyelaraskan operasi data dengan maksud bisnis. Agen juga dapat memunculkan ambiguitas dan memvalidasi asumsi, memasukkan strategi data dan kebijakan tata kelola langsung ke dalam rencana yang diusulkan.
Selanjutnya, agen AI melakukan pekerjaan yang ditentukan oleh rencana. Mereka mengakses dan menafsirkan data di seluruh sistem, menerapkan tata kelola dan pemeriksaan kualitas, mengelola perilaku penyimpanan, menjalankan langkah-langkah pemrosesan data, dan menyiapkan output untuk konsumsi hilir. Agen juga dapat mengoptimalkan biaya atau latensi, mengadaptasi operasi ketika sistem gagal, dan memetakan ketergantungan di seluruh ekosistem data.
Dengan begitu banyak bagian yang bergerak, agen AI membantu memastikan operasi data tetap dapat diandalkan saat skema berkembang atau beban kerja bergeser. Mereka mengurangi tugas berulang dan memakan waktu di seluruh siklus hidup data dan meningkatkan skalabilitas untuk inisiatif data perusahaan.
Sistem metadata tradisional menggambarkan struktur dengan menangkap bidang, format dan definisi skema. Sebaliknya, basis data vektor dapat beroperasi sebagai lapisan semantik, menangkap makna dengan merepresentasikan bagaimana elemen data berhubungan dan konteks penggunaannya. Satu menguraikan bentuknya; yang lain mengungkapkan teksturnya.
Basis data vektor menyimpan penyematan yang mewakili metrik, kumpulan data, dan istilah bisnis sebagai vektor matematika. Hal ini memungkinkan sistem agen untuk mengukur kesamaan, mengungkap hubungan semantik, dan deteksi pergeseran makna—bahkan ketika skema tetap sama.
Lapisan semantik memungkinkan:
Tata kelola yang efektif merupakan dasar dari manajemen data agen. Alih-alih mengandalkan ulasan manual, sistem ini secara terus-menerus menerapkan kontrol kebijakan, kualitas, dan keamanan saat data pindah melalui siklus hidupnya. Aturan validasi dan perlindungan integritas ditegakkan selama pelaksanaan untuk memastikan output tetap akurat dan dapat dipercaya di seluruh ekosistem data perusahaan.
Beberapa organisasi bahkan menerapkan agen “penjaga” ringan—agen pengawas kecil yang memantau perilaku dan kesehatan pipeline secara real time—untuk mempertahankan observabilitas dan permukaan masalah sebelum mereka membahayakan alur kerja hilir. Pengawasan tambahan ini membantu menjaga agar pipeline otomatis tetap cepat, andal, dan selaras dengan standar manajemen data perusahaan.
Komponen-komponen ini bersatu dalam alur kerja loop tertutup yang memadukan niat manusia, perencanaan berbasis LLM, eksekusi yang diatur AI, dan validasi berkelanjutan. Interaksi yang khas mungkin terlihat seperti:
Meskipun sering dibingkai sebagai pendekatan yang bersaing, manajemen data agen sebenarnya meningkatkan manajemen master data (MDM) dengan membuatnya lebih dinamis.
MDM mendefinisikan entitas perusahaan, menetapkan aturan tata kelola, dan menjaga konsistensi di seluruh sistem pencatatan. MDM membantu menciptakan sebuah “golden record”—sumber kebenaran tunggal yang mengintegrasikan data dari berbagai sumber—sehingga semua orang dalam organisasi bekerja dengan informasi yang sama.
ADM mengoperasionalkan fondasi tersebut dengan memvalidasinya saat data pindah, menerapkannya di seluruh program data dan beradaptasi ketika kondisi berubah.
Kedua pendekatan berbeda dalam beberapa cara penting:
MDM memperbarui definisi melalui proses yang diatur dan siklus pengelolaan berkala. ADM mendeteksi pergeseran saat terjadi, seperti pembaruan skema dan metrik yang didefinisikan ulang, dan mengkalibrasi ulang untuk menjaga sistem hilir tetap selaras.
MDM menetapkan catatan otoritatif dalam domain yang dikurasi seperti pelanggan, pemasok, dan produk. ADM memperluas tanggung jawab itu di seluruh ekosistem data, memastikan definisi tersebut tetap konsisten di seluruh sistem operasional, aplikasi, dan lingkungan analitik.
MDM mengelola data saat istirahat, mengoptimalkan catatan melalui pencocokan, pembersihan, dan standardisasi. ADM mengelola data yang bergerak, menerapkan pagar pembatas, pemeriksaan garis keturunan dan validasi semantik saat data mengalir melalui organisasi.
MDM bergantung pada aturan dan pengawasan manusia: penjaga data menulis pemetaan, meninjau ulasan pengecualian dan memperbarui proses. ADM menggunakan orkestrasi yang digerakkan oleh maksud: agen cerdas menafsirkan tujuan bisnis, menghasilkan rencana, dan secara mandiri mengeksekusi dan memvalidasi alur kerja.
MDM beradaptasi dengan kecepatan proses, mencerminkan perubahan hanya setelah alur kerja tata kelola selesai. ADM beradaptasi dengan laju perubahan, menyesuaikan logika dan perilaku pipeline secara dinamis saat definisi, kumpulan data, dan kondisi bisnis berkembang.
Di era bisnis real-time tanpa gesekan, manajemen data beralih dari alur kerja yang kaku dan berbasis aturan ke perilaku adaptif yang digerakkan oleh maksud. Riset IBM di seluruh AI, kesiapan data, dan model operasi menunjukkan tiga perubahan besar yang membentuk lingkungan manajemen data baru ini.
AI agen pindah alur kerja melampaui skrip statis dan menjadi perilaku adaptif dan sadar konteks. Pipeline akan merespons perubahan metadata, business rules, beban operasional, dan batasan tata kelola — mengubah jalur pelaksanaannya alih-alih melanggar saat kondisi bergeser.
Dalam arsitektur agen ini, sistem multi-agen menggantikan platform monolitik: agen khusus menangani penyerapan, kualitas, garis keturunan atau pengoptimalan sementara agen penga was mempertahankan keselarasan dengan niat dan kebijakan.
Data siap untuk AI tidak hanya bergantung pada akurasi skema, tetapi juga pada konsistensi semantik. Masalah kualitas data hari ini sering kali ditelusuri kembali ke penyimpangan skema, tetapi besok akan berasal dari penyimpangan semantik: makna bisnis yang berkembang tanpa perubahan struktural. Ketika segmen pelanggan bergeser atau hierarki produk berkembang, sistem agen perlu menangkap inkonsistensi dalam makna, bukan hanya format.
Memori semantik, pemahaman vektor, dan validasi sadar konteks menjadi penting untuk mempertahankan data yang dapat dipercaya dan Siap untuk AI.
Seiring dengan matangnya model operasi agen, insinyur data beralih dari pengodean tangan menjadi transformasi untuk mengawasi sistem otonom. Hal ini berarti merancang pagar pembatas, ulasan keputusan agen, dan menyelesaikan kasus-kasus baru yang muncul.
Pergeseran ini menjadikan penjelasan sebagai inti dari model: jejak penalaran, log yang dapat diaudit, dan pos pemeriksaan human-in-the-loop menjadi penting untuk kepercayaan dan kepatuhan.
Buat dan kelola pipeline data streaming cerdas melalui antarmuka grafis yang intuitif, yang memfasilitasi integrasi data tanpa batas di seluruh lingkungan hybrid dan multicloud.
watsonx.data memungkinkan Anda untuk menskalakan analitik dan AI dengan semua data Anda, di mana pun data berada, melalui penyimpanan data yang terbuka, hybrid, dan diatur.
Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.
1 “Can AI Autonomously Build, Operate and Use the Entire Data Stack?” IBM Research, 8 Desember 2025