Diterbitkan: 6 September 2024
Kontributor: Matthew Kosinski
Manajemen data AI adalah praktik penggunaan kecerdasan buatan (AI) dan machine learning (ML) dalam siklus hidup manajemen data. Contohnya termasuk menerapkan AI untuk mengotomatiskan atau merampingkan pengumpulan data, pembersihan data, analisis data, keamanan data, dan proses manajemen data lainnya.
Baik model AI tradisional yang berbasis aturan dan AI generatif yang lebih canggih dapat membantu manajemen data.
Perusahaan modern memiliki sejumlah besar data tentang segala hal, mulai dari transaksi keuangan dan inventaris produk hingga catatan karyawan dan preferensi pelanggan. Organisasi yang menggunakan data ini untuk menginformasikan pengambilan keputusan dan mendorong inisiatif bisnis dapat memperoleh keuntungan yang signifikan dibandingkan pesaing mereka.
Namun, tantangannya adalah membuat kumpulan data yang besar ini menjadi akurat, dapat diandalkan, dan cukup mudah diakses sehingga orang dapat menggunakan data ini dalam praktiknya.
IBM Data Differentiator melaporkan bahwa 82% perusahaan merasakan pengalaman silo data yang menghambat alur kerja utama. Sebanyak 68% data organisasi tidak pernah dianalisis, yang berarti bisnis tidak pernah menyadari manfaat penuh dari data tersebut.
Alat bantu AI dan ML dapat membantu organisasi memanfaatkan data mereka dengan mengoptimalkan berbagai tugas seperti mengintegrasikan sumber data, membersihkan data, dan mengambil data. Akibatnya, bisnis dapat mengambil lebih banyak keputusan berbasis data.
Manajemen data AI juga membantu organisasi membangun jalur data berkualitas tinggi yang mereka butuhkan untuk melatih dan menerapkan model AI dan algoritma machine learning mereka sendiri.
Pelajari tentang peluang untuk meningkatkan layanan data menggunakan AI generatif guna melengkapi praktisi data.
Banyak jenis alat bantu manajemen data—seperti solusi penyimpanan data, alat integrasi data, alat bantu master data management, solusi tata kelola, dan lainnya—sekarang menggabungkan kemampuan ML dan AI. Berbagai alat bantu ini dapat menggunakan algoritma AI tradisional dan sistem AI generatif.
Sistem AI tradisional melakukan tugas-tugas spesifik berbasis aturan—misalnya, sistem manajemen basis data yang secara otomatis mengategorikan data berdasarkan kriteria yang telah ditetapkan.
Sistem AI generatif, seperti Microsoft Copilot, Llama Meta, dan IBM Granite, merespons bahasa alami dan membuat konten asli. Misalnya, sistem manajemen basis data dengan model bahasa besar terintegrasi (LLM) dapat membuat ringkasan data dan menerima kueri dalam bahasa Inggris biasa, bukan SQL.
AI dan ML dapat masuk ke hampir semua bagian dari proses manajemen data, tetapi beberapa contoh penggunaan yang paling umum meliputi:
Organisasi saat ini bekerja dengan banyak data, yang masuk ke bisnis dari berbagai sumber berbeda, dalam berbagai format. Data ini ditangani oleh berbagai pengguna dan akhirnya tersebar di seluruh cloud publik dan pribadi, sistem penyimpanan lokal, dan bahkan titik akhir pribadi karyawan.
Mungkin sulit untuk melacak dan mengelola semua data ini secara terpusat sehingga menimbulkan dua masalah.
Pertama, organisasi tidak dapat menggunakan kumpulan data jika tidak tahu bahwa kumpulan data itu ada.
Kedua, “data bayangan” yang belum ditemukan dan tidak dikelola ini menimbulkan risiko keamanan. Menurut Laporan Biaya Pelanggaran Data IBM, sepertiga dari pelanggaran data melibatkan data bayangan. Pelanggaran ini menelan biaya rata-rata USD 5,27 juta—16% lebih banyak dari biaya pelanggaran rata-rata secara keseluruhan.
AI dan ML dapat mengotomatiskan banyak aspek penemuan data, memberikan organisasi lebih banyak visibilitas ke dalam, dan kontrol atas, semua aset data mereka.
Alat bantu penemuan data yang didukung AI dapat secara otomatis memindai perangkat jaringan dan tempat penyimpanan data, mengindeks data baru dalam waktu yang hampir seketika.
Alat bantu klasifikasi data otomatis dapat menandai data baru berdasarkan aturan yang telah ditentukan atau model machine learning. Misalnya, alat bantu ini dapat mengklasifikasikan nomor sembilan digit apa pun dalam format XXX-XX-XXXX sebagai nomor jaminan sosial AS.
LLM dan alat bantu pemrosesan bahasa alami lainnya dapat mengekstrak data terstruktur dari sumber data yang tidak terstruktur, seperti menarik detail kontak kandidat pekerjaan dan pengalaman masa lalu dari resume dokumen teks dengan berbagai format.
Data yang buruk dapat menyebabkan lebih banyak masalah dibandingkan tidak ada data sama sekali. Jika data organisasi tidak lengkap atau tidak akurat maka inisiatif bisnis dan model AI yang dibangun di atas data tersebut juga akan kurang baik.
Alat bantu AI dan ML dapat membantu mengidentifikasi dan memperbaiki kesalahan dalam data organisasi, yang berarti pengguna tidak perlu melakukan pekerjaan pembersihan data secara manual yang memakan waktu. AI juga dapat bekerja lebih cepat dan menangkap lebih banyak kesalahan dibandingkan pengguna manusia.
Alat bantu persiapan data yang mendukung AI dapat melakukan pemeriksaan validasi dan menandai atau mengoreksi kesalahan seperti pemformatan yang tidak tepat dan nilai yang tidak beraturan. Beberapa alat bantu persiapan data yang didukung AI juga dapat mengonversi data ke format yang sesuai, seperti mengubah catatan rapat yang tidak terstruktur menjadi tabel terstruktur.
Generator data sintetis dapat memberikan missing values dan mengisi kesenjangan lain dalam kumpulan data. Generator ini dapat menggunakan model machine learning untuk mengidentifikasi pola dalam data yang ada dan menghasilkan titik data sintetis yang sangat akurat.
Beberapa alat master data management (MDM) dapat menggunakan AI dan ML untuk mendeteksi dan memperbaiki kesalahan dan duplikat dalam catatan penting. Misalnya, menggabungkan dua catatan pelanggan dengan nama, alamat, dan detail kontak yang sama.
Alat bantu observabilitas data yang didukung AI dapat secara otomatis menghasilkan catatan garis keturunan data sehingga organisasi dapat melacak siapa yang menggunakan data dan cara data berubah dari waktu ke waktu.
Banyak organisasi tidak menyadari nilai penuh data mereka dikarenakan adanya silo data. AI dan ML dapat merampingkan upaya integrasi data, menggantikan repositori yang terisolasi dengan struktur data terpadu. Pengguna di seluruh organisasi dapat mengakses aset data yang mereka butuhkan saat mereka perlu.
Alat bantu integrasi data berkemampuan AI dapat secara otomatis mendeteksi hubungan antara kumpulan data yang berbeda, memungkinkan organisasi untuk menghubungkan atau menggabungkannya.
Alat bantu manajemen metadata dengan kemampuan AI dapat membantu mengotomatiskan pembuatan katalog data dengan menghasilkan deskripsi aset data berdasarkan penandaan dan klasifikasi.
Basis data dan katalog data dengan antarmuka yang didukung LLM dapat menerima dan memproses perintah bahasa alami, sehingga pengguna dapat menemukan aset data dan produk tanpa perlu menulis kode khusus atau SQL Query. Beberapa antarmuka yang didukung LLM juga dapat membantu pengguna memperbaiki kueri, memperkaya kumpulan data, atau menyarankan titik data terkait.
Mesin kueri berkemampuan AI dapat menggunakan algoritma machine learning untuk meningkatkan kinerja basis data dengan menganalisis pola beban kerja dan mengoptimalkan eksekusi kueri.
Ada kasus bisnis yang harus dibuat untuk memprioritaskan keamanan data. Rata-rata pelanggaran data merugikan organisasi sebesar USD 4,88 juta antara kehilangan bisnis, waktu henti sistem, kerusakan reputasi, dan upaya respons, menurut laporan Cost of a Data Breach.
AI dan ML dapat membantu menegakkan kebijakan keamanan, mendeteksi pelanggaran, dan memblokir aktivitas yang tidak sah.
Alat bantu pencegahan kehilangan data yang didorong oleh AI dapat secara otomatis mendeteksi informasi identitas pribadi (PII) dan data sensitif lainnya, menerapkan kontrol keamanan, dan menandai atau memblokir penggunaan data tersebut secara tidak sah.
Alat deteksi ancaman berbasis anomali seperti analisis perilaku pengguna dan entitas (UEBA) serta deteksi dan respons titik akhir (EDR) menggunakan algoritma AI dan ML untuk memantau aktivitas jaringan. Mereka mendeteksi deviasi yang mencurigakan di luar kebiasaan, seperti banyak data yang tiba-tiba pindah ke lokasi baru.
LLM dapat membantu organisasi menghasilkan dan menerapkan kebijakan tata kelola data. Misalnya, dalam sistem kontrol akses berbasis peran (RBAC), LLM dapat membantu tim keamanan menguraikan berbagai jenis peran dan izinnya. LLM juga dapat membantu mengubah deskripsi peran ini menjadi aturan untuk sistem manajemen identitas dan akses.
Alat bantu deteksi penipuan berkemampuan AI dapat menggunakan AI dan ML untuk menganalisis pola dan menemukan transaksi abnormal.
AI dapat membantu mengubah manajemen data dengan mengotomatiskan berbagai tugas sulit seperti penemuan data, pembersihan, dan pembuatan katalog, sekaligus merampingkan pengambilan serta analisis data. Organisasi dapat membangun proses manajemen data yang lebih efisien yang kurang rentan terhadap kesalahan dan lebih kondusif untuk ilmu data, inisiatif AI, dan privasi data.
Dalam Laporan AI dan Manajemen Informasi AvePoint, 64% organisasi yang disurvei mengatakan mereka mengelola setidaknya satu petabyte data.1 Sebagai perspektif, angka tersebut setara dengan sekitar 9 kuadriliun bit informasi. Dan sebagian besar data berasal dalam format tidak terstruktur, seperti file teks, gambar, dan video.
Semua data ini dapat menjadi keuntungan bagi para ilmuwan data, tetapi tidak mungkin untuk mengelola data yang begitu kompleks dan dalam jumlah yang begitu besar secara manual. Alat bantu AI dan ML dapat membuat data ini dapat digunakan dengan mengotomatiskan berbagai tugas penting seperti penemuan, integrasi, dan pembersihan.
Ketika data bersih dan dapat diakses, organisasi dapat menggunakannya untuk proyek analitik data tingkat lanjut, seperti inisiatif analisis prediktif yang menggunakan data historis untuk memperkirakan tren belanja konsumen di masa depan.
Teknologi AI juga dapat membuat data lebih mudah diakses oleh pengguna tanpa latar belakang ilmu data. Katalog data yang mudah digunakan dengan antarmuka database yang didukung LLM dan visualisasi otomatis memungkinkan lebih banyak pengguna di seluruh bisnis untuk menggunakan data dalam mengambil keputusan mereka.
59% CEO yang disurvei oleh IBM Institute for Business Value meyakini bahwa keunggulan kompetitif organisasi di masa depan bergantung pada memiliki AI generatif yang paling canggih. Untuk membangun dan menerapkan model AI tersebut, organisasi membutuhkan aliran data yang baik dan bersih yang stabil.
Dengan merampingkan manajemen data, alat bantu AI membantu membangun alur data tepercaya dan berkualitas tinggi yang dibutuhkan organisasi untuk melatih model AI dan ML mereka sendiri. Dan karena model ini dapat dilatih pada data bisnis, mereka dapat dilatih untuk melakukan tugas dan memecahkan masalah khusus untuk bisnis dan pelanggannya.
Alat keamanan dan tata kelola yang didukung AI membantu menangkal serangan siber dan pelanggaran data, yang kerugiannya mahal. Mereka juga memungkinkan perusahaan untuk menggunakan data yang mereka miliki sambil mematuhi peraturan privasi dan perlindungan data seperti GDPR dan Payment Card Industry Data Security Standard (PCI-DSS).
Menurut Institute for Business Value, 57% CEO mengatakan bahwa keamanan data merupakan penghalang untuk mengadopsi AI generatif. 45% mengatakan bahwa privasi data juga merupakan penghalang. Hambatan ini bisa sangat menantang di industri yang sangat diatur, seperti layanan kesehatan dan keuangan.
Manajemen data berkemampuan AI dapat membantu dengan menerapkan perlindungan yang sesuai dan kebijakan penggunaan data secara otomatis. Dengan begitu, hanya pengguna yang berwenang yang dapat mengakses data, dan mereka dapat menggunakannya hanya dengan cara yang diizinkan oleh peraturan industri dan kebijakan perusahaan.
Generator data sintetis juga dapat membantu dengan menghasilkan kumpulan data yang secara akurat mencerminkan tren keseluruhan sekaligus menghapus data pribadi sensitif yang mungkin tidak diizinkan untuk digunakan oleh organisasi dengan cara tertentu.
Rancang strategi data yang menghilangkan silo data, mengurangi kompleksitas, dan meningkatkan kualitas data untuk pengalaman pelanggan dan karyawan yang luar biasa.
Penyimpanan file dan objek berkinerja tinggi untuk tugas AI, ML, analitik dan beban kerja NVIDIA.
Pelajari tentang strategi, teknologi, dan budaya yang menjadi dasar untuk mengarahkan organisasi berbasis data yang didorong oleh AI.
Manajemen data adalah praktik pengumpulan, pemrosesan, dan penggunaan data secara aman dan efisien untuk hasil bisnis yang lebih baik.
Pelajari cara Anda dapat melakukan investasi optimal dalam fondasi data terbuka dan tepercaya yang tepat untuk kebutuhan Anda.
1 Laporan AI dan Manajemen Informasi 2024, AvePoint, 2024. (Tautan berada di luar ibm.com.)