Berita teknologi terbaru, didukung oleh insight dari pakar
Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.
Tata kelola data adalah disiplin manajemen data yang berfokus pada kualitas, keamanan, dan ketersediaan data organisasi. Tata kelola data membantu memastikan integritas data dan keamanan data dengan menetapkan dan menerapkan kebijakan, standar, dan prosedur untuk pengumpulan, kepemilikan, penyimpanan, pemrosesan, dan penggunaan data.
Tata kelola data bertujuan menjaga data yang aman dan berkualitas tinggi yang mudah diakses untuk penemuan data, inisiatif intelijen bisnis, dan upaya AI. Bertindak layaknya pusat kendali lalu lintas udara, fungsi tata kelola data membantu memastikan bahwa aliran data terverifikasi melewati pipeline yang aman ke titik akhir dan pengguna yang tepercaya.
Kecerdasan buatan (AI), big data, dan upaya transformasi digital merupakan pendorong utama program tata kelola data. Seiring dengan meningkatnya volume data dari sumber data baru, seperti teknologi Internet of Things (IoT), organisasi mempertimbangkan kembali praktik manajemen data dan prinsip tata kelola data mereka. Mengadopsi praktik dan prinsip yang tepat dapat membantu organisasi meningkatkan upaya intelijen bisnis (business intelligence, BI) dan mengambil keputusan yang lebih tepat.
Perkembangan pesat dalam AI perusahaan juga menuntut strategi baru untuk tata kelola data. Makin hari, program tata kelola harus mempertimbangkan data terstruktur dan tidak terstruktur yang berfungsi sebagai input atau output dari sistem RAG, database vektor, dan agen AI.
Program tata kelola data yang kuat dapat membantu organisasi melindungi dan mengelola data dalam jumlah besar dengan meningkatkan kualitas data, mengurangi silo data, menegakkan kepatuhan dan kebijakan keamanan, serta mendistribusikan akses data dengan tepat.
Tata kelola data adalah bagian dari manajemen data, yang merupakan praktik menyeluruh mengumpulkan, memproses dan menggunakan data secara aman dan efisien untuk mendukung pengambilan keputusan strategis dan meningkatkan hasil bisnis.
Manajemen data meliputi tata kelola data, tetapi juga termasuk area lain dalam siklus proses data, seperti pemrosesan data, penyimpanan data dan keamanan data. Selain itu, berbagai aspek proses manajemen data semuanya memengaruhi satu sama lain.
Karena aspek lain dalam manajemen data dapat memengaruhi tata kelola data, berbagai tim harus berkolaborasi dalam merancang dan menerapkan strategi tata kelola data.
Misalnya, tim tata kelola data mungkin mengidentifikasi kesamaan di berbagai kumpulan data yang berbeda. Jika ingin mengintegrasikan data tersebut, mereka biasanya bekerja sama dengan tim manajemen data untuk menentukan model data dan arsitektur data guna memfasilitasi hubungan tersebut. Strategi yang berbeda mungkin sesuai untuk data cloud versus data yang disimpan secara lokal.
Contoh lainnya adalah akses data, di mana tim tata kelola data dapat menetapkan kebijakan terkait akses ke jenis data tertentu, seperti informasi identifikasi pribadi (PII). Kemudian, tim manajemen data akan menyediakan akses tersebut secara langsung atau membuat mekanisme untuk menyediakan akses tersebut, sering kali melalui kontrol akses berbasis peran (RBAC). Mendapatkan izin akses yang benar jauh lebih penting di era di mana makin banyak agen AI yang mengakses data daripada karyawan manusia.
Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.
Kerangka kerja tata kelola data menerangkan struktur dan proses organisasi untuk mengelola aset data kritis. Kerangka kerja ini menentukan kepemilikan data dan tanggung jawab, serta menentukan bagaimana data harus ditangani untuk menjaga standar kualitas, keamanan, dan kepatuhan data.
Tidak ada kerangka kerja yang bersifat universal, karena setiap kerangka kerja dirancang sebagai peta jalan yang disesuaikan dengan sistem data, sumber data, protokol industri, dan peraturan pemerintah yang unik untuk setiap organisasi. Selain itu, kerangka kerja lama dapat dengan cepat menjadi usang. Kerangka kerja harus makin memperhitungkan AI, sistem multicloud, dan lingkungan data yang bergerak lebih cepat.
Kerangka kerja tata kelola data biasanya alamat item seperti:
Program tata kelola data biasanya menetapkan tujuan tertentu, seperti meningkatkan kualitas data, memastikan kepatuhan, atau mendukung pengambilan keputusan berbasis data. Mereka juga memilih metrik untuk mengukur kemajuan menuju tujuan ini. Metrik tata kelola utama dapat mencakup:
Pengurangan kesalahan data dan redundansi.
Pengurangan biaya dari efisiensi yang lebih besar dan waktu ke pasar yang lebih cepat.
Konsistensi dan kelengkapan data.
Tingkat literasi data dan kepatuhan proses karyawan.
Program tata kelola menetapkan peran dan tanggung jawab semua pihak yang terlibat, termasuk komite pengarah, pemilik data, pengelola data, dan pemangku kepentingan.
Kerangka kerja tata kelola menetapkan parameter seputar data yang akan dikelola dan hasil yang diinginkan. Proses ini termasuk menetapkan pedoman untuk format data, model data, manajemen master data (master data management, MDM), metadata, konvensi penamaan, dan banyak lagi.
Kerangka kerja tata kelola umumnya memetakan aliran data dan menentukan cara data akan dikumpulkan, disimpan, diduplikasi, dipindahkan, dan diarsipkan. Kerangka kerja ini juga dapat mengidentifikasi perangkat keras, perangkat lunak, dan layanan yang akan mendukung upaya tata kelola serta arsitektur data yang lebih luas di organisasi.
Beberapa kerangka kerja tata kelola mungkin menentukan cakupan data, yang merupakan parameter akses untuk aset data tertentu, seperti data master, metadata, dan data historis. Cakupan data dapat membantu memastikan bahwa pengguna dan aplikasi hanya memiliki akses ke data yang mereka butuhkan dan tidak ada yang dapat mengakses data yang tidak seharusnya mereka miliki.
Kerangka kerja tata kelola menjelaskan prosedur pengujian, audit, dan pencatatan untuk menjaga transparansi dan keterjelasan program tata kelola.
Audit rutin atau berkelanjutan dapat membantu memastikan secara real-time bahwa pengguna mematuhi kerangka kerja tata kelola data. Audit juga dapat mengidentifikasi cara mengembangkan program tata kelola untuk beradaptasi dengan data, proses, atau teknologi baru.
Akhirnya, audit juga dapat membantu organisasi mencapai dan membuktikan kepatuhan terhadap peraturan.
Teknologi memainkan peran penting dalam tata kelola data yang efektif. Alat tata kelola data Enterprise dapat bervariasi dari platform komprehensif hingga solusi titik khusus. Setiap organisasi memilih alat yang berbeda berdasarkan arsitektur data dan kerangka kerja tata kelolanya masing-masing.
Kemampuan umum dari solusi tata kelola data meliputi:
Penemuan dan klasifikasi data secara otomatis.
Penegakan aturan perlindungan data dan kontrol akses berbasis peran.
Mengatasi persyaratan privasi dan kepatuhan data.
Otomatisasi manajemen metadata, katalogisasi data, dan pelacakan silsilah data.
Dukungan untuk glosarium bisnis.
Solusi tata kelola data dapat menangani berbagai format data. Beberapa solusi menawarkan kemampuan visualisasi untuk meningkatkan pemahaman tentang kumpulan data dan hubungan yang kompleks, sehingga lebih mudah untuk mengidentifikasi tren, outlier, dan area yang membutuhkan perhatian. Seiring waktu, solusi tata kelola data dapat membantu mengelola data yang digunakan dalam pipeline AI.
Menerapkan kerangka kerja tata kelola data yang kuat dapat membantu organisasi mewujudkan berbagai manfaat:
Organisasi tidak dapat membuat keputusan bisnis yang efektif jika keputusan tersebut didasarkan pada data yang cacat. Tata kelola data memastikan integritas, akurasi, kelengkapan, dan konsistensi data melalui kerangka kerja yang mendukung pengelolaan data yang efektif dalam seluruh proses manajemen data secara menyeluruh.
Data yang andal memungkinkan organisasi mengidentifikasi peluang baru, memahami pelanggan dan alur kerja mereka dengan lebih baik, serta meningkatkan kinerja bisnis secara keseluruhan.
Tanpa tata kelola data, dapat terjadi kesalahan dalam metrik kinerja, yang dapat menyesatkan organisasi. Sementara itu, alat tata kelola data dapat membantu mengatasi ketidakakuratan sebelum memengaruhi strategi bisnis.
Sebagai contoh, alat pelacak silsilah data dapat membantu pemilik data melacak data di sepanjang siklus prosesnya, termasuk setiap transformasi yang dialami data selama proses ekstraksi, transformasi, dan pemuatan (extract, transform, load; ETL) atau proses ekstraksi, pemuatan, dan transformasi (extract, load, transform; ELT). Fitur ini membantu organisasi untuk mengidentifikasi dan mengatasi akar masalah penyebab kesalahan data.
Pembatasan akses data dalam organisasi dapat menghambat inovasi, meningkatkan ketergantungan pada pakar bidang (UKM), dan memperlambat proses bisnis.
Program tata kelola data mendistribusikan akses data secara tepat dengan hanya memberikan akses ke data yang dibutuhkan setiap departemen atau individu. Hal ini memungkinkan tim lintas fungsi untuk bekerja sama lebih erat dan efisien sekaligus menjaga data tetap aman.
Sistem data yang diatur dengan benar dapat menyediakan sumber kebenaran tunggal di seluruh organisasi. Pengambilan keputusan dapat ditingkatkan ketika semua pihak bekerja dengan kumpulan data yang sama.
Memusatkan definisi data dan metadata dalam satu katalog data dapat membantu mengurangi kebingungan dan inefisiensi. Dokumentasi ini, pada gilirannya, menjadi fondasi untuk solusi layanan mandiri yang memungkinkan akses terpadu dan konsisten ke data di seluruh organisasi.
Kebijakan tata kelola data sering kali mencakup operasi agar lebih mudah memenuhi peraturan pemerintah terkait data sensitif dan privasi, seperti General Data Protection Regulation (GDPR) di Uni Eropa, Health Insurance Portability and Accountability Act (HIPAA) di Amerika Serikat, dan persyaratan industri seperti Payment Card Industry Data Security Standards (PCI DSS). Dalam beberapa tahun terakhir, bermunculan pula peraturan yang berfokus pada AI yang menampilkan fitur data; contohnya mencakup UU AI Uni Eropa, Undang-Undang Data Uni Eropa, dan DORA. Pelanggaran terhadap persyaratan peraturan ini dapat mengakibatkan denda pemerintah yang mahal dan reaksi negatif dari publik.
Alat tata kelola data membantu organisasi menetapkan pagar pembatas yang dapat mencegah pelanggaran data, kebocoran, dan penyalahgunaan. Kerangka kerja tata kelola membantu membangun sistem data yang jelas, dapat dijelaskan, adil, dan inklusif. Pada gilirannya, sistem data ini menjaga privasi dan keamanan serta menjaga loyalitas dan kepercayaan pelanggan.
Dalam survei IDC, hanya 45,3% responden mengatakan bahwa mereka memiliki aturan dan proses untuk menegakkan prinsip-prinsip AI yang bertanggung jawab sebagai perlindungan dari pelanggaran keamanan, masalah tanggung jawab hukum, dan risiko regulasi.1
Tata kelola data mencakup pemahaman tentang asal-usul, sensitivitas, dan siklus proses semua data yang digunakan oleh organisasi. Pemahaman ini adalah dasar untuk setiap praktik tata kelola AI dan sangat penting dalam mengurangi berbagai risiko perusahaan.
Tata kelola data membantu organisasi menghadirkan data berkualitas tinggi untuk inisiatif AI dan ML sekaligus melindungi data tersebut dan mematuhi aturan dan regulasi yang relevan. Sebagai contoh, alat tata kelola dapat membantu memastikan bahwa data pribadi yang sensitif tidak diberikan kepada AI jika memang tidak dibutuhkan.
Memiliki data yang tepat adalah dasar untuk analisis data lanjutan dan inisiatif ilmu data. Data yang diatur dengan hati-hati memungkinkan inisiatif berharga seperti pelaporan intelijen bisnis atau proyek machine learning (ML) lebih kompleks.
Sebagai contoh, melakukan profil data dengan benar—yaitu meninjau dan membersihkan data untuk memahami struktur dan kualitasnya—dapat membantu mengidentifikasi hubungan antara berbagai kumpulan data dan sumbernya.
Inisiatif tata kelola data dapat menghadapi banyak rintangan dalam implementasi. Beberapa tantangan tersebut meliputi:
Program tata kelola data yang efektif biasanya memerlukan dukungan di dua tingkat: eksekutif sebagai pengarah kebijakan dan individu sebagai pelaksana. Chief data officer (CDO) dan pengelola data sangat penting dalam komunikasi dan penentuan prioritas tata kelola data dalam sebuah organisasi.
CDOs dapat memberikan pengawasan dan menegakkan akuntabilitas di seluruh tim data untuk membantu memastikan bahwa kebijakan tata kelola data diadopsi. Pengelola data dapat membantu mempromosikan kesadaran akan kebijakan ini kepada produsen data dan konsumen data untuk mendorong kepatuhan di seluruh organisasi.
Tanpa sponsor yang tepat, pengguna data mungkin tidak menyadari atau tidak memperhatikan kebijakan tata kelola. Situasi ini dapat menyebabkan ketidakpatuhan, integritas data yang buruk, dan terganggunya keamanan data.
Tanpa alat dan arsitektur data yang tepat, organisasi mungkin kesulitan untuk menerapkan program tata kelola data yang efektif.
Misalnya, tim mungkin menemukan data yang redundan di berbagai fungsi. Untuk memungkinkan tata kelola yang efektif, Data Architect perlu mengembangkan model data dan arsitektur data yang sesuai untuk menggabungkan dan mengintegrasikan data di seluruh penyimpanan.
Tim mungkin juga perlu mengadopsi katalog data untuk membuat inventaris aset data di seluruh organisasi. Atau jika sudah memilikinya, mereka mungkin perlu membuat proses untuk manajemen metadata, yang membantu memastikan bahwa data yang mendasarinya relevan dan terkini.
Tata kelola data, terutama di lingkungan hybrid dan multicloud, sering kali melibatkan data yang disimpan dalam berbagai format di beragam penyedia dan lokasi. Selain itu, data mungkin berada di berbagai jenis penyimpanan data, seperti data lake, data lakehouse, dan data warehouse.
TI bayangan dapat melemparkan kunci pas tambahan ke dalam proses. Menurut studi TechTarget, tantangan keamanan data paling umum kedua adalah karyawan yang mendaftar ke aplikasi dan layanan cloud tanpa persetujuan dari tim TI.2
Penyebaran data yang luas dapat menyulitkan pelacakan dan pemantauan aliran serta penggunaannya. Tata kelola data memerlukan pemahaman yang jelas tentang sumber data, tujuan, proses transformasi, ketergantungan, kepemilikan, hak akses, dan tanggung jawab.
Menerapkan kebijakan tata kelola data di berbagai lingkungan mungkin memerlukan koordinasi di antara pemangku kepentingan yang berbeda, seperti pemilik data, pengelola data, konsumen data, dan regulator data.
Munculnya analitik layanan mandiri dan intelijen bisnis membawa tantangan baru dalam tata kelola data.
Permintaan akses data dari pengguna semakin meningkat dengan cepat, namun tim tata kelola harus menyeimbangkan kecepatan dan aksesibilitas dengan privasi serta keamanan. Selain itu, sistem dan prosedur streaming data harus disetel dengan baik untuk menghindari kebocoran data.
Banyak alat penyimpanan dan tata kelola data tidak mampu menyediakan data secara optimal untuk pelatihan AI dan operasionalnya.
Bagaimanapun, AI pada dasarnya lebih kompleks daripada proses dan kemampuan berbasis TI standar—sehingga meningkatkan pentingnya tata kelola data yang aktif dan terinformasi. Laporan KPMG menyoroti kesenjangan tata kelola AI sebagai salah satu risiko utama yang saat ini mengancam bisnis.3 Sebagai contoh, tanpa adanya pedoman yang memadai, AI mungkin secara tidak sengaja mengungkapkan PII yang sensitif atau rahasia perusahaan. Risiko semacam itu bisa menjadi jauh lebih mahal di era meningkatnya regulasi terkait AI (seperti Undang-Undang AI Uni Eropa, yang diadopsi pada Juni 2024).
Untuk mengurangi risiko dan kompleksitas AI, organisasi dapat menggabungkan kemampuan penyimpanan data yang dioptimalkan AI dengan program tata kelola data yang dirancang dengan mempertimbangkan AI.
Perencanaan dan pembuatan kerangka kerja tata kelola data memerlukan waktu dan upaya di berbagai pemangku kepentingan dan tim. Praktik umum yang digunakan organisasi saat menerapkan program tata kelola meliputi:
Mengotomatiskan beberapa aspek dalam proses tata kelola data dapat meningkatkan efisiensi dan mengurangi kesalahan. Alat tata kelola dan manajemen data memungkinkan otomatisasi tugas rutin, seperti:
Klasifikasi data didasarkan pada categories, seperti PII, data keuangan, kekayaan intelektual, atau informasi rahasia.
Keamanan data dan kontrol akses yang kuat sangat penting untuk kerangka kerja tata kelola data apa pun. Sementara itu, organisasi ingin akses data menjadi semulus mungkin bagi pengguna yang memiliki otorisasi untuk melihat dan menggunakan kumpulan data tertentu. Tanpa akses mudah ke informasi layanan mandiri ini, kolaborasi dan insight baru akan terhambat.
Banyak organisasi kesulitan mengelola data mereka karena kurangnya visibilitas. Katalog data pusat dapat beroperasi sebagai sumber kebenaran tunggal, memungkinkan integrasi dan inisiatif tata kelola data.
Menurut laporan Gartner, permintaan katalog data meningkat karena organisasi kesulitan menemukan, menginventarisasi, dan menganalisis aset data yang tersebar dan beragam. Dengan katalog data yang kuat, organisasi dapat lebih mudah menemukan dan mengklasifikasikan informasi dalam skala besar, sehingga memungkinkan penegakan kebijakan tata kelola data yang lebih baik.
Banyak organisasi merasa terbantu untuk membuat peta jalan tata kelola yang jelas. Model kematangan dapat memberikan peta jalan ini.
Model kematangan tata kelola data adalah alat yang membantu organisasi menilai kondisi terkini program tata kelola data mereka, menetapkan tujuan, dan melacak kemajuan dari waktu ke waktu.
Organisasi dapat membuat mekanisme penilaian dan pelaporan rutin untuk memantau data dan metrik tata kelola dari waktu ke waktu. Penilaian ini dapat membantu organisasi mengidentifikasi masalah dan melakukan perbaikan pada proses tata kelola.
Meninjau kerangka kerja secara teratur dan menyesuaikannya berdasarkan masukan, peraturan baru atau perubahan dalam strategi bisnis membantu kerangka kerja tetap relevan dan efektif.
Selain itu, penilaian dapat menumbuhkan budaya yang menghargai data sebagai aset strategis, sehingga mendukung intelijen bisnis yang efektif dan penggunaan data sehari-hari di seluruh organisasi.
Operasionalkan AI yang dapat dipercaya dengan memantau model, mengelola risiko, dan menegakkan tata kelola di seluruh siklus hidup AI Anda.
Dapatkan kontrol atas data Anda dengan alat tata kelola yang meningkatkan kualitas, memastikan kepatuhan, dan mengaktifkan analitik dan AI tepercaya.
Tetapkan praktik AI yang bertanggung jawab dengan panduan pakar untuk mengelola risiko, memenuhi peraturan, dan mengoperasionalkan AI yang dapat dipercaya dalam skala besar.
1 IDC MarketScape: Worldwide AI Governance Platforms 2023 Vendor Assessment. IDC. 2023.
2 The Need for Data Compliance in Today’s Cloud Era, Enterprise Strategy Group de TechTarget, April 2023. (PDF).
3 Top risk forecast, KPMG, 2024.