Data steward ditugaskan menjalankan program data stewardship. Tanggung jawab spesifik data steward termasuk menentukan metrik kualitas data, mengelola metadata dan data referensi, melacak silsilah data, dan mengklasifikasikan data sensitif.
Berbagai teknologi dan alat bantu dapat mendukung alur kerja data steward, termasuk kecerdasan buatan (AI), katalog data, database relasional, platform kualitas data, dan perangkat lunak tata kelola data.
Perusahaan saat ini mengumpulkan dan menganalisis lebih banyak data daripada sebelumnya dengan harapan mencapai insight yang berharga. Namun, pengumpulan data dan analisis sendiri tidak cukup untuk mengamankan hasil yang sukses. Data stewardship dan data steward dapat mendukung dan memandu penggunaan data yang efektif dalam budaya berbasis data.
Dalam beberapa tahun terakhir, dengan meningkatnya adopsi AI, signifikansi data stewardship kian meningkat. Sistem AI mengonsumsi dan menghasilkan data dalam jumlah besar. Data stewardship membantu memastikan kualitas dan integritas data tersebut sehingga proses bisnis yang didukung AI efektif, sesuai dengan peraturan pemerintah, dan selaras dengan tata kelola dan standar AI yang beretika.
Program data stewardship yang baik memungkinkan keberhasilan kurasi data dengan meningkatkan kualitas, aksesibilitas, kegunaan, dan keamanan data. Data steward membantu memastikan bahwa karyawan dapat mengakses data bisnis yang berguna dan akurat untuk mendukung pengambilan keputusan berbasis data dan peningkatan produktivitas yang didorong oleh AI. Manfaat tambahan dari data stewardship termasuk penafsiran data yang lebih konsisten dan peningkatan kesiapan audit.
Data steward sering berkolaborasi dengan sejumlah pemangku kepentingan, termasuk pemilik data, analis data, pakar ilmu data, dan pengguna bisnis umum, untuk mencapai manfaat ini.
Karyawan yang tidak secara resmi diakui sebagai “data steward” mungkin tetap bertanggung jawab atas data stewardship dan mencurahkan banyak waktu untuk memenuhi kebutuhan data organisasi, seperti menginventarisasi data dan mengevaluasi kualitas data. Namun, beberapa pakar manajemen data mengatakan bahwa memformalkan peran data stewardship merupakan hal penting karena hal tersebut menunjukkan keseriusan perusahaan terhadap manajemen kualitas data.1
Tata kelola data dan data stewardship adalah konsep yang terpisah tetapi terkait. Program tata kelola data perusahaan membantu memastikan integritas data dan keamanan data melalui kebijakan, standar, dan prosedur pengumpulan, kepemilikan, penyimpanan, pemrosesan, dan penggunaan data. Banyak tanggung jawab data stewardship memerlukan penerapan aturan yang diuraikan dalam kerangka kerja tata kelola data. Dengan demikian, data stewardship dapat dianggap sebagai "aspek operasional" dari tata kelola data.2
Perusahaan dengan program data stewardship yang lebih matang mungkin memiliki berbagai jenis peran data steward, termasuk:
Contoh penggunaan untuk data stewardship meliputi:
Data stewardship sering menjadi kunci bagi master data management (MDM), yang merupakan pendekatan untuk mengelola data penting organisasi melalui teknologi, alat, dan proses. Organisasi menggunakan MDM untuk membuat sumber kebenaran tunggal yang menggabungkan data dari berbagai sumber sehingga semua pengguna data bekerja dengan informasi yang sama.
Perusahaan dan data steward sering mulai menerapkan inisiatif MDM dalam satu domain data (pengelompokan logis data serupa, seperti data pelanggan atau data karyawan) sebelum menskalakan pekerjaan tersebut di seluruh aset data organisasi.4
Data steward dapat meningkatkan kualitas data dengan meninjau isi database, yang dikenal sebagai penentuan profil data. Mereka juga bekerja sama dengan pemangku kepentingan data untuk membuat definisi data, merancang metrics kualitas data, dan menetapkan aturan bisnis untuk data, misalnya nilai apa yang dianggap valid atau tidak valid.
Sebagai contoh, seperti yang dijelaskan dalam buku “Data Stewardship”, ketika data yang dikumpulkan adalah status pernikahan pelanggan, aturan dapat menyatakan bahwa “belum kawin”, “kawin”, “cerai mati”, atau “cerai hidup” akan menjadi nilai yang valid, sementara respons kosong akan dianggap tidak valid.5 Data steward juga dapat memberikan input untuk mengatasi masalah kualitas data yang timbul.
Metadata adalah informasi yang menggambarkan titik data atau kumpulan data, seperti tanggal pembuatan data atau detail penulisan. Data steward dapat bertanggung jawab untuk membuat metadata berkualitas tinggi dan mengevaluasi kualitas metadata yang sudah ada. Seperti halnya kualitas data umum, data steward ditugaskan untuk mengatasi masalah kualitas metadata.
Data steward sering kali memelihara data referensi, yaitu data yang mengategorikan data lain dalam perusahaan. Contoh data referensi meliputi kode negara, informasi mata uang, dan kode produk. Melalui dokumentasi data, data steward dapat mencatat nilai valid untuk data referensi, mengevaluasi apakah nilai valid baru diperlukan, dan merekonsiliasi nilai data referensi di berbagai sistem.
Dalam kasus terakhir, dengan menggunakan contoh status perkawinan, data steward mungkin ditugaskan untuk menentukan tindakan apa yang harus dilakukan ketika satu sistem mengizinkan “cerai mati” dan “cerai hidup” sebagai data status perkawinan, sementara sistem lainnya hanya menerima “kawin” dan “belum kawin”.6
Sering kali, beberapa contoh data mewakili entitas yang sama. Sebagai contoh, satu pelanggan muncul beberapa kali dalam database jaringan apotek karena pelanggan tersebut memiliki beberapa resep berbeda yang disiapkan di beberapa apotek berbeda.
Melalui proses yang dikenal sebagai resolusi identitas, data steward akan menentukan kapan contoh data yang berbeda merujuk ke entitas yang sama. Dalam kasus pelanggan apotek tersebut, misalnya, resolusi identitas dapat membantu memastikan bahwa interaksi obat yang berpotensi berbahaya terdeteksi saat resep pelanggan disiapkan.7
Keamanan informasi adalah perlindungan informasi penting terhadap akses, pengungkapan, penggunaan, perubahan, atau gangguan yang tidak sah. Tunduk pada peraturan privasi data, perusahaan diharuskan menerapkan perlindungan yang ditingkatkan untuk informasi sensitif seperti data layanan kesehatan. Mereka juga diharuskan untuk mematuhi aturan terkait berbagi data, pembatasan pengumpulan data, dan banyak lagi. Data steward dapat terlibat dalam perlindungan data dan kepatuhan terhadap peraturan dengan membuat dan menetapkan klasifikasi keamanan untuk berbagai jenis data.
Silsilah data adalah proses pelacakan siklus proses data, yang memberikan pemahaman gamblang tentang sumber data, perubahan data, dan tujuan akhirnya. Data steward dapat melacak silsilah, yang membantu organisasi menegaskan integritas data untuk tujuan pelaporan sesuai peraturan.
Kualitas data yang buruk dapat membahayakan proses bisnis. Data steward dapat bekerja sama dengan pemimpin proses bisnis untuk menentukan penggunaan data dalam suatu proses dan mengetahui seberapa rentan proses tersebut terhadap kegagalan dalam hal kualitas data yang buruk.8
Organisasi dapat menggunakan berbagai solusi dan alat untuk mendukung kegiatan data stewardship, termasuk:
AI dan data stewardship dianggap memiliki hubungan simbiosis oleh beberapa pihak. Data stewardship membantu memastikan sistem AI bekerja dengan data berkualitas tinggi, sementara alat bantu berbasis AI dapat mengoptimalkan tugas data stewardship. Misalnya, alat persiapan data bertenaga AI dapat melakukan pemeriksaan validasi dan menandai kesalahan seperti salah format, sementara alat pencegahan kehilangan data berdukungan AI dapat mendeteksi informasi sensitif dan menerapkan kontrol keamanan sesuai kebutuhan.
Katalog data adalah inventaris semua aset data dalam suatu organisasi. Katalog ini dirancang untuk membantu data steward dan profesional data lainnya menemukan informasi dengan mudah dan cepat. Metadata yang terkait dengan setiap aset data memungkinkan penelusuran di katalog.
Alat pembuatan profil dan analisis data dapat menilai konsistensi dan kualitas data. Fitur-fitur pada alat tersebut dapat mencakup kemampuan mengidentifikasi anomali, memvalidasi sumber data, dan meringkas hasil analisis melalui laporan khusus.
Salah satu cara data steward mengatur data adalah melalui database relasional. Database relasional (relational database, RDB) adalah jenis database di mana data diatur ke dalam baris dan kolom. Tabel yang dihasilkan mungkin dihubungkan bersama untuk menunjukkan hubungan antara titik data. Sistem manajemen database relasional (relational database management system, RDBMS) adalah solusi perangkat lunak yang dapat digunakan oleh data steward dan pihak lain untuk memelihara dan memperbarui RDB.
Program perangkat lunak tata kelola data sering kali menggabungkan alat bantu pembuatan profil dan analisis data serta kemampuan yang didorong oleh AI. Fitur-fiturnya mungkin mencakup pengayaan metadata berdukungan AI, pembuatan katalog data, pelacakan silsilah data, dan penetapan kontrol akses data berbasis peran.
Semua tautan berada di luar ibm.com.
1, 4 Allen et al. “Multi-Domain Master Data Management.” Morgan Kaufmann. 10 April 2015.
2, 3, 5, 6, 7, 8 Plotkin. “Data Stewardship, Second Edition.” Academic Press. 20 November 2020.
Rancang strategi data yang menghilangkan silo data, mengurangi kompleksitas, dan meningkatkan kualitas data untuk pengalaman pelanggan dan karyawan yang luar biasa.
watsonx.data memungkinkan Anda untuk menskalakan analitik dan AI dengan semua data Anda, di mana pun data berada, melalui penyimpanan data yang terbuka, hybrid, dan diatur.
Dapatkan nilai data perusahaan dengan IBM Consulting, untuk membangun organisasi berbasis insight yang memberikan keuntungan bisnis.