Apa itu katalog data?

Foto luas dari Yale Beinecke Rare Book and Manuscript Library

Penyusun

Alexandra Jonker

Staff Editor

IBM Think

Tom Krantz

Staff Writer

IBM Think

Apa itu katalog data?

Katalog data adalah inventaris terperinci aset data dalam suatu organisasi. Solusi ini membantu pengguna dengan mudah menemukan, memahami, mengelola, mengkurasi, dan mengakses data.

Dengan menggunakan metadata dan alat manajemen data, katalog data mengatur aset data sehingga pengguna—seperti analis data, ilmuwan data, dan pengelola data—dapat dengan cepat menemukan data yang tepat untuk contoh penggunaan analitis atau bisnis mereka. Banyak katalog data mendukung pencarian bahasa alami, yang memungkinkan pengguna menemukan data tanpa menulis kode atau kueri SQL.

Katalog data biasanya mencakup berbagai aset data, termasuk:

Katalog data yang kuat juga mencakup kemampuan manajemen metadata untuk mengumpulkan dan mengkurasi metadata setiap aset data. Berbagai fitur ini dapat memudahkan untuk mengidentifikasi, mengevaluasi, dan menggunakan data secara efektif. Katalog juga harus menyediakan alat tata kelola data untuk membantu menjaga kualitas dataintegritas data, dan keamanan data.

Berita teknologi terbaru, didukung oleh insight dari pakar

Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan disediakan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM® kami untuk informasi lebih lanjut.

Apa itu metadata?

Metadata adalah "data tentang data." Ini adalah informasi tentang data yang terpisah dari konten data itu sendiri—seperti penulis, tanggal pembuatan, atau ukuran file. Metadata membuatnya lebih mudah untuk mencari, mengatur, dan menggunakan data.

Contoh klasik metadata adalah katalog kartu atau katalog daring di perpustakaan. Dalam ini, setiap kartu atau daftar berisi informasi tentang sebuah buku: judul, penulis, subjek, tanggal terbit, edisi, lokasi di perpustakaan, atau ringkasan.

Informasi ini memudahkan pembaca untuk menemukan dan mengevaluasi buku: Apakah terkini atau ketinggalan zaman? Apakah buku tersebut memiliki informasi yang saya cari? Apakah penulisnya seseorang yang saya percayai atau karyanya saya sukai? Dengan cara yang sama, metadata memudahkan pengguna data untuk menemukan dan mengevaluasi data organisasi mereka.

Berbagai jenis metadata memiliki fungsi yang berbeda. Katalog data biasanya menangani beberapa kelas metadata, termasuk:

Metadata teknis

Metadata teknis memuat informasi teknis detail tentang data, termasuk jenis file, informasi pengodean, skema, dan lokasi penyimpanan. Ini memberi tahu pengguna cara menggunakan data—misalnya apakah diperlukan transformasi untuk analisis.

Metadata operasional

Metadata operasional menjelaskan kondisi pembuatan dan penggunaan aset data. Misalnya, mencakup informasi tentang kapan, bagaimana, dan oleh siapa aset data diakses, digunakan, diperbarui, atau diubah.

Metadata administratif

Metadata administratif menetapkan kebijakan penggunaan dan penyimpanan data. Jenis metadata ini digunakan dalam tata kelola data dan membantu organisasi mematuhi kebijakan hukum, peraturan, dan kebijakan internal.

Metadata bisnis

Metadata bisnis menggambarkan konteks bisnis suatu aset data dan relevansinya bagi organisasi. Metadata ini mudah dipahami oleh profesional data dan pengguna bisnis.

Biasanya, katalog data memiliki alat manajemen metadata untuk mengkurasi dan memperkaya metadata dengan tag, asosiasi, peringkat, dan anotasi.

Mixture of Experts | 12 Desember, episode 85

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.

Mengapa katalog data penting?

Organisasi modern saat ini mengelola lingkungan data yang semakin kompleks. Aset dapat berasal dari berbagai lingkungan cloud dan sistem lokal, serta dari tim yang terpisah, wilayah geografis, dan platform yang berbeda. Katalog data memudahkan pengguna untuk menemukan, mengevaluasi, dan menggunakan semua data ini dengan sedikit keahlian teknis atau usaha.

Pertimbangkan analogi berikut: Sistem digital library menghemat waktu dan tenaga pembaca yang biasanya harus berkeliling rak-rak buku untuk mencari buku tertentu. Katalog data memiliki fungsi serupa, membantu pengguna menemukan data yang mereka butuhkan dengan cepat daripada harus menelusuri kumpulan data yang luas dan tidak terorganisir. Akses data yang lebih baik secara signifikan meningkatkan efisiensi inisiatif insight di seluruh organisasi—sama seperti digital library membawa pembaca ke halaman pertama lebih cepat.

Katalog data juga memainkan peran penting dalam tata kelola data, mitigasi risiko, dan kepatuhan terhadap peraturan, terutama dalam menghindari pelanggaran. Kemampuan di bidang ini mencakup klasifikasi data otomatis untuk data sensitif hingga pemberitahuan saat anomali data terdeteksi.

Melalui katalog data, profesional data dapat mengakses data secara mandiri—tanpa bergantung pada tim TI, insinyur data, atau berisiko melanggar kepatuhan dan tata kelola data. Faktor-faktor ini menciptakan lingkungan data yang tangkas dan mandiri yang memberikan manfaat kepada seluruh organisasi.

Katalog data vs. data dictionary

Katalog data dan data dictionary memiliki tujuan berbeda namun saling melengkapi untuk membuat data lebih berguna.

Katalog data menawarkan gambaran luas dari semua aset data dalam suatu organisasi. Solusi ini menyediakan konteks bisnis untuk membantu pengguna menemukan dan mengevaluasi kumpulan data.

Sebaliknya, kamus data mendefinisikan struktur dan isi kumpulan data individu. Sebaliknya, kamus data mendefinisikan struktur dan isi dari kumpulan data individu. Ini mencakup detail seperti nama bidang, tipe data, nilai yang diizinkan, rentang, dan format.

Apa manfaat dari katalog data?

Katalog data memberikan berbagai manfaat untuk mendukung penemuan, pengelolaan, dan pemanfaatan data di seluruh organisasi, termasuk:

Analisis data yang dipercepat

Katalog data memungkinkan analisis layanan mandiri, memudahkan analis data menemukan, mengakses, menyiapkan, dan memercayai data—mempercepat keseluruhan proses analisis.

Efisiensi Operasional

Dengan menciptakan pembagian kerja yang optimal antara pengguna dan TI, katalog data membantu mengurangi hambatan. Warga data dapat mengakses dan menganalisis data secara mandiri, memungkinkan tim TI fokus pada tugas strategis dan prioritas tinggi.

Pengambilan keputusan berbasis data yang ditingkatkan

Dengan data yang terpusat, kontekstual, dan tepercaya di ujung jari, profesional data dapat merespons lebih cepat dan membuat keputusan lebih tepat—membantu mereka memenuhi metrik intelijen bisnis (BI) dan big data.

Pengurangan risiko regulasi

Dengan mendorong, menyederhanakan, dan mengotomatiskan tata kelola, katalog data memberi analis keyakinan bahwa mereka bekerja dengan data yang diizinkan untuk digunakan, sesuai dengan peraturan industri dan privasi data.

Silo data yang ditingkatkan

Katalog data dapat menyatukan sejumlah besar data yang terpisah dari seluruh sumber data organisasi (seperti gudang data, data lake, dan data lakehouse). Memecah silo ini mendorong aksesibilitas dan kolaborasi data yang lebih luas di antara para pemangku kepentingan.

Apa alat dan fitur katalog data utama?

Katalog data modern menyediakan berbagai alat dan kemampuan yang membantu konsumen data menemukan, memahami, dan menggunakan data perusahaan secara bertanggung jawab. Fitur utama meliputi:

  • Penemuan data: Katalog data harus memungkinkan semua pengguna data untuk dengan cepat dan mudah menemukan data yang relevan. Pengalaman pencarian harus intuitif dan ramah pengguna, mirip dengan Netflix, Amazon, atau platform konsumen lainnya.

  • Pengelolaan metadata: Pengelolaan metadata yang efektif membantu meningkatkan kemudahan pencarian dan penemuan katalog data. Katalog data yang kuat membuat metadata terstruktur dengan baik, dapat diakses, dan dapat ditindaklanjuti.

  • Silsilah data: Melalui metadata, katalog data harus menampilkan siklus hidup data—memberikan pandangan yang transparan dan menyeluruh tentang asal-usulnya, bagaimana data tersebut berubah, dan tujuannya dalam pipeline data.

  • Tata kelola data: Katalog data yang andal terintegrasi secara mulus dengan kebijakan dan alat tata kelola, termasuk aturan kualitas data, glosarium bisnis, dan alur kerja.

  • Pembuatan profil data: Katalog data modern mencakup alat pembuatan profil yang dapat meninjau data dan kemudian membantu menjaga standar kualitas data melalui proses pembersihan dan validasi.

  • Privasi data: Untuk membantu memastikan keamanan dan privasi data sensitif, katalog harus menerapkan kontrol akses dan izin pengguna, serta mendukung kepatuhan terhadap peraturan seperti Peraturan Perlindungan Data Umum; atau (GDPR).

  • Integrasi data: Katalog data harus terhubung dengan ekosistem data organisasi—termasuk gudang data, alat BI, dan platform lainnya—melalui crawler, konektor, atau antarmuka pemrograman aplikasi (API).

  • Dukungan untuk kecerdasan buatan (AI): Data adalah kunci keberhasilan model AI. Katalog data perusahaan modern membantu menandai dan menyiapkan kumpulan data untuk kinerja dan transparansi model yang optimal.

Apa itu katalog data AI?

Katalog data AI menggunakan teknologi canggih seperti otomatisasi, kecerdasan buatan, dan machine learning untuk meningkatkan dan mengoptimalkan fungsionalitas katalog data tradisional. Fitur utama katalog data AI dapat mencakup:

Pengayaan metadata otomatis

Didukung oleh kecerdasan data, katalog data berbasis AI dapat mengotomatiskan pengayaan metadata teknis secara real time pada ribuan aset data.

Tata kelola data otomatis

Dengan klasifikasi data lanjutan, katalog data AI dapat mengidentifikasi dan menandai data sensitif, lalu menegakkan aturan privasi dan keamanan data, seperti kontrol akses.

Pencarian cerdas

Dengan pencarian cerdas, katalog data AI dapat menggunakan pemrosesan bahasa alami untuk memperluas dan meningkatkan kueri pengguna untuk hasil yang lebih relevan dan insight.

Solusi terkait
IBM Knowledge Catalog

Aktifkan data untuk AI dan analitik dengan katalog cerdas dan manajemen kebijakan. IBM Knowledge Catalog adalah perangkat lunak tata kelola data yang menyediakan katalog data untuk mengotomatiskan penemuan data, manajemen kualitas data, dan perlindungan data.

Temukan Knowledge Catalog
Solusi IBM data intelligence

Ubah data mentah menjadi insight yang dapat ditindaklanjuti dengan cepat, satukan tata kelola, kualitas, silsilah, dan pembagian data, serta berdayakan konsumen data dengan data yang andal dan kontekstual.

Temukan solusi intelijen data
Layanan konsultasi data dan analitik

Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.

Temukan layanan analitik
Ambil langkah selanjutnya

Temukan, pahami, kurasi, dan akses data, aset pengetahuan, dan hubungannya, di mana pun mereka berada—di cloud atau on premises. IBM Knowledge Catalog adalah perangkat lunak tata kelola data yang menyediakan katalog data untuk mengotomatiskan penemuan data, manajemen kualitas data, dan perlindungan data.

Jelajahi Katalog Pengetahuan Jelajahi solusi kecerdasan data