Cara memastikan kualitas, nilai, dan keandalan data

Kualitas data hilir bergantung langsung pada kualitas data di mil pertama. Pada awal penyerapan, data yang akurat dan andal akan memastikan bahwa data yang digunakan di hilir untuk analitik, visualisasi, dan ilmu data akan bernilai tinggi.

Untuk bisnis, ini membuat semua perbedaan antara mendapatkan manfaat dari data dan membuatnya memainkan peran kedua saat membuat keputusan. Dalam postingan blog ini, kami menjelaskan pentingnya kualitas data, cara mengaudit dan memantau data Anda, dan cara mendapatkan kepemimpinan, kolega, dan anggota tim Anda.

Topik yang dibahas:

  • Observabilitas data secara proaktif
  • Mengaudit data untuk kualitas
  • Kualitas data atau nilai data?
  • Cara mendekati C-level dan dewan direksi
  • Cara melatih secara internal
  • Kutukan “YLainnya”
  • Praktik terbaik untuk memulai: Memastikan kualitas data di seluruh perusahaan

Observabilitas data secara proaktif

Mengelola data seperti berlari maraton. Banyak faktor yang menentukan hasil akhir, dan itu adalah proses yang panjang. Namun, misalkan seorang pelari tersandung dan melukai pergelangan kakinya pada mil pertama. Dalam hal ini, dia tidak akan berhasil menyelesaikan maraton. Demikian pula, jika data tidak dipantau sedini konsumsi, sisa pipeline akan terkena dampak negatif.

Bagaimana kita dapat memastikan tata kelola data selama mil pertama perjalanan data ini?

Data memasuki pipeline dari berbagai sumber: API eksternal, data drop dari penyedia luar, menarik dari basis data, dan lain-lain. Pemantauan data pada titik penyerapan memastikan insinyur data dapat memperoleh observabilitas proaktif dari data yang masuk.

Ini memungkinkan mereka untuk memperebutkan dan memperbaiki data untuk memastikan prosesnya sehat dan dapat diandalkan sejak awal.

Dengan mendapatkan pengamatan proaktif dari pipeline data, insinyur data dapat:

  • Mempercayai data
  • Mengidentifikasi titik putus dengan mudah
  • Perbaiki masalah dengan cepat sebelum tiba di gudang atau dasbor

Audit data untuk kualitas

Insinyur data yang ingin meninjau pipeline atau audit mereka dan memantau sumber data eksternal dapat menggunakan pertanyaan berikut selama evaluasi mereka:

  1. Apa itu lingkup cakupan?
  2. Bagaimana data dilacak?
  3. Apakah ada referensi data master yang mencakup persyaratan dan metadata?
  4. Apakah pelanggan didefinisikan dengan cara yang benar?
  5. Apakah ada hierarki yang sama?
  6. Apakah taksonomi memanfaatkan persyaratan bisnis?
  7. Apakah geografi telah ditetapkan dengan benar?
  8. Apakah ada duplikat?
  9. Apakah data dicari sebelum membuat entitas baru?
  10. Apakah data terstruktur untuk memungkinkan integrasi dan interoperabilitas yang mulus?

Sekarang kita telah membahas bagaimana insinyur data dapat mendekati kualitas data, mari kita lihat bagaimana mendapatkan dukungan dari pemangku kepentingan tambahan di perusahaan.

Kualitas data atau nilai data?

Insinyur data sering berbicara tentang kualitas data. Namun, dengan mengubah percakapan menjadi nilai data, pemangku kepentingan tambahan dalam organisasi dapat didorong untuk mengambil bagian yang lebih signifikan dalam proses data. Ini penting untuk mendapatkan perhatian, sumber daya, dan untuk bantuan berkelanjutan.

Untuk melakukannya, kami sarankan berbicara tentang bagaimana data selaras dengan tujuan bisnis. Jika tidak, para pemangku kepentingan eksternal mungkin akan mengira bahwa percakapan hanya berfokus pada pembersihan data.

4 kriteria untuk menentukan nilai data—untuk insinyur dan bisnis:

  • Relevansi: Apakah data memenuhi tujuan bisnis?
  • Cakupan: Apakah data mencakup seluruh pasar, memungkinkan perusahaan untuk memainkannya?
  • Struktur: Apakah data terstruktur sehingga perusahaan dapat menggunakannya?
  • Akurasi: apakah data lengkap dan benar?

Cara mendekati C-level dan dewan direksi

Dengan mengalihkan percakapan ke nilai data daripada kualitasnya, C-level dan dewan dapat didorong untuk menginvestasikan lebih banyak sumber daya ke dalam pipeline data. Berikut cara mendekatinya:

  1. Mulailah dengan alasan mengapa mengelola data sangat penting secara strategis bagi perusahaan Anda. Tunjukkan bagaimana data dapat membantu melaksanakan niat strategis.
  2. Jelaskan bagaimana mengelola dan menganalisis data dapat membantu perusahaan mencapai tujuan yang dibutuhkan. Tunjukkan bagaimana data dapat tumbuh, meningkatkan, dan melindungi bisnis. Anda dapat menenun empat kriteria dari sebelumnya untuk menekankan poin Anda.
  3. Hubungkan data ke departemen tertentu. Tunjukkan bagaimana data dapat membantu meningkatkan efisiensi operasional, meningkatkan penjualan, dan mengurangi risiko. Tidak ada departemen lain yang dapat mengklaim untuk membantu menumbuhkan, meningkatkan, dan melindungi semua departemen pada tingkat yang sama seperti rekayasa data.
  4. Jangan fokus pada proses dan teknologi—jika tidak, Anda akan memiliki audiens yang sangat kecil.

Cara melatih secara internal

Selain kepemimpinan perusahaan, penting juga untuk melibatkan orang-orang di perusahaan. Ini akan membantu dengan analisis dan pemantauan data. Insinyur data sering membutuhkan karyawan perusahaan untuk berpartisipasi dalam upaya pemeliharaan data yang berkelanjutan. Misalnya, tenaga penjualan diharuskan mengisi beberapa bidang dalam CRM saat menambahkan peluang baru.

Kami merekomendasikan menginvestasikan waktu dalam manajemen orang, seperti pelatihan dan memastikan semua orang berada di halaman yang sama mengenai pentingnya kualitas data. Misalnya, menjelaskan bagaimana mengidentifikasi perbedaan secara akurat dapat membantu menemukan anomali bisnis (bukan anomali data, yang dapat terjadi jika orang tidak memperbarui data secara konsisten dan komprehensif).

Kutukan “Lainnya“

Audit nilai data sangat penting karena secara langsung berdampak pada kemampuan untuk membuat keputusan di atasnya. Jika Anda membutuhkan contoh untuk meyakinkan karyawan untuk berpartisipasi dalam manajemen data, ingatkan mereka tentang “kutukan ’lain’.”

Ketika unit bisnis seperti pemasaran, produk, dan penjualan memantau dasbor, dan sebagian besar diberi judul “lainnya“, mereka tidak memiliki semua data yang mereka butuhkan dan pengambilan keputusan mereka terganggu. Ini adalah akibat dari kurangnya manajemen data dan tata kelola data.

Praktik terbaik untuk memulai: Memastikan kualitas data di seluruh perusahaan

Bagaimana insinyur data dapat mengubah kualitas data dari teori abstrak menjadi praktik? Mari kita gabungkan semua yang telah kita bahas ke dalam sebuah rencana yang dapat ditindaklanjuti.

Langkah 1: Audit situasi data

Pertama, menilai domain mana yang harus dicakup dan seberapa baik mereka dikelola. Ini termasuk tipe data seperti:

  • Data hubungan dengan pelanggan, vendor, mitra, prospek, warga negara, pasien, dan klien
  • Data merek dari produk, layanan, penawaran, spanduk, dan lainnya

Identifikasi kesalahan pada tahap pipa yang berbeda, mulai dari konsumsi.

Langkah 2: Menampilkan pipeline data

Menyajikan situasi data kepada berbagai pemangku kepentingan. Tunjukkan bagaimana data dikelola dari titik masuk ke produk akhir. Kemudian, jelaskan bagaimana nilai data saat ini memengaruhi keputusan mereka. Sajikan titik kesalahan dan sarankan cara untuk perbaikan.

Langkah 3: Prioritaskan masalah untuk perbaikan

Bangun rencana prioritas untuk mendorong perubahan. Tentukan masalah mana yang harus diperbaiki terlebih dahulu. Sertakan identifikasi sumber dan cara mereka mengirim data, manajemen data internal, dan melatih karyawan. Dapatkan dukungan terhadap rencana tersebut, dan lanjutkan untuk melaksanakannya.

Kesimpulan

Memastikan kualitas data adalah tanggung jawab insinyur data dan seluruh organisasi. Pemantauan kualitas data dimulai dari sumbernya. Namun, dengan mendapatkan dukungan dari karyawan dan manajemen, insinyur data dapat memastikan mereka akan mendapatkan sumber daya dan perhatian yang dibutuhkan untuk memantau dan memperbaikan masalah data di seluruh pipeline, dan membantu bisnis tumbuh.

