Apa itu produk data?

Rak server data

Penyusun

Tom Krantz

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

Apa itu produk data?

Produk data adalah paket mandiri yang dapat digunakan kembali yang menggabungkan data, metadata, semantik, dan templat untuk mendukung beragam contoh penggunaan bisnis. Ini dapat mencakup komponen seperti kumpulan data, dasbor, laporan, model machine learning (ML), kueri yang dibangun sebelumnya, atau data pipelines. 

Produk data dikembangkan dengan pendekatan pemikiran produk dan dengan menerapkan prinsip-prinsip pengembangan produk tradisional. Pendekatan ini melibatkan pemahaman kebutuhan pengguna, memprioritaskan fitur bernilai tinggi dan mengulangi berdasarkan masukan. Pada akhirnya, ia memperlakukan data sebagai produk yang dirancang untuk memecahkan masalah pengguna tertentu. 

Produk data dibangun agar dapat ditemukan ,dapat dioperasikan, dan dapat ditindaklanjuti. Mereka memungkinkan semua orang—mulai dari pengguna bisnis dan analis data hingga ilmuwan data, pengelola data, dan insinyur—untuk mengekstrak nilai yang berarti dari data yang terperangkap dalam suatu perusahaan. 

Konsep produk data menjadi terkenal pada tahun 2019 ketika Zhamak Dehghani, direktur teknologi untuk perusahaan konsultan TI ThoughtWorks, memperkenalkan produk data sebagai komponen inti dari arsitektur data mesh. Data mesh adalah arsitektur data terdesentralisasi yang mengatur data berdasarkan domain bisnis tertentu (seperti pemasaran, penjualan dan layanan pelanggan) untuk memberikan lebih banyak kepemilikan kepada produsen kumpulan data. 

Desain 3D bola yang menggelinding di lintasan

Berita + Insight AI terbaru 


Temukan insight dan berita yang dikurasi oleh para pakar tentang AI, cloud, dan lainnya di Buletin Think mingguan. 

Karakteristik utama dari produk data

Agar berfungsi secara efektif, produk data harus menunjukkan beberapa karakteristik utama:

Dapat ditemukan

Pemangku kepentingan harus dapat dengan mudah menemukan dan menemukan produk data yang tepat untuk contoh penggunaan mereka. 

Dapat dimengerti

Suatu produk data harus menyertakan metadata yang jelas dan terstruktur menurut domain bisnis tertentu, sehingga konsumen data dan tim domain dapat menafsirkan dan menerapkan informasi secara efektif. 

Interoperabel

Produk data harus terintegrasi dengan lancar dengan sistem lain untuk memberikan insight yang konsisten di seluruh platform. 

Dapat dibagikan

Produk data harus dikemas sebagai unit kohesif yang dapat didistribusikan dengan mudah ke seluruh organisasi, memastikan penggunaan dan pemahaman yang konsisten di antara tim. 

Aman

  Produk data harus memiliki kontrol akses dan langkah-langkah keamanan untuk memastikan bahwa hanya pengguna yang berwenang yang dapat mengakses data dengan tetap menjagakepatuhan. 

Dapat digunakan kembali

Produk data yang dirancang dengan baik dibangun dari komponen modular yang dapat digunakan kembali untuk membuat produk data baru atau insight turunan, meningkatkan efisiensi dan mengurangi upaya berlebihan. 

Mengapa produk data penting?

McKinsey melaporkan bahwa perusahaan berbasis data memiliki kemungkinan 23x lebih besar untuk mendapatkan pelanggan dan 19x lebih besar untuk mendapatkan keuntungan. Namun, terlepas dari meningkatnya permintaan untuk pengambilan keputusan berbasis data, banyak organisasi terus menghadapi hambatan seperti silo data, vendor lock-in, dan risiko kepatuhan karena kurangnya kerangka kerja tata kelola data.

Untuk mengatasi tantangan ini, beberapa organisasi telah mengadopsi pendekatan data-as-a-product, memperlakukan data sebagai aset yang dikelola dan dapat dikonsumsi daripada produk sampingan alamat.  

Metodologi data-as-a-product menekankan penataan dan mengatur data untuk menginformasikan keputusan bisnis dan meningkatkan pengalaman pengguna. Dibangun di atas dasar itu, produk data menyediakan pendekatan mandiri terstruktur untuk manajemen data, mengurangi ketergantungan pada tim teknis sambil mendukung pengambilan keputusan real-time . 

Organisasi yang berinvestasi dalam produk data dapat mengalami peningkatan dalam akses data, interoperabilitas, penyimpanan data dan tata kelola. Di seluruh industri, produk data memiliki potensi untuk meningkatkan otomatisasi, mendukung pengambilan keputusan berbasis data, dan membantu perusahaan menyelaraskan strategi data mereka dengan tujuan bisnis jangka panjang. Dengan memanfaatkan platform data yang kuat, model machine learning , dan alat visualisasi, organisasi dapat memberdayakan tim untuk memaksimalkan data mereka. 

Produk data sering mencapai keuntungan ini dengan memberdayakan berbagai peran dalam organisasi: 

  • Ilmuwan data dan insinyur AI mendapatkan akses lebih cepat ke data dan item yang relevan, mempercepat pengembangan dan penerapan solusi AI dan ML. 
  • Insinyur data mendapatkan manfaat dari pengujian, penerapan, dan kurasi data secara otomatis, memastikan jalur pipa memenuhi standar kualitas data dan perjanjian tingkat layanan yang ditentukan dalam kontrak produk data . 
  • Analis data dan konsumen menerima data yang tepat waktu dan andal yang selaras dengan kebutuhan spesifik domain mereka dan dapat dengan cepat diperbarui tanpa bergantung pada tim TI pusat. 
  • Pengelola data dapat mempertahankan tata kelola dan kepatuhan yang kuat melalui kontrak data, menetapkan pagar pembatas yang jelas yang melindungi data dan menjaganya tetap aman. 

Data sebagai aset vs. data sebagai produk 

Cara organisasi mengelola data telah berevolusi dari Approach pasif berbasis aset menjadi Strategi aktif berbasis produk.

Data sebagai aset (pendekatan tradisional)

Secara tradisional, perusahaan memperlakukan data terutama sebagai sesuatu untuk dikumpulkan dan disimpan. Pendekatan ini menempatkan data dalam gudang data pusat atau sistem sumber, mengaturnya berdasarkan bidang subjek (seperti keuangan atau pemasaran) dan menetapkan kepemilikan ke tim terpusat. Kesuksesan sering kali diukur dari volume data, seperti terabyte yang tersimpan, dengan harapan dengan memiliki lebih banyak data, karyawan akan menggunakannya. 

Namun, metadata biasanya ditentukan oleh departemen TI dan tidak ramah bisnis bagi konsumen data. Akibatnya, banyak upaya dengan aset data berkisar pada analitik deskriptif dan pelaporan, melihat ke belakang pada apa yang terjadi daripada menggunakan aset secara proaktif untuk memecahkan pertanyaan bisnis. 

Data-sebagai-produk (pendekatan baru)

Sebaliknya, melihat data sebagai produk mengalihkan fokus dari penyimpanan, ke penggunaan dan penciptaan nilai.  Produk data mengalami pengalaman siklus hidup produk data dan dirancang, diuji, dan diulangi — seperti produk piranti lunak yang mengikuti metodologi Agile atau DataOps.  

Kepemilikan bersifat spesifik untuk domain tertentu (misalnya, produk data pemasaran yang dikelola oleh pakar pemasaran), yang membuat data tetap relevan dan berkualitas tinggi. Data juga dikuratori untuk kebutuhan konsumsi tertentu, dengan metadata kaya yang didorong oleh bisnis. Ini memastikan bahwa produk data mudah ditemukan dan dimengerti oleh pengguna bisnis.

Karena pemilik data bertanggung jawab atas produk data, ada pemantauan terus menerus terhadap penggunaan, kualitas , dan nilai yang berasal dari suatu produk melalui masukan dengan pengguna akhir.  

Keberhasilan diukur dengan bagaimana data meningkatkan pengambilan keputusan, mendorong pendapatan atau mengurangi biaya, bukan hanya dengan berapa banyak terabyte yang disimpan di toko. Akibatnya, inisiatif produk data dapat memecahkan pertanyaan bisnis dengan analitik lanjutan, seperti pemodelan prediktif dan preskriptif. 

  

Komponen produk data

 Produk data yang terstruktur dengan baik terdiri dari beberapa komponen yang memungkinkan fungsionalitas dan kegunaan dalam ekosistem data organisasi: 

  • Model dan skema data: Struktur terdefinisi yang menstandardisasi organisasi data, meningkatkan aksesibilitas dan konsistensi semantik . Seringkali, ini bergantung pada SQL untuk query dan transformasi. 
  • Antarmuka dan API: Mekanisme yang memfasilitasi integrasi dengan aplikasi bisnis dan aplikasi, memastikan akses data yang lancar dan aman. 
  • Visualisasi dan dasbor: Alat ramah pengguna yang menyajikan insight melalui laporan interaktif atau tampilan analitis, membantu interpretasi data. 
  • Model ML:  Algoritma prediktif yang menganalisis pola dalam data, mendukung pengambilan keputusan berdasarkan informasi melalui  komputasi lanjutan. 
  • Kontrol keamanan dan tata kelola: Kebijakan dan tindakan yang memastikan kepatuhan terhadap peraturan tata kelola data , melacak silsilah data, dan mengelola kontrol akses untuk menjaga integritas dan keamanan data . 

 

    Jenis produk data

    Produk data dapat dikategorikan berdasarkan kualitas dan tingkat penyempurnaan data. Jenis produk data meliputi: 

    Berbasis sumber

    Produk data dari sistem sumber. Jenis produk data mentah (atau dengan Transformasi minimal) ini sering kali merupakan blok bangunan  contoh penggunaan seperti ilmu data dan AI generatif.

    Berbasis master

    Produk data yang telah dikurasi dan dikonsolidasikan menjadi data master yang menstandarisasi entitas bisnis utama (seperti pelanggan atau produk) untuk memastikan konsistensi di seluruh sistem. 

    Berbasis insight

    Produk data yang disempurnakan, diproses, dan dirancang untuk mendukung pengambilan keputusan dan menghasilkan insight yang dapat ditindaklanjuti. 

    Siklus hidup produk data

    Dengan mengikuti siklus hidup manajemen produk yang terstruktur, tim data dapat membangun produk data yang terus berharga, dapat diskalakan, dan selaras dengan kebutuhan bisnis yang terus berkembang. 

    ​Tahapan kunci dari siklus hidup produk data meliputi: 

    1. Mendefinisikan: Tentukan tujuan bisnis, contoh penggunaan, spesifikasi desain, dan kontrak data. Ini termasuk atribut seperti syarat, ketentuan, dan perjanjian tingkat layanan. 

    2. Pengembangan: Membangun komponen produk data, seperti tabel, tampilan, model, file, dan dasbor. Kemudian, uji terhadap kontrak data. 

    3. Paket: Mengkurasi komponen produk data menjadi paket yang dapat digunakan kembali , diperkaya dengan metadata bisnis dan teknis agar mudah ditemukan di dalam katalog data atau alat penyimpanan data lainnya.

    4. Mengatur: Mengelola izin akses produk data sesuai kontrak data. 

    5. Publikasikan: Publikasikan produk data Anda ke portal untuk ditemukan.  

    6. Konsumsi: Memungkinkan konsumen di seluruh organisasi mengakses produk data dengan mudah untuk mengatasi berbagai tantangan. Kumpulkan masukan konsumen untuk penyempurnaan untuk iterasi di masa mendatang.​ 

    7. Pantau dan lakukan pengulangan: Melakukan aktivitas yang sedang berlangsung seperti memantau penggunaan, kualitas, dan akses. Menerapkan manajemen rilis untuk perubahan versi pada produk data yang diterbitkan.​​ 

    8. Pensiun: Menghentikan produk data karena alasan seperti kurangnya penggunaan atau ketidakpatuhan. Hentikan produk, beri tahu konsumen, arsipkan produk dan bersihkan sumber daya. 

    Cocok untuk contoh penggunaan produksi

    Organisasi di seluruh industri mengandalkan produk data untuk mendorong nilai bisnis, mendukung inisiatif strategis, dan memecahkan masalah bisnis penting.  

    Contoh nyata dari produk data meliputi:

    • Sebuah bank nasional yang besar menerapkan satu produk data pelanggan yang mendukung 60 contoh penggunaan yang beragam—mulai dari penilaian risiko kredit real-time hingga chatbot AI—berbagai saluran. Akibatnya, bank memperoleh tambahan pendapatan tahunan $60 juta dan mencegah kerugian $40 juta. 

    •  Perusahaan barang kemasan konsumen (CPG) memperkenalkan produk data untuk merampingkan penggunaan data, meningkatkan efisiensi dan skalabilitas. Dengan mengerahkan lebih dari 50 tim lintas fungsi untuk mengimplementasikan solusi berbasis data, perusahaan meningkatkan EBITDA sebesar 18% selama dua tahun. 

    Membangun dan menskalakan produk data

    Keberhasilan mengembangkan produk data membutuhkan pendekatan strategis yang mencakup pemahaman konsumsi data, pemetaan interaksi data, pengujian nilai pasar, dan pengulangan untuk mendapatkan skala. 

    Menganalisis pola konsumsi data 

    Langkah pertama dalam membuat produk data adalah menganalisis konsumsi data saat ini dalam organisasi. Langkah ini melibatkan identifikasi target pengguna, memahami data yang mereka konsumsi dan mengapa data tersebut penting bagi mereka.  

    Mengulas penggunaan data dalam hal volume, frekuensi, sensitivitas, dan jenisnya memberikan insight tentang kumpulan data mana yang memiliki nilai paling tinggi. Dengan memprioritaskan kelompok pengguna yang memiliki dampak besar, organisasi dapat membantu memastikan upaya awal berfokus pada area yang memiliki potensi dampak bisnis terbesar. 

    Memetakan perjalanan data 

    Setelah pola konsumsi data jelas, langkah selanjutnya adalah memetakan perjalanan data. Membuat peta terperinci tentang interaksi data dunia nyata membantu memvisualisasikan bagaimana data mengalir di berbagai sistem dan tim.  

    Peta-peta ini dapat berfungsi sebagai dasar untuk bertukar pikiran tentang contoh penggunaan baru yang menghasilkan pendapatan untuk produk data. Mengembangkan hipotesis tentang bagaimana produk data dapat meningkatkan proses bisnis dapat membantu organisasi mulai mengeksplorasi cara untuk mengubah data mentah menjadi insight yang bermakna dan dapat ditindaklanjuti. 

    Iterasi dan penskalaan 

    Dengan insight yang tervalidasi, langkah berikutnya adalah mengulang  dan meningkatkan skala. Daripada hanya mengandalkan tim TI pusat, organisasi dapat mendorong kelincahan dan inovasi dengan memberdayakan domain bisnis dan tim untuk menyempurnakan dan meningkatkan produk data. Setelah perbaikan dilakukan, proyek dapat diperluas ke lebih banyak tim dan domain, memastikan bahwa produk data berskala efektif dan terus mendorong nilai bisnis. 

    Solusi terkait
    IBM Data Product Hub

    Mengelola data sebagai produk di seluruh siklus hidup. Pelihara siklus hidup produk data mulai dari penerimaan hingga penghapusan dengan sistem yang andal untuk pembuatan versi, pemeliharaan, dan pembaruan produk data.

    Jelajahi Data Product Hub
    Solusi IBM Data Intelligence

    Ubah data mentah menjadi insight yang dapat ditindaklanjuti dengan cepat, satukan tata kelola, kualitas, silsilah, dan pembagian data, serta berdayakan konsumen data dengan data yang andal dan kontekstual.

    Jelajahi solusi kecerdasan data
    Layanan konsultasi data dan analitik

    Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.

    Jelajahi layanan analitik
    Ambil langkah selanjutnya

    Untuk berkembang, perusahaan harus menggunakan data untuk membangun loyalitas pelanggan, mengotomatiskan proses bisnis, dan berinovasi dengan solusi yang didorong oleh AI.

    Jelajahi solusi analitik Pelajari Data Product Hub