Diterbitkan: 30 Agustus 2024
Kontributor: Tim Mucci
Berbagi data adalah proses membuat sumber daya data organisasi tersedia untuk beberapa aplikasi, pengguna, dan organisasi lain. Berbagi data yang efektif melibatkan kombinasi teknologi, praktik, kerangka kerja hukum, dan upaya organisasi untuk memfasilitasi akses aman bagi banyak entitas tanpa mengorbankan integritas data.
Organisasi yang merangkul analitik data besar mengenali data sebagai aset strategis yang berharga dalam portofolio mereka. Data ini berasal dari berbagai sumber, seperti metrik yang berasal dari aplikasi perangkat lunak, data perilaku pelanggan dan sinyal Internet of Things (IoT) dari peralatan dan sensor.
Bayangkan data sebagai buku di perpustakaan. Berbagi data mirip dengan memiliki kartu perpustakaan yang memungkinkan semua orang dalam organisasi mengakses dan meminjam buku-buku ini ketika mereka membutuhkannya. Tanpa berbagi data, setiap departemen harus membuat dan mengelola perpustakaannya sendiri, yang menyebabkan duplikasi, informasi yang ketinggalan zaman, dan sumber daya yang terbatas.
Organisasi yang berbagi data dapat berkolaborasi lebih efektif dengan mitra, membangun peluang bisnis baru, membentuk kemitraan baru, dan menghasilkan aliran pendapatan melalui produk data dan monetisasi lainnya. Namun, berbagi data memerlukan komitmen untuk menjaga integritas dan keandalan data bersama sepanjang siklus hidupnya, memastikan bahwa data tersebut tetap dapat dipercaya, koheren, dan berguna untuk analisis yang akurat. Berbagi data yang sukses memungkinkan para pemangku kepentingan memperoleh perspektif yang berharga, mengembangkan layanan dan teknologi baru, serta mempersiapkan tren yang akan datang dengan menganalisis sejumlah besar data baik dari dalam maupun luar organisasi.
Panduan pemimpin data menggambarkan bagaimana setiap jenis basis data sesuai dengan kebutuhan bisnis, tergantung pada apakah organisasi memprioritaskan analitik, AI, atau kinerja aplikasi.
Pelajari bagaimana rencana manajemen data membantu melindungi informasi sensitif
Data sebagai produk menawarkan pendekatan terstruktur untuk mengelola nilai data
Organisasi telah berbagi data jauh sebelum penemuan internet, tetapi kemajuan dalam literasi digital, teknologi, dan adopsi cloud telah mengarah pada berbagi data secara real-time dalam skala global. Teknologi penyimpanan dan transfer data lebih tersedia dan terjangkau dari sebelumnya. Akibatnya, kebijakan dan peraturan telah berkembang untuk mengurangi risiko yang terkait dengan berbagi data. Berbagi data lebih dari sekadar memungkinkan akses untuk analisis dan monetisasi, tetapi juga meruntuhkan hambatan antara unit bisnis dan mitra eksternal. Tim yang berbeda dapat bekerja secara independen atau dengan satu sama lain, masing-masing menyimpulkan dari sumber data terkini yang sama. Meningkatnya jumlah dan variasi data yang tersedia memungkinkan tim yang beragam di seluruh organisasi untuk berkontribusi pada tujuan organisasi yang lebih luas.
Menggabungkan informasi dari berbagai sumber, seperti data penelitian, data operasional atau masukan pelanggan, meningkatkan kinerja layanan dan meningkatkan nilai layanan tersebut. Misalnya, unit bisnis dengan akses ke data dapat menggunakan analisis data untuk memutuskan berdasarkan tren pasar dan preferensi pelanggan serta mengembangkan strategi pemasaran yang sukses.
Selain itu, berbagi data memungkinkan otoritas publik dan organisasi untuk berbagi data mereka dengan cara yang aman, legal, dan diatur. Bagian penting dari kebersihan berbagi data melibatkan produsen data yang mendokumentasikan dan melabeli kumpulan data dengan metadata yang akurat untuk mendukung reproduktivitas. Deskripsi terperinci dengan definisi yang jelas memastikan bahwa orang lain dapat dengan mudah menemukan, menemukan, dan memahami data yang dibagikan.
Future of Privacy Forum1 (FPF) menganalisis kemitraan berbagi data antara perusahaan dan peneliti akademis dan menentukan bahwa kemitraan ini dapat mempercepat penelitian yang bermanfaat secara sosial, memperluas akses ke kumpulan data yang berharga, dan meningkatkan kemampuan reproduksi temuan penelitian. Seiring dengan makin meluasnya berbagi data data, para pemangku kepentingan mengambil langkah proaktif untuk mengatasi risiko dan pelanggaran data dengan menggunakan perjanjian berbagi data (DSA) dan teknologi yang meningkatkan privasi (PET).
IBM memberikan contoh yang baik dalam menerapkan protokol privasi dan keamanan yang ketat dalam praktik berbagi datanya, termasuk penggunaan PET untuk menganonimkan data sebelum membagikannya kepada universitas, lembaga nirlaba, dan laboratorium penelitian. Pendekatan IBM mendukung penemuan ilmiah sekaligus melindungi data sensitif, membina kemitraan yang lebih aman dan efektif. Misalnya, IBM berkolaborasi dengan Melbourne Water di Australia untuk menganalisis data yang bertujuan mengurangi emisi energi. Selama pandemi COVID-19, IBM memproses sekuens genom SARS-CoV-2, menyumbangkan lebih dari 3 juta sekuens ke repositori penelitian.
Contoh penggunaan lain yang menarik dari nilai berbagi data berasal dari lembaga nirlaba Amerika Serikat, Benefits Data Trust. 2 Benefits Data Trust (BDT) mempromosikan berbagi data di antara negara bagian dan organisasi yang terlibat dalam perawatan kesehatan dan pendidikan di Amerika Serikat. Melalui perjanjian berbagi data, BDT meningkatkan pendaftaran dalam program publik yang penting seperti Program Bantuan Gizi Tambahan (SNAP) dan Medicaid.
Departemen Layanan Sosial Carolina Selatan, dengan BDT, membandingkan daftar Medicaid dan SNAP bulanan, di mana mereka mengidentifikasi individu yang memenuhi syarat yang tidak terdaftar dalam program tersebut. Inisiatif ini telah menghasilkan lebih dari 20.000 pendaftaran SNAP sejak tahun 2015, yang meningkatkan akses terhadap bantuan gizi bagi populasi yang rentan. Upaya serupa di Pennsylvania juga telah berhasil, dengan berbagi data yang membantu mendaftarkan sekitar 240.000 orang dalam berbagai program bantuan publik sejak tahun 2005.
Meskipun menawarkan banyak manfaat bagi bisnis, berbagi data juga memiliki risiko. Ketika informasi sensitif didistribusikan secara tidak benar, hal ini dapat membuat organisasi terekspos pada risiko peraturan, persaingan, keuangan, dan keamanan. Konsumen data memiliki kontrol terbatas atas kualitas dan ketersediaan data. Data berkualitas rendah mungkin juga menyimpan bias tersembunyi terhadap jenis kelamin, ras, agama, atau kelompok etnis.
Proses tata kelola data menetapkan kebijakan, standar, dan praktik terbaik untuk mengelola data secara aman, akurat, dan konsisten di seluruh organisasi. Tata kelola yang efektif membatasi akses sehingga hanya pengguna yang berwenang yang memiliki izin penggunaan data. Tata kelola juga melindungi, mengklasifikasikan, dan membantu memastikan bahwa data digunakan mematuhi badan hukum dan peraturan yang ada.
Setiap organisasi memiliki kewajiban hukum dan etika untuk menjaga privasi data pelanggan yang dikelolanya. Teknologi seperti enkripsi dan penyuntingan data memungkinkan berbagi data yang aman sambil melindungi privasi. Namun, kurangnya komunikasi antara produsen data dan konsumen dapat menyebabkan salah tafsir, yang mengakibatkan asumsi yang salah ketika mengembangkan laporan atau terlibat dalam inisiatif pengambilan keputusan berbasis data.
Sebagai contoh, pada tahun 2012, Knight Capital Group3 mengalami kesalahan trading karena kurangnya komunikasi dan koordinasi antar-tim, menyebabkan mereka kehilangan USD 440 juta hanya dalam waktu 45 menit. Pembaruan perangkat lunak secara tidak sengaja mengaktifkan perangkat lunak tertanam yang belum teruji, tidak berdokumen, dan tidak aktif. Karena pengembang tidak secara efektif mengomunikasikan dampak potensial dari perubahan pada sistem trader, perdagangan yang salah dijalankan dengan kecepatan tinggi, yang mengakibatkan kerugian finansial yang signifikan.
Perpindahan data yang mahal, terutama melalui proses ekstrak, transformasi, muat (ETL) yang intensif sumber daya, secara tradisional menghambat berbagi data secara luas. Menjaga kualitas data dan praktik terbaik tata kelola dapat menjadi tantangan tersendiri, terutama ketika berhadapan dengan volume data yang sangat besar. Berbagi kumpulan data yang besar dengan aman melalui jaringan memakan waktu dan sangat teknis, serta membutuhkan investasi besar dalam penyimpanan dan infrastruktur.
Keamanan data memerlukan langkah-langkah perlindungan dan pendidikan yang ketat untuk melindungi data sensitif. Informasi yang bergerak melintasi jaringan dan platform selama proses berbagi data rentan terhadap ancaman, seperti akses tidak sah, pelanggaran data, dan serangan siber. Selain itu, organisasi harus menavigasi undang-undang dan peraturan privasi data yang kompleks saat berbagi data dengan mitra eksternal, pemangku kepentingan, atau vendor pihak ketiga.
Menerapkan praktik terbaik dalam berbagi data membantu organisasi memaksimalkan manfaat sambil meminimalkan risiko.
Pasar data memungkinkan organisasi untuk berbagi dan memonetisasi data dan produk data mereka dengan aman. Ada beberapa jenis pasar data yang berbeda:
Pasar data publik menawarkan lingkungan yang aman bagi para peserta untuk membeli dan menjual data dan layanan terkait, yang pada gilirannya mengesahkan kualitas dan konsistensi yang tinggi dari penyedia data. Perusahaan dapat menggunakan pasar data untuk memperoleh data pihak ketiga guna memperkaya kumpulan data mereka yang sudah ada atau untuk menawarkan dan memonetisasi produk dan layanan data baru.
Setiap jenis berbagi data memenuhi peran khusus dalam memfasilitasi pertukaran informasi yang aman.
Jenis teknologi berbagi data yang paling banyak digunakan di antara organisasi perusahaan adalah data warehouse dan data lakehouse. Sistem arsitektur data modern ini menyediakan repositori pusat untuk pengumpulan, penyimpanan, dan berbagi data besar dari beberapa unit bisnis. Arsitektur ini biasanya mencakup tingkatan untuk klien front-end, Analytics Engine, dan server database.
Antarmuka pemrograman aplikasi (API) memungkinkan komponen perangkat lunak untuk mengkomunikasikan definisi dan protokol bersama. API berbagi data mendukung kontrol akses dan izin yang sangat terperinci, menentukan data apa yang dapat dan tidak dapat diminta oleh konsumen.
Pembelajaran federasi, teknologi blockchain, dan platform pertukaran data adalah teknologi lain yang mendukung berbagi data. Pembelajaran federasi memungkinkan sistem AI untuk melatih kumpulan data terdistribusi dari berbagai sumber tanpa harus memindahkan data. Blockchain menyediakan buku besar yang transparan dan tidak dapat diubah untuk melacak transaksi, termasuk transaksi pada pertukaran data terbuka, memberikan lapisan integritas dan keamanan pada proses berbagi data.
Teknologi lama seperti Secure File Transfer Protocol (SFTP) dan email memungkinkan solusi yang bersifat vendor-agnostik dan dibuat sendiri, tetapi makin sulit untuk diamankan dan diatur. Mereka tidak memiliki fitur keamanan canggih seperti enkripsi saat istirahat, kontrol akses data granular, dan audit otomatis, yang lebih umum pada solusi modern.
Solusi data modern berfokus pada berbagi data yang aman, dengan penyimpanan data cloud yang menawarkan skalabilitas dan keandalan dengan batasan aksesibilitas dan keamanan. Solusi berbagi data khusus vendor menawarkan keamanan dan skalabilitas bawaan, tetapi sering kali disertai dengan vendor lock-in, yang membatasi fleksibilitas dan meningkatkan biaya jangka panjang.
Teknologi yang meningkatkan privasi, ruang bersih data, dan teknologi lainnya meningkatkan operasi data melalui otomatisasi. Tren ini menyoroti pergeseran ke arah privasi, desentralisasi, dan pendekatan yang didorong oleh AI dalam menangani dan menganalisis data.
Tren masa depan dalam berbagi data menekankan meningkatnya pentingnya privasi. Teknologi yang meningkatkan privasi seperti komputasi multi-pihak yang aman dan masking data menjadi sangat penting untuk menyeimbangkan berbagi data tanpa hambatan dan perlindungan data yang aman. Mengadopsi PET memberi perusahaan keunggulan kompetitif karena alat-alat ini menjadi bagian integral dari operasi.
Ruang bersih data adalah lingkungan yang aman dan berfokus pada privasi di mana beberapa pihak dapat berkolaborasi pada data tanpa berbagi data mentah. Solusi ini memungkinkan perusahaan untuk melakukan analisis dan mendapatkan insight sekaligus melindungi data sensitif, sehingga tetap mematuhi peraturan privasi. Ruang bersih membantu menjaga kepercayaan di antara para mitra dengan mencegah pemaparan informasi pribadi dan memungkinkan data yang dikumpulkan dan dianonimkan untuk dibagikan.
Jaring data memungkinkan organisasi memperlakukan data sebagai produk, membuatnya dapat ditemukan dan digunakan dalam format layanan mandiri. Pendekatan ini memungkinkan unit bisnis untuk membuat dan mengelola produk data mereka secara mandiri. Hal ini juga memfasilitasi tampilan data yang terpusat di berbagai platform dan teknologi, meningkatkan konektivitas dan insight tanpa memerlukan platform data yang terpisah
Model bahasa besar (LLM) dapat merampingkan rekayasa dan operasi data dengan mengotomatiskan tugas-tugas seperti pembuatan profil data, pemodelan, dan integrasi, yang mengarah pada peningkatan kualitas data. Menerapkan AI generatif dalam infrastruktur data yang ada memungkinkan organisasi untuk menangani tugas-tugas rutin dengan lebih efisien, membebaskan sumber daya untuk analisis dan pengambilan keputusan yang lebih kompleks.
IBM Data Product Hub membantu menyederhanakan proses berbagi data dan mengotomatiskan pengiriman produk data ke konsumen data di seluruh organisasi.
IBM Cloud Pak for Data membantu meningkatkan kualitas data, privasi dan kepatuhan, serta membantu pengguna menemukan data yang mereka butuhkan dengan lebih cepat.
IBM watsonx.data adalah penyimpanan data hybrid yang dapat diskalakan yang dirancang untuk beban kerja AI dan analitik. IBM watsonx.data menawarkan akses data terbuka, mesin kueri yang sesuai dengan tujuan dan integrasi dengan berbagai lingkungan data, memungkinkan persiapan data data yang efisien di seluruh pengaturan cloud atau lokal.
Kemitraan IBM dengan TechD menggunakan AI generatif untuk membuka insight berbasis data dan kemampuan pengambilan keputusan dengan tetap menjaga privasi yang ketat.
Solusi penyimpanan data tingkat lanjut sangat penting untuk memastikan ketangkasan, keamanan, dan skalabilitas bisnis, sekaligus memungkinkan organisasi mengelola dan memanfaatkan data secara efisien di seluruh lingkungan yang terus berkembang.
Arsitektur data fabric membantu menyederhanakan akses data, memecah silo, dan meningkatkan pengambilan keputusan dengan menyediakan data yang siap pakai untuk bisnis di lingkungan hybrid dan multicloud.
1 Data sharing for research (tautan berada di luar IBM.com), The Future of Privacy Forum, Agustus 2022
2 Knight Capital Group stock trading disruption (tautan berada di luar IBM.com), Wikipedia, Agustus 2012