Blockchain dan Big Data adalah salah satu teknologi baru teratas yang dijadwalkan untuk merevolusi beberapa industri, secara radikal mengubah cara bisnis dan organisasi dijalankan. Orang mungkin berasumsi bahwa teknologi ini saling eksklusif—masing-masing menempa jalur unik dan diterapkan secara independen satu sama lain.
Namun, itu akan meleset dari sasaran.
Blockchain—sama seperti ilmu data—secara bertahap mengubah cara beberapa industri beroperasi. Dan sementara ilmu data berfokus pada pemanfaatan data untuk administrasi yang tepat, blockchain memastikan kepercayaan data dengan mempertahankan buku besar yang terdesentralisasi.
Pertanyaannya adalah, adakah titik temu antara kedua konsep ini?
Apa yang akan dicapai ketika kedua teknologi ini diterapkan secara bersamaan?
Sederhananya, bagaimana blockchain dapat mengganggu ilmu data?
Untuk menjawab pertanyaan-pertanyaan ini, akan bermanfaat untuk memahami Blockchain dan Ilmu Data secara terpisah satu sama lain.
Blockchain pada dasarnya adalah buku besar yang tidak memerlukan kepercayaan, yang mencatat transaksi ekonomi sedemikian rupa sehingga tidak dapat dimanipulasi. Teknologi ini menjadi terkenal sebagai hasil dari minat pada bitcoin dan mata uang kripto secara umum tetapi sejak itu menemukan relevansi dalam mencatat tidak hanya transaksi mata uang kripto tetapi segala sesuatu yang bernilai. Mengetahui kemampuan teknologi ini, pengembang dan penggemar teknologi telah bekerja untuk membentuk contoh penggunaan demi contoh penggunaan untuk blockchain.
Permintaan untuk pengembang blockchain telah membengkak dalam beberapa tahun terakhir seperti proyek yang mengerjakan berbagai aplikasi blockchain. Laporan dari platform freelancing seperti UpWork telah mempertahankan keterampilan blockchain sebagai keterampilan yang paling dituntut. Dengan cara yang sama, para profesional di bidang lain seperti studi Hukum dikatakan memiliki keuntungan besar jika mereka memiliki keterampilan blockchain—atau setidaknya memiliki pemahaman tentang teknologi.
Ilmu data berusaha mengekstrak pengetahuan dan insight dari data terstruktur dan tidak terstruktur. Bidang ini mencakup statistik, analisis data, machine learning dan metode canggih lainnya yang digunakan untuk memahami dan menganalisis proses aktual menggunakan data.
Data sering disebut sebagai “minyak baru” dalam istilah ekonomi, itulah sebabnya perusahaan-perusahaan terkemuka termasuk GAFA (Google, Amazon, Facebook, dan Apple) menguasai sejumlah besar data. Beberapa aplikasi umum ilmu data terlihat dalam protokol mesin internet, iklan digital, dan layanan rekomendasi. Analisis data, aspek kunci dari ilmu data, telah ditemukan relevan dalam industri perawatan kesehatan untuk melacak perawatan pasien dan aliran peralatan; dalam perjalanan dan permainan untuk meningkatkan pengalaman konsumen; untuk manajemen energi serta banyak sektor lainnya.
Ada juga permintaan yang tampaknya tak terpenuhi untuk ilmuwan data yang dapat memberikan lebih banyak insight dengan data dan membantu memecahkan lebih banyak masalah. Ini bahkan lebih jelas ketika mempertimbangkan big data, aspek lanjutan dari ilmu data yang berhubungan dengan sejumlah besar data yang tidak dapat ditangani oleh metode pemrosesan data tradisional.
Berbeda dengan bidang seperti Fintech, kesehatan, dan rantai pasok di mana blockchain kini sudah sangat familiar, teknologi ini belum dieksplorasi secara mendalam dalam aspek-aspek ilmu data. Bagi sebagian orang, hubungan antara konsep tidak jelas jika tidak ada.
Sebagai permulaan, baik blockchain dan ilmu data berhubungan dengan data—ilmu data menganalisis data untuk insight yang dapat ditindaklanjuti, sementara blockchain merekam dan memvalidasi data. Keduanya menggunakan algoritme yang dibuat untuk mengatur interaksi dengan berbagai segmen data. Tema umum yang akan segera Anda perhatikan adalah ini, “ilmu data untuk prediksi; blockchain untuk integritas data.”
Ilmu data, sama seperti kemajuan teknologi apa pun memiliki tantangan dan keterbatasan tersendiri yang ketika ditangani akan melepaskan kemampuan penuhnya. Beberapa tantangan utama untuk ilmu data termasuk data yang tidak dapat diakses, masalah privasi data, dan data kotor.
Kontrol data kotor (atau informasi yang salah) adalah salah satu area di mana teknologi blockchain dapat berdampak positif pada bidang ilmu data dalam ukuran yang tidak sedikit. Menurut survei 2017 terhadap 16.000 profesional data, dimasukkannya data kotor seperti data duplikat atau salah diidentifikasi sebagai tantangan terbesar bagi ilmu data. Melalui algoritme konsensus terdesentralisasi dan kriptografi, blockchain memvalidasi data sehingga hampir tidak mungkin untuk dimanipulasi karena sejumlah besar daya komputasi yang akan dibutuhkan.
Sekali lagi melalui sistem desentralisasi, teknologi blockchain memastikan keamanan dan privasi data. Sebagian besar data disimpan di server terpusat yang sering menjadi target penyerang siber; beberapa laporan peretasan dan pelanggaran keamanan menunjukkan tingkat ancaman. Blockchain, di sisi lain, mengembalikan kontrol data kepada individu yang menghasilkan data sehingga menjadi tugas berat bagi penjahat siber untuk mengakses dan memanipulasi data dalam skala besar.
Jika kuantitasnya besar, kata Maria Weinberger dari Janexter, blockchain adalah kualitasnya. Ini mengikuti pemahaman bahwa blockchain difokuskan pada memvalidasi data sementara ilmu data atau big data melibatkan membuat prediksi dari sejumlah besar data.
Blockchain telah membawa cara baru untuk mengelola dan beroperasi dengan data—tidak lagi dalam perspektif pusat di mana semua data harus disatukan tetapi dengan cara terdesentralisasi di mana data dapat dianalisis langsung dari tepi perangkat individu. Blockchain terintegrasi dengan teknologi canggih lainnya, seperti solusi cloud, kecerdasan buatan (AI) dan Internet of Things (IoT).
Selain itu, data yang divalidasi yang dihasilkan melalui teknologi blockchain datang terstruktur dan lengkap ditambah fakta bahwa itu tidak dapat diubah seperti yang kami sebutkan sebelumnya. Area penting lainnya di mana data yang dihasilkan blockchain menjadi dorongan untuk big data adalah dalam integritas data karena blockchain memastikan asal data melalui rantai tertautnya.
Setidaknya ada lima cara spesifik data blockchain dapat membantu ilmuwan data secara umum.
Data yang direkam di blockchain dapat dipercaya karena mereka harus melalui proses verifikasi yang memastikan kualitasnya. Ini juga memberikan transparansi, karena aktivitas dan transaksi yang terjadi di jaringan blockchain dapat dilacak.
Tahun lalu, Lenovo memamerkan contoh penggunaan teknologi blockchain ini untuk deteksi dokumen dan formulir penipuan. Raksasa PC ini menggunakan teknologi blockchain untuk memvalidasi dokumen fisik yang dikodekan dengan tanda tangan digital. Tanda tangan digital diproses oleh komputer dan keaslian dokumen diverifikasi melalui catatan blockchain.
Sering kali, integritas data dipastikan ketika rincian asal dan interaksi mengenai blok data disimpan di blockchain dan secara otomatis diverifikasi (atau divalidasi) sebelum dapat ditindaklanjuti.
Karena blockchain menggunakan algoritme konsensus untuk memverifikasi transaksi, tidak mungkin bagi satu entitas untuk mengancam jaringan data. Sebuah node (atau unit) yang mulai bertindak tidak normal dapat dengan mudah diidentifikasi dan dihapus dari jaringan.
Karena jaringan sangat terdistribusi, hampir tidak mungkin bagi satu pihak untuk menghasilkan daya komputasi yang cukup untuk mengubah kriteria validasi dan memungkinkan data yang tidak diinginkan dalam sistem. Untuk mengubah aturan blockchain, mayoritas node harus dikumpulkan bersama untuk membuat konsensus. Ini tidak akan mungkin dicapai oleh satu aktor buruk.
Data blockchain, seperti jenis data lainnya, dapat dianalisis untuk mengungkapkan insight berharga tentang perilaku, tren dan dengan demikian dapat digunakan untuk memprediksi hasil di masa depan. Terlebih lagi, blockchain menyediakan data terstruktur yang dikumpulkan dari individu atau perangkat individu.
Dalam analisis prediktif, ilmuwan data mendasarkan pada kumpulan data besar untuk menentukan dengan akurasi yang baik hasil acara sosial seperti preferensi pelanggan, nilai seumur hidup pelanggan, harga dinamis, dan tingkat churn yang berkaitan dengan bisnis. Namun, ini tidak terbatas pada insight bisnis karena hampir semua peristiwa dapat diprediksi dengan analisis data yang tepat apakah itu sentimen sosial atau penanda investasi.
Dan karena sifat blockchain yang terdistribusi dan kekuatan komputasi besar yang tersedia melaluinya, ilmuwan data bahkan di organisasi yang lebih kecil dapat melakukan tugas analisis prediktif yang ekstensif. Para ilmuwan data ini dapat menggunakan kekuatan komputasi beberapa ribu komputer yang terhubung pada jaringan blockchain sebagai layanan berbasis cloud untuk menganalisis hasil sosial dalam skala yang tidak mungkin dilakukan.
Seperti yang telah ditunjukkan dalam sistem keuangan dan pembayaran, blockchain memungkinkan transaksi lintas batas secara real-time. Beberapa bank dan inovator fintech sekarang menjelajahi blockchain karena menawarkan penyelesaian cepat—sebenarnya, real-time—dalam jumlah besar terlepas dari hambatan geografis.
Dengan cara yang sama, organisasi yang memerlukan analisis data real-time dalam skala besar dapat menggunakan sistem yang mendukung blockchain untuk mencapainya. Dengan blockchain, bank dan organisasi lain dapat mengamati perubahan data secara real time sehingga memungkinkan untuk membuat keputusan cepat—apakah itu untuk memblokir transaksi yang mencurigakan atau melacak aktivitas abnormal.
Dalam hal ini, data yang diperoleh dari studi data dapat disimpan dalam jaringan blockchain. Dengan cara ini, tim proyek tidak mengulangi analisis data yang sudah dilakukan oleh tim lain atau salah menggunakan kembali data yang sudah digunakan. Selain itu, blockchain platform dapat membantu ilmuwan data memonetisasi pekerjaan mereka, mungkin dengan hasil analisis perdagangan yang disimpan di blockchain platform.
Blockchain, seperti yang telah dicatat, sedang dalam tahap awal meskipun mungkin tidak tampak demikian karena hype yang didapat teknologi dalam waktu singkat. Orang akan berharap bahwa ketika teknologi matang dan ada lebih banyak inovasi di sekitarnya, contoh penggunaan yang lebih konkret akan diidentifikasi dan dieksplorasi—ilmu data menjadi salah satu bidang yang akan mendapat manfaat dari ini.
Meskipun demikian, beberapa tantangan telah diajukan tentang dampaknya dalam ilmu data terutama dalam big data yang membutuhkan sejumlah besar data untuk ditangani. Satu kekhawatiran adalah bahwa aplikasi blockchain dalam hal ini akan sangat mahal untuk dikejar. Ini karena penyimpanan data pada blockchain mahal dibandingkan dengan cara tradisional. Blok menangani jumlah data yang relatif kecil dibandingkan dengan volume besar data yang dikumpulkan per detik untuk big data dan tugas analisis data lainnya.
Bagaimana blockchain berkembang untuk mengatasi kekhawatiran ini dan berlanjut untuk mengganggu ruang ilmu data akan sangat menarik, karena, seperti yang kita lihat, teknologi ini memiliki potensi besar untuk mengubah cara kita mengelola dan menggunakan data.
Dari waktu ke waktu, kami mengundang para pemimpin pemikiran industri, pakar akademis, dan mitra ke blog Blockchain Pulse untuk berbagi pendapat dan insight mereka tentang tren terkini di blockchain. Meskipun pendapat dalam postingan blog ini adalah milik mereka sendiri dan tidak selalu mencerminkan pandangan IBM, blog ini berupaya untuk menyambut semua sudut pandang ke dalam percakapan.
