Panduan Arsitektur IBM® untuk Data Fabric

Ikhtisar

Data Fabric adalah pola arsitektur yang dirancang untuk memperkuat pemanfaatan data di seluruh organisasi, terlepas dari format data, sumber data, lokasi data, maupun penggunaan data. Berbagai aspek siklus hidup data yang dicakup oleh Data Fabric mulai dari akses hingga konsumsi meliputi penemuan data, tata kelola data, kualitas data, klasifikasi data, asosiasi konteks bisnis, garis keturunan data, layanan mandiri, serta operasionalisasi data untuk memastikan bahwa data yang tepat tersedia di tempat dan waktu yang tepat. Klik untuk melihat panduan tambahan.

Arsitektur Referensi untuk Data Fabric merupakan template yang dapat digunakan perusahaan sebagai panduan untuk membantu menerapkan berbagai komponen Data Fabric di lingkungan masing-masing. Arsitektur referensi Data Fabric memiliki lima modul utama, yaitu Impor Data Meta, Pengayaan Data Meta, Katalogisasi Data Meta, Kurasi dan Transformasi Data, serta Konsumsi Data. Modul-modul ini menjadi kunci untuk mewujudkan manfaat Data Fabric yang telah disebutkan sebelumnya.

Arsitektur referensi ini mencakup komponen kunci, langkah-langkah yang terlibat, serta keputusan arsitektur untuk setiap modul yang membantu mewujudkan tujuan dari kelima modul tersebut. Selain itu, arsitektur ini juga mencakup berbagai opsi teknologi yang tersedia di lingkungan IBM® untuk mengimplementasikan komponen dan langkah-langkahnya. Untuk modul Konsumsi Data, pola konsumsi generik dicakup dengan asumsi bahwa perincian setiap contoh penggunaan konsumsi akan dijelaskan dalam arsitektur referensi masing-masing untuk setiap contoh penggunaan.

Yang juga menarik adalah Arsitektur Referensi Data dan AI secara keseluruhan.

Diagram yang menggambarkan arsitektur data fabric

Ringkasan IBM® Z

IBM® Z Systems Data Fabric Reference Architecture merupakan spesialisasi dari pola arsitektur IBM® Data and Analytics Data Fabric yang lebih luas, yang dirancang untuk memperkuat pemanfaatan data di seluruh organisasi tanpa bergantung pada format data, sumber data, lokasi data, maupun penggunaan data. Berbagai aspek siklus hidup data mulai dari akses hingga konsumsi yang dicakup oleh Data Fabric meliputi penemuan data, tata kelola data, kualitas data, klasifikasi data, asosiasi konteks bisnis, garis keturunan data, layanan mandiri, serta operasionalisasi data untuk memastikan bahwa data yang tepat tersedia di tempat dan waktu yang tepat. Lihat panduan tambahan:

Dengan mengkhususkan pola arsitektur Data Fabric yang lebih luas dalam konteks sistem IBM® Z Systems, pembahasan ini menelusuri dua aspek utama:

• Menangani tata kelola dan akses ke berbagai sumber data di IBM® Z Systems (misalnya IMS, Db2, …)
• Linux pada IBM® Z atau LinuxONE (MongoDB, …), dan
• Menerapkan komponen arsitektur Enterprise-wide Data Fabric pada IBM® Z Systems serta Linux pada IBM® Z/LinuxONE. Solusi ini mencakup komponen yang berjalan pada ZSystems/LinuxONE dan/atau pada sistem eksternal.

Arsitektur Referensi untuk Data Fabric merupakan template yang dapat digunakan perusahaan sebagai panduan untuk membantu menerapkan berbagai komponen Data Fabric di lingkungan masing-masing. Arsitektur referensi Data Fabric memiliki lima modul utama - yaitu Impor Data Meta, Pengayaan Data Meta, Katalogisasi Data Meta, Kurasi dan Transformasi Data, serta Konsumsi Data. Modul-modul ini menjadi kunci untuk mewujudkan manfaat Data Fabric yang telah disebutkan sebelumnya.

Arsitektur referensi ini mencakup komponen kunci, langkah-langkah yang terlibat, serta keputusan arsitektur untuk setiap modul yang membantu mewujudkan tujuan dari kelima modul tersebut. Selain itu, arsitektur ini juga mencakup berbagai opsi teknologi yang tersedia di lingkungan IBM® untuk mengimplementasikan komponen dan langkah-langkahnya. Untuk modul Konsumsi Data, pola konsumsi generik dicakup dengan asumsi bahwa perincian setiap contoh penggunaan konsumsi akan dijelaskan dalam arsitektur referensi masing-masing untuk setiap contoh penggunaan.

Modernisasi aplikasi untuk arsitektur IBM® Z memberikan rincian lebih lanjut mengenai pola arsitektur modern yang memungkinkan akses yang lebih mudah ke data system-of-record (SOR) pada IBM® Z dan LinuxONE, serta berbagai pola integrasi yang berfokus pada data. Hal ini penting untuk memperoleh insight guna menghasilkan nilai bisnis berbasis data, karena aplikasi berbagi data system-of-record (SOR) baik melalui akses langsung, replikasi, caching, maupun konsep virtualisasi data yang menggabungkan aset data di seluruh perusahaan.

Yang juga menarik adalah keseluruhan Arsitektur Referensi Data, Analitik, dan AI:

Diagram yang menggambarkan arsitektur referensi data fabric

Nama

Masalah atau Pernyataan Masalah

Asumsi

Motivasi

Lokasi , gravitasi, dan kedaulatan data

AD01

Kontrol yang tepat serta metode akses data harus tersedia untuk mendukung persyaratan ketersediaan dan kepatuhan terhadap regulasi.

Perpindahan dan replikasi data harus diminimalkan untuk meningkatkan kesederhanaan, tata kelola, efisiensi biaya, serta kepatuhan terhadap regulasi, sekaligus tetap menyediakan platform yang efektif, tangguh, dan fleksibel untuk analitik (termasuk analitik mendalam, decision optimization, dan beban kerja AI).

Metode implementasi yang dipilih akan memiliki dampak langsung terhadap biaya, kelayakan dalam mendukung persyaratan latensi, kepatuhan terhadap regulasi, serta kepuasan pelanggan secara keseluruhan.

Kontrol yang tepat serta metode akses data harus tersedia untuk mendukung persyaratan ketersediaan dan kepatuhan terhadap regulasi.

Pergerakan dan replikasi data harus diminimalkan untuk meningkatkan kesederhanaan, tata kelola, efisiensi biaya, serta kepatuhan terhadap regulasi, sekaligus menyediakan platform yang efektif, tangguh, dan fleksibel untuk analitik (termasuk analitik mendalam, decision optimization, dan AI workloads).

Metode implementasi yang dipilih akan memiliki dampak langsung terhadap biaya, kelayakan dalam mendukung persyaratan latensi, kepatuhan terhadap regulasi, serta kepuasan pelanggan secara keseluruhan.

Berdasarkan lokasi data, tentukan apakah data perlu dipindahkan atau diakses secara virtual sesuai dengan beban kerja, latensi, dan pertimbangan regulasi, pada waktu yang tepat.

Organisasi dan hubungan katalog pengetahuan

AD02

Organisasi mungkin perlu mendukung keberadaan beberapa katalog, tergantung pada berbagai jenis persyaratan, misalnya dalam ekosistem hybrid multi-cloud di mana katalog perlu terhubung secara virtual. Struktur katalog selanjutnya dapat didasarkan pada pertimbangan Proyek, LOB, dan Perusahaan. Selain itu, mungkin juga terdapat kebutuhan akan lingkungan eksperimen atau sandbox, misalnya untuk contoh pengembangan dalam suatu organisasi.

Instansiasi katalog harus diimplementasikan dengan cara yang mendukung kebutuhan organisasi tanpa menjadi terlalu rumit untuk dikelola maupun dinavigasi.

Pilihan katalog akan berdampak pada kemampuan organisasi untuk memanfaatkan data di seluruh ekosistem perusahaan serta ekosistem mitra bisnis yang berpotensi.

Aset dan hubungan data, termasuk pengambilan serta pengayaan metadata

AD03

Aset data sedang dibuat dan dikonsumsi dengan laju yang terus meningkat. Organisasi tidak lagi dapat bergantung pada proses manual atau otomatisasi yang longgar untuk mendukung penangkapan serta katalogisasi aset data dan metadata terkaitnya.

Otomatisasi merupakan kunci untuk menangkap dan memperkaya metadata yang dihasilkan untuk berbagai aset data secara tepat waktu.

Tanpa otomatisasi, organisasi tidak akan mampu mempertahankan katalog aset data yang tetap mutakhir dan dapat digunakan, yang pada akhirnya akan menghambat kemampuan organisasi untuk memanfaatkan aset data mereka dalam melanjutkan kemajuan menuju organisasi berbasis data.

Memastikan metode transformasi dan kurasi yang tepat berdasarkan beban kerja yang ada serta mempertimbangkan persyaratan non-fungsional

AD04

Organisasi akan membutuhkan berbagai jenis implementasi (mis. waktu nyata, nyaris seketika (streaming), serta batch (mikro/mini/besar) untuk beban kerja kecil, menengah, besar, dan sangat besar yang memerlukan transformasi dan kurasi.

Terlepas dari jalur implementasi yang dipilih, transformasi dan kurasi data harus tetap konsisten agar fungsi ilmu data, analitik, dan pelaporan dapat menghasilkan hasil yang akurat.

Memilih metode transformasi data dan kurasi yang tepat akan memastikan bahwa organisasi dapat mencapai tujuan mereka dalam berbagai contoh penggunaan, termasuk AI yang dapat dipercaya, Customer 360, dan pengembangan insight.

Sumber daya

Apa itu Arsitektur Data Fabric

Baca tentang enam kemampuan inti dari arsitektur data fabric di postingan blog ini.

Data dan Analisis Data Fabric