Apa itu pemodelan data?

Kantor Pribadi Kecil Berwarna-Warni

Apa itu pemodelan data?

Pemodelan data adalah proses menciptakan representasi visual dari keseluruhan sistem informasi atau bagian-bagiannya untuk mengkomunikasikan hubungan antara titik data dan struktur.

Tujuan pemodelan data adalah menggambarkan jenis data yang digunakan dan disimpan dalam sistem, hubungan antar tipe data, cara data dikelompokkan dan diatur, serta format dan atributnya.

Model data dibangun di sekitar kebutuhan bisnis. Aturan dan persyaratan ditentukan sejak awal melalui masukan pemangku kepentingan agar dapat dimasukkan ke dalam desain sistem baru atau disesuaikan dalam iterasi yang sudah ada.

Data dapat dimodelkan pada berbagai tingkat abstraksi. Proses dimulai dengan mengumpulkan informasi mengenai kebutuhan bisnis dari pemangku kepentingan dan pengguna akhir. Aturan tersebut kemudian diterjemahkan ke dalam struktur data untuk membentuk desain basis data yang konkret. Model data dapat dianalogikan sebagai peta jalan atau cetak biru yang memudahkan pemahaman lebih mendalam tentang sistem yang sedang dirancang.

Pemodelan data menggunakan skema standar dan teknik formal. Hal ini memberikan cara yang konsisten dan dapat diprediksi untuk mendefinisikan serta mengelola sumber daya data di seluruh organisasi, bahkan lintas organisasi.

Idealnya, model data adalah dokumen hidup yang berkembang mengikuti perubahan kebutuhan bisnis. Model ini berperan penting dalam mendukung proses bisnis serta perencanaan arsitektur dan strategi TI. Model data dapat dibagikan dengan vendor, mitra, atau rekan industri.

Berita teknologi terbaru, didukung oleh insight dari pakar

Tetap terinformasi tentang tren industri yang paling penting—dan menarik—tentang AI, otomatisasi, data, dan di luarnya dengan buletin Think. Lihat Pernyataan Privasi IBM®.

Terima kasih! Anda telah berlangganan.

Langganan Anda akan disediakan dalam bahasa Inggris. Anda akan menemukan tautan berhenti berlangganan di setiap buletin. Anda dapat mengelola langganan atau berhenti berlangganan di sini. Lihat Pernyataan Privasi IBM® kami untuk informasi lebih lanjut.

Jenis-jenis model data

Seperti proses desain lainnya, desain basis data dan sistem informasi dimulai dari tingkat abstraksi tinggi lalu menjadi semakin konkret dan spesifik. Model data secara umum dapat dibagi menjadi tiga categories, yang bervariasi sesuai dengan tingkat abstraksinya. Prosesnya akan dimulai dari model konseptual, berlanjut ke model logis, dan diakhiri dengan model fisik. Setiap jenis model data dibahas secara lebih rinci di bagian selanjutnya:

Model data konseptual

Model ini juga disebut sebagai model domain dan menawarkan gambaran besar tentang apa yang akan ada di dalam sistem, bagaimana sistem akan diorganisir dan aturan bisnis yang terlibat. Model konseptual biasanya dibuat sebagai bagian dari proses pengumpulan persyaratan proyek awal. Biasanya, ini mencakup kelas entitas (mendefinisikan jenis-jenis hal yang penting bagi bisnis untuk direpresentasikan dalam model data), karakteristik dan batasannya, hubungan di antara mereka, dan persyaratan keamanan dan integritas data yang relevan. Notasi apa pun biasanya sederhana.

Bagan Pemodelan Data Konseptual

Model data logis

Model ini tidak terlalu abstrak dan memberikan detail yang lebih besar tentang konsep dan hubungan dalam domain yang sedang Anda pertimbangkan. Salah satu dari beberapa sistem notasi pemodelan data formal diikuti. Ini menunjukkan atribut data, seperti tipe data dan panjang yang sesuai, dan menunjukkan hubungan di antara entitas. Model data logis tidak menentukan persyaratan sistem teknis apa pun. Tahap ini sering kali dihilangkan dalam praktik tangkas atau DevOps. Model data logis sangat berguna dalam lingkungan implementasi yang bersifat prosedural atau untuk proyek yang secara alami berorientasi pada data, seperti desain gudang data atau pengembangan sistem pelaporan.

Bagan pemodelan data logis

Model data fisik

Model data fisik menyediakan skema tentang bagaimana data akan disimpan secara fisik dalam basis data. Dengan demikian, ini adalah yang paling tidak abstrak dari semuanya. Model data fisik menawarkan desain akhir yang siap diimplementasikan sebagai basis data relasional, termasuk tabel asosiatif yang menggambarkan hubungan antar entitas serta kunci utama dan kunci asing yang mempertahankan hubungan tersebut. Model data fisik dapat mencakup properti khusus sistem manajemen basis data (DBMS), termasuk penyetelan kinerja.

Bagan pemodelan data fisik

Proses pemodelan data

Sebagai disiplin ilmu, pemodelan data mendorong para pemangku kepentingan untuk mengevaluasi pemrosesan dan penyimpanan data secara detail. Teknik pemodelan data memiliki konvensi berbeda yang menentukan simbol yang digunakan untuk merepresentasikan data, tata letak model, dan cara menyampaikan kebutuhan bisnis. Semua pendekatan menyediakan alur kerja formal dengan urutan tugas yang dijalankan secara berulang. Alur kerja tersebut umumnya terlihat seperti ini:

  1. Identifikasi entitas. Proses pemodelan data dimulai dengan mengidentifikasi objek, peristiwa, atau konsep yang akan direpresentasikan dalam kumpulan data yang akan dimodelkan. Setiap entitas harus kohesif dan terpisah secara logis dari yang lain.
  2. Identifikasi properti kunci dari setiap entitas. Setiap jenis entitas dibedakan karena memiliki satu atau lebih properti unik yang disebut atribut. Misalnya, entitas “pelanggan” dapat memiliki atribut seperti nama depan, nama belakang, nomor telepon, dan salam, sementara entitas “alamat” dapat mencakup nama jalan, nomor, kota, negara bagian, negara, dan kode pos.
  3. Mengidentifikasi hubungan antar entitas. Draf awal model data menentukan jenis hubungan yang dimiliki setiap entitas satu sama lain. Dalam contoh tersebut, setiap pelanggan “tinggal di” sebuah alamat. Jika model diperluas dengan entitas “pesanan,” maka setiap pesanan akan dikirim dan ditagihkan ke alamat yang sama. Hubungan semacam ini biasanya didokumentasikan menggunakan UML (Unified Modeling Language).
  4. Petakan atribut ke entitas secara lengkap. Hal ini akan memastikan model mencerminkan cara bisnis menggunakan data. Beberapa pola pemodelan data formal umum digunakan. Pengembang berorientasi objek sering memakai pola analisis atau pola desain, sementara pemangku kepentingan dari domain bisnis lain dapat memilih pola lainnya.
  5. Tetapkan kunci sesuai kebutuhan dan tentukan tingkat normalisasi yang menyeimbangkan pengurangan redundansi dengan kebutuhan kinerja. Normalisasi adalah teknik pengaturan model data (dan basis data yang diwakilinya) dengan menggunakan pengidentifikasi numerik yang disebut kunci untuk merepresentasikan hubungan antar data tanpa mengulangi data. Misalnya, jika setiap pelanggan memiliki kunci unik, kunci tersebut dapat ditautkan ke alamat dan riwayat pesanan tanpa perlu mengulang informasi tersebut di tabel pelanggan. Normalisasi cenderung mengurangi jumlah ruang penyimpanan yang dibutuhkan basis data, tetapi dapat mengorbankan kinerja kueri.
  6. Menyelesaikan dan memvalidasi model data. Pemodelan data adalah proses berulang yang harus diulang dan disempurnakan saat kebutuhan bisnis berubah.
Mixture of Experts | 12 Desember, episode 85

Decoding AI: Rangkuman Berita Mingguan

Bergabunglah dengan panel insinyur, peneliti, pemimpin produk, dan sosok kelas dunia lainnya selagi mereka mengupas tuntas tentang AI untuk menghadirkan berita dan insight terbaru seputar AI.

jenis pemodelan data

Pemodelan data berkembang seiring perkembangan sistem manajemen basis data, dengan jenis model yang semakin kompleks mengikuti meningkatnya kebutuhan penyimpanan data bisnis. Berikut adalah beberapa jenis model:

  • Model data hierarkis merepresentasikan hubungan satu-ke-banyak dalam struktur mirip pohon. Dalam model ini, setiap catatan memiliki satu root atau induk yang terhubung ke satu atau lebih tabel anak. Pendekatan ini diimplementasikan dalam IBM® Information Management System (IMS), yang diperkenalkan pada 1966 dan dengan cepat diadopsi luas, terutama di sektor perbankan. Meski kurang efisien dibanding model basis data yang lebih modern, model hierarkis masih digunakan dalam sistem Extensible Markup Language (XML) dan sistem informasi geografis (GIS).
  • Model data relasional awalnya diusulkan oleh peneliti IBM® E.F. Codd pada tahun 1970. Model relasional masih digunakan hingga kini dalam berbagai basis data relasional yang umum di lingkungan komputasi perusahaan. Pemodelan data relasional tidak memerlukan pemahaman mendetail tentang cara penyimpanan fisik data. Dalam model ini, segmen data dihubungkan secara eksplisit melalui tabel, sehingga mengurangi kompleksitas basis data.

Basis data relasional sering kali menggunakan bahasa kueri terstruktur (SQL) untuk manajemen data. Basis data ini efektif menjaga integritas dan meminimalkan redundansi. Sistem ini sering digunakan dalam sistem point-of-sale, serta untuk jenis pemrosesan transaksi lainnya.

  • Model data entity-relationship (ER) menggunakan diagram formal untuk merepresentasikan hubungan antar entitas dalam basis data. Berbagai alat pemodelan ER digunakan oleh arsitek data untuk membuat peta visual yang menggambarkan tujuan desain basis data.
  • Model data berorientasi objek mulai populer seiring meningkatnya pemrograman berorientasi objek pada pertengahan 1990-an. “Objek” dalam model ini merupakan abstraksi entitas dunia nyata. Objek dikelompokkan dalam hierarki kelas, dan memiliki fitur terkait. Basis data berorientasi objek dapat tetap menggunakan tabel, tetapi juga mendukung hubungan data yang lebih kompleks. Pendekatan ini digunakan dalam basis data multimedia, hypertext, dan berbagai contoh penggunaan lainnya.
  • Model data dimensi dikembangkan oleh Ralph Kimball dan dirancang untuk mengoptimalkan kecepatan pengambilan data dalam analitik gudang data. Jika model relasional dan ER menekankan efisiensi penyimpanan, model dimensi justru menambah redundansi untuk memudahkan pengambilan dan pelaporan data. Pemodelan ini biasanya digunakan di seluruh sistem OLAP.

Model data dimensi yang populer meliputi skema bintang, di mana data diatur menjadi fakta (item terukur) dan dimensi (informasi referensi), dengan setiap fakta dikelilingi oleh dimensi terkait membentuk pola seperti bintang. Lainnya adalah lain adalah skema kepingan salju, yang mirip skema bintang tetapi menambahkan lapisan dimensi tambahan sehingga pola percabangannya lebih kompleks.

Manfaat pemodelan data

Pemodelan data memudahkan pengembang, arsitek data, analis bisnis, dan pemangku kepentingan lainnya untuk melihat dan memahami hubungan antara data dalam basis data atau gudang data. Selain itu, dapat:

  • Mengurangi kesalahan dalam pengembangan perangkat lunak dan basis data.
  • Tingkatkan konsistensi dalam dokumentasi dan desain sistem di seluruh perusahaan.
  • Meningkatkan kinerja aplikasi dan basis data.
  • Memudahkan pemetaan data di seluruh organisasi.
  • Tingkatkan komunikasi antara pengembang dan tim intelijen bisnis.
  • Kemudahan dan mempercepat proses desain basis data pada tingkat konseptual, logis dan fisik.

Alat pemodelan data

Banyak solusi rekayasa perangkat lunak berbantuan komputer (CASE) komersial dan sumber terbuka banyak digunakan saat ini, termasuk beberapa pemodelan data, diagram, dan alat visualisasi. Berikut adalah beberapa contoh:

  • erwin Data Modeler adalah alat pemodelan data berdasarkan bahasa pemodelan data Integrasi DEFinition for information modeling (IDEF1X) yang kini mendukung metodologi notasi lainnya, termasuk pendekatan dimensi.
  • Enterprise Architect adalah alat pemodelan dan desain visual yang mendukung pemodelan sistem dan arsitektur informasi perusahaan serta aplikasi perangkat lunak dan basis data. Ini didasarkan pada bahasa dan standar berorientasi objek.
  • ER/Studio adalah perangkat lunak desain basis data yang kompatibel dengan berbagai sistem manajemen basis data populer. Mendukung pemodelan data relasional serta dimensi.
  • Alat bantu pemodelan data gratis termasuk solusi sumber terbuka seperti Open ModelSphere.
Solusi terkait
Alat dan solusi ilmu data

Gunakan alat dan solusi ilmu data untuk mengungkap pola dan menyusun prediksi dengan menggunakan data, algoritma, machine learning, dan teknik AI.

Jelajahi solusi ilmu data
IBM Cognos Analytics

Memperkenalkan Cognos Analytics 12.0, wawasan yang didukung AI untuk pengambilan keputusan yang lebih baik.

Jelajahi Cognos Analytics
Layanan konsultasi data dan analitik

Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.

Temukan layanan analitik
Ambil langkah selanjutnya

Gunakan alat dan solusi ilmu data untuk mengungkap pola dan menyusun prediksi dengan menggunakan data, algoritma, machine learning, dan teknik AI.

Jelajahi solusi ilmu data Jelajahi layanan analitik