Mendorong perusahaan agen Tonton Keynote Think

Apa itu pemodelan data?

Apa itu pemodelan data?

Pemodelan data adalah proses menciptakan representasi visual dari keseluruhan sistem informasi atau bagian-bagiannya untuk mengkomunikasikan hubungan antara titik data dan struktur.

Tujuan dari pemodelan data adalah untuk menggambarkan jenis data yang digunakan dan disimpan dalam sistem dan hubungan antara tipe data ini. Pemodelan ini juga menjelaskan cara data dapat dikelompokkan dan diatur, bersama dengan format dan atributnya.

Model data dibangun di sekitar kebutuhan bisnis. Aturan dan persyaratan ditentukan sejak awal melalui masukan pemangku kepentingan agar dapat dimasukkan ke dalam desain sistem baru atau disesuaikan dalam iterasi yang sudah ada.

Data dapat dimodelkan pada berbagai tingkat abstraksi. Proses dimulai dengan mengumpulkan informasi mengenai kebutuhan bisnis dari pemangku kepentingan dan pengguna akhir. Aturan tersebut kemudian diterjemahkan ke dalam struktur data untuk membentuk desain basis data yang konkret. Model data dapat dianalogikan sebagai peta jalan atau cetak biru yang memudahkan pemahaman lebih mendalam tentang sistem yang sedang dirancang.

Pemodelan data menggunakan skema standar dan teknik formal. Pendekatan ini menghadirkan cara yang konsisten dan dapat diprediksi untuk menentukan serta mengelola sumber daya data di seluruh organisasi, bahkan melampaui batas organisasi itu sendiri.

Idealnya, model data adalah dokumen hidup yang berkembang seiring dengan perubahan kebutuhan bisnis. Model ini memainkan peran penting dalam mendukung proses bisnis dan perencanaan arsitektur dan strategi TI. Model data dapat dibagikan dengan vendor, mitra, atau rekan industri.

Jenis-jenis model data

Seperti proses desain apa pun, desain basis data dan sistem informasi dimulai pada tingkat abstraksi yang tinggi dan menjadi lebih konkret dan spesifik. Model data umumnya dapat dibagi menjadi tiga kategori, yang bervariasi sesuai dengan tingkat abstraksi mereka. Prosesnya akan dimulai dengan model konseptual, maju ke model logis dan diakhiri dengan model fisik. Setiap jenis model data dibahas secara lebih rinci di bagian selanjutnya:

Model data konseptual

Model ini juga disebut sebagai model domain dan menawarkan pandangan tingkat tinggi tentang apa yang akan dikandung sistem, bagaimana itu akan diatur, dan business rules mana yang terlibat. Model konseptual dibuat sebagai bagian dari proses pengumpulan persyaratan proyek awal.

Biasanya, model ini termasuk kelas entitas (mendefinisikan jenis hal yang penting bagi bisnis untuk diwakili dalam model data), karakteristik dan kendala mereka, dan hubungan di antara mereka. Model ini juga mencakup persyaratan keamanan dan integritas data yang relevan. Berbagai elemen ini secara kolektif mendefinisikan bagaimana data terstruktur dan diatur dalam model. Notasi apa pun biasanya sederhana.

Bagan Pemodelan Data Konseptual

Model data logis

Pendekatan ini lebih konkret dan menyediakan rincian lebih mendalam tentang konsep serta relasi dalam domain yang dipertimbangkan. Prosesnya mengikuti salah satu sistem notasi formal untuk pemodelan data. Notasi ini menunjukkan atribut data, seperti tipe data dan panjang yang sesuai, dan menunjukkan hubungan antar entitas.

Model data logis tidak menentukan persyaratan sistem teknis apa pun. Tahap ini sering kali dihilangkan dalam praktik yang tangkas atau DevOps . Model data logis dapat berguna dalam lingkungan implementasi yang sangat prosedural, atau untuk proyek yang berorientasi data secara alami, seperti desain gudang data atau pengembangan sistem pelaporan.

Bagan pemodelan data logis

Model data fisik

Model ini menyediakan skema bagaimana data akan disimpan secara fisik dalam basis data. Dengan demikian, model ini adalah yang paling tidak abstrak. Solusi ini menawarkan desain akhir yang dapat diimplementasikan sebagai basis data relasional, termasuk tabel asosiatif yang menggambarkan hubungan antar entitas. Desain juga menentukan kunci utama dan kunci asing yang akan digunakan untuk mempertahankan hubungan tersebut. Model data fisik dapat mencakup properti spesifik sistem manajemen basis data (DBMS), termasuk penyelarasan kinerja.

Bagan pemodelan data fisik

Proses pemodelan data

Sebagai disiplin ilmu, pemodelan data mendorong para pemangku kepentingan untuk mengevaluasi pemrosesan dan penyimpanan data secara detail. Teknik pemodelan data memiliki konvensi berbeda yang menentukan simbol yang digunakan untuk merepresentasikan data, tata letak model, dan cara menyampaikan kebutuhan bisnis. Semua pendekatan menyediakan alur kerja formal dengan urutan tugas yang dijalankan secara berulang. Alur kerja tersebut umumnya terlihat seperti ini:

  1. Identifikasi entitas. Proses pemodelan data dimulai dengan mengidentifikasi objek, peristiwa, atau konsep yang akan direpresentasikan dalam kumpulan data yang akan dimodelkan. Setiap entitas harus kohesif dan terpisah secara logis dari yang lain.
  2. Identifikasi properti kunci dari setiap entitas. Setiap jenis entitas dapat dibedakan dari yang lain karena memiliki satu atau lebih properti unik, yang disebut atribut. Misalnya, entitas yang disebut “pelanggan” mungkin memiliki atribut seperti nama, nama keluarga, nomor telepon, dan salam yang diberikan. Entitas yang disebut “alamat” mungkin menyertakan nama dan nomor jalan, kota, negara bagian, negara, dan kode pos.
  3. Identifikasi hubungan antar entitas. Draf awal model data akan menentukan sifat hubungan yang dimiliki setiap entitas dengan yang lain. Dalam contoh sebelumnya, setiap pelanggan “tinggal di” sebuah alamat. Jika model itu diperluas untuk menyertakan entitas yang disebut “pesanan,” setiap pesanan akan dikirim dan ditagih ke satu alamat. Hubungan ini didokumentasikan melalui bahasa pemodelan terpadu (UML).
  4. Petakan atribut ke entitas secara lengkap. Pendekatan ini akan memastikan bahwa model mencerminkan bagaimana bisnis akan menggunakan data. Beberapa pola pemodelan data formal digunakan secara luas. Pengembang berorientasi objek sering kali menerapkan pola analisis atau pola desain, sementara pemangku kepentingan dari domain bisnis lain dapat beralih ke pola lain.
  5. Tetapkan kunci sesuai kebutuhan, dan putuskan tingkat normalisasi yang menyeimbangkan kebutuhan untuk mengurangi redundansi dengan persyaratan kinerja. Normalisasi adalah teknik dalam menyusun model data (dan basis data yang diwakili) dengan menetapkan identitas numerik atau kunci pada kelompok data untuk menggambarkan relasi antar data tanpa pengulangan informasi. Misalnya, jika pelanggan masing-masing diberi kunci, kunci itu dapat ditautkan ke alamat dan riwayat pesanan mereka tanpa harus mengulangi informasi ini dalam tabel nama pelanggan. Normalisasi mengurangi jumlah ruang penyimpanan yang dibutuhkan basis data, tetapi dapat mengorbankan kinerja kueri.
  6. Menyelesaikan dan memvalidasi model data. Pemodelan data adalah proses berulang yang harus diulang dan disempurnakan saat kebutuhan bisnis berubah.
AI Academy

Apakah manajemen data merupakan rahasia AI generatif?

Jelajahi mengapa data berkualitas tinggi sangat penting untuk keberhasilan penggunaan AI generatif.

jenis pemodelan data

Pemodelan data telah berkembang seiring dengan sistem manajemen basis data, dengan tipe model yang semakin kompleks seiring dengan meningkatnya kebutuhan penyimpanan data bisnis. Berikut adalah beberapa jenis model:

  • Model data hierarkis mewakili hubungan satu-ke-banyak dalam format yang mirip pohon. Dalam jenis model ini, setiap catatan memiliki satu akar atau induk, yang dipetakan ke satu atau lebih tabel turunan. Model ini diimplementasikan dalam IBM® Information Management System (IMS), yang diperkenalkan pada tahun 1966 dan dengan cepat digunakan secara luas, terutama di perbankan. Meskipun pendekatan ini kurang efisien dibanding model basis data yang lebih modern, metode ini masih digunakan dalam sistem Extensible Markup Language (XML) dan geographic information systems (GIS).
  • Model data relasional awalnya diusulkan oleh peneliti IBM® E.F. Codd pada tahun 1970. Berbagai model ini masih diimplementasikan hari ini di banyak basis data relasional yang berbeda yang biasa digunakan dalam komputasi perusahaan. Pemodelan data relasional tidak memerlukan pemahaman rinci tentang sifat fisik penyimpanan data yang digunakan. Di dalamnya, segmen data secara eksplisit digabungkan melalui tabel, mengurangi kompleksitas basis data.

Basis data relasional sering menggunakan bahasa kueri terstruktur (SQL) untuk manajemen data. Basis data ini bekerja dengan baik untuk menjaga integritas data dan meminimalkan redundansi. Basis data ini sering digunakan dalam sistem point-of-sale, serta untuk jenis pemrosesan transaksi lainnya.

  • Model data entity-relationship (ER) menggunakan diagram formal untuk merepresentasikan hubungan antar entitas dalam basis data. Berbagai alat pemodelan ER digunakan oleh arsitek data untuk membuat peta visual yang menggambarkan tujuan desain basis data.
  • Model data berorientasi objek mulai populer seiring meningkatnya pemrograman berorientasi objek pada pertengahan 1990-an. “Objek” dalam model ini merupakan abstraksi entitas dunia nyata. Objek dikelompokkan dalam hierarki kelas, dan memiliki fitur terkait. Basis data berorientasi objek dapat tetap menggunakan tabel, tetapi juga mendukung hubungan data yang lebih kompleks. Pendekatan ini digunakan dalam basis data multimedia, hypertext, dan berbagai contoh penggunaan lainnya.
  • Model data dimensi dikembangkan oleh Ralph Kimball, dan model ini dirancang untuk mengoptimalkan kecepatan pengambilan data untuk tujuan analitik di gudang data. Sementara model relasional dan ER menekankan penyimpanan yang efisien, model dimensi meningkatkan redundansi guna memudahkan pencarian informasi untuk pelaporan dan pengambilan. Pemodelan ini biasanya digunakan di seluruh sistem OLAP .

Model data dimensi dua yang umum adalah skema bintang, di mana data diatur ke dalam fakta (item terukur) dan dimensi (informasi referensi). Dalam model ini, setiap fakta dikelilingi oleh dimensi terkait dalam pola seperti bintang. Yang lainnya adalah skema kepingan salju, yang menyerupai skema bintang tetapi mencakup lapisan dimensi terkait lainnya, sehingga pola percabangannya menjadi lebih kompleks.

Manfaat pemodelan data

Pemodelan data memudahkan pengembang, data architect, analis bisnis, dan pemangku kepentingan lainnya untuk melihat dan memahami hubungan antara data dalam basis data atau gudang data. Selain itu, solusi ini juga dapat:

  • Mengurangi kesalahan dalam pengembangan perangkat lunak dan basis data.
  • Tingkatkan konsistensi dalam dokumentasi dan desain sistem di seluruh perusahaan.
  • Meningkatkan kinerja aplikasi dan basis data.
  • Memudahkan pemetaan data di seluruh organisasi.
  • Tingkatkan komunikasi antara pengembang dan tim intelijen bisnis.
  • Kemudahan dan mempercepat proses desain basis data pada tingkat konseptual, logis dan fisik.

Alat pemodelan data

Banyak solusi rekayasa perangkat lunak berbantuan komputer (CASE) komersial dan sumber terbuka banyak digunakan saat ini, termasuk beberapa pemodelan data, diagram, dan alat visualisasi. Berikut adalah beberapa contoh:

  • erwin Data Modeler adalah alat pemodelan data berdasarkan bahasa pemodelan data Integrasi DEFinition for information modeling (IDEF1X) yang kini mendukung metodologi notasi lainnya, termasuk pendekatan dimensi.
  • Enterprise Architect adalah alat pemodelan dan desain visual yang mendukung pemodelan sistem dan arsitektur informasi perusahaan serta aplikasi perangkat lunak dan basis data. Ini didasarkan pada bahasa dan standar berorientasi objek.
  • ER/Studio adalah perangkat lunak desain basis data yang kompatibel dengan berbagai sistem manajemen basis data populer. Mendukung pemodelan data relasional serta dimensi.
  • Alat bantu pemodelan data gratis termasuk solusi sumber terbuka seperti Open ModelSphere.
Render 3D dari spiral beberapa ikon yang berbaris seperti kamera, kenop volume, dan clipboard
Solusi terkait
Alat dan solusi ilmu data

Gunakan alat dan solusi ilmu data untuk mengungkap pola dan menyusun prediksi dengan menggunakan data, algoritma, machine learning, dan teknik AI.

Jelajahi solusi ilmu data
IBM Cognos Analytics

Memperkenalkan Cognos Analytics 12.0, wawasan yang didukung AI untuk pengambilan keputusan yang lebih baik.

Jelajahi Cognos Analytics
Layanan konsultasi data dan analitik

Buka nilai data perusahaan dengan IBM Consulting, membangun organisasi berbasis insight yang memberikan keuntungan bisnis.

Temukan layanan analitik
Ambil langkah selanjutnya

Gunakan alat dan solusi ilmu data untuk mengungkap pola dan menyusun prediksi dengan menggunakan data, algoritma, machine learning, dan teknik AI.

  1. Jelajahi solusi ilmu data
  2. Jelajahi layanan analitik