Il data modeling è il processo di creazione di una rappresentazione visiva di un intero sistema informativo o di parti di esso per comunicare le connessioni tra punti e strutture di dati.
L'obiettivo del data modeling è illustrare i tipi di dati utilizzati e memorizzati all'interno del sistema, le relazioni tra questi tipi di dati, i modi in cui i dati possono essere raggruppati e organizzati e i loro formati e attributi.
I modelli di dati sono costruiti in base alle esigenze aziendali. Le regole e i requisiti sono definiti in anticipo tramite feedback degli stakeholder aziendali, così da poter essere incorporati nella progettazione di un nuovo sistema o adattati nell'iterazione di uno esistente.
I dati possono essere modellati a vari livelli di astrazione. Il processo inizia con la raccolta di informazioni sui requisiti aziendali da stakeholder e utenti finali. Queste business rules vengono poi tradotte in strutture di dati per formulare un progetto di database concreto. Un modello di dati può essere paragonato a una roadmap, a un blueprint o a qualsiasi diagramma formale che faciliti una comprensione più approfondita di ciò che si sta progettando.
Il data modeling impiega schemi standardizzati e tecniche formali. Questo fornisce un modo comune, coerente e prevedibile di definire e gestire le risorse dati all'interno di un'organizzazione, o anche oltre.
Idealmente, i modelli di dati sono documenti viventi che si evolvono insieme alle esigenze aziendali che mutano. Svolgono un ruolo importante nel supportare i processi aziendali e pianificare l'architettura e la strategia IT. I modelli di dati possono essere condivisi con fornitori, partner e/o colleghi del settore.
Newsletter di settore
Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.
L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.
Come ogni processo di progettazione, la progettazione di database e sistemi informativi inizia da un alto livello di astrazione e poi diventa sempre più concreta e specifica. I modelli di dati possono generalmente essere suddivisi in tre categorie, che variano in base al grado di astrazione. Il processo inizierà con un modello concettuale, progredirà verso un modello logico e si concluderà con un modello fisico. Ogni tipo di modello di dati verrà discusso più in dettaglio nelle sezioni successive:
Vengono anche definiti modelli di dominio e offrono una visione d'insieme di ciò che il sistema conterrà, come sarà organizzato e quali business rules sono coinvolte. I modelli concettuali vengono solitamente creati come parte del processo di raccolta dei requisiti iniziali del progetto. In genere, includono le classi di entità (che definiscono i tipi di elementi che è importante che l'azienda rappresenti nel modello di dati), le loro caratteristiche e vincoli, le relazioni tra esse e i requisiti di sicurezza e integrità dei dati pertinenti. Qualsiasi notazione è tipicamente semplice.
Sono meno astratti e forniscono maggiori dettagli sui concetti e le relazioni nel dominio in esame. Si segue uno dei diversi sistemi di notazione formale di data modeling. Questi indicano gli attributi dei dati, come i tipi di dati e le loro lunghezze corrispondenti, e mostrano le relazioni tra le entità. I modelli di dati logici non specificano alcun requisito tecnico di sistema. Questa fase viene spesso omessa nelle pratiche Agile o DevOps. I modelli di dati logici possono essere utili negli ambienti di implementazione altamente procedurali o per i progetti orientati ai dati per natura, come la progettazione di data warehouse o lo sviluppo di sistemi di reportistica.
Forniscono uno schema di come i dati saranno fisicamente memorizzati all'interno di un database. Pertanto, sono i meno astratti di tutti. Offrono una progettazione finalizzata che può essere implementata come database relazionale, comprese tabelle associative che illustrano le relazioni tra le entità, nonché le chiavi primarie ed esterne che verranno utilizzate per mantenere tali relazioni. I modelli di dati fisici possono includere proprietà specifiche del sistema di gestione del database (DBMS), inclusa la regolazione delle prestazioni.
Come disciplina, il data modeling invita gli stakeholder a valutare il trattamento e l'archiviazione dei dati nei minimi dettagli. Le tecniche di data modeling hanno convenzioni diverse che determinano quali simboli vengono utilizzati per rappresentare i dati, come vengono disposti i modelli e come vengono trasmessi i requisiti aziendali. Tutti gli approcci forniscono workflow formalizzati che includono una sequenza di attività da eseguire in modo iterativo. Generalmente, questi workflow si presentano così:
La modellazione dei dati si è evoluta insieme ai sistemi di gestione dei database, con i tipi di modelli che sono diventati sempre più complessi con l'accrescersi delle esigenze di data storage delle aziende. Ecco diversi tipi di modelli:
I database relazionali utilizzano spesso un linguaggio di query strutturato (SQL) per la gestione dei dati. Questi database funzionano bene per mantenere l'integrità dei dati e ridurre al minimo la ridondanza. Sono spesso utilizzati nei sistemi POS, così come in altri tipi di elaborazione delle transazioni.
Due modelli di dati dimensionali popolari sono lo schema a stella, in cui i dati sono organizzati in fatti (elementi misurabili) e dimensioni (informazioni di riferimento), dove ogni fatto è circondato dalle dimensioni associate in un motivo simile a una stella. L'altro è lo schema a fiocco di neve, che somiglia allo schema a stella ma include strati aggiuntivi delle dimensioni associate, quindi il pattern di ramificazione è più complesso.
Il data modeling consente a sviluppatori, data architect, analisti aziendali e stakeholder di visualizzare e comprendere più facilmente le relazioni tra i dati in un database o in un data warehouse. Inoltre, può:
Oggi ci sono numerose soluzioni commerciali e open source di ingegneria software assistita dal computer (CASE) che sono ampiamente utilizzate, inclusi molteplici strumenti di data modeling, diagrammatizzazione e visualizzazione. Ecco alcuni esempi:
Usa strumenti e soluzioni di data science per scoprire modelli e creare previsioni utilizzando dati, algoritmi, tecniche di machine learning e AI.
Introduzione a Cognos Analytics 12.0, insight basati sull'AI per prendere decisioni migliori.
Sblocca il valore dei dati enterprise con IBM Consulting, creando un'organizzazione basata su insight in grado di generare vantaggi aziendali.