Cos'è un database relazionale?

Un database relazionale è un tipo di database che organizza i dati in righe e colonne, che insieme formano una tabella in cui i punti dati sono correlati tra loro.

I dati sono in genere strutturati in più tabelle, che possono essere unite attraverso una chiave primaria o una chiave esterna. Questi identificatori univoci mettono in evidenza le diverse relazioni che esistono tra le tabelle; queste relazioni vengono solitamente illustrate attraverso diversi tipi di modelli di dati. Gli analisti utilizzano le query SQL per combinare diversi punti dati e riepilogare le prestazioni aziendali, consentendo alle organizzazioni di ottenere insight, ottimizzare i workflow e identificare nuove opportunità.

Ad esempio, immagina che la tua azienda abbia una tabella di database con le informazioni sui clienti, che contiene i dati aziendali a livello di account. Potrebbe anche esserci una tabella diversa, che descrive tutte le singole transazioni che si riferiscono a quell'account. Insieme, queste tabelle possono fornire informazioni sui diversi settori che acquistano uno specifico prodotto software.

Le colonne (o i campi) per la tabella del cliente potrebbero essere ID cliente, Nome azienda, Indirizzo azienda, Settore, ecc.; le colonne per una tabella delle transazioni potrebbero essere Data transazione, ID cliente, Importo transazione, Metodo di pagamento, ecc. Le tabelle possono essere unite tra loro con il campo comune ID cliente. È possibile, quindi, eseguire query sulla tabella per produrre report preziosi, ad esempio report sulle vendite per settore o azienda, che possono migliorare la comunicazione verso i potenziali clienti.

I database relazionali sono anche tipicamente associati ai database transazionali, che eseguono comandi, o transazioni, in modo collettivo. Un esempio solitamente utilizzato per spiegare questo meccanismo è quello di un bonifico bancario. Un importo definito viene prelevato da un conto e quindi depositato su un altro. L'importo totale di denaro viene prelevato e depositato e questa transazione non può avvenire in modo parziale. Le transazioni hanno proprietà specifiche. Rappresentate dall'acronimo "ACID" le proprietà ACID sono:

Atomicità: tutte le modifiche ai dati vengono eseguite come se fossero una singola operazione. In altre parole, vengono eseguite tutte le modifiche, o nessuna.

Coerenza: i dati mantengono uno stato di coerenza dall'inizio alla fine, il che rafforza la loro integrità.

Isolamento: lo stato intermedio di una transazione non è visibile ad altre transazioni e, di conseguenza, le transazioni eseguite simultaneamente sembrano serializzate.

Durabilità: dopo il completamento con successo di una transazione, le modifiche ai dati persistono e non vengono annullate, anche in caso di guasto del sistema.

Queste proprietà consentono un'elaborazione affidabile delle transazioni.

Unisciti agli oltre 100.000 iscritti che leggono le ultime notizie nel campo della tecnologia

Rimani aggiornato sulle tendenze più importanti (e più interessanti) del settore in ambito AI, automazione, dati e oltre con la newsletter Think, disponibile due volte a settimana. Leggi l'Informativa sulla privacy di IBM.

Cos'è un sistema di gestione di database relazionali (RDBMS)

Mentre un database relazionale organizza i dati in base a un modello di dati relazionali, un sistema di gestione di database relazionali (RDBMS) è un riferimento più specifico al software di database sottostante che consente agli utenti di gestirli. Questi programmi consentono agli utenti di creare, aggiornare, inserire o eliminare dati nel sistema e di fornire:

struttura di dati

Accesso multiutente

Controllo dei privilegi

Accesso alla rete

Gli esempi di sistemi RDBMS popolari includono MySQL, PostgreSQL e IBM DB2. Inoltre, un sistema di database relazionale differisce da un sistema di gestione di database (DBMS) in quanto memorizza i dati in tabelle mentre un DBMS memorizza le informazioni come file.

Cos'è SQL?

Inventato da Don Chamberlin e Ray Boyce di IBM, il linguaggio SQL (Structured Query Language) è il linguaggio di programmazione standard per interagire con i sistemi di gestione di database relazionali e consente all’amministratore del database di aggiungere, aggiornare o eliminare facilmente righe di dati. Noto in origine come SEQUEL, è stato semplificato in SQL a causa di un problema relativo al marchio depositato. Le query SQL consentono inoltre di recuperare dati dai database utilizzando solo poche righe di codice. Alla luce di questa relazione, è facile capire perché i database relazionali vengono a volte definiti anche “database SQL”.

Utilizzando l’esempio riportato sopra, potresti creare una query per trovare le prime 10 transazioni per azienda per un anno specifico con il seguente codice:

SELECT COMPANY_NAME, SUM(TRANSACTION_AMOUNT)

FROM TRANSACTION_TABLE A

LEFT JOIN CUSTOMER_TABLE B

ON A.CUSTOMER_ID = B.CUSTOMER_ID

WHERE YEAR(DATE) = 2022

GROUP BY 1

ORDER BY 2 DESC

LIMIT 10

La possibilità di unire i dati in questo modo ci aiuta a ridurre la ridondanza all’interno dei nostri sistemi di dati, consentendo ai team che lavorano con i dati di mantenere una tabella principale per i clienti anziché duplicare queste informazioni in caso di un’altra transazione futura. Se vuoi saperne di più, Don approfondisce la storia di SQL nel documento consultabile qui.

Breve storia dei database relazionali

Prima dei database relazionali, le aziende utilizzavano un sistema di database gerarchico con una struttura ad albero per le tabelle di dati. Questi primi sistemi di gestione dei database (DBMS) consentivano agli utenti di organizzare grandi quantità di dati. Tuttavia erano complessi, spesso legati a una particolare applicazione e limitati nelle modalità di scoperta dei dati. Queste limitazioni hanno portato il ricercatore IBM Edgar F. Codd a pubblicare, nel 1970, un documento intitolato "A Relational Model of Data for Large Shared Data Banks", che teorizzava il modello di database relazionale. In questo modello proposto, le informazioni potevano essere recuperate senza conoscenze avanzate in ambito informatico. Codd proponeva di organizzare i dati in base a relazioni significative come tuple o coppie attributo-valore. Gli insiemi di tuple venivano definiti relazioni, il che alla fine consentiva l'unione dei dati tra le tabelle.

Nel 1973, il San Jose Research Laboratory, oggi noto come Almaden Research Center, avviò un programma chiamato System R (R per relational) per dimostrare questa teoria relazionale con quella che definì "un'implementazione di livello industriale". Alla fine è diventato anche un banco di prova per SQL, consentendogli di essere adottato più ampiamente in un breve periodo di tempo. Tuttavia, l'adozione di SQL da parte di Oracle non ha compromesso la sua popolarità tra gli amministratori di database.

Nel 1983, IBM introdusse la famiglia di database relazionali DB2, così chiamata perché era la seconda famiglia di software di gestione di database di IBM. Oggi è uno dei prodotti di maggior successo di IBM, che continua a gestire miliardi di transazioni ogni giorno sull'infrastruttura cloud e definisce il livello di base per le applicazioni di machine learning.

Database relazionali o non relazionali

Mentre i database relazionali strutturano i dati in un formato tabulare, i database non relazionali non sono rigidi come uno schema di database. Infatti, i database non relazionali organizzano i dati in modo diverso in base al tipo di database. Indipendentemente dal tipo di database non relazionale, tutti puntano a risolvere i problemi di flessibilità e scalabilità intrinseci nei modelli relazionali che non risultano ideali per i formati di dati non strutturati come testo, video e immagini. Questi tipi di database comprendono:

Archivio chiave/valore: questo modello di dati senza schema è organizzato in un dizionario di coppie chiave/valore, in cui ogni elemento è dotato di una chiave e di un valore. La chiave potrebbe essere qualcosa di simile a un SQL Database, come l'ID di un carrello, mentre il valore è un array di dati, come ogni singolo articolo nel carrello dell'utente. Viene comunemente utilizzato per il caching e la memorizzazione delle informazioni sulla sessione utente, ad esempio i carrelli. Tuttavia, non è la soluzione ideale quando è necessario estrarre più record contemporaneamente. Redis e Memcached sono esempi di database open source con questo modello di dati.

Archivio documenti: come suggerisce il nome, i database di documenti archiviano i dati come documenti. Possono essere utili nella gestione dei dati semistrutturati, e i dati vengono generalmente archiviati nei formati JSON, XML o BSON. Ciò mantiene insieme i dati quando vengono utilizzati nelle applicazioni, riducendo la quantità di traduzioni necessarie per utilizzarli. Gli sviluppatori ottengono inoltre maggiore flessibilità perché non è necessario che gli schemi di dati corrispondano tra i documenti (ad es. name vs. first_name). Tuttavia, questo può essere problematico per transazioni complesse, e portare alla corruzione dei dati. I casi d'uso più diffusi dei database di documenti includono i sistemi di gestione dei contenuti e i profili utente. Un esempio di database orientato ai documenti è MongoDB, il componente database dello stack MEAN.

Archivio wide-column: questi database memorizzano le informazioni in colonne, consentendo agli utenti di accedere solo alle colonne specifiche di cui hanno bisogno senza allocare memoria aggiuntiva su dati irrilevanti. Questo database cerca di risolvere le carenze delle memorie di valori chiave e di documenti ma, dal momento che può essere un sistema più complesso da gestire, se ne sconsiglia l'uso da parte dei team e per i progetti più recenti. Apache HBase e Apache Cassandra sono esempi di database open-source wide-column. Apache HBase è costruito sulla base di Hadoop Distributed Files System, che fornisce un modo per memorizzare insiemi di dati sparsi, comunemente utilizzati in molte applicazioni di big data. Apache Cassandra, invece, è stato progettato per gestire grandi quantità di dati su più server e clustering che si estendono su più data center. È stato utilizzato per una varietà di casi d'uso, come siti web di social network e data analytics in tempo reale.

Archivio di grafi: questo tipo di database ospita tipicamente i dati di un grafo di conoscenza. Gli elementi dei dati vengono memorizzati come nodi, archi e proprietà. Qualsiasi oggetto, luogo o persona può essere un nodo. Un bordo definisce la relazione tra i nodi. I database a grafo vengono utilizzati per archiviare e gestire una rete di connessioni tra elementi all'interno del grafo. Neo4j (link esterno a IBM), un servizio di database a grafo basato su Java con una community edition open-source in cui gli utenti possono acquistare licenze per il backup online e le estensioni per l'high availability, oppure una versione preconfezionata con licenza con backup ed estensioni incluse.

I database NoSQL danno inoltre priorità alla disponibilità rispetto alla coerenza.

Quando i computer operano su una rete, devono inevitabilmente decidere se dare la priorità a risultati coerenti (in cui ogni risposta è sempre la stessa) oppure a tempi di attività elevati, definiti "disponibilità". Questo si chiama "Teorema CAP" (Consistency, Availability, or Partition Tolerance). I database relazionali garantiscono che le informazioni siano sempre sincronizzate e coerenti. Alcuni database NoSQL, come Redis, preferiscono fornire sempre una risposta. Ciò significa che le informazioni ricevute da una query potrebbero essere errate di alcuni secondi, o persino fino a mezzo minuto. Sui siti di social media, questo significa vedere una vecchia immagine del profilo quando quella più recente ha solo pochi istanti. L'alternativa potrebbe essere un timeout o un errore. Al contrario, nelle transazioni bancarie e finanziarie, un errore e un nuovo invio possono rappresentare un'alternativa migliore a informazioni datate ed errate.

Per una panoramica completa delle differenze tra SQL e NoSQL, vedi "Database SQL e NoSQL: qual è la differenza?"

Vantaggi dei database relazionali

Il vantaggio principale dell'approccio del database relazionale è la possibilità di creare informazioni significative unendo le tabelle. L'unione di tabelle consente di comprendere le relazioni tra i dati o la connessione tra le tabelle. SQL include la possibilità di contare, aggiungere, raggruppare e combinare le query. SQL può eseguire funzioni matematiche e subtotali di base e trasformazioni logiche. Gli analisti possono ordinare i risultati per data, nome o qualsiasi colonna. Queste caratteristiche rendono l'approccio relazionale lo strumento di query più popolare nelle aziende odierne.

I database relazionali hanno diversi vantaggi rispetto ad altri formati di database:

Facilità d'uso

In virtù della durata di vita del prodotto, esiste più di una comunità attorno ai database relazionali, che ne perpetua parzialmente l'uso continuato. SQL facilita inoltre il recupero di set di dati da più tabelle e l'esecuzione di semplici trasformazioni come il filtraggio e l'aggregazione. L'uso degli indici all'interno dei database relazionali consente inoltre di individuare rapidamente queste informazioni senza dover cercare ogni riga nella tabella selezionata.

Sebbene i database relazionali siano sempre stati considerati come un'opzione di archiviazione dei dati più rigida e poco flessibile, i progressi nella tecnologia e nelle opzioni DBaaS stanno cambiando questa percezione. Nonostante lo sviluppo di schemi sia ancora più gravoso rispetto alle offerte di database NoSQL, i database relazionali stanno diventando più flessibili man mano che migrano agli ambienti cloud.

Riduzione della ridondanza

I database relazionali possono eliminare la ridondanza in due modi. Il modello relazionale stesso riduce la ridondanza dei dati tramite un processo noto come normalizzazione. Come già detto, una tabella clienti dovrebbe registrare solo record univoci di informazioni sui clienti, anziché duplicare tali informazioni per più transazioni.

Le procedure memorizzate aiutano anche a ridurre il lavoro ripetitivo. Ad esempio, se l'accesso al database è limitato a determinati ruoli, funzioni o team, una procedura memorizzata può aiutare a gestire il controllo degli accessi. Queste funzioni riutilizzabili consentono agli sviluppatori di guadagnare tempo da dedicare ad attività di maggiore impatto.

Facilità di backup e disaster recovery

I database relazionali sono transazionali: garantiscono che lo stato dell'intero sistema sia coerente in qualsiasi momento. La maggior parte dei database relazionali offre opzioni di esportazione e importazione semplici, rendendo il backup e il ripristino estremamente facili. Queste esportazioni possono avvenire anche mentre il database è in esecuzione, facilitando il ripristino in caso di errore. I moderni database relazionali basati sul cloud possono eseguire il mirroring continuo, rendendo la perdita di dati al momento del ripristino misurabile in pochi secondi o meno. La maggior parte dei servizi gestiti nel cloud consente di creare repliche di lettura, come in IBM Cloud Databases for PostgreSQL. Queste repliche di lettura consentono di memorizzare una copia di sola lettura dei dati in un data center sul cloud. Le repliche possono essere promosse anche a istanze di lettura/scrittura per il disaster recovery.

Rendering 3D di una spirale di diverse icone allineate, come una fotocamera, una manopola del volume e una lavagnetta

Leggi la guida per i Data Leader per scoprire come rendere i dati della tua organizzazione AI-ready.

Risorse

Rendering 3D di diverse icone allineate, come un microfono e una fotocamera

Gli agenti AI funzionano con i dati: i tuoi sono pronti?

I dati sono il tuo vantaggio competitivo. Scopri come sbloccarli in modo sicuro e ottenere un ROI misurabile dall'AI in questo breve webinar.

Cos'è la gestione dei dati

Techsplainers by IBM analizza gli elementi essenziali dei dati per l'AI, dai concetti chiave ai casi d'uso del mondo reale. Gli episodi chiari e rapidi ti aiutano ad apprendere rapidamente le nozioni fondamentali.

Rendering 3D di diverse icone allineate, come una manopola del volume e una cartellina

Unifica e accedi ai tuoi dati per scalare la tua AI

Scopri perché il percorso verso i dati AI-ready spesso inizia con un accesso efficace ai dati strutturati e non strutturati e quali problematiche possono ostacolare i leader dei dati.

Gli oneri legali si trasformano in insight strategici

Scopri come un agente legale basato su AI aiuta ad accelerare il processo decisionale, ridurre il lavoro manuale e migliorare la conformità normativa.

Due uomini che parlano tra loro in un podcast

AI Academy: sviluppare una strategia dei dati per l'AI aziendale

In questo episodio, Cathy Reese spiega come le organizzazioni necessitino attualmente di una strategia dei dati pronta per l’AI avanzata, utilizzando al meglio i loro dati di qualità superiore.

Rendering 3D di diverse icone allineate, come una fotocamera e aeroplani di carta

Il data lakehouse ibrido e aperto per l'AI

Semplifica l'accesso ai dati e automatizza la governance dei dati. Scopri la potenza dell'integrazione di una strategia di data lakehouse nella tua architettura di dati, con ottimizzazione dei costi dei workload e scalabilità dell'AI e dell'analytics, con tutti i tuoi dati, ovunque.

Report Cost of a Data Breach 2025

I costi delle violazioni dei dati non sono mai stati così elevati. Ottieni insight aggiornati sulle minacce alla cybersecurity e sul loro impatto finanziario sulle organizzazioni.

Rendering 3D di due righe di diverse icone come una fotocamera, una manopola del volume e una cartellina

La guida ai dati AI-ready per i leader dei dati

Scopri i passi concreti che i leader dei dati possono intraprendere per superare le sfide legate ai dati, creare le basi per una piattaforma dati affidabile e preparare i dati della tua organizzazione per l’AI.

Rendering 3D di diverse icone allineate, come la fotocamera, la manopola del volume e gli appunti

Come i vertici aziendali trasformano le informazioni in impatto

Esplora gli insight di 1.700 CDO in questo report intersettoriale per i leader dei dati.

Soluzioni correlate

IBM StreamSets

Crea e gestisci pipeline di dati intelligenti in streaming attraverso un'interfaccia grafica intuitiva, che facilita la perfetta integrazione dei dati in ambienti ibridi e multicloud.

Esplora StreamSets

IBM watsonx.data™

Watsonx.data ti consente di scalare analytics e AI con tutti i tuoi dati, ovunque risiedano, attraverso uno storage dei dati aperto, ibrido e governato.

Scopri watsonx.data

Servizi di consulenza per dati e analytics

Sblocca il valore dei dati enterprise con IBM Consulting, creando un'organizzazione basata su insight in grado di generare vantaggi aziendali.

Esplora i servizi di analytics

Fai il passo successivo

Progetta una strategia dati che elimini i silo, riduca la complessità e migliori la qualità dei dati per esperienze eccezionali di clienti e dipendenti.

Cos'è un database relazionale?