Architettura di catalogazione dei dati IBM

IBM Data Cataloging è una piattaforma estensibile che fornisce l'acquisizione di dati su scala exabyte, la visualizzazione dei dati, l'attivazione dei dati e la mappatura dei dati orientata al business.

Nota: tutti i riferimenti a "Spectrum Discover" nelle immagini fanno riferimento a "Data Cataloging".

Inserimento dati su scala exabyte

  • Scansione di miliardi di file e oggetti in un giorno
  • Notifiche di eventi in tempo reale
  • Indicizzazione automatica

Visualizzazione dati

  • Query veloci di miliardi di record
  • Ricerca multifacet
  • Dashboard drilldown

Attivazione dati

  • SDK (Software Development Kit) applicazione
  • Architettura estensibile
  • Blueprint della soluzione

Associazione di dati orientati al business

  • Tag di dati a livello di sistema
  • Applicazione di tag ai dati contestuali
  • Flussi di lavoro basati sulle politiche
La figura seguente illustra una vista di alto livello dell'architettura di IBM Data Cataloging.
Figura 1. Architettura di catalogazione dei dati IBM

Gestione dati

IBM Data Cataloging si collega alle fonti di dati mostrate nell'immagine dell'architettura ( IBM Data Cataloging architecture ) e raccoglie e indicizza automaticamente i metadati del sistema laddove i metadati del sistema si riferiscono a determinate informazioni. Ciò potrebbe includere le seguenti informazioni.
  • Potrebbe includere i nomi dei file e degli oggetti.
  • Potrebbe includere il bucket o il percorso in cui risiedono i dati.
  • Potrebbe includere la dimensione.
  • Potrebbe includere l'ora dell'ultima modifica delle origini dati.

Una volta inseriti i dati, le analitiche vengono applicate automaticamente per classificare e raggruppare i dati in base ai differenti attributi dei metadati di sistema. I dati possono essere ispezionati automaticamente in IBM Data Cataloging utilizzando le funzionalità integrate di ricerca dei contenuti per identificare le informazioni sensibili e di identificazione personale ed eseguire la classificazione dei dati. Le funzionalità di ispezione del contenuto possono essere utilizzate anche da ricercatori e data scientist per estrarre il contenuto dai loro set di dati. Questa funzionalità di estrazione facile da utilizzare consente di rilevare i dati.

I record gestiti da IBM Data Cataloging possono anche essere ulteriormente arricchiti con tag di metadati personalizzati, che mappano i dati ai costrutti aziendali e aumentano ulteriormente il valore dei dati.

È possibile utilizzare il catalogo IBM Data Cataloging per ottenere informazioni sui dati e trovarli facilmente.

L'architettura di IBM Data Cataloging supporta anche un catalogo di applicazioni open source supportate dalla comunità che migliorano e personalizzano le capacità di IBM Data Cataloging con estensioni di terze parti. Gli utenti possono trovare e installare le applicazioni disponibili e possono sviluppare e condividere nuove applicazioni che utilizzano un SDK che contiene codice di esempio e un'API completamente pubblicata. Per ulteriori informazioni, vedere Creazione di applicazioni personalizzate da utilizzare nel catalogo delle applicazioni di Data Cataloging. Per ulteriori informazioni, vedere l'argomento Creazione di applicazioni personalizzate da utilizzare nel catalogo delle applicazioni IBM Data Cataloging nella sezione Amministrazione.

Figura 2. Architettura Application SDK