Knowledge Accelerators classi di dati

Ampliare l'insieme Knowledge Accelerators delle classi di dati fornite in IBM Knowledge Catalog con classi di dati che descrivono i tipi di dati comunemente presenti nelle risorse di diversi settori, oltre alle classi di dati basate su standard industriali quali ISO, FHIR e CIM. Queste nuove classi di dati descrivono informazioni comunemente utilizzate nei settori dell'energia e dei servizi pubblici, dei servizi finanziari, della sanità, delle assicurazioni e in altre fonti di dati intersettoriali.

Le classi di dati descrivono il tipo e le caratteristiche dei dati contenuti nelle risorse di dati. Vengono utilizzati durante IBM Knowledge Catalog l'arricchimento dei metadati per profilare i dati. Includono classi di dati Knowledge Accelerators specifiche del settore che utilizzano i codici provenienti da set di dati di riferimento o elenchi di valori validi, aggiungono espressioni regolari per identificare modelli di dati o criteri di corrispondenza dei nomi delle colonne.

Le classi di Knowledge Accelerators dati migliorano la capacità del processo IBM Knowledge Catalog di arricchimento di riconoscere i dati specifici del settore. Le classi di dati IBM Knowledge Catalog esistenti e le nuove classi di dati fornite dal Knowledge Accelerators sono tutte combinate in una nuova gerarchia di categorie basata su argomenti quali dati demografici, finanza e posizione geografica. Questa sottocategorizzazione consente di includerli in modo selettivo in diversi arricchimenti dei metadati per migliorare la precisione della corrispondenza. Poiché le classi di dati sono pre-mappate ai termini del Business Core Vocabulary, l'arricchimento dei metadati assegna automaticamente anche il termine aziendale quando corrisponde ai dati di una risorsa a una classe di dati.

Le classi di dati rilevanti per i dati personali sono inoltre classificate come Informazioni personali (PI) o Informazioni personali sensibili (SPI) a seconda della sensibilità dei dati che descrivono. Questa classificazione aiuta a identificare i dati personali nelle risorse di dati e supporta l'applicazione delle norme sulla protezione dei dati per controllare l'accesso ai dati.

Le classi di dati sono completamente personalizzabili e, se necessario, possono essere modificate per concentrarsi su set di dati di riferimento specifici del cliente o restrizioni di corrispondenza dei nomi delle colonne.
Nota:

L'insieme delle classi di dati fornite con IBM Knowledge Catalog è contenuto nella categoria di primo livello "Non categorizzato". L'importazione di uno qualsiasi dei Knowledge Accelerators crea una copia di queste classi di dati, con l'aggiunta delle classificazioni PI/SPI, e le colloca nelle sottocategorie della nuova gerarchia della categoria "Classi di dati", insieme alle nuove Knowledge Accelerators classi di dati.

Le classi di dati duplicate possono essere rimosse da "Non categorizzati" dopo aver verificato eventuali relazioni esistenti con termini aziendali o assegnazioni a risorse di dati, che potrebbero dover essere trasferite alle nuove copie importate con il file Knowledge Accelerators.

Tabella 1. Esempi di classi di dati
Settore Classe dati Descrizione Categoria primaria Metodo di confronto Dataset di riferimento Valori dei dati di riferimento Termini di business
Industria incrociata Numero di telefono internazionale La raccolta di informazioni che identificano un numero di telefono specifico, come definito dai servizi di telecomunicazione... Classi di dati comuni Crea corrispondenza con criteri in espressione regolare Espressione regolare Esempi:
  • +14655551212
  • +4402079460111
  • 003530209138764
Numero di telefono
Energia e pubblica utilità Tipo di edificio Il tipo di struttura dell'edificio che è stato costruito. Classi di dati comuni Crea corrispondenza con elenco di valori validi Valori validi
  • Scollegato
  • bungalow
  • Cottage
  • Allevamento
  • Cupola
  • ...
Tipo di edificio
Servizi finanziari Codice valuta Un codice standard per rappresentare una valuta, utilizzando un codice numerico o alfabetico. Questa classe di dati contiene contenuti provenienti dai codici valuta ISO 4217. Corsi sui dati finanziari Crea corrispondenza con elenco di valori validi Valori validi
  • USD
  • EUR
  • GBP (Sterlina britannica)
  • SEK
  • Yen
  • ...
Codice valuta
Sanità Gruppo sanguigno Classifica i gruppi sanguigni in base allo stato dell' ABO /Rh. Classi di dati sanitari e biometrici Crea corrispondenza con elenco di valori validi Valori validi
  • A+
  • A-
  • B+
  • B-
  • O+
  • O-
  • ...
Gruppo sanguigno
Settore assicurativo Tipo di veicolo Il tipo o la classificazione associati al modello del veicolo. KAIN - Classi di informazioni sui veicoli e dati sugli incidenti Crea corrispondenza con dati di riferimento Tipo di veicolo
  • Auto
  • Ciclo a pedali
  • Veicolo agricolo
  • Motocicletta su 500cc
  • Merci 7.5 tonnellate mgw e oltre
  • ..
Tipo veicolo
Nota: molte delle classi di dati elencate negli esempi sopra riportati sono rilevanti per più di un settore, pertanto sono condivise tra i vari gruppi dell' Knowledge Accelerators, ove opportuno.

Ulteriori informazioni