Cos'è IBM Watson Knowledge Catalog?

IBM Watson® Knowledge Catalog è un repository di metadati enterprise basato su cloud- che consente di catalogare gli asset di analytics e conoscenza, compresi i modelli di machine learning e i dati strutturati e non strutturati ovunque si trovino, in modo che possano essere facilmente accessibili e utilizzati per alimentare la data science e tutte le forme di AI.

Per i tipi di origine selezionati, Watson Knowledge Catalog può rilevare e registrare automaticamente gli asset di dati mediante la connessione fornita. Gli asset vengono aggiunti al catalogo e indicizzati e classificati automaticamente, semplificandone l'uso per utenti, come tecnici, analisti scientifici, steward dei dati e analisti di business per trovare, comprendere, condividere e utilizzare le risorse. I suggerimenti e la ricerca basata sull'AI guidano gli utenti verso gli asset più rilevanti nel catalogo in base alla comprensione delle relazioni esistenti tra gli asset, delle modalità di utilizzo degli asset e delle connessioni social tra gli utenti.

Watson Knowledge Catalog fornisce anche un framework di governance intelligente e affidabile che consente di definire e applicare i dati e le politiche di accesso per garantire che i dati giusti vengano recapitati alle persone giuste. 

Attraverso il glossario di business di Watson Knowledge Catalog , gli utenti possono creare un vocabolario di business comune e associarlo ad asset, politiche e regole, fornendo il collegamento tra il dominio di business e gli asset tecnici.

A quali regioni è possibile distribuire Watson Knowledge Catalog?

Se si hanno limitazioni dei dati regionali, è possibile distribuirlo su una delle seguenti città: Dallas, LondraFrancoforte o Tokyo.

Watson Knowledge Catalog è disponibile in tutto il mondo?

Sì.  Oltre agli Stati Uniti, è possibile registrarsi per Watson Knowledge Catalog nel Regno Unito,  Germania, e in Giappone.

Devo spostare i miei dati in Watson Knowledge Catalog?

No. È possibile conservare i dati nei relativi repository esistenti. Watson Knowledge Catalog memorizza i metadati  dei propri asset.

Quali origini dati e tipi di asset sono supportati?

IBM fornisce oltre 30 connettori al cloud o tipi di origine dati on-premise che permettono di connettersi ai propri asset di dati remoti. Ad esempio, connettori a IBM Db2® nel cloud o on-premise, IBM Cloudant®, IBM Cloud™ Object Storage, Oracle, Microsoft SQL Server, Microsoft Azure, Amazon S3, Salesforce.com, Hortonworks HDFS, Sybase e molti altri sono disponibili da IBM.

Oltre agli asset provenienti da origini dati remote, Watson Knowledge Catalog supporta altri tipi di asset, come i dati strutturati (riga/colonna), i dati semistrutturati e i dati non strutturati. Ad esempio, è possibile aggiungere CSV, Microsoft Excel, PDF, Testo, Microsoft Word, Jupyter Notebook (IPYNB), file immagine HTML, per nominarne alcuni, al catalogo per creare profili e condividere i contenuti con altri utenti.

Qual è il numero massimo di asset che posso avere in Watson Knowledge Catalog?

Con il piano Professional, non c'è alcun limite di asset che è possibile avere in Knowledge Catalog. Con i piani Lite e Standard, i limiti sono rispettivamente di 50 e 500 asset.

Watson Knowledge Catalog fornisce servizi di governance?

Watson Knowledge Catalog include un motore di applicazione delle politiche automatizzato che determina i risultati in base alle politiche e all'azione intrapresa. Watson Knowledge Catalog fornisce la possibilità di impostare le politiche di governance all'interno del sistema, in modo da limitare l'accesso ai dati o di trasformare i dati, codificando i contenuti sensibili. 

È possibile eliminare o modificare l'origine originale dei dati con una politica dei dati che maschera i dati?

No. Quando una politica di protezione dei dati rende anonimi i dati sensibili nel catalogo, solo i dati di anteprima che sono gestiti dall'applicazione vengono trasformati. I dati di origine originali non vengono modificati.

Watson Knowledge Catalog fornisce servizi di classificazione?

Watson Knowledge Catalog può classificare automaticamente gli asset di dati quando vengono aggiunti al catalogo. I componenti integrati forniscono oltre 160 classificatori di attributi, inclusi nomi, email, indirizzi postali, numeri di carta di credito, numeri di patenti di guida, numeri di identificazione del governo, date di nascita, informazioni demografiche, numeri DUNS (Data Universal Numbering System) e altro. I cataloghi creano anche profili di asset di dati non strutturati ed estraggono i metadati dal contenuto, come le categorie, i concetti, le opinioni e le emozioni. Consultare la sezione Profile data assets.

Sono disponibili funzionalità di preparazione dei dati in Watson Knowledge Catalog?

Sì. Le funzionalità di preparazione dei dati sono disponibili tramite Data Refinery, che è incluso in Watson Knowledge Catalog. Data Refinery fornisce una serie completa di funzionalità che permette non solo di rilevare, pulire e trasformare i dati con operazioni integrate, ma viene fornita anche con potenti strumenti di creazione dei profili e di visualizzazione, come tabelle, grafici e statistiche, che ti consentono di interagire e comprendere i dati. Le politiche di accesso ai dati e di trasformazione definite in Watson Knowledge Catalog vengono applicate anche in Data Refinery per garantire che i dati sensibili provenienti dai cataloghi gestiti siano protetti.

È possibile impostare gruppi di accesso per le persone in diverse LoB (line of business)?

Sì. I gruppi di accesso possono essere impostati tramite IBM Cloud Identity e Asset Management. Nel modulo Access Control di Watson Knowledge Catalog, è possibile aggiungere un collaboratore o un gruppo di utenti.

Cosa sono le ore unità di unità di capacità?

I flussi di Data Refinery, l'UI interattiva di Data Refinery e le attività di creazione dei profili vengono addebitati in base al numero di unità di capacità o unità intere richieste ogni ora, per ogni tipo di capacità:

  • I flussi di Data Refinery richiedono 1,5 unità di capacità all'ora con un ambiente Spark predefinito. Per altri ambienti personalizzati, il calcolo dipende dal numero di esecutori e di risorse utilizzate per l'executor o driver Spark.
  • L'UI interattiva di Data Refinery richiede 1,5 unità di capacità all'ora – a partire dal momento in cui l'UI di Rafinery inizia e termina quando è chiusa.
  • Le attività di creazione profili richiedono sei unità di capacità all'ora. Un addebito minimo di 0,96 (equivalente a 10 minuti) viene applicato per l'esecuzione di ogni processo.

Un numero definito di ore di unità di capacità gratuite viene incluso in ogni piano mensile.Per i piani Standard e Professional, le tariffe vengono applicate una volta raggiunto il limite del piano per un determinato mese.Per un piano Lite, una volta raggiunto il limite del piano mensile, non è possibile eseguire attività di creazione profili o flussi di Data Refinery fino al mese successivo o finché non viene effettuato l'aggiornamento al piano Standard o Professional.

Esempi di flusso di Data Refinery che utilizzano il Tipo di capacità predefinita 3:

  1. Un flusso di Data Refinery viene eseguito per 1 ora: 1,5 CUH
  2. Due flussi di Data Refinery vengono eseguiti per 1 ora ciascuno: 2 ore * 1,5 CUH = 3 CUH
  3. Un flusso di Data Refinery viene eseguito per 30 minuti: 0,5 ore * 1,5 CUH = 0,75 CUH
  4. L'UI interattiva di Data Refinery UI viene utilizzata per 1 ora: 1,5 CUH

Esempi di creazione profili (i lavori di creazione profili possono essere attivati automaticamente o manualmente):

  1. Un lavoro di creazione profili viene eseguito per 30 minuti: 0,5 ore * 6 CUH = 3 CUH
  2. Un lavoro di creazione profili viene eseguito per 9 minuti. Per questo scenario è prevista l'applicazione di un importo minimo: 0,16 ore * 6 CUH = 0,96 CUH

Dopo l'acquisto di un piano Standard o Professional, quanta configurazione è richiesta per poter trarre il massimo vantaggio dal prodotto?

Watson Knowledge Catalog è completamente self service, quindi un amministratore può iniziare creando un catalogo, per poi aggiungere e gestire gli asset da subito. Ulteriori attività possono includere:

  • Creazione di un glossario di business
  • Definizione delle politiche di protezione dei dati per gestire l'accesso ai dati
  • Invitare gli utenti al catalogo

Tutto questo è disponibile su IBM Cloud Pak for Data?

Sì. Scopri di più sulla più recente piattaforma di dati integrata di IBM: IBM Cloud Pak™ for Data

Prova Watson Knowledge Catalog

Sfrutta gli strumenti di machine learning e l'AI per analizzare i tuoi dati. Cataloga i dati per trovarli e utilizzarli con più facilità.