Czym jest rozwiązanie IBM Watson® Knowledge Catalog?

IBM Watson® Knowledge Catalog to oparte na chmurze repozytorium metadanych, które pozwala na katalogowanie wiedzy i zasobów analitycznych, w tym modeli uczenia maszynowego oraz ustrukturyzowanych i nieustrukturyzowanych danych niezależnie od miejsca ich rezydowania. Dzięki temu zasoby te są łatwo dostępne i można je swobodnie wykorzystywać na potrzeby analityki danych i we wszelkich formach sztucznej inteligencji (AI).

Rozwiązanie Watson Knowledge Catalog może też podczas połączenia automatycznie wykrywać i rejestrować zasoby danych z wybranych źródeł. Zasoby dodawane do katalogu są automatycznie indeksowane i klasyfikowane, co ułatwia użytkownikom, takim jak inżynierowie danych, analitycy danych, administratorzy danych i analitycy biznesowi, wyszukiwanie, interpretowanie, udostępnianie i wykorzystywanie zasobów. Wyszukiwanie i rekomendacje oparte na sztucznej inteligencji (AI) kierują użytkownika do odpowiednich zasobów, analizując relacje między zasobami, ich wykorzystanie oraz społeczne powiązania między użytkownikami.

Watson Knowledge Catalog zapewnia również inteligentne, niezawodne środowisko nadzoru, w którym można definiować i wymuszać strategie dostępu i wykorzystania danych, dzięki czemu właściwe dane trafiają do właściwych osób. 

Za pomocą glosariusza biznesowego Watson Knowledge Catalog Business Glossary użytkownicy mogą utworzyć wspólne słownictwo biznesowe i powiązać je z zasobami, strategiami i zasadami, łącząc ze sobą działalność biznesową i zasoby techniczne.

W jakich regionach można wdrożyć rozwiązanie Watson Knowledge Catalog?

Jeśli obowiązują Cię regionalne ograniczenia dotyczące danych, produkt możesz wdrożyć w jednym z następujących miast: Dallas, LondynFrankfurt lub Tokio.

Czy rozwiązanie Watson Knowledge Catalog jest dostępne w innych miejscach na świecie?

Tak. Oprócz Stanów Zjednoczonych rejestracja w rozwiązaniu Watson Knowledge Catalog jest możliwa także w Wielkiej BrytaniiNiemczech i Japonii.

Czy muszę przenosić moje dane do środowiska Watson Knowledge Catalog?

Nie. Dane można dalej przechowywać w istniejących już repozytoriach. Rozwiązanie Watson Knowledge Catalog przechowuje metadane Twoich zasobów.

Jakie typy zasobów i źródeł danych są przechowywane?

IBM dostarcza ponad 30 konektorów łączących z chmurą lub lokalnymi źródłami danych. Za pomocą tych konektorów użytkownik może połączyć się ze zdalnymi zasobami danych. Udostępniamy na przykład konektory do takich usług, jak IBM Db2® (w chmurze lub środowisku lokalnym), IBM Cloudant®, IBM Cloud™ Object Storage, Oracle, Microsoft SQL Server, Microsoft Azure, Amazon S3, Salesforce.com, Hortonworks HDFS, Sybase i wielu innych rozwiązań.

Oprócz zasobów ze zdalnych źródeł danych rozwiązanie Watson Knowledge Catalog obsługuje też inne typy zasobów, na przykład dane ustrukturyzowane (rzędy/kolumny), półustrukturyzowane i nieustrukturyzowane. Do katalogu można dodać na przykład plik CSV, PDF, HTML lub Jupyter Notebook (IPYNB), a także pliki tekstowe oraz pliki z programów Microsoft Excel bądź Microsoft Word, a następnie sprofilować dane i udostępnić je innymi użytkownikom.

Ile maksymalnie zasobów można przechowywać w rozwiązaniu Watson Knowledge Catalog?

W wypadku planu Professional liczba zasobów w rozwiązaniu Knowledge Catalog jest nieograniczona. W wypadku planów Lite i Standard limit wynosi odpowiednio 500 i 50 zasobów.

Czy rozwiązanie Watson Knowledge Catalog obejmuje usługę sprawowania nadzoru?

Rozwiązanie Watson Knowledge Catalog ma zautomatyzowany mechanizm wymuszania strategii, który określa wyniki na podstawie zrealizowanych strategii i działań. Rozwiązanie Watson Knowledge Catalog umożliwia skonfigurowanie strategii nadzoru wewnątrz systemu, co pozwala na ograniczanie dostępu do danych, a także na przekształcanie danych za pomocą maskowania wrażliwych treści. 

Czy za pomocą strategii maskującej można też usunąć dane lub zmienić ich pierwotne źródło?

Nie. Podczas anonimizowania wrażliwych danych w katalogu w ramach strategii ich ochrony, aplikacja zarządza jedynie danymi w formie do podglądu i przekształca tylko te informacje. Dane w pierwotnym źródle nie są modyfikowane.

Czy rozwiązanie Watson Knowledge Catalog obejmuje usługę klasyfikowania?

Watson Knowledge Catalog może automatycznie klasyfikować kolumny w zestawach danych, które są dodawane do katalogu. Wbudowane komponenty dostarczają ponad 160 klasyfikatorów atrybutów, w tym imiona i nazwiska, adresy elektroniczne i pocztowe, numery kart kredytowych, numery prawa jazdy, krajowe numery identyfikacyjne, daty urodzenia, dane demograficzne, numery DUNS (Data Universal Numbering System), liczby i inne szczegóły. Katalogi profilują również zasoby nieustrukturyzowanych danych i wyodrębniają z treści metadane, takie jak kategorie, koncepcje, sentyment i emocje. Zobacz Profilowanie zestawów danych.

Czy rozwiązanie Watson Knowledge Catalog oferuje funkcje przygotowywania danych?

Tak. Funkcje przygotowywania danych są dostępne w usłudze Data Refinery, która jest częścią rozwiązania Watson Catalog. Data Refinery oferuje wiele różnych funkcji, które nie tylko pozwalają na badanie, oczyszczanie i przekształcanie danych za pomocą wbudowanych procesów, ale obejmują też zaawansowane narzędzia do profilowania i wizualizacji, takie jak diagramy, wykresy i statystyki ułatwiające interakcję z danymi i ich zrozumienie. Usługa Data Refinery wymusza również realizację strategii przekształcania i dostępu do danych zdefiniowanych w rozwiązaniu Watson Knowledge Catalog, by wrażliwe dane z nadzorowanych katalogów pozostawały chronione.

Czy możliwe jest skonfigurowanie grup dostępowych dla osób z różnych obszarów działalności?

Tak. Grupy dostępowe można skonfigurować za pomocą rozwiązania IBM Cloud Identity and Asset Management. Współpracownika lub grupę użytkowników można dodać w module Access Control rozwiązania Watson Knowledge Catalog.

Czym są jednostkogodziny mocy obliczeniowej (CUH)?

Opłaty za korzystanie z przepływów i interaktywnego interfejsu użytkownika w usłudze Data Refinery oraz z zadań profilowania są naliczane na podstawie całkowitej liczby jednostek mocy obliczeniowej, które w ciągu godziny zużywa dany rodzaj obciążenia:

  • Przepływy Data Refinery w domyślnym środowisku Spark potrzebują do działania 1,5 jednostki mocy obliczeniowej na godzinę. W niestandardowych środowiskach wartość ta zależy od liczby procesów wykonawczych i zasobów wykorzystanych przez sterownik Spark i funkcję wykonawczą.
  • Interaktywny interfejs użytkownika usługi Data Refinery wymaga 1,5 jednostki mocy obliczeniowej na godzinę, licząc od uruchomienia interfejsu do jego zamknięcia.
  • Zadania profilowania wymagają 6 jednostek mocy obliczeniowej na godzinę. Za każde wykonanie zadania naliczana będzie minimalna opłata w wartości 0,96 (odpowiadająca 10 minutom).

W ramach każdego planu oferowana jest określona liczba bezpłatnych jednostkogodzin mocy obliczeniowej w miesiącu. W wypadku planów Standard i Professional opłaty zostaną naliczone po przekroczeniu limitu na dany miesiąc. W wypadku planu Lite po przekroczeniu miesięcznego limitu z przepływów Data Refinery i zadań profilowania można skorzystać dopiero w kolejnym miesiącu lub po rozszerzeniu planu do wersji Standard bądź Professional.

Przykładowe przepływy Data Refinery wykorzystujące domyślnie moc obliczeniową 3. rodzaju:

  1. Jeden przepływ Data Refinery działający przez 1 godzinę: 1,5 CUH
  2. Dwa przepływy Data Refinery, każdy działający przez 1 godzinę: 2 godziny * 1,5 CUH = 3 CUH
  3. Jeden przepływ Data Refinery działający przez 30 minut: 0,5 godziny * 1,5 CUH = 0,75 CUH
  4. Interaktywny interfejs użytkownika Data Refinery działa przez 1 godzinę: 1,5 CUH

Przykłady profilowania (zadania profilowania można uruchamiać automatycznie lub ręcznie):

  1. Zadanie profilowania działa przez 30 minut: 0,5 godziny * 6 CUH = 3 CUH
  2. Zadanie profilowania działa przez 9 minut. W tym wypadku ma zastosowanie minimalna opłata: 0,16 godziny * 6 CUH = 0,96 CUH

Ile czasu trzeba poświęcić na skonfigurowanie produktu po zakupie planu Standard lub Professional, by w pełni korzystać z jego możliwości?

Watson Knowledge Catalog to usługa samoobsługowa, więc administrator może zacząć od utworzenia katalogu, a następnie od razu dodać do niego nadzorowane zasoby. Dodatkowe zadania do wykonania to na przykład:

  • Utworzenie glosariusza biznesowego
  • Zdefiniowanie strategii ochrony danych w celu nadzorowania dostępu do danych
  • Zaproszenie użytkowników do korzystania z katalogu

Czy omawiane rozwiązanie jest dostępne w ramach pakietu IBM Cloud Pak for Data?

Tak. Dowiedz się więcej o najnowszej oferowanej przez IBM zintegrowanej platformie danych: IBM Cloud Pak™ for Data

Wypróbuj Watson Knowledge Catalog

Wykorzystaj uczenie maszynowe i sztuczną inteligencję do analizowania swoich danych. Skataloguj swoje dane, aby ułatwić ich wyszukiwanie i użytkowanie.