Data Fabric nostaa tekoälykehityksen uudelle aikakaudelle

By | 4 minute read | Mon, October 25th 2021

IBM Data fabric

Voidaanko datan käyttöä demokratisoida?

Data on tekoälyn raaka-aine. Ilman laadukasta dataa koneoppiminen ei toimi. Google on hyvä esimerkki tiedon käyttöön perustuvista globaaleista hypermenestyjistä. Se ja muutamat muut kuluttajapalveluja tuottavat IT-jätit ovat saavuttaneet ylivoimaisen markkina-aseman perustuen dataan, jonka ne ovat keränneet osana palvelutuotantoa. Asiakkaat maksavat ilmaisen palvelun osin hyvinkin yksityisellä, käytön aikana kerättävällä tiedolla, eli ilmaisia lounaita ei löydy myöskään somesta tai karttapalvelusta.

Vähemmän huomiota on saanut tosiseikka, että jätit ovat onnistuneet kehittämään menetelmät ja organisaation, joka osaa globaalisti skaalautuvan tekoälykehityksen. Niiden pyörittämät datan tuotantolinjat on viritetty tietotehtaiksi, jotka kustannuksia ja työtä kaihtamatta vastaavat liiketoiminnan tarpeisiin. Aiemmin tämä ei ole ollut mahdollista suurimmalle osalle yrityksiä johtuen kustannuksista ja osaajien puutteesta.

Uusi data fabric -arkkitehtuuri tähtää tehokkaaseen toteutukseen automatisointia hyödyntäen. Sillä voidaan demokratisoida kehittämistä ja antaa tasoitusta globaalissa kilpailussa pienemmille yrityksille.

Mikä on data fabric?

Data fabric on uusi tapa toteuttaa tekoälyn ja analytiikan kehittämistä tukeva informaatioarkkitehtuuri. Sen avulla liiketoiminnalle voidaan tarjota ketterä yritystietopohja hyödyntäen hajautetun ympäristön monimuotoisia tietolähteitä. Etevä ratkaisu osaa automatisoida datan löytämisen ja integroinnin tekoälyä hyödyntäen.

Data fabricin komponentit kattavat datan virtualisoinnin ja integroinnin sekä meta- ja masterdatan että tietoturvan tukeutuen moderneihin työkaluihin. Ihanneratkaisun tulisi toimia sekä hybridi- että monipilviympäristöissä ja tukea sekä tiedon hajautettua varastointia että keskitettyä hallinnointimallia.

Data fabric -ratkaisuilla tavoitellaan kustannussäästöjä datan valmistelussa ja hallinnoinnissa, tiedon nopeaa toimitusta analyytikoille sekä tietoturvariskien minimointia.

Miksi automaatio on tärkeää?

Käyttäjän näkökulmasta tiedon käytettävyyden automatisointia voidaan tarkastella asteikolla manuaalinen – täysin automatisoitu. Perinteinen tietovarastointi on esimerkki manuaalisesta ratkaisusta, jossa tietolähteet piti ensin tunnistaa, hankkia niihin käyttöoikeudet ja tietokanta-ajurit ja muu tarvittava tekniikka. Vasta tämän jälkeen päästiin mallintamaan loogista käsittelyä kuten datan transformaatioita ja tietomalleja.

Täysin automatisoitu data fabric tähtää siihen, että vastaukset liiketoimintaongelmiin löydetään ilman teknistä osaamista. Data fabric hakee oikeat tietolähteet käyttäjän tarpeen mukaan liiketoimintaa kuvaavien termien avulla. Se etsii niistä tarvittavan tiedon ottaen huomioon kullekin käyttäjälle annetut oikeudet sekä muokkaa ja yhdistelee tarvittavat datasetit.

Vielä pidemmälle vietynä kokonaisia liiketoimintaprosesseja voidaan automatisoida. Milloin tekoäly voidaan valjastaa operoimaan konepajateollisuuden päivittäistä tuotantoa sisältäen menekin ennustamisen, raaka-aineiden ja puolivalmisteiden hankinnan, tuotantolinjan ohjauksen, varastojen ja kuljetuslogistiikan optimoinnin sekä myynnin ja asiakaspalvelun markkinointia unohtamatta? Jos asetetaan vielä tavoitteeksi, että ihmistä tarvitaan vain ympäristön äkillisissä muutoksissa ja kenties eettisissä kysymyksissä, tarvitaanko vielä 10 vai 20 vuotta, vai hieman enemmän?

Miten IBM:n data fabric -ratkaisu toimii?

IBM Cloud Pak for Data -ratkaisussa on tekoälyn tukemia komponentteja, jotka muodostavat älykkään data fabricin ytimen.

IBM:n ratkaisu automatisoi datan hallinnan tehtäviä. Se etsii, integroi ja luetteloi dataa hajautetussa ympäristössä pitäen samalla huolta tietoturvasta. Se osaa myös yhdistää heterogeeniset tietolähteet ja tietovarastot yhdeksi kokonaisuudeksi ilman tarvetta datan kopioimiseen tai siirtämiseen. Automaatiota edistävät komponentit ovat AutoSQL, AutoCatalog ja AutoPrivacy.

  • AutoSQL on kyselymoottori heterogeenisten tietolähteiden hallintaan. Sen avulla käyttäjä voi hakea yhdellä kyselyllä tietoa erityyppisistä tietolähteistä ml. tietovarastot ja -altaat sekä striimattu data. Datan virtualisoinnin avulla se osaa hyödyntää ja yhdistää tietoa on se sitten yrityksen omissa konehuoneissa tai julkipilvissä. Datan hallinnoinnin sääntöjä se jakaa AutoCatalogin kanssa.
  • AutoCatalog automatisoi datan etsimisen ja luokittelun reaaliaikaista datakatalogia hyödyntäen. Sen ansiosta käyttäjä voi muodostaa kyselyn liiketoiminnan termien avulla ilman teknistä osaamista ja suorittaa sen heterogeenisessä ympäristössä AutoSQL:n avustaessa.
  • AutoPrivacyn avulla toimeenpannaan yrityksen sensitiivisen datan politiikka. Sen avulla voidaan tekoälyn ja analytiikan kehittäjille antaa itsepalveluoikeudet dataan ilman tietoturvan vaarantamista.

IBM Cloud Pak for Data

IBM Cloud Pak for Data -ratkaisu takaa data fabricin oikeaoppisen toteutuksen.

Lisäksi data fabricin ja tekoälykehityksen rajapinnassa IBM AutoAI helpottaa datatieteilijän työtä. Se arvioi käytettävissä olevan datasetin ja suosittelee sen perusteella analysoitavaan käyttötapaukseen parhaiten soveltuvan ennustemallin.

Suomen kansallinen näkökulma

Kotimaisesta näkökulmasta data fabric tarjoaa mahdollisuuden parantaa yritysten tuotekehitystä hyödyntäen kansallisia vahvuuksiamme. Terveydenhuollon ja lääketeollisuuden kehitystä Suomessa tukee hyvin hallittu ja arkistoitu väestödata perustuen mm. henkilötunnuksen käyttöön ja kirkonkirjojen pitkään historiaan. Laadukas väestötieto yhdistettynä data fabriciin tehostaa terveysklusterimme tutkimusta ja tuotekehitystä. Lääketeollisuudelle suunnattu vientituote voisi sisältää sekä arvokkaan suomalaisen raakadatan että data fabric -ratkaisun täydennettynä tekoälyn kehitysmalleilla ja työkaluilla.

Suomalaisen teknologiateollisuuden kirkkaimmat tähdet ja näiden insinöörit miettivät kuumeisesti miten tekoälyn kehittämistä tulisi tehostaa vientituotteiden ja niihin liittyvien palvelujen tueksi. Painopiste on monilla alueilla siirtymässä projektitoimituksista palveluihin. Perinteistä laitteistotoimitusta voidaan täydentää älykkäällä kunnossapidolla, joka kerää ja analysoi käytössä syntyvän datan sekä optimoi huolto-ohjelman tämän perusteella. Entäpä koneen kyljessä asuva tekoäly, joka kommunikoi reaaliaikaisesti asiakkaan muiden järjestelmien kanssa auttaen kehittämään tuotantoprosessia?

Edistääkö data fabric muutosta, kun  korkeatasoisen tuotekehityksen rinnalle rakennetaan datan käyttöön perustuvia palveluja?

Lisätietoa:

https://www.ibm.com/cloud/blog/announcements/automate-data-discovery-governance-and-consumption-with-ibms-data-fabric

https://www.ibm.com/cloud/blog/announcements/intelligently-automate-data-and-ai-with-the-next-generation-of-ibm-cloud-pak-for-data

 

Hannu Löppönen
Data & AI Sales, IBM Finland
hannu.lopponen@fi.ibm.com
+358-400 839 730

[autopilot_shortcode]