noun_Email_707352 noun_917542_cc noun_Globe_1168332 Map point Play Untitled Retweet

Ota datamaailman termit haltuun datasanaston avulla

Mitä dataohjautuvuus tarkoittaa liiketoiminnalle käytännön tasolla? Mihin tarvitaan dataputkea? Mitä eroa on tietovarastolla ja tietoaltaalla?

05 toukokuuta 2020

Datan onnistunut hyödyntäminen yrityksessä perustuu toimivaan kommunikaatioon ja yhteisymmärrykseen datan kanssa työskentelevien tiimien välillä. Termiviidakkoon voi kuitenkin eksyä, jos asioista ei puhuta samoilla sanoilla.

Kokosimme avuksesi datasanaston, josta voit tarkistaa datatermien selitykset ja syöksyä astetta syvemmälle datan maailmaan. Löydät termien yhteydestä linkkejä podcast-jaksoihin, joissa keskustelemme aiheesta lisää tunnettujen yritysten asiantuntijoiden kanssa.

Ota datatermit haltuun datasanastomme avulla:

  1. Analytiikka
  2. API-monetisaatio
  3. APIt ja API-hallinta
  4. Data governance
  5. Data- ja analytiikka-alustat (datacloud)
  6. Data-arkkitehtuuri
  7. Dataekosysteemi
  8. Datakeskeisyys
  9. Datalähtöinen liiketoimintatransformaatio
  10. Datan elinkaari
  11. Dataohjautuvuus
  12. DataOps
  13. Dataputket
  14. Ennakoiva analytiikka
  15. Industry 4.0
  16. Keinoälyn ja analytiikan erot
  17. Tietovaraston ja tietoaltaan erot
  18. Valmistavan teollisuuden datan hallinta

1. Analytiikka

Data-analytiikka, tai analytiikka, on laaja kattotermi, jolla tarkoitetaan datan käsittelyä ihmiselle hyödynnettävään muotoon. Analytiikkaprosessi voi sisältää mm. datan mallinnusta, käsittelyä, tallennusta, tietovarastointia, raportointia ja visualisointia. Analytiikkaa voidaan sisällyttää myös tekoälymenetelmien käyttöön. Tällöin puhutaan edistyneestä tai ennakoivasta analytiikasta.

Analytiikasta puhuttaessa tarkoitetaan usein erityisesti prosessin loppupäätä: datan hyödyntämistä ja tulosten esittelyä ihmisille. Näin datan esikäsittelyvaiheet jäävät vähemmälle huomiolle. Analytiikan tulosten laatu on kuitenkin hyvin riippuvainen datan ja sen käsittelyn laadukkuudesta.

Analytiikka voidaan jakaa osa-alueisiin monella tapaa. Tällaisia osa-alueita ovat esimerkiksi bisnesanalytiikka joka analysoi taloustietoja, verkkokäytön analytiikka ja ohjelmistojen käyttäytymisen analytiikka turvallisuusnäkökulmasta. Analytiikan eri vaiheisiin on olemassa useita yleiskäyttöisiä ohjelmistoja ja ohjelmointityökaluja. Eri käyttötarkoituksiin löytyy myös omia erityistarpeisiin valmistettuja työkaluja kuten talouden raportointijärjestelmät ja verkon analytiikkatyökalut.

2. API-monetisaatio

API-monetisaatio on prosessi, jonka avulla liiketoiminnot voidaan kerätä API-rajapintojen avulla. API-tarjoaja voi monetisaation tuella luoda jo olemassa olevasta datasta ja liiketoimintamalleista uusia liikevaihtoa tuottavia palveluita asiakkailleen ja kumppaneilleen.

3. APIt ja API-hallinta

API on ohjelmointirajapinta, jonka avulla eri osapuolet voivat vaihtaa tietoa ja tehdä pyyntöjä eri järjestelmien ja palveluiden välillä. API nähdään myös sopimuksena API-tarjoajan (API Provider) ja API-kuluttajan (API Consumer) välillä, missä API-kuluttaja saa palvelua sovitusti ja dokumentoituna. 

APIen tuomat hyödyt liiketoiminnoille ovat uusien palveluiden nopeampi kehittäminen, kustannustehokkuus sekä uudet liiketoimintamahdollisuudet esimerkiksi API-monetisaation avulla. APIt tuovat myös enemmän ketteryyttä ja joustavuutta IT-toimintoihin.

APIt luokitellaan kolmeen kategoriaan: yksityiset eli yrityksen sisäiset APIt, asiakas- ja kumppani-APIt sekä julkiset eli avoimet APIt. Yksityiset APIt mahdollistavat mm. yritysten sisäisten järjestelmien tiedon vaihdon, mikropalveluiden integroinnin sekä pilvipalveluiden integroinnin. 

Asiakas- ja kumppani-APIt tuovat yrityksille paremmat edellytykset tuottaa reaaliaikaisia palveluita omille asiakkaailleen sekä ketterämpää tiedon vaihtoa ja uusia liiketoimintamalleja ja -sovelluksia kumppaneiden kanssa (esim. IoT mahdollisuudet). 

Avoimet API-rajapinnat tuovat yrityksille mukanaan täysin uusia liiketoimintamahdollisuuksia ja palveluita, kuten erilaiset web- ja mobiilisovellukset.

Jotta API-hallinta olisi sujuvaa ja hallittua koko APIn elinkaaren ajan, on kehitetty erilaisia hallinta-alustoja ja toimintamalleja keskitettyyn API-hallintaan ja -valvontaan. Nämä alustat sekä toimintamallit tukevat myös APIen tietoturvaa sekä antavat mahdollisuudet optimoida, monitoroida sekä kerätä analytiikkaa APIen toiminnasta ja käytöstä.

4. Data governance

Data governancen eli tiedonhallintamallin ytimessä on datan omistajuus. Yrityksen liiketoimintayksiköillä, laitteilla ja kiinteistöillä on omistaja, joka huolehtii niiden käytöstä ja pyrkii maksimoimaan niistä saatavan liiketoimintahyödyn. Näin pitäisi olla myös yrityksen omistamilla datajoukoilla. 

Datajoukon omistajan tehtävänä on huolehtia siitä, että datan laatu on hyvä ja sen käyttöoikeudet noudattavat asetettuja sääntöjä. Yrityksen tiedonhallintamallin pitäisi määrittää datan omistajille sekä muille datan käyttäjille toimintamallit ja työkalut tätä varten.

Data governancen henkeen kuuluu, että mahdollisimman monella yrityksen työntekijällä on pääsy ja näkyvyys kaikkeen tarvittavaan dataan – yli organisaation yksikkörajojen. Datan käyttöoikeuksia rajataan vain hyvin perustein, kuten esimerkiksi yksityisyyssyistä. 

Jotta organisaatio voi hyödyntää hallussaan olevaa dataa kokonaisvaltaisesti ja kehittää liiketoimintaansa dataohjautuvaksi on valtavan tärkeää, että tiedonhallintamalli on olemassa ja se on jalkautettu käyttöön. Mikäli tämä organisaatiolta vielä puuttuu, sen toteuttaminen kannattaa aloittaa sellaisesta datajoukosta, jolla on eniten liiketoiminta-arvoa ja joka on priorisoitu organisaation ylimmän johdon toimesta.

Usein nopeimmat hyödyt saadaan sillä, että lähtökohtana on jokin merkittävää liiketoimintahyötyä tuottava analytiikan kehitysprojekti.

Tutustu aiheeseen lisää lukemalla tai kuuntelemalla Tietoa tulevasta -podcastin neljäs jakso, jossa pohditaan, miten dataa hyödynnetään finanssimaailmassa.

5. Data- ja analytiikka-alustat (datacloud)

Moderni pilvipalveluihin perustuva data- ja analytiikka-alusta yhdistää perinteisen raportointikäytön moderniin analytiikkaan ja datatieteilijöiden palveluihin sekä tarjoaa alustan esimerkiksi tekoälyyn perustuville datalähtöisille sovelluksille.

Alusta hyödyntää kaiken muotoista dataa sekä organisaation sisältä, kumppaneilta että ulkoisilta tahoilta. Data prosessoidaan erilaisiksi tietotuotteiksi lähes reaaliajassa. Tämä mahdollistaa ajantasaisen näkymän organisaation tilaan. Perustietojen lisäksi näkymät voivat sisältää esimerkiksi koneoppimisalgoritmien tuottavia ennustuksia.

Alusta koostuu moderneista julkipilven palveluista. Palvelut ovat sekä teknisesti että lisenssimalliltaan elastisia, eli niistä täytyy maksaa vain käytön mukaan, ja palveluita voidaan viipaloida eri käyttäjäryhmille. Tällöin esimerkiksi yksittäinen raskas analytiikka-ajo ei häiritse normaaleja operatiivisia tiedonjalostusprosesseja, eikä esimerkiksi kerran vuodessa toistuvaan ajoon tarvitse varata koko vuodeksi resursseja.

Lue tai kuuntele aiheesta lisää Tietoa tulevasta -podcastissamme.

6. Data-arkkitehtuuri

Data-arkkitehtuuri on osa kokonaisarkkitehtuuria ja sillä voidaan viitata useaan eri näkökulmaan. Usein viitataan data-arkkitehtuurin artefakteihin eri abstraktiotasoilla, eli tietomalleihin, määrittelyihin sekä tietovirtojen ja metadatan kuvauksiin. 

Näiden artefaktien avulla datan käsittely voidaan suunnitella ja toteuttaa järjestelmähankkeissa siten, että ne tukevat data uudelleenkäyttöä, laatua, tietoturvaa ja yksityisyydensuojaa, sekä vastaavat liiketoiminnan vaatimuksiin yli toiminnallisten siilojen.

Tutustu aiheeseen tarkemmin blogissamme tai kuuntele datan maailmaan syventyvää Tietoa tulevasta -podcastiamme.

7. Dataekosysteemi

Dataekosysteemi on avoin tai suljettu toimijoiden verkosto, jossa toimijoiden välillä on intressi vaihtaa dataa yhteisten sääntöjen – eli rajapintojen ja tietomallien – mukaisesti. Ekosysteemin jäseniä yhdistää se, että he hyötyvät muiden datasta niin paljon, että heidän kannattaa luovuttaa omaa dataansa muille. Vaihdanta voi perustua vaihtokaupan sijaan myös rahalliseen korvaukseen.

Dataekosysteemillä on yhteisesti sovittu visio, jonka avulla mahdollistetaan monimuotoisempi data- ja ratkaisupohja verrattuna siihen, mitä yksittäinen toimija voisi yksin saavuttaa. Ekosysteemillä voi olla omistaja, jolloin tyypillisesti on kyse yhden toimijan ylivoimasta ja hyödystä. Vaihtoehtoisesti ekosysteemin omistajuus voi olla hajautettu jäsenille, jolloin kaikki ekosysteemin toimijat ovat tasavertaisia.

Joissakin tilanteissa dataekosysteemillä on erillinen operaattoritoimija, joka huolehtii toimijoiden välisestä yhteensopivuudesta sekä datan liikuttamisesta toimijoiden välillä – ilman, että se itse hyödyntää ekosysteemin dataa omassa toiminnassaan. 

Hyvässä dataekosysteemissä mukana oleminen tai jopa dataekosysteemin omistaminen on parhaimmallaan merkittävä kilpailuetu. 

Lue tai kuuntele Tietoa tulevasta -podcastin kolmannesta jaksosta dataekosysteemin roolista kansainvälisessä yhteistoiminnassa.

8. Datakeskeisyys

Datanhallinnassa datakeskeinen toiminta tarkoittaa sitä, että organisaation liiketoimintaprosessit ja käsitteet ovat toiminnan keskipisteenä, eikä niinkään sovellukset, jotka näitä suorittavat.

Yhteisen käsitteistön ja datastandardin avulla toiminta ketteröityy, digitalisaatio mahdollistuu ja data on valmista esim. tekoälyn tai koneoppimisen käyttöön – nopeammin ja edullisemmin.

Datakeskeinen toimintamalli tukee jatkuvuutta - teknologiat muuttuvat, mutta tietyt osat prosesseista ja niiden käsittämistä asioista säilyvät.

Tutustu aiheeseen tarkemmin kuuntelemalla datan maailmaan syventyvää Tietoa tulevasta -podcastiamme.

9. Datalähtöinen liiketoimintatransformaatio

Liiketoimintatransformaatiolla tavoitellaan merkittävää liiketoiminnan tai liiketoimintaprosessien uudistamista. Datalähtöisessä liiketoimintatransformaatiossa tämä mahdollistetaan datan ja analytiikan – eli dataohjautuvuuden – paremmalla hyödyntämisellä. 

Nykyisellään organisaatiot joko eivät käytä dataa juuri lainkaan perinteisen talousraportoinnin lisäksi tai käyttävät sitä pistemäisesti. Uudenlaisessa datalähtöisessä ajattelussa data valjastetaan liiketoiminnan, johtamisen ja palvelutuotannon prosessien parantamiseen yli organisaation toimialarajojen. 

Datalähtöinen liiketoimintatransformaatio edellyttää teknologian käyttöönottamisen lisäksi erityisesti datan saatavuuden, datan laadun, toimintamallien ja datalähtöisen kulttuurin kehittämistä.

Tutustu aiheeseen tarkemmin kuuntelemalla datan maailmaan syventyvää Tietoa tulevasta -podcastiamme.

10. Datan elinkaari (data lineage)

Tiedon elinkaari (data lifecycle) tarkoittaa tietoelementtien ja tietovarojen eri vaiheita tiedon luonnista sen tuhoamiseen. Vaiheita ovat esimerkiksi tallentaminen, varastointi, siirto, käyttö ja arkistointi.

Tietoturvan ja yksityisyyden suojan vaatimusten vuoksi on tärkeää, että myös tiedon elinkaaren loppupäälle asetetaan liiketoiminnan vaatimukset, kuten kuinka kauan kyseistä tietoa saa/pitää säilyttää ja miksi.

Tiedon liikkumista eri järjestelmien välillä ja sen muuntumista matkalla tiedon lähteeltä sen kuluttajille visualisoidaan metatiedon hallintajärjestelmien avulla. Tiedon elinkaaren visualisoinnista käytetään termiä data lineage.

Syvenny aiheeseen tarkemmin lukemalla blogimme tai kuuntelemalla datan maailmaan syventyvää Tietoa tulevasta -podcastiamme.

11. Dataohjautuvuus

Dataohjautuvuudella tarkoitetaan sitä, että organisaatiossa päätökset tehdään tietoon perustuen. Edellytyksenä dataohjautuvalle organisaatiolle on, että dataan voidaan luottaa ja se on helposti saatavilla. Teknologia ja järjestelmät eivät riitä, vaan onnistumiseen tarvitaan ihmisiä ja kulttuurinmuutosta. Dataohjautuvuus luo uusia mahdollisuuksia: oikein hyödynnettynä data tehostaa toimintaa, parantaa tuloksia, tuo kilpailuetua ja luo uusia liiketoimintamahdollisuuksia.

Lue lisää dataohjautuvuudesta ja kuuntele myös Tietoa tulevasta -podcastin ensimmäinen jakso, jossa tutustutaan tietohallinnon ja liiketoiminnan toimivan yhteistyön tuloksiin.

12. DataOps

DataOps tulee sanoista Data Operations ja tarkoittaa toimintamallia, joka hyödyntää erilaisia henkilörooleja ja teknologioita dataputkien (data pipeline) automatisoituun hallintaan ja tukemaan datalähtöistä liiketoiminnan kehitystä.

Yritysten ymmärrys datan arvosta on lisääntynyt, mutta liiketoimintadatan tuotteistaminen hyötykäyttöön vaatii teknologiaorganisaatioiden ja liiketoimintojen yhteistyötä. Liiketoimintadatasta on pystyttävä nopeasti luomaan lisäarvoa tuottavia kokonaisuuksia (datatuotteita), jolloin liiketoimintojen ja niitä tukevien teknologiaorganisaatioiden välinen yhteistyö vaatii uudenlaista lähestymistä. Tähän DataOps pyrkii vastaamaan.

DataOps on itseasiassa liiketoimintaongelman ympärille muodostettava poikkitieteellinen tiimi, joka organisoi tiedon tuottamiseen tarvittavaa dataa, työkaluja, koodia ja kehitysympäristöjä pitäen samalla huolen dataputkien skaalautuvuudesta, toimivuudesta ja muutoksista. Tiimi pyrkii jatkuvan toimituksen (continuous delivery) periaatteiden mukaisesti tuottamaan lähdedatasta nopeasti liiketoimintoja hyödyttävää tietoa.

Lue tai kuuntele aiheesta lisää Tietoa tulevasta -podcastissamme.

13. Dataputket

Dataputki (data pipeline) on hallittu toimintokokonaisuus datan jalostukseen ja liiketoiminta-arvoa tuottavien datatuotteiden luontiin. Datatuote voi olla esimerkiksi raportti tai koneoppimis­algoritmin tuottama ennuste, jota käytetään rajapinnan kautta.

Dataputki sisältää ja yhdistää useita komponentteja, jotka kattavat lähdedatan lukemisen, datan muokkauksen ja analysoinnin, tallennuksen eri tietomalleihin sekä datan aktivoinnin jalostetun datatuotteen kautta. Komponentit perustuvat mikropalvelumalliin, joten yksittäisillä komponenteilla voi olla eri kehittäjätahoja ja eri elinkaari.

Tutustu aiheeseen tarkemmin kuuntelemalla datan maailmaan syventyvää Tietoa tulevasta -podcastiamme.

14. Ennakoiva analytiikka

Koneoppimisella ja tilastollisilla menetelmillä on mahdollista mallintaa tulevia tapahtumia aiemman datan perusteella. Kun analytiikka hyödyntää tällaista mallinnusta, sitä kutsutaan ennakoivaksi. Tyypillisiä sovellusalueita näille malleille ovat asiakaspoistuman todennäköisyys, talouslukujen ennustaminen ja laitteiston huoltotarpeen ennakointi.

Ennakoivaksi analytiikaksi kutsutaan myös mallinnusta, jossa aiemmasta tapahtumasta haetaan uutta tietoa. Esimerkkinä tälle on sentimenttianalyysi, jossa asiakkaan antaman palautteen tai kommentin sävyä arvioidaan automaattisesti. Vaikkapa kriittiseen palautteeseen voidaan tällöin reagoida välittömästi.

Ennakoiva analytiikka erotetaan yleensä kuvailevasta analytiikasta siksi, että tilanteen raportoinnin sijaan hankitaan uutta tietoa, joka ei välittömästi ollut saatavilla.

Lue tai kuuntele aiheesta lisää Tietoa tulevasta -podcastissamme.

15. Industry 4.0

Industry 4.0 on visio kehittyneestä teollisuudesta, joka hyödyntää ekosysteemejä, teollista internetiä, moderneja teknologioita ja uusia liiketoimintamalleja. Vision taustalla on perinteisten valmistus- ja tuotantomenetelmien digitaalinen transformaatio. Sen vauhdittajina toimivat koneiden ja laitteiden älykkyyden ja yhdistettävyyden räjähdysmäinen kasvu sekä nopeasti kehittyvät teknologiat, kuten digitaaliset tuotantoketjut, robotiikka, sensorit, 3D-tulostus, lisätty todellisuus, digitaaliset kaksoset, Big Data -alustat, tekoäly ja koneoppiminen.

Industry 4.0:n keskiössä ovat kyberfyysiset järjestelmät. Ne kuvaavat älykkäitä, toisiinsa kytkeytyneitä teollisia tuotanto- ja logistiikkayksiköitä, jotka kykenevät kommunikoimaan keskenään sekä toimimaan ja mukautumaan itsenäisesti vaihtelevissa toimintaolosuhteissa. Tällaisten järjestelmien toiminta myös vaatii ja tuottaa paljon dataa, jonka hyödyntäminen vaatii analysointia ja prosessointia esimerkiksi tekoälyn ja koneoppimisen avulla.

Proaktiivinen integraatio, tiedon läpinäkyvyys ja välitys yritysten, asiakkaiden ja tuotteiden välillä onkin avainasemassa, jotta teknologiakehityksen tuomat hyödyt voidaan valjastaa hyötykäyttöön. Näin ollen datalähtöinen ajattelu, analytiikka ja esimerkiksi dataekosysteemit ja datan hallinta nousevat yrityksissä entistä merkittävämpään rooliin.

Lue tai kuuntele aiheesta lisää Tietoa tulevasta -podcastissamme.

16. Keinoälyn ja analytiikan erot

Keino- eli tekoäly on sateenkaaritermi älykkääksi mielletyille ratkaisuille. Esimerkkejä keinoälystä ovat internetin hakukoneet, älykaiuttimet ja itseohjautuvat autot. Keinoälyyn usein liitetään järjestelmien autonomisuutta; riippumattomuutta ihmisen päätöksenteosta. Analytiikalla taas viitataan ihmiselle tuotettavaan dataperustaiseen raportointiin ja visualisointiin.

Analytiikka voi hyödyntää keinoälyn – usein koneoppimisen – avulla saatavaa tietoa. Toisaalta keinoälyn kehittämisessä hyödynnetään saatavilla olevan datan analytiikkaa. Voidaan vaikka selvittää, mitä ihmiset älykaiuttimelta toivovat sekä miten tuote on vastannut tarpeisiin. Samoin liiketoiminnan keinoälypohjaiset päätöksentekojärjestelmät vaativat alleen tarkkaa talouslukujen analytiikkaa.

Analytiikkaan verrattuna keinoäly ottaa kuitenkin monta askelta pidemmälle kohti itsenäistä tiedon hyödyntämistä.

Lue tai kuuntele aiheesta lisää Tietoa tulevasta -podcastissamme.

17. Tietovaraston ja tietoaltaan erot

Tietovarasto tukee organisaation perinteisiä ydintoimintoja ja vastausten saamista määriteltyihin kysymyksiin tunnetusta lähdedatasta. Tietoallas tukee ennustavampaa ja kokeellisempaa lähestymistapaa.

Tietovarasto on pääosin tarkoitettu rakenteellisen tiedon käsittelyyn. Tietoallas mahdollistaa organisaation kaikenlaisen datan käsittelyn. Koska tietovaraston ja tietoaltaan käyttötapaukset ovat erilaisia, täydentävät ne toisiaan.

Tietoallasta käytetään usein tietovaraston yhteydessä tallentamaan kaikki raakadata, josta tietovarastoon välitetään vain soveltuva osa. Viime aikoina markkinoille on tullut myös ratkaisuja, jotka ovat tietoaltaan ja tietovaraston sekoituksia. Tällaiselle hybridiratkaisulle ei ole vielä vakiintunutta termiä.

Lue tai kuuntele Tietoa tulevasta -podcastin viides jakso, jossa syvennytään teknologian ja digitaalisuuden mahdollisuuksiin terveydenhuoltoalalla.

18. Valmistavan teollisuuden datan hallinta (installed base)

Valmistavan teollisuuden yritysten liiketoiminta perustuu siihen, että rakennetaan laite, joka myydään tai vuokrataan asiakkaalle. Tällaiset yritykset keräävät liiketoiminnastaan paljon erilaista tietoa: mitä on myyty ja kenelle, mistä osista laitteet on valmistettu, kuka niitä käyttää, sekä milloin ja miten paljon laitteita on huollettu.

Jos tämä data on hyvin hallinnassa, voidaan laitteiden elinkaarta mallintaa tarkasti. Tämä mahdollistaa monenlaisten palveluiden tuottamisen aina laitteiden käyttöön perustuvista rahoitusratkaisuista ennakoivaan huoltoon ja varaosien myyntiin.

Jos data ei ole laadukasta, liiketoiminnan digitalisaatio on mahdotonta. 

Eri perusjärjestelmistä saatavien tietojen yhdistäminen, rikastaminen sekä sen perusteella tehtävä ennustaminen mahdollistaa asiakkaiden käyttöön toimitettuihin laitteisiin liittyvien palveluprosessien automaation.

Lue aiheesta lisää tai kuuntele Tietoa tulevasta -podcastin toinen jakso, jossa perehdytään globaalisti toimivan teollisuusyrityksen datan hallintaan ja digitalisaatioon.

Haluatko perehtyä aiheeseen syvemmin?

Nappaa Tietoa tulevasta -podcasti seurantaan Spotifyssa ja seuraa meitä Instagramissa, niin pysyt ajan tasalla uusista jaksoistamme, joissa datasanaston termit heräävät eloon käytännön esimerkkien avulla. Kun liiketoimintasi kaipaa uutta teknologiaa tavoitteiden saavuttamiseksi, on TietoEVRY:n syväosaaminen käytössäsi.

Haluatko tietää lisää?

Roosa-Maria Säntti

Head of Cloud, Data and Insight

Jaa Facebookissa Jaa Twitterissä Jaa LinkedInissä