Yritysarkkitehtuuri konsultti
Datan hyötykäytön anatomiaa

Miten dataa pitäisi hyödyntää? Mikä osa datasta on relevanttia ja mikä voidaan sivuuttaa? Miten ihmiset liittyvät datan hyödyntämiseen? Näihin kysymyksiin nykypäivän dataintensiivisessä ympäristössä törmätään yhä useammin. Miltä suunnalta datan hyötykäyttöä voisi sitten lähestyä?

Yksi suunta on pohtia ensin, mistä data tulee. Voidaan sanoa, että liiketoiminnassa jokainen toiminto tuottaa dataa. Sitä muodostuu yrityksen omasta toiminnasta, asiakkaiden ja kumppaneiden toiminnasta. Myös yrityksen ulkoisesta toimintaympäristöstä muodostuu dataa, jota voidaan käyttää yrityksen toiminnan ohjaamiseen. Katsotaan seuraavaksi, mitä alueita datan hyödyntäminen sisältää.

Datan hyödyntäminen liiketoiminnassa

Datan olemus

Datan käyttämistä arvioitaessa on hyvä lähteä ensin siitä, mitä data itseasiassa on. Data on yksinkertaisimmillaan tiedon yksikkö. Puhtaassa datassa ei ole informaatioarvoa tai järjestystä, vaan vasta annettaessa datalle merkitys ja yhdistämällä dataa, saadaan sen jalostusarvoa nostettua.

Otetaan esimerkkinä tietokannan sarake, joka sisältää arvoja 0 tai 1. Itsessään tämä ei kerro vielä mitään, vaan vaaditaan tieto siitä, mitä tämä data tarkoittaa: esimerkiksi tietokannan sarakkeen nimi ja onko kysymyksessä esimerkiksi asiakkaan tilauksen tila (lähetetty/ei lähetetty). Yhdistelemällä dataa saadaan jalostusarvoa nostettua vielä lisää. Tätä esimerkin yhtä bittiä voidaan käyttää vaikkapa kokoamaan kaikki asiakkaiden lähettämättömät tilaukset jatkoanalysointia varten.

Yksi tapa luokitella yrityksen dataa on “operatiivinen-analyyttinen” -akseli. Osittain tämä jaottelu tulee siitä, että näillä kahdella luokalla on erilaiset tarpeet datan käsittelyyn. Operatiivista dataa luetaan ja päivitetään (CRUD), mutta analyyttistä dataa vain kirjoitetaan. Operatiivista dataa on myös yleensä selvästi pienempiä määriä kuin analyyttistä dataa. Operatiivinen data on yksinkertaisemmassa muodossa esimerkiksi tietokannan tauluissa (taulukkomuoto). Analyyttinen data voi olla usein melkein ilman rakennetta. Se voi olla lokirivejä, tekstiä tai kuvia. Operatiivinen data on yleensä ajan tasalla, mutta analyyttinen data on aina historiadataa.

Datan varastointi

Yrityksen dataa on kokoelmina erilaisissa datavarastoissa. Tässä ei tarkoiteta pelkästään perinteisiä tietokantoja ja tietovarastoratkaisuja, vaan kaikkia tapoja, joilla dataa tallennetaan ja käsitellään yrityksessä. Kokoelmalla dataa on erilaisia ulottuvuuksia, joita voidaan arvioida. Näitä ulottuvuuksia ovat esimerkiksi määrä, arvo, vauhti, muoto ja luotettavuus.

Datan varastoinnin käytännön tavat ja vaadittavat työkalut vaihtelevat näiden ulottuvuuksien mukaan. Pieniä määriä dataa voi varastoida hyvin erilaisilla tavoilla verrattuna suuriin määriin. Vastaavasti taulukkomuotoisen datan varastointi eroaa merkittävästi videoiden varastoinnista. Datan ulottuvuudet määrittelevät suurelta osin järkevät tavat varastoida ja käsitellä dataa.

Erilaisista datavarastoista dataa voidaan tarjota ulos vaihtelevin tavoin. Sillä, miten dataa varastoidaan ja miten dataa tarjotaan ulos näistä varastoista on suuri merkitys datan käyttömahdollisuuksien kannalta. Tästä päästäänkin seuraavaan alueeseen, joka on datan analysointi, eli erilaiset analytiikan tavat.

Analytiikan tehtävä on vastata liiketoiminnan kysymyksiin

Vasta datan ja sopivien tallennustapojen kautta päästään lähemmäksi liiketoiminnan hyötyjä. Voidaan alkaa miettiä, millä tavoin parhaiten pystytään vastaamaan liiketoiminnan kysymyksiin. Nämä kysymykset voivat vaihdella hyvin yksinkertaisten mittareiden seuraamisesta edistyneempiin, ennustaviin kysymyksiin. Se, millä tavalla näihin pystytään vastaamaan, tulee erilaisista analytiikan tekniikoista.

Yksinkertaisimmillaan analytiikka on kevyiden tilastollisten menetelmien ja visualisointien käyttöä. Datasta voi tehdä näillä menetelmillä esimerkiksi ad hoc -raportteja tai reaaliaikaisia dashboardeja. Voidaan seurata reaaliajassa verkkokaupan mittareita, kuten asiakasmäärän vaihtelua päivätasolla ja mitä asiakkaat tarkemmin tekevät verkkokaupassa.

 

Näistä yksinkertaisista tilastollisista menetelmistä on pieni askel siirtyä eteenpäin käyttämään edistyneempiä tekniikoita, esimerkiksi yksinkertaisia ennustavia malleja. Asuntokaupassa voi ennustaa käytetyn asunnon hintaa asunnon ominaisuuksien perusteella. Tämän voisi tehdä kohtuullisen yksinkertaisesti usean muuttujan lineaarisella regressiolla. Syötteenä olisi dataa asunnosta, sen paikasta ja muista ominaisuuksista. Lopputuloksena olisi asunnon ennustettu hinta.

Edistyneemmissä yrityksissä tekoälytekniikat voivat olla sisäisen käytön lisäksi suoraan asiakkaiden käytössä: tekoälyä tarjotaan asiakkaan ongelman ratkaisuun. Esimerkkinä tästä voisivat olla suosituspalvelut, jotka osaavat suositella verkkokaupan asiakkaille tuotteita sen mukaan, mitä samantyyppiset asiakkaat ovat ostaneet. Tämän voisi yksinkertaistettuna tehdä klusteroimalla asiakkaat ryhmiin ja katsomalla, mitä tuotteita nämä ryhmät usein ostavat. Yksittäiselle asiakkaalle voi sen jälkeen suositella tuotteita viiteryhmän ostamien tuotteiden mukaan.

Erilaisia analytiikan käyttömahdollisuuksia on paljon. Kaikissa analytiikan tavoissa visuaalisuus on tärkeä apuväline. Hyvin tehdystä kuvasta saa nopeammin yleisnäkymän dataan. Visualisointeja voi hyödyntää monenlaisiin tarkoituksiin raportoinnissa ja dashboardeissa. Kuvia voi myös käyttää itse analytiikan toiminnan ymmärtämiseen ja kehittämiseen.

Haasteita

Datan hyödyntämisen haasteisiin on hyvä ottaa kokonaisnäkymä, jotta ei ajauduta tilanteeseen, jossa tarvittavaa tietoa johtamiseen ei ole saatavilla. Haasteisiin voi olla monia syitä: data voi olla kovin siiloutunutta yrityksen sisällä erilaisissa tietojärjestelmissä, tai se voi olla epäyhteensopivissa muodoissa. Tähän liittyen yksi tärkeä näkökulma on datan omistajuus ja se, kuinka erillään datan tuottamisen ja hyödyntämisen toiminnot ovat. Tämän eron ollessa kovin suuri voi siitä aiheutua ongelmia, esimerkiksi syvällisen liiketoiminta-alueen ymmärryksen puuttuessa siellä, missä dataa käsitellään.

 

Vaikka datan hyödyntämisessä laaja kuva on tärkeää, on silti myös hyvä pitää mielessä, että koko maailmaa ei tarvitse aina ratkaista kerralla. Datan käyttämisessä voidaan saada nopeammin konkreettisia hyötyjä, jos sitä lähdetään tekemään osittain ja iteratiivisesti. Yhdenkin liiketoiminta-alueen datalähteen käyttäminen analysoinnissa voi tarjota hyötyjä tai se voi avata myöhemmin laajempia mahdollisuuksia ja ideoita yrityksen data-arkkitehtuurin kehittyessä.

Menneisyydestä tulevaisuuteen

Analytiikan kypsyystason kehittyessä voidaan siirtää tarkkailukohdetta pitkältä menneisyydestä lähemmäs nykyhetkeä ja myös tulevaisuuteen. Kyvykkyyden kehittyessä yrityksessä saadaan päätöksenteon tueksi yhä tarkempaa materiaalia. Dataa ja analyysia saadaan yhä reaaliaikaisemmin ja yksityiskohtaisemmin. Voidaan siirtyä jo ennustamaan asioita pelkän jälkikäteen reagoimisen sijaan.

Liiketoiminta-alueiden ymmärrys löytyy yrityksen ihmisistä. Näin ollen heidän olisi hyvä olla mukana tiiviisti myös datan hyödyntämisessä. Vaikuttaa siltä, että parhaiten toimivat yritykset käyttävät laajasti dataa liiketoiminnan hyödyksi unohtamatta ihmisten osallistamista tähän prosessiin.

Vesa Saarinen

Lähetä Vesalle sähköpostia.

Vesa on koneoppimisesta ja analytiikasta kiinnostunut Reflectorin ratkaisuarkkitehti.

Reflector on ICT-talo, jonka ykköstehtävä on auttaa asiakkaitamme liiketoiminnan isoissa ja pienissä muutoshankkeissa. Ketterästi ja riippumattomasti.

Jaa artikkeli

Voisit pitää myös näistä:

Vaatimusmäärittely

Onko vaatimusmäärittelylle paikkaa SAFe-junassa?

Joskus IT-ammattilaisten kahviautomaattikeskusteluja kuunnellessa syntyy vaikutelma, että ketteryys, Scrum esimerkkinä, kadottaa tarpeen perinteiseen järjestelmäkehitykseen kuuluvalle vaatimusmäärittelylle ja kattavalle toiminnalliselle määrittelylle. Kun keskusteluun tuodaan

Lue lisää
Kokonaisarkkitehtuuri Reflector

Ota yhteyttä, mietitään yhdessä juuri teille parhaat ratkaisut

Täytä tiedot ja siirry lataamaan tutkimus

Kokonaisarkkitehtuuri Reflector

Get in touch!