Big data – tiedonsirpaleista arvokkaita vastauksia
Helpoin keino saada oma kirjoitus osaksi Yhdysvaltain Kongressin kirjaston kokoelmia on varmaankin twiitata. Digitaalisen datan kasvusta ei ole epäilystä, mutta yllätyksenä tulevat edelleen tilanteet ja muodot, joissa uutta dataa syntyy ja sitä kerätään. Vielä enemmän yllättää, kun tutusta tiedosta kaivetaan esille aiemmin tuntematonta. Ja joko osaat arvioida, miten suuri on digitaalinen varjosi?

Elämämme on melkoisen läpinäkyvää, olemme mitä twiittaamme. Netissä oleva data kertoo ihmisten päivittäisestä tilasta paljon. Mukana kuljettamamme älypuhelin tietää meistä enemmän kuin me kyseisestä laitteesta.
Älypuhelimesta kertyvä tieto on erilaista kuin mihin itse keskitymme, mutta koottuna arvokasta. Viestiemme lisäksi erilaista dataa syntyy paikkatiedosta, lokeista, selaushistoriasta, hakusanoista, ostotapahtumista, verkkoliikenteestä, liiketunnistimesta, mainosklikkauksista, soittolokeista, kontaktiverkostosta ja niin edelleen. Yksittäinen twiitti tuntuu merkityksettömältä, mutta miljoonan twiitin analysointi antaa jo kuvaa yleisestä terveydentilasta tietyllä alueella, kuten ilmassa leijuvien hiukkasten aiheuttamasta allergiahuipuista.
Talvisen flunssaepidemian liikkeiden ennustaminen muistuttaakin jatkossa sääennusteita, tosin paremmalla tarkkuudella ja pidemmällä ajanjaksolla. Suurkaupungeissa digitaalisen jalanjäljen analysointi paljastaa kahdeksan päivää etukäteen, 90 prosentin varmuudella, flunssa-aallon saapumisen. Sosiaalisen median ja pilven jälkeen big datasta on tullut tietotekniikan seuraava megatrendi.
Kyse on tiedon kaivamisesta esille. Jo muutaman viikon lämpöaalto aiheuttaa tukalan olon etenkin vanhuksille. Tähänkin on apua saatavilla. Sähkönkulutuksen seuranta paikantaa taloudet, joissa ilmastointia ei ole käytössä. Kun nämä tiedot yhdistetään väestörekisterin tietoihin, riskiryhmään kuuluviin vanhuksiin voidaan pitää yhteyttä, ja tarvittaessa heille voidaan myös järjestää väliaikainen oleskelu ilmastoiduissa tiloissa. Tälläkin tavalla digitaalinen data auttaa järjestämään ja tuottamaan yhteiskunnan palveluita tehokkaasti.
Se ei ole isoa eikä edes dataa
Big data ei itse asiassa ole suurta. Liki kaikki siihen liittyvä tieto on kooltaan pientä, mutta sitä on paljon. Kymmenien teratavujen tietokannat ovat tyypillisiä, petatavut samoin. Siksi teemaa kutsutaan isoksi.
Eikä kyse ole itse asiassa edes datasta. Data on vain kuvaus siitä, miten jotkin asiat maailmassa toimivat. Kyse on prosessista, jolla tietoa sovelletaan tiettyyn asiayhteyteen.
Hyödyllisen digitaalisen datan määrää voidaan lisätä ja kohdistaa se halutulle prosessille. Hyvinvointipalveluissa sensoreiden käyttö lisääntyy, niin sairaaloissa kuin kotona. Potilaiden terveydentilan jatkuva valvonta helpottuu. Liki reaaliaikainen datan läpikäynti tunnistaa poikkeamat normaalioloista, ja yhteys terveyskeskukseen tai -palveluun voidaan tarvittaessa tuottaa jopa automaattisesti. Periaatteessa myös lääkeannosten oikeanaikaista ottamista voidaan seurata ja tukea etäisesti, ja puhelin voi piipata unohtuneista lääkkeistä.
Heilahtelun voima
Tesco on yksi maailman suurimmista ruokakauppaketjuista. Se päivittää myymälöiden tuotekohtaiset myyntiennusteet 18 miljoonalle tuotteelleen kolmesti päivässä. Lähiajan sääennuste tarkennetaan kolmesti päivässä. Salaatin ja kaalin kysyntä kasvaa, mutta itujen laskee, kun sää paranee ja lämpötila nousee. Vastaavasti kasvaa myös voileipien myynti, mutta vain keskusta-alueilla ja arkipäivinä eikä koskaan viikonloppuisin.
Heilahtelun voima vaihtelee myymälän sijainnin ja viikonpäivän mukaan ja on erilainen esimerkiksi huhtikuun lopussa kuin toukokuun alussa. Laskukaava on monimutkainen, mutta laskettavissa. Sen avulla pilaantuvien päivittäistavaroiden määrää voidaan vähentää ja tavarakuljetuksia minimoida.
Analytiikan aikakausi alkaa
Entä jos edellä kuvattu potilaan tilasta kertova tieto myydään vakuutusyhtiölle? Kaikkia big dataan liittyviä haasteita ei vielä ole puitu julkisuudessa. Missä vaiheessa merkityksetön digitaalinen data muuttuu tiedoksi, jolla on arvoa?
Kun kirjaudumme uuteen verkkopalveluun ja täytämme profiilitietoihin sukupuolen, syntymäpäivän ja postinumeron – jotta saisimme meille sopivaa kohdistettua palvelua – harva tulee ajatelleeksi, että palvelun tuottaja voi tietojen avulla selvittää henkilöllisyytemme jo ennen kuin hyväksymme palveluehdot ja napsautamme ”hyväksyn”.
On syytä tiedostaa, että monet big data -hankkeet pitävät meitä, sinua ja minua, ensisijaisesti kuluttajina ja vasta sitten ihmisinä. Big data on ilmiö, joka perustuu valtavaan määrään raaka-aineen muodossa olevaa dataan, digitaaliseen varjoomme.
Yhdysvalloissa herätti taannoin kohua tietojärjestelmä, joka kykeni tunnistamaan tulevan äidin pelkästään asiakaskorteista kerättyjen ostotietojen perusteella ennen kolmannen raskauskuukauden päättymistä. Yksittäinen hanke tuhansien meneillään olevien joukossa osoittaa, miten tarkka varjomme on jo tänään.
Olemme siirtymässä hakukoneiden ajasta analytiikan aikakaudelle. Ilmiö aiheuttaa haasteita arvokasta tietoa haravoitaessa. Mahdollisuudet liiketoiminnan tehokkuuden parantamiseen ovat kattavat. Trendien ennakointi ja myynnin tarkka ennustaminen perustuvat suureen määrään tietoa. Raporttien sijaan keskitytään dataan, josta yritys voi jutella ja tehdä valintoja ilman intuitiota. Nopean päätöksenteon automatisointi algoritmien avulla parantaa reagointikykyä. Heikkojenkin asiakastarpeiden tunnistaminen auttaa parantamaan tuotteiden laatua.
Suurimmat muutokset ja opit yrityksissä liittyvät siihen, miten ne hyödyntävät ja kehittävät omia rakenteitaan ja prosessejaan informaation avulla. Ihmiset näyttelevät pääosaa, sillä big datan analysointi on lopulta vaativaa ja yllättävän manuaalista työtä.
Ilman analysointia data on vain kallista triviaa, joka lisää tuskaa. Vastaavasti organisaatiolle on jopa haitaksi, jos tieto osataan analysoida, mutta siihen ei reagoida.
Oikea kysymys antaa oikeaa tietoa
Jokaisen yrityksen toiminta on ympäröity ulkopuolisella tiedolla. Monet eivät kuitenkaan tiedä, mistä tiedosta heille olisi hyötyä tai mitä siitä voi aistia. Olemme tottuneet hakemaan vastauksia.
Big datan haasteena on kyky esittää oikeita kysymyksiä. Mitä kysymyksiä meidän pitäisi esittää, jotta voimme kehittää toimintaamme? Miten mikään saatavilla oleva tieto liittyy meihin ja tulevaisuuteemme? Mihin kysymykseen annettu vastaus muuttaisi toimintaamme olennaisesti? Jos kuvitellaan, että yrityksen johto saisi säännöllisesti vastauksen yhteen heitä mietityttävään seikkaan, minkä kysymyksen he esittäisivät?
Tähän verrattuna big dataa käsittelevien järjestelmien kehittäminen ja integrointi on helppoa. Uudet teknologiat auttavat käsittelemään ja analysoimaan big dataa ja yhdistämään sitä olemassa olevan yritystiedon kanssa. Fujitsun teknologiat tukevat monia tilanteita. Big Data Parallel Processing Server on Apache Hadoop -ratkaisu yhdessä Fujitsun kehittämän tiedostojärjestelmän kanssa suuren tietomäärän rinnakkaiskäsittelyyn.
Big Data Complex Event Processing Server on reaaliaikaisten tietovirtojen sääntömääräiseen käsittelyyn perustuva ratkaisu. eXtreme Transaction Processing Server on muistitekniikkaan perustuva hajautettu tietokantaratkaisu. Business Analytics Modeling Server analysoi kirjoitetusta tiedosta piilotettuja merkityksiä ja kaavamaisuuksia. Näiden avulla voidaan hakea vastauksia kysymyksiin.
Ei ole helppoa nähdä asioita uudella tavalla, ymmärtää eri näkökulmia ja tuottaa ideoita. Maailma on täynnä linkattavaa tietoa ja vastauksia. The Economist -lehti luonnehtii big datan taloudellisen arvon yhtä merkittäväksi kuin pääoman tai työn. Kysymysten optimoinnissa tietohallintojohtajan rooli voi olla merkittävä.
Jutun kirjoittaja, Glen Koskela, on Fujitsu Nordicin teknologiajohtaja.