Vaikka usein käytössä olevat erilliset tietokannat palvelevat hyvin yritysten eri yksiköitä, on haasteena tietysti nykymaailmassa siiloutuminen ja tarve kokonaisvaltaiselle näkyvyydelle yrityksen kehittämisessä. Miten tiedon siis saisi yhtenäistettyä? Miten eri sidosryhmät saisivat tarvitsemansa yksilöidyn tiedon, mutta niin, että samalla pystyttäisiin määrittelemään, miten asiat suhtautuvat toisiinsa ja miltä se kuuluisa iso kuva näyttää? Onko tähän edes ratkaisua?
Vanhaa Data warehouse -käsitettä on alettu viljelemään viime vuosina enemmän ja enemmän. Datainsinööreille käsite on toki tuttu, mutta meille maallikoille on kyse siis kokonaisuudesta, johon yhdistetään eri datalähteet. Kaikessa yksinkertaisuudessaan (mitä asia toki ei tosiaankaan ole) tiedot poimitaan operatiivisista järjestelmistä ja ladataan erilliseen data warehouse -kantaan tai suomeksi tietovarastoon.
Uutta vanhaa 2020-luvulla on myös data mining eli tiedon louhinta. Vanhaa se on siten, että jo 1930-luvulla Alan Turing esitteli idean universaalista koneesta, joka pystyy suorittamaan samanlaisia laskutoimituksia kuin nykypäivän tietokoneet. Uutta se on siksi, että yritykset ovat pikkuhiljaa heräämässä siihen, että dataa pitäisi hyödyntää ihan oikeasti.
Data mining on prosessi, jossa poimitaan ja löydetään malleja suurista tietojoukoista ja johon sisältyy menetelmiä koneoppimisesta, tilastotieteestä ja tietokantajärjestelmistä.
Koneoppimisen avulla datamassasta koostetaan sellaista tietoa, joka aidosti tuo liiketoiminnallista hyötyä yrityksen kehittämiseen. Vielä 10-15 vuotta sitten yritykselle pystyi tekemään 5 vuoden strategian, mutta tänä päivänä maailma muuttuu niin nopeasti, että yritysten ketteryys on koetuksella ja pitkän tähtäimen strategiat harvemmin mahdollisia. Jos haluaa olla ketterä ja tehdä aikaa kestäviä suunnitelmia, niitä pitää voida muuttaa matkan varrella ja tässä data näyttelee pääroolia. Jotta dataa voi hyödyntää, sen tulee olla oikein kerättyä ja koostettua. Juuri tätä varten data warehousen rakentaminen kannattaa - siihen koostettava master data on avain kestävään tiedonhallintaan ja hyödyntämiseen.