Ergin Tuganay, Partner, Head of Industry 4.0, April 21, 2021
Datan merkitys liiketoiminnalle kasvaa jatkuvasti. Datamäärien kasvaessa myös datapalveluiden saavutettavuus ja sujuva käyttökokemus ovat tulevaisuudessa yrityksille elinehto. Siksi data-alustojen toteutuksessa siirrytään enenevissä määrin moderneihin pilvipohjaisiin sekä API-lähtöisiin arkkitehtuureihin.
Useita datahankkeita kuvaa hyvin jo ilmestyessään vuonna 1998 kulttimaineen saavuttaneen South Parkin toisen kauden 17. jakso Gnomes (Tontut). Jaksossa South Parkin sankarit Stan, Kyle, Cartman ja Kenny sekä kaverinsa Tweek huomasivat, että heiltä häviää alushousuja. Lopulta pojat löytävät pienikokoisten kalsaritonttujen yhdyskunnan, joka pöllii southparkilaisten alusvaatteita rahat ja rikkaudet mielessään. Kysyttäessä kehittämänsä liiketoimintasuunnitelman neroudesta, kuvaavat kalsaritontut ideaansa seuraavasti:
• Vaihe 1: Kerää kalsareita
• Vaihe 2: ?
• Vaihe 3: Voitto
Vaiheen 2 puuttuminen osoittaa, että tontuilla ei ollut varsinaista suunnitelmaa pienellä viekkaudella kartutetun kalsarikokoelmansa monetisointiin.
Puutteellinen liiketoimintasuunnitelma. Kuva: Wikipedia (”Gnomes” South Park)
Kuten South Parkin kalsaritontuilla, vaiheen 2 puuttuminen on paljastunut tyypilliseksi ongelmaksi myös monen oikean yrityksen data platform -hankkeissa. Tyypillisiä data-alustahankkeiden kohtaamia haasteita ovat muiden muassa:
Moneen muuhun verrattuna ovat tietojärjestelmät insinöörialana vielä nuoressa iässä. Esimerkiksi sillanrakennus, eräs klassisimmista insinöörialoista, voidaan tiettävästi ajoittaa jo vuoteen 850 EAA. Digitaalisten tietojärjestelmät ensiaskelet juontavat juurensa vasta vuoteen 1935, jolloin Alan Turingin teoksia julkaistiin Cambridgen yliopistossa.
Tietojärjestelmäalan sisällä Big Data ja Data Platform -teemaan liittyvät Data Warehouse ja Data Lake -konseptit ovat vielä huomattavasti nuorempia, lähes lapsen kengissä. Koko Big Data -termi on ensimmäisen kerran esiintynyt akateemisissa julkaisuissa vasta vuonna 1997 ja ensimmäiset, yleisesti käytössä olevat kaupalliset tuotteet kuten Apache Hadoop, AWS S3, Google Storage ja Azure Data Lake yleistyivät vasta 2010-luvulla.
Yksi insinööritieteiden perussäännöistä on, että osaaminen ja tarkkuus kasvavat kokemuksen, eli yritysten ja erehdysten kautta sekä myötä. Tämä näkyy myös tähän asti toteutettujen data-arkkitehtuurien maturiteetissa.
Sillanrakennuksen taito on noin 3 000 vuoden takaa, kun digitaalisten tietojärjestelmien ensiaskelet otettiin Cambridgen yliopistossa vuonna 1935.
Vaikka Data Platform -termin alle kuuluvat konseptit ovat hädin tuskin saavuttaneet edes varhaisteini-ikää, ei yksikään yritys halua pysähtyä odottamaan alan kehittymistä. Useat yritykset ovatkin lähteneet liikkeelle vahvalla ”data on uusi öljy”-ajatuksella tavoitteenaan tarjota eri käyttäjäkunnille dataa buffet-pöydistä tutulla itsepalveluperiaatteella.
Yritysten kilpavarustelua ovat vauhdittaneet teknologiatalojen markkinoinnissa esiintyvät vahvat lupaukset AI- ja koneoppimiseen perustuvalla analytiikalla saavutettavista pikavoitoista. Vaikka palveluntarjoajat intoutuvat toisinaan hieman epärealistisiin lupauksiin, on todellisuus kuitenkin kiistämätön: tulevaisuudessa data ja sen hyödyntäminen tulee vääjäämättä näyttelemään entistä suurempaa roolia yritysten kilpailukyvyn parantamisessa. Monelle yhtiölle data ja sen taitava hyödyntäminen ovat jo nyt suorastaan elinehto.
Suurin osa tämän päivän tietovarastohankkeista rakentuu edelleen keskitetyn organisaation ja monoliittisen arkkitehtuurin varaan. Siinä keskeisinä komponentteina ovat:
Tyypillisesti tämän kaltaiset projektit vastaavat organisaatioiden hyvin perinteiseen DW- ja analytiikkatarpeeseen. Tulevaisuuden data-alusta-arkkitehtuurin on kuitenkin vastattava pelkän raportoinnin lisäksi myös operatiivisen monitoroinnin ja reaaliaikaisen analytiikan tarpeisiin. Kasvavana trendinä on erityisesti teollisuusyrityksissä nähtävissä tuotannon reaaliaikaisten sovellusten tarpeet. Aikaisemmin näitä tarpeita on tyydytetty erilaisilla automaatiotoimittajien täsmäsovelluksilla, mutta jatkossa myös tehtaiden tuotannon sovelluskehityksessä katseet kääntyvät enenevissä määrin moderneihin hybridi-pilvipohjaisiin data-alustoihin:
”Tulevaisuuden data-alusta-arkkitehtuurin on vastattava pelkän raportoinnin lisäksi myös operatiivisen monitoroinnin ja reaaliaikaisen analytiikan tarpeisiin.”
Edellä mainitut esimerkit tuottavat haasteita perinteisissä, puhtaasti DW- ja bisnesanalytiikan tarpeista syntyneissä tietovarastoarkkitehtuureissa. Tämän vuoksi on syntymässä – ja jo syntynyt – uusia, entistä kokonaisvaltaisempia data-alusta-arkkitehtuureja ja niitä tukevia teknologioita.
Yksi uuden lähestymistavan virstanpylväistä näki päivänvalon keväällä 2019, jolloin Zhamak Dehghani julkaisi näkemyksensä tulevaisuuden Data Mesh -konseptista. Vastaavasti kuin nykyaikaisissa sovellusarkkitehtuureissa on jo hyvän tovin siirrytty monoliittisista järjestelmistä mikropalveluihin, tulevat organisaatiot Data Mesh -arkkitehtuurissa myös siirtymään moniliittisistä tietovarastoistaan mikropalveluperiaatteiden mukaisesti toteutettuihin loogisesti hajautettuihin datapalveluihin.
Samaa arkkitehtuurillista ajattelumallia edustaa myös Gartner. Pian Dheghanin artikkelin julkaisun jälkeen vuoden 2020 Gartner IT Symposium/XPO -tapahtumassa lähes jokainen esitys nojasi kahteen teemaan: Composable Business Architecture sekä Packaged Business Capabilities.
PBC (Packaged business capability) on noussut suosituksi teemaksi Zhamak Dehghanin Data Mesh -konseptiin liittyvien näkemysten pohjalta.
Gartnerin näkemyksen mukaan kaikki liiketoiminnan sovellukset voidaan tulevaisuudessa toteuttaa kokoelmana paketoituja digitaalisia liiketoimintakyvykkyyksiä. Niitä yhdistellään yhä uudelleen toistensa kanssa, mitä tekemällä luodaan jälleen täysin uusia innovatiivisia kyvykkyyksiä.
Sekä Zhamak Dheghanin esittelemä Data Mesh, että Gartnerin Composable Business Architecture -teema nojaavat vahvasti modernin sovelluskehityksen ja integraatioiden periaatteisiin. Siinä hajautettu arkkitehtuuri ja API-pohjainen ekosysteemilähestyminen näyttelevät merkittävää roolia. Tämän perusteella voikin sanoa, että data-alustahankkeet tulevat jatkossa noudattamaan seuraavia periaatteita:
Löytyykö relaatiomallin mukainen tietovarasto tulevaisuudessakin yritysten tiedonhallinnan keskiöstä ja mikä on sen ja esimerkiksi digitaalisia palveluita tarjoavan API-alustan keskinäiset roolit? Tänä päivänä molemmilla on oma toisistaan erillinen paikka arkkitehtuurissa, mutta jatkossa uskomme, että tämä ero on kuroutumassa monella tavalla umpeen. Tulemme varmuudella pian näkemään, kuinka yhä useammat yritykset siirtyvät keskitetyistä, monoliittisista relaatiopohjaisista tietovarastoistaan hajautettuihin API-arkkitehtuureihin. Niissä tuotteistetut, API-rajapinnoin julkaistavat datapalvelut julkaisevat selkeitä ja ymmärrettäviä liiketoimintakyvykkyyksiä moninaisiin tarpeisiin: johdon kuukausittaisesta raportoinnista tehtaan tuotantolinjan reaaliaikaiseen hälytykseen ja kunnossapitotyöntekijän mobiilisovelluksen ilmoituksiin – ja miksei myös kalsaritontuille omassa tärkeässä tehtävässään alusvaatetalouden kirittämiseksi.
Me Nortalilla olemme erikoistuneet sekä modernin sovelluskehityksen että data-alustojen suunnitteluun ja toteutukseen. Konsultoimme myös haastavia bisnesideoita menestykseen.