6.1. Tavoitearkkitehtuuri

Kuva 9: Tavoitearkkitehtuuri tietovarantojen hallintaan

Datastrategia_Kuva_9.jpg

Kaupungin datavarannot on pääosin tallennettu lähdejärjestelmien yhteydessä oleviin tietokantoihin. Tavoitearkkitehtuurissa lähdejärjestelminä toimivat toimialojen ja liikelaitosten operatiiviset järjestelmät sekä ulkoiset toimijat kuten DVV, Tilastokeskus ja HSL. Kaupungin API-linjausten mukaisesti lähdejärjestelmien ja data-alustan väliset yhteydet toteutetaan ensisijaisesti API-pohjaisesti, ja jokaiseen hankittavaan järjestelmään tulee sisältyä APIt, jotta jo kerättyä ja kerättävää dataa voidaan hyödyntää laajasti. Ulkopuoliset datat noudetaan data-alustalle ulkopuolisilta toimijoilta heidän tarjoamin menetelmin. Mikäli toimijan tiedonsiirtomenetelmät eivät täytä nykyaikaisen tietojenkäsittelyn vaatimuksia, kaupungin tulee vaatia niiden kehittämistä käytettävälle tasolle.

Tarvittaessa on mahdollista myös siirtää raakadataa suoraan lähdejärjestelmistä data-alustalle dataeksploraatiota ja analyyttistä mallinnusta varten. Datatieteen (esim. neuroverkot) luonteeseen kuuluu se, että datasta pyritään löytämään piileviä yhteyksiä ja riippuvuussuhteita ilman, että etukäteen tiedetään tarkkaan, mitkä data-attribuutit vaikuttavat tutkittavaan ilmiöön.

Kun raakadata on siirretty data-alustalle, tulee sille suorittaa esikäsittely, joka sisältää mm. mahdollisten virheiden korjauksen, tietojen yhdistelyn ja mahdollisen aggregoinnin. Tähän kuuluu myös konseptuaalinen, looginen ja fyysinen datamallinnus yhtenäistä jatkokäsittelyä varten. Sensoridatan ja muun reaaliaikaisuutta vaativan datan käsittelyä varten on käytössä erillinen data-allas, jossa data käsitellään ajantasaisuusvaatimukset huomioiden. Rakenteellisemman datan käsittely voi tapahtua tietovarastossa.

Datavarantojen yhdistäminen ja analyyttinen käsittely tapahtuu analytiikkaympäristössä, josta löytyvät tehokkaat työkalut datavarantojen käsittelyyn, yhdistämiseen sekä edistyneen analytiikan käyttötapausten, kuten ennustemallien, toteutukseen. Valmiiksi käsitellyt datat, analyysit ja mallit julkaistaan rajapintojen kautta kaupungin sisäiseen ja ulkoiseen käyttöön sillä laajuudella kuin käyttöoikeudet julkaisun sallivat.

Luonnos