1.3 Datan hyödyntämisen nykytila

Helsingin kaupunki on suuri monialakonserni, jonka palvelut koskettavat lähes jokaista kaupunkilaista päivittäin. Palveluista kertyy erilaista dataa, jota kerätään jo tänä päivänä talteen kaupungin tietojärjestelmiin ja tietovarastoihin.

Kaupungilla on sekä vahvuuksia että heikkouksia datan hyödyntämisessä. Kuva 1 esittää yhteenvedon kaupungin datan hyödyntämisen nykytilasta, niin teknologian, datan, kuin data-analytiikan näkökulmista, jotka seuraavaksi käydään kukin läpi.

Teknologia: Kaupungin omat tietovarannot ovat suurilta osin operatiivisissa järjestelmissä. Keskitettyyn tietovarastoon, HETA, on kerätty mm. kaupunkiyhteiset talous-, HR- ja tilatiedot sekä suoritetietoja SOTE- ja KASKO-toimialoilta. HETA-järjestelmässä ei ole käytössä pilviratkaisuihin natiivisti sisältyviä massadatojen, reaaliaikaisen datan ja koneoppimismenetelmien käsittelyyn soveltuvia työvälineitä. HETAn käyttöä jatketaan toistaiseksi ja selvitetään, miten HETA integroidaan osaksi tulevaisuuden kokonaistavoitearkkitehtuuria.

Kaupungin tutkimus- ja tilastoyksikössä (KTT) ylläpidetään tilasto- ja tutkimusaineistoja sisältävää data-asemaa, jota käytetään datavarantojen hyödyntämiseen ja analysointiin. KTT hallinnoi myös SAS Office Analytics -ohjelmistoa, jossa on monipuoliset datanhallinta- ja analysointiominaisuudet. SAS-ohjelmisto on HETA-tietovaraston tavoin optimoitu rakenteellisen tiedon käsittelyyn. Lisäksi SAS-ohjelmiston rajoitteena on kyky käsitellä vain oman ympäristön sisällä olevaa tietoa, mikä vaikeuttaa tiedon yhdistämistä ja jakamista.

Datan visualisoinnissa ja raportoinnissa on käytössä SAS Office Analytics. Lisäksi on jonkin verran käytetty SAP BO Dashboardia, Lumiraa ja PowerBI:tä sekä evaluoitu erilaisia muita moderneja työkaluja, kuten Tableau ja SAP Analytics Cloud. Paikkatietoanalytiikkaa käytetään hajanaisesti eri toiminnoissa.

Kuva 1. Yhteenveto kaupungin datan hyödyntämisen nykytilasta (Lähde: datastrategiaprojektin haastattelut ja asiantuntija-analyysi)

Datastrategia_Kuva_1.jpg

Datastrategian suositus on seurata eri teknologioiden ja analytiikkaympäristöjen kehittymistä ja hyödyntää kuhunkin tilanteeseen parhaiten soveltuvia välineitä.

Data: Dataa on määrällisesti paljon ja suuri osa siitä on toimialojen operatiivisissa järjestelmissä. Lähdejärjestelmien data täyttää monessa tapauksessa alkuperäisen käyttötarpeen laatuvaatimukset, mutta puutteita on mm. yhteentoimivuudessa sekä laadussa ja yhtenäisyydessä alkuperäisestä käyttötarpeesta poikkeavissa käyttötapaukissa. Kaupunkiyhteisessä käytössä olevaa dataa on vähän ja tiedonhallinnan ja tiedon jakamisen prosesseissa on kehitettävää. Rajapintojen kehittäminen on vielä alkuvaiheessa eikä kaupunkiyhteistä harmonisointia ja jakelua datalle tehdä kovinkaan paljon.

Data-analytiikka: Kaupunkitutkimus ja -tilastot -yksiköllä on pitkä historia ja paljon tieto-osaamista, mikä osaltaan auttaa ymmärtämään, kuinka tärkeää data on kaupungille. Tutkimustoiminta ja vaikuttavuuden arviointi on pääosin kertaluonteista, vaikkakin tiettyjä tutkimuksia toistetaan säännöllisesti. Myöskään tilastointi ei tuota jatkuvia, esim. päivittäin päivittyviä analyysejä. Tilastollinen seuranta tuottaa nykyisellään kuukausittain, neljännesvuosittain ja vuosittain päivittyvää tietoa, mutta sekään ei tuota monissa tilanteissa tarvittavaa reaaliaikaista tilannetietoa. Ennustavaa analyysiä ja skenaariotyöskentelyä tehdään mm. Liikenteen ja väestön kehitykseen liittyen. Tekoälyn menetelmiä on pienissä määrin hyödynnetty toimialojen pilottihankkeissa, mutta skaalaaminen kaupunkitasoiseksi vaatii merkittäviä panostuksia.

Luonnos