4.1. Luokittelu tietosisällön mukaan

Kuva 5. Dataluokat tietosisällön mukaan

Datastrategia_Kuva_5.jpg

Tunnistedata

Määrittää, mihin tunnistetasoon data on linkitetty. Henkilötiedon osalta tunniste voi olla esimerkiksi Helsinki-profiilin tunniste, henkilötunnus tai sähköpostiosoite, mutta myös laite tai eväste tunnistaa yksilön. Tunnistetaso voi olla myös yritys (esimerkiksi y-tunnus), luonnon tai rakennetun ympäristön kohde (kohdetunnus) tai alue (esimerkiksi postinumeroalue). Tunniste voi olla myös esimerkiksi verkkosivun url. Data voi olla myös ei-tunnisteellista (esim. tilasto).

Ominaisuudet

Tietoa, joka liittyy tietoon. Esimerkiksi tiedon lähde, keräysaika tai -paikka, käyttötarkoitus ja siihen liittyvät käsittelysäännöt. Kaupunkimallin kohdalla myös esimerkiksi mittakaava ja sijaintitarkkuus. Keskeinen osa metadataa, hyödyllistä datan käytössä sekä tiedon elinkaaren hallinnassa.

Datan käsittelytaso

Määrittää, millä tasolla dataa käsitellään. Käsittelytaso voi olla rivitason raakadata (esimerkiksi henkilön asiointihistoria tai sensorin lähettämä mittaustieto), tunnisteeseen yhdistymätön data (esimerkiksi tilastotieto) tai aggregoitu data yhdistetty tunnisteeseen (esimerkiksi asiakkaaseen liitetty tieto siitä, montako kertaa käyttänyt kulttuuripalveluja vuoden aikana, tai aluetason tilastotietoa).

Datan käsittelysäännöt

Kuvaa tietoa käsittelyn rajoitteiden näkökulmasta: onko kyseessä henkilötieto, erityiset henkilötietoryhmät, salassa pidettävä tai turvaluokiteltu tieto, vai onko tieto julkista tai avointa. Ks. kohta 4.3

Datakategoriat

Kuvaavat erityyppisiä tietovarantoja. Eri kategorioilla on erilaisia vaatimuksia datan käsittelyn suhteen. Esimerkiksi ydintiedon osalta tarvitaan prosessit varmistamaan yhteisen datan ylläpito ja käyttö keskitetystä lähteestä, kun taas online-käyttäytyminen ja anturidata voidaan halutessa tallentaa pilviympäristöön suurten datamassojen vuoksi. Samantyyppisten käyttösääntöjen voidaan ajatella pääsääntöisesti pätevän saman kategorian datoille, joskin toimialan erityispiirteet ja muut luokittelukriteerit voivat tuoda tähän variaatioita. Dataa voi luokitella myös teemoittain, ks. esim. hri.fi, jossa avoimet datat on kategorisoitu JHS-suosituksen (JHS183) pohjalta.

Luonnos