Käsitteitä

Aggregointi Aggregointi on tiedon muokkaamista yleiselle tasolle tai sellaiseen muotoon, etteivät yksittäisiä henkilöitä tai henkilöryhmiä koskevat tiedot ole enää tunnistettavassa muodossa.

Anonymisointi Anonymisointi on tiedon saattamista peruuttamattomasti muotoon, josta se ei ole suoraan eikä epäsuoraan yhdistettävissä tunnistettuun tai tunnistettavissa olevaan henkilöön. Tämä oi tapahtua joko aggregoimalla tai pilkkomalla yksilötason tieto siten, että yksilö ei ole tunnistettavissa (esimerkiksi yhteen sessioon liittyvä verkkokäyttäytyminen).

Algoritmi Sarja täsmällisesti määriteltyjä käskyjä tai toimenpiteitä jonkin tehtävän tai prosessin suorittamiseksi.

Analytiikka Menetelmä, jonka tarkoituksena on raakadataa tutkimalla ja analysoimalla tehdä johtopäätöksiä datan sisältämästä tiedosta.

API API (Application programming interface) eli ohjelmointirajapinta on määritelmä, jonka mukaan eri ohjelmat voivat tehdä pyyntöjä ja vaihtaa tietoja eli keskustella keskenään.

Avoin data Avoimella datalla tarkoitetaan julkishallinnon, organisaatioiden tai yritysten tuottamaa tai niille kertynyttä julkista tietoa, joka on avattu rakenteisessa muodossa vapaasti ja maksutta kaikkien hyödynnettäväksi.

Data Data on tietoa, jolla itsessään ei ole välttämättä semanttista merkitystä tai informatiivista järjestystä.

Edistynyt analytiikka Edistyneellä analytiikalla tarkoitetaan koneoppimismenetelmiä laajasti. Niihin kuuluvat menetelmät, joissa käytettävä algoritmi oppii itse yhteyksiä datasta. Oppimisen lisäksi koneoppiminen/tekoäly mahdollistaa ennakoivien mallien rakentamisen.

IoT-data IoT (Internet of Things) tarkoittaa teknisten laitteiden suorittamia automaattista tiedonsiirtoa internet-verkon kautta. IoT-data on kyseisten teknisten laitteiden avulla kerättyä dataa, esimerkiksi lämpötila-anturin keräämä mittaustieto kohteesta.

Johdon työpöytä Johdon työpöytä (engl. Dashboard), on auton mittaristoa muistuttava näkymä, jolla pyritään seuraamaan keskeisiä liiketoimintamuuttujia reaaliaikaisesti.

Koneoppiminen Koneoppiminen (engl. Machine Learning, ML) on toimintaa, jossa ohjelma oppii toistuvista tapahtumista tai datasta ja muuttaa itse toimintaansa annetun tavoitteen suuntaan saamansa palautteen perusteella. Koneoppimisella pyritään automatisoimaan tiedon tulkintaa ja laajentamaan ohjelman havainnointikykyä.

Metatieto Metatieto (engl. Metadata) on tietoa tiedosta eli kuvailevaa ja määrittävää tietoa datajoukosta.

Mikropalvelu Mikropalvelu (engl. Microservices) on sovelluskehityksen lähestymistapa, jossa iso sovellus rakennetaan modulaarisista komponenteista tai palveluista.

Pseudonymisointi Henkilötietojen käsittely siten, ettei niitä voida suoraan yhdistää rekisteröityyn käyttämättä henkilön yksilöinnin mahdollistavia lisätietoja. Lisätiedot tulee säilyttää erillään henkilötiedoista ja niihin tulee soveltaa teknisiä ja organisatorisia toimenpiteitä, joilla varmistetaan, ettei yhdistämistä tunnistettuun tai tunnistettavissa olevaan henkilöön voi tapahtua.

Rajaresurssi Rajaresursseilla (engl. Boundary resources) tarkoitetaan sopimuksellisia ja muita yhteistoiminnallisia säännöksiä sekä teknisiä ohjelmistotyökaluja ja rajapintoja. Ne toimivat avoimina vuorovaikutuskanavina digitaalisen alustan ja minkä tahansa kolmannen osapuolen välillä. Rajaresurssit ovat tyypillisesti Internetissä vapaasti ja ilmaiseksi (tai pientä korvausta vastaan) saatavilla.

Tekoäly Tekoäly on yleistermi algoritmeille, jotka pystyvät oppimaan ilman, että ihminen ohjelmoi toimenpiteitä tai vaiheita erikseen.

Tiedonohjaus Tiedon käsittelyn ohjaaminen tietojärjestelmässä. Tiedonohjaussuunnitelma ohjaa asiakirjatiedon syntymistä ja käsittelyä tuottamalla metatietoarvoja ja käsittelysääntöjä (JHS 191). Helsingin kaupungilla tiedonohjaussuunnitelma ohjaa digitaalisen tiedon lisäksi myös manuaaliaineiston käsittelyä

Tieto Tietoa synnytetään datasta antamalla datalle semanttinen merkitys.

Tietoaineisto Tietoaineistolla tarkoitetaan asiakirjoista ja muista vastaavista tiedoista muodostuvaa tiettyyn viranomaiseen tehtävään tai palveluun liittyvää tietokokonaisuutta. Lähde tiedonhallintalaki (906/2019) 2 §.

Tietoallas Tietoallas (engl. Data lake) on tietotekninen arkkitehtuuriratkaisu, joka perustuu isojen tietomassojen käsittelyyn soveltuvien teknologioiden hyödyntämiseen. Tietoaltaaseen pystytään nopeasti tallettamaan isoja tietomassoja sekä strukturoimatonta dataa.

Tietomalli Tietomalli kuvaa, mitä tietokenttiä tietoaineistossa on ja miten ne liittyvät toisiinsa.

Tietovaranto Kaupungin tehtävien hoidossa tai muussa toiminnassa käytettävä dataa sisältävä kokonaisuus yhdessä tai useammassa tietojärjestelmässä.

Tietovarasto Tietovarasto (engl. Data Warehouse) on erillinen relaatiotietokantoihin pohjautuva arkkitehtuuri, johon eri järjestelmissä hajallaan oleva strukturoitu data poimitaan ja ladataan raportointia, analytiikkaa ja muuta käyttöä varten.

Ydintieto Ydintieto (engl. Master data) on pysyvästi tarvittavaa perustietoa, joka on tunnistettu ja jaettu läpi organisaation ja jonka olemassaolo on välttämätöntä organisaation useiden prosessien ja toimintojen kannalta.

Yhteentoimivuus Tietojärjestelmien kyky viestiä keskenään sellaisella tavalla tai siinä laajuudessa, että ne voivat rutiininomaisesti käyttää toistensa tuloksia. Tietojen hyödyntämistä ja vaihtoa eri tietojärjestelmien välillä siten, että tietojen merkitys ja käytettävyys säilyvät.

Luonnos