Matkapuhelinaineistot ponnahduslautana kohti dynaamista väestöaineistoa

Helsingin yliopistossa hiljattain valmistunut pro gradu tarjoilee tietoa pääkaupunkiseudun väestön dynamiikasta. Missä kaupunkilaiset viettävät aikaa arki-iltaisin? Millainen on kaupungin tai eri kaupunginosien pulssi? Missä ja milloin ihmiset kohtaavat?

Väestön dynaamisuus esitettynä kartalla.
Väestön osuuden erotus staattisen (rekisteriaineisto) ja dynaamisen väestöaineiston (interpoloitu matkapuhelinaineisto) välillä päiväsaikaan (klo 15-16) 250 m x 250 m tilastoruuduilla. Sinisillä ruuduilla staattinen väestöaineisto aliarvioi väestön osuutta suhteessa dynaamiseen väestöaineistoon. Näitä alueita ovat erityisesti työpaikka- ja palvelutoimintojen keskittymät. Punaisilla ruuduilla staattinen väestöaineisto vuorostaan yliarvioi väestöä dynaamiseen aineistoon verrattuna. Staattinen väestöaineisto yliarvioi väestöä päiväsaikaan erityisesti asuinalueilla.

 

Teksti: Claudia Bergroth

Kysymyksiin ihmisten liikkeistä kaipaavat vastauksia muun muassa kaupunkisuunnittelijat, turvallisuusviranomaiset, asiakasvirroista kilpailevat yritykset ja tutkijat monilla aloilla. Ymmärrys väestön alueellisesta jakautumisesta tiettynä ajanhetkenä ja sen vuorokaudenaikaisesta vaihtelusta – väestön dynamiikasta on vähäistä ja rajoittuu pääasiassa tietoon siitä, missä ihmiset nukkuvat.

Tuore matkapuhelinaineistoa hyödyntävä maantieteen pro gradu -työni tarjoaa empiiristä tietoa väestön dynamiikasta pääkaupunkiseudulla sekä menetelmiä tulevaisuuden tiedonlouhintaan. Empiirisiä tuloksia voidaan käyttää suunnittelun ja päätöksenteon tukena.

Kotona 24/7?

Tieto ihmisten alueellisesta jakautumisesta perustuu meillä ja maailmalla edelleen pitkälti staattisiin, asuinpaikkaan sidottuihin väestötietoihin. Tarkkakin tieto on monin tavoin puutteellista väestön dynamiikan tarkastelun kannalta. Dynamiikan puuttuminen tietovarannoista voi johtaa merkittävien väestöryhmien, kuten pendelöivien työmatkalaisten tai turistien, sivuuttamiseen, kun päätöksiä tehdään. Dynaamisen tiedon kerääminen on kuitenkin työlästä.

Tutkijoiden piirissä on kehitetty erilaisia menetelmiä perinteisten väestöaineistojen puutteiden korjaamiseksi. Menetelmien kirjoon sisältyy muun muassa yövalaistuksen analysointi kaukokartoituksen keinoin, sähkönkulutuksen seuranta tai asuinpaikkatiedon rikastaminen erilaisilla tilastoaineistoilla, kuten liikennemäärillä. Parhaat tulokset on kuitenkin saavutettu matkapuhelinaineistoja hyödyntäen.

Matkapuhelin ihmisen sijainnin kuvaajana

Matkapuhelimet ovat lyhyessä ajassa raivanneet tiensä lähes jokaisen taskuun, jossa ne kulkevat mukana päivittäisestä aktiviteetista toiseen. Samanaikaisesti matkapuhelinoperaattorit tallentavat tietoa puhelinten sijainnista verkon toimintaa optimoidakseen. Juuri korkea läpäisevyys ja sen mahdollistama otoskoko tekee matkapuhelinaineistosta tutkijalle houkuttelevan ja erottaa sen esimerkiksi sosiaalisen median aineistosta väestödynamiikkaa koskevan tiedon lähteenä.

Matkapuhelinaineistojen hyödyntäminen ihmisen liikkumisen tutkimuksessa onkin vallannut alaa tieteen kentässä jo 2000-luvun alusta lähtien, mutta tästä huolimatta matkapuhelinaineistoihin pohjautuvaa tieteellistä, Suomeen sijoittuvaa tutkimusta ihmisten liikkumisesta ei ole aiemmin julkaistu. Lisäksi vain harvassa tutkimuksessa on ilmoitettu matkapuhelinten tiedonsiirto aineistolähteenä datankäytön ja älypuhelinten yleistyvyydestä huolimatta tai vertailtu erilaisten matkapuhelinaineistojen soveltuvuutta ihmisen sijainnin kuvaajana.

Näistä lähtökohdista lähdin viime keväänä valmistuneessa pro gradu -työssäni tarkastelemaan pääkaupunkiseudun väestödynamiikkaa matkapuhelinaineistoa hyödyntäen.

Dynaaminen väestöaineisto on monen aineiston summa

Yksi työn keskeisistä tavoitteista oli tuottaa dynaaminen 24 tunnin väestöaineisto pääkaupunkiseudulta. Lähtöaineistona käytin matkapuhelinoperaattori Elisan vuosina 2017–2018 keräämää verkkopohjaista matkapuhelinaineistoa. Aineisto sisälsi tunnin tarkkuudella puheluiden, tiedonsiirtoyhteyksien ja verkkoyhteyksien muodostusyritysten lukumäärän kussakin tukiasemassa. Tietoa yksittäisistä puhelimista ei ollut mukana aineistossa, minkä johdosta henkilöiden yksityisyydensuoja pysyy turvattuna.

Lisäksi hyödynsin aineistoja maankäytöstä, rakennusten pinta-alasta ja käyttötarkoituksesta sekä Tilastokeskuksen ajankäyttötutkimuksen tuloksia väestön kohdentamiseen 250 m x 250 m tilastoruudukkoon käyttäen edistynyttä dasymetristä interpolointimenetelmää (ks. Järv et al. 2017). Näin oli mahdollista kohdentaa väestö tukiasemien teoreettisten kuuluvuusalueiden sisällä alueille, joilla ihmiset todennäköisimmin ovat tiettyyn aikaan päivästä. Lopuksi interpoloitu väestöaineisto validoitiin väestörekisteritietoja käyttäen.

Tuloksena syntynyttä 24 tunnin väestöaineistoa käytin pääkaupunkiseudun pulssin analysointiin ja ensimmäisen täysin dynaamisen saavutettavuusmallin toteuttamiseen tutkimusalueella. Lisäksi vertailin tilastollisesti kolmen käytössä olleen eri matkapuhelinaineistotyypin soveltuvuutta ihmisen sijainnin kuvaajana.

Dynaaminen väestöaineisto paljastaa kaupungin pulssin

Työn tulokset osoittavat, että matkapuhelinpohjainen väestöaineisto on luotettava ihmisten sijainnin kuvaaja ja tarjoaa realistisempia tuloksia kuin staattinen väestöaineisto. Päivän aikana staattinen väestöaineisto yliarvioi väestön osuutta erityisesti asuinalueilla samalla aliarvioiden väestöä alueilla, joilla on työpaikka- tai palvelukeskittymiä. Dynaaminen väestöaineisto paljastaa myös kaupungin pulssin. Tämä korostuu erityisesti Helsingin keskustassa, jossa tutkimusalueen väestön suhteellinen osuus kasvaa yöstä 50 prosentilla keskipäivän huippuunsa.

Myös käytetyllä matkapuhelinaineistolla on väliä: tiedonsiirto osoittautui kaikilla mittareilla luotettavimmaksi aineistolähteeksi, ja vertailuissa se suoriutui selkeästi paremmin kuin puheluiden lukumäärä.  Erot korostuvat varsinkin yöaikaan, jolloin puheluita soitetaan vähän, mutta älypuhelimet usein synkronisoivat taustalla esimerkiksi sähköpostia.

Edistysaskelia dynaamisen väestötiedon saatavuuden parantamiseksi tarvitaan

Yhteiskunnan ymmärtäminen edellyttää luotettavia tietoja väestön dynamiikasta. Herää kuitenkin kysymys, kenellä on pääsy tarvittavaan aineistoon. Matkapuhelinaineiston saatavuus esimerkiksi tutkijakäyttöön ja riippumattomaan tilastotuotantoon on edelleen haastavaa. Yhteistyön edistäminen matkapuhelinoperaattorien ja tutkijoiden välillä on edellytys, jos halutaan siirtyä kohti luotettavampaa, dynaamista väestötietoa päätöksenteon ja suunnittelun pohjaksi.

Claudia Bergroth toimii tutkijana Helsingin kaupungin Kaupunkitutkimus ja -tilastot -yksikössä. Sähköposti: etunimi.sukunimi@hel.fi. Teksti perustuu keväällä 2019 Helsingin yliopiston Digital Geography Lab (DGL) -tutkimusryhmässä valmistuneeseen pro gradu -työhön. Työtä ohjasivat post doc -tutkijat Olle Järv ja Henrikki Tenkanen sekä prof. Tuuli Toivonen. Työstä on valmisteilla useita tieteellisiä artikkeleita.

Lue lisää aiheesta:

Palaa lehden sisällysluetteloon