Hyppää pääsisältöön

Maanmittauslaitoksen paikkatietoaineistojen formaatit

LAZ

LAZ on laserkeilausaineistojen jakeluun käytettävä häviöttömästi pakattu muoto LAS-formaatista.  LAS on avoin tiedostomuoto, jonka kehittämisestä vastaa American Society for Photogrammetry and Remote Sensing (ASPRS) ja se on myös hyväksytty OGC:n yhteisöstandardiksi (2018).

LAZ-pakkaus tiivistää LAS-tiedoston 7-20 % tilaan alkuperäiseen verrattuna.  LAZ-menetelmä on avointa lähdekoodia ja ensimmäisen kerran sitä on käytetty LAStools-ohjelmakirjastossa.

LAS-formaattia voidaan käyttää useimmilla laserkeilausaineistoja hyödyntävillä ohjelmistoilla.  Kaikki niistä eivät pysty lukemaan suoraan pakattua LAZ-formaattia, mutta LAZ-formaatin pakkauksen purkamiseen on olemassa monia sekä avoimen lähdekoodin että ei-avoimia ohjelmia, kuten LASzip, LAZperf ja FME.

GML

GML on paikkatietojen välittämiseen kehitetty XML-muoto. GML:n kehittäjiä ovat kansainväliset standardointijärjestöt ISO ja OGC.

Maanmittauslaitos käyttää GML-formaattia muun muassa kiinteistörekisterin ja maastotietokannan avoimien aineistojen jakelussa. Myös INSPIRE-latauspalvelut (WFS-palvelut) perustuvat GML-formaattiin.

GML-formaatin avulla voidaan välittää mutkikkaitakin paikkatietorakenteita. Samalla kohteella voi olla esimerkiksi useita eri geometrioita: kunnan hallintokeskus pisteenä, kunnan rajat viivoina sekä kunnan alue polygonina. GML tukee geometrioita, jotka ovat joko osittain tai kokonaan kaaria, kuten ympyrä, sekä luettelomaisia ominaisuustietoja, kuten paikannimi, josta voi olla olemassa suomen-, ruotsin- ja eri saamenkieliset versiot.  

GML:n heikkoutena on se, että etenkin mutkikkaita rakenteita sisältävän GML:n käyttö voi olla vaikeaa. Valmisohjelmistot eivät välttämättä tue kaikkia GML:n ominaisuuksia ja myös kehittäjät kokevat tiedostomuodon hankalaksi. Lisäksi tekstimuotoinen GML on ennen kaikkea siirtoformaatti, joka ei suoraan sovi suoraan suurta suorituskykyä vaativiin tarkoituksiin, vaan tiedot on käyttöä varten muunnettava johonkin muuhun tiedostomuotoon.

Heikkouksistaan huolimatta GML on se tiedostomuoto, jonka avulla Maanmittauslaitokset vektoriaineistojen tiedot voidaan varmimmin siirtää alkuperäisinä ja miltään osin muuttumattomina. Erot GeoPackage-muotoon verrattuna ovat kuitenkin pieniä.

QGIS-ohjelmisto avaa Maanmittauslaitoksen maastotietokannan ja nimistön GML-tiedostot ongelmitta.

GeoPackage

GeoPackage (GPKG) on vuonna 2014 hyväksytty OGC:n standardi, jolla määritellään yhtenäinen tapa tallentaa rasteri- ja vektoritietoja SQLite-tietokantaan. GeoPackage-tietokanta on yksi ainoa tiedosto, joka voi kuitenkin sisältää rajattoman määrän erillisiä vektori- ja rasterikarttatasoja. Käyttäjälle tämä merkitsee pienempää määrää ladattavia tiedostoja.  Maanmittauslaitoksen aineistoista tämä on erityisen huomattavaa yli sata kohdeluokkaa sisältävän maastotietokannan kohdalla. GeoPackage-tiedostoilla ei ole kokorajoitusta eikä aineistoja siitä syystä ole pakko pilkkoa osiin.

GeoPackage on monipuolinen tiedostomuoto, joka tukee lähes kaikkia Maanmittauslaitoksen GML-tuotteissa käytettäviä ominaisuuksia. Koska GeoPackage käyttää aina UTF-8 merkistökoodausta, niin esimerkiksi saamen kielissä esiintyvät erikoismerkit eivät tuota sille ongelmia. GeoPackage on myös nopea, joten sitä ei tarvitse muuntaa muihin formaatteihin, vaan se sopii suoraan käytettäväksi. Tietokantana GeoPackage on myös laajennettavissa, ja esimerkiksi vektoriaineistojen esitystyylit on mahdollista tallentaa samaan tietokantaan yhdessä aineistojen kanssa. Koska GeoPackage-standardi on tältä osin vielä kesken, niin MML testaa tyylien tallentamista QGIS-ohjelmiston tukemalla tavalla.

Sovellusohjelmistojen tuki GeoPackage-tiedostoille on parempi kuin GML:lle, mutta huonompi kuin Shapefilelle. Yleisimmät paikkatieto-ohjelmistot, kuten QGIS, ArcGIS ja MapInfo, voivat käyttää GeoPackage-tiedostoja suoraan.

ESRI Shapefile

Shapefile on ESRI:n vuonna 1994 esittelemä tiedostomuoto. Shapefile tuli yleisesti käyttöön myös muissa kuin ESRI:n ohjelmistoissa sen jälkeen, kun ESRI julkaisi formaatin teknisen rakenteen pääpiirteet vuonna 1998. Shapefile lienee tällä hetkellä paikkatieto-ohjelmien yleisimmin tukema vektoriformaatti, jota käytetään myös laajasti aineistojen jakeluun. Shapefilen vahvin etu on laaja ohjelmistotuki sekä nopeus, jonka takia se sopii sekä siirto- että käyttöformaatiksi.

Shapefilen ominaisuudet on opittu tuntemaan hyvin ja siksi sen puutteidenkin kanssa osataan toimia, mutta tämä tiedostomuoto alkaa kuitenkin käydä vanhanaikaiseksi. Pahin Shapefilen puutteista on se, että sillä ei pysty välittämään kaikenlaisia tietoja. Formaatti ei esimerkiksi tue päivämääriä aikaleimalla (DATETIME), vaan pelkästään päivämäärää, merkkijonot eivät voi olla yli 254 merkin mittaisia, eikä kenttiin voi tallentaa NULL-arvoja. Muihin ongelmiin kuuluu tiedostojen 2 gigatavun maksimikoko, minkä vuoksi suuret aineistot on pilkottava osiin. Pilkkomistarvetta lisää vielä se, että Shapefile voi sisältää vain yhden karttatason, ja yhden Shapefilen geometrioiden on oltava saman tyyppisiä, eli joko pisteitä, viivoja tai alueita. Yleisiä ongelmia ovat myös vaikeudet erikoismerkkien kanssa, koska Shapefilen merkistökoodaukseen ei ole olemassa yhtä yleisesti käytettyä menetelmää.

Maanmittauslaitos jakaa useita aineistoja Shapefile-muodossa. Jos samasta aineistosta on olemassa myös GML- tai GeoPackage-versio, niin Shapefile on niiden rinnakkaistuote, jonka tietosisältö poikkeaa formaatin teknisten rajoitusten takia edellisistä.

Shapefile-tiedostoja voi käsitellä kaikilla yleisimmillä paikkatieto-ohjelmistoilla, mukaan lukien ESRI:n tuotteet, MapInfo Pro, QGIS ja Tatuk GIS.

MapInfo MID/MIF

MapInfo-yhtiön kehittämä MID/MIF-tiedostomuoto on ESRI Shapefilen tavoin peräisin 1990-luvun puolivälistä. MID/MIF on tekstimuotoinen siirtoformaatti, jonka vastineena on binäärinen TAB-formaatti. TAB-formaattia käytetään vain MapInfo-ohjelmassa, mutta MID/MIF on ollut yksinkertaisuutensa vuoksi myös yleisenä siirtoformaattina. Nykyisin GeoJSON on enimmäkseen korvannut MID/MIF-formaatin tässä käytössä.

MapInfo-formaatilla on samankaltaisia rajoituksia kuin Shapefile-muodolla, kuten 2 gigatavun kokorajoitus, merkkijonon maksimipituus 254 merkkiä, ja hankaluudet erikoismerkkien käytössä. MapInfo on esitellyt myös uuden ”NativeX Extented Tab”-tiedostomuodon, jolla näitä rajoituksia ei ole, mutta tätä tiedostomuotoa Maanmittauslaitos ei tue.

MapInfo MID/MIF-formaatilla ei ole enää juuri merkitystä yleisenä siirtotiedostomuotona, eivätkä MapInfo-käyttäjätkään enää tarvitse MID/MIF-muotoa, koska MapInfo voi käyttää sekä GeoPackage- että Shapefile-tiedostoja.

MapInfo-ohjelman lisäksi MID/MIF-tiedostot voi avata QGIS-ohjelmalla.

GeoTIFF

GeoTIFF on tavallinen TIFF-kuvatiedosto, jonka sisään on tallennettu kuvien paikkatietokäyttöä varten tarvittavat metatiedot.  Tärkein näistä metatiedoista on georeferointi eli tieto kuvan maantieteellisestä sijainnista ja kuvan käyttämästä koordinaattijärjestelmästä. Ennen GeoTIFF:in kehittämistä kuvan sijainti voitiin ilmoittaa erillisellä, niin sanotulla ”world file” tiedostolla, ja koordinaattijärjestelmä niin ikään erillisellä projektiotiedostolla.  Kuvatiedoston sisään tallennetuilla georeferointitiedoilla on se tärkeä etu, että se eivät pääse hukkumaan, mutta GeoTIFF voi sisältää enemmänkin metatietoja. Ensimmäinen GeoTIFF-määrittely laadittiin vuonna 1994 ja vuonna 2019 GeoTIFF:stä tuli myös OGC-standardi.  GeoTIFF on todennäköisesti maailman yleisimmin käytetty ortokuvien ja satelliittikuvien tiedostomuoto.

TIFF on monimuotoinen tiedostomuoto.  Usein luullaan, että kaikki TIFF-tiedostot ovat pakkaamattomia ja siksi suurikokoisia, mutta TIFF voi olla myös pakattu. Pakkaukseen voidaan käyttää tietoa hävittämättömiä pakkausmenetelmäiä, kuten LZW, tai tehokkaampia, mutta tietoa pysyvästi muuttavia menetelmiä, kuten JPEG. Aikaisemmin oli tavallista, että kuvankatseluohjelmat eivät pystyneet avaamaan kaikkia TIFF-muotoja, mutta nykyisin nämä ongelmat ovat harvinaisempia.

Maanmittauslaitos käyttää GeoTIFF-tiedostomuotoa eräiden rasterikartta-aineistojen sekä korkeusmallin jakeluun. Rasterikarttojen TIFF-tiedostot ovat 8-bittisiä, LZW-pakattuja yksikanavaisia kuvia, joihin liittyy väripaletti.  Korkeusmallitiedostot ovat 16-bittisiä yksikanavaisia harmaasävykuvia.

TIFF- ja GeoTIFF-kuvia voidaan katsella sekä tavallisilla kuvankatseluohjelmilla että paikkatieto-ohjelmilla. Korkeusmallin 16-bittisten TIFF-tiedostojen hyödyntämiseen tarvitaan kuitenkin siihen tarkoitettua ohjelmistoa.

JPEG 2000

JPEG 2000 on edistyksellisiä ominaisuuksia tarjoava kuvanpakkausmenetelmä, joka suunniteltiin korvaamaan vuodelta 1992 peräisin oleva JPEG-tiedostomuoto. JPEG 2000 mahdollistaa sekä häviöttömän että häviöllisen pakkauksen, ja pakatun kuvan laatu suhteessa tiedostokokoon on parempi kuin JPEG-menetelmällä.

JPEG 2000 on erittäin monimuotoinen ja monimutkainen menetelmä. Parhaat JPEG 2000-ohjelmakirjastot ovat kalliita ja harvat avoimen lähdekoodin ratkaisut ovat olleet viime aikoihin asti hitaita. Koska muilla pakkausmenetelmillä ja ilmaisilla ohjelmistoilla on saavutettu nopeampi pakkaus ja purku sekä riittävän hyvä laatu hieman tiedostokoosta tinkimällä, niin JPEG 2000 ei ole yleistynyt paikkatietokäytössä, vaan valta-asemassa on GeoTIFF.  JPEG 2000 on kuitenkin otettu käyttöön muissa yhteyksissä, kuten digitaalisissa elokuvateattereissa sekä lääketieteellisessä kuvantamisessa.

JPEG 2000 -tiedostojen sisään voidaan tallentaa paikkatietoon liittyvät metatiedot samaan tapaan kuin GeoTIFF-tiedostoihin. Menetelmä esitetään OGC:n standardissa ”GML in JPEG 2000”.

Maanmittauslaitokselta avoimena datana saatavat ortoilmakuvat ovat häviöttömästi pakattuja, GML in JPEG 2000 -standardin mukaisia JPEG 2000. Tärkein syy tiedostomuodon valintaan on ollut se, että JPEG 2000 on yksi INSPIRE-direktiivin teknisissä ohjeissa hyväksytyistä tiedostomuodoista.

Maanmittauslaitoksen suurikokoiset JPEG 2000 -ortokuvat eivät aukea tavallisilla valokuvaohjelmilla. QGIS- ja ESRI:n ohjelmistoilla sekä GIMP valokuvankäsittelyohjelmassa niiden avaaminen onnistuu.

PNG

PNG on erittäin yleinen kuvatiedostomuoto erityisesti Internetissä. PNG-tiedoston kuvadata on pakattu tietoa hävittämättömällä menetelmällä, joka pakkaa erityisen tehokkaasti kuvat, joissa on paljon yhtenäisiä saman värisiä alueita. Perinteiset kartat ovat juuri tällaisia. PNG-tiedostomuoto sopii hyvin kuvien katseluun, kunhan kuvat ovat suhteellisen pieniä, mutta suurten PNG-kuvien avaaminen vaatii paljon muistia ja voi olla hidasta.

PNG-kuvia voidaan katsella sekä tavallisilla kuvankatseluohjelmilla että paikkatieto-ohjelmilla. Karttatiedostoon liittyvän erillisen .pgw-tiedoston avulla paikkatieto-ohjelmistot tunnistavat kuvan sijainnin, mutta eivät sen koordinaattijärjestelmää.

JPEG

JPEG on PNG-tiedostomuodon tavoin erittäin yleisesti käytetty kuvaformaatti. JPEG-pakkaus on häviöllinen eli se muuttaa kuvadataa pysyvästi. JPEG-pakkaus on kehitetty valokuvien pakkaamista varten ja siitä syystä se sopiikin parhaiten ilmakuvien kaltaisten, jatkuvasti ja vähitellen muuttuvien kuvien pakkaamiseen. Menetelmä hyödyntää ihmissilmän heikkouksia ja poistaa kuvista informaatiota, jota silmä ei kuitenkaan huomaisi. Tällä tavalla pakkaussuhdetta voidaan parantaa, mutta toisaalta lopputulos ei ole paras mahdollinen koneelliselle kuvantulkinnalle. JPEG-pakkaus tiivistää myös tavalliset kartat PNG-pakkausta pienempään tilaan, mutta karttojen laatu saattaa huonontua näkyvästi erityisesti viivojen ja tekstien kohdalta.

JPEG sopivat PNG:n tavoin parhaiten pienehköjen kuvien katselukäyttöön. JPEG-pakkauksen purkamista varten koko tiedosto on ensin avattava, joten suurten kuvien avaaminen vaatii paljon muistia.

JPEG-kuvia voidaan katsella sekä tavallisilla kuvankatseluohjelmilla että paikkatieto-ohjelmilla. Karttatiedostoon liittyvän erillisen .jgw-tiedoston avulla paikkatieto-ohjelmistot tunnistavat kuvan sijainnin, mutta eivät sen koordinaattijärjestelmää.

ARC/INFO ASCII Grid

ASCII Grid on tekstimuotoinen rasteritiedosto. Tiedoston otsikkoriveillä kerrotaan rasterikuvan koko riveinä ja sarakkeina, jonka jälkeen tiedostoon on tallennettu jokaisen kuvan pikselin numeroarvot peräkkäin. Formaatti tukee vain yksikanavaisia rastereita. Tyypillisessä käyttötapauksessa rasteriarvot kuvaavat jotain mittaustulosta. Korkeusmallirasterissa tämä mittausarvo on pikselin keskipisteen korkeus maastossa.

ASCII Grid on yksinkertainen tiedostomuoto, jota voi tarvittaessa tutkia vaikka tavallisella tekstieditorilla. Sovelluksissa sen käyttöön ei tarvita laajoja ohjelmakirjastoja, kuten esimerkiksi GeoTIFF:iä käytettäessä. GeoTIFF ja muut binääriset tiedostomuodot toimivat kuitenkin ASCII Gridiä nopeammin sovelluksissa.

ASCII Grid -tiedostomuotoa tukevat mm. ESRI:n tuotteet ja QGIS.

CSV

Comma-Separated Values (CSV) on tekstitiedosto, jonka tietokentät erotetaan toisistaan erotinmerkillä. Erotinmerkkinä on tiedostomuodon nimen mukaisesti usein pilkku, mutta CSV-muotoa ei ole mitenkään standardoitu ja erottimena käytetään yleisesti muitakin merkkejä, kuten puolipistettä ja sarkainta.

Maanmittauslaitoksen aineistoista CSV-muodossa on saatavilla kiintopisterekisterin tietoja. Kenttien erottimena käytetään puolipistettä.

CSV-tiedostoja käsitellään tavallisimmin tekstinkäsittelyohjelmilla tai Excelillä, mutta niitä on mahdollista lukea myös paikkatieto-ohjelmilla.

CityGML

CityGML on OGC:n hyväksymä kolmiulotteisten kohteiden tietomalli ja tiedostoformaatti. Maanmittauslaitos käyttää CityGML-tiedostomuotoa 3D-rakennuksille.

CityGML-tiedostojen käsittelyyn tarvitaan erityinen 3D-ohjelmisto. 

Avoimien aineistojen tiedostopalvelu

Lataa maksutta Maanmittauslaitoksen avoimia paikkatieto-, kartta- ja ilmakuva-aineistoja Avoimien aineistojen tiedostopalvelusta.

Rajapintapalvelu vai tiedostopalvelu?

Aineistoja on saatavilla rajapintapalvelusta ja tiedostopalvelusta. Pohditko, missä tapauksessa kannattaa käyttää rajapintapalvelua, missä tapauksessa tiedostopalvelua?