Hoppa till huvudinnehåll

Format för Lantmäteriverkets geografiska datamängder

LAZ

LAZ är ett förlustfritt komprimerat LAS-format som används för distribution av lasersskanningsdatamängder.  LAS är ett öppet filformat som utvecklas av American Society for Photogrammetry and Remote Sensing (ASPRS) och har också godkänts som gemenskapsstandard av OGC (2018).


LAZ-formatet komprimerar LAS-filen till 7–20 procent av originalet.  LAZ-metoden är öppen källkod och har för första gången använts i programbiblioteket LAStools.


LAS-formatet kan användas med de flesta programvaror som använder laserskanningsdata.  Alla kan inte direkt läsa det komprimerade LAZ-formatet, men det finns många program för att dekomprimera LAZ-formatet, såväl öppen källkod som icke-öppna program, såsom LASzip, LAZperf och FME.

 

GML

GML är ett XML-format utvecklat för överföring av geodata. Utvecklare av GML är de internationella standardiseringsorganisationerna ISO och OGC.


Lantmäteriverket använder GML-formatet bland annat för distribution av öppna datamängder i fastighetsregistret och terrängdatabasen. INSPIRE-nedladdningstjänsterna (WFS-tjänster) är också baserade på GML-formatet.


GML-formatet gör det möjligt att förmedla även komplexa rumsliga strukturer. Samma objekt kan till exempel ha flera olika geometrier: kommunens förvaltningscentrum som punkt, kommungränserna som linjer samt kommunens område som polygon. GML stöder geometrier som antingen helt eller delvis är bågar, såsom cirkel, samt attribut av katalogkaraktär, såsom ortnamn, av vilket det kan finnas finska, svenska och olika samiskspråkiga versioner.  


En svaghet i GML är att det kan vara svårt att använda GML, särskilt med komplicerade strukturer. Färdig programvara stöder inte nödvändigtvis alla funktioner i GML och utvecklarna upplever också att filformatet är komplicerat. Dessutom är det textbaserade GML framför allt ett överföringsformat som inte direkt passar för ändamål där höga prestanda krävs, utan data måste konverteras till något annat filformat för användning.


Trots sina svagheter är GML det filformat som gör det möjligt att med störst säkerhet överföra uppgifterna i Lantmäteriverkets vektormaterial i original och utan några förändringar i något avseende. Skillnaderna i förhållande till GeoPackage-formatet är dock små.


QGIS-programvaran öppnar GML-filerna i Lantmäteriverkets terrängdatabas och namnbestånd utan problem.

 

GeoPackage

GeoPackage (GPKG) är en OGC-standard som antogs 2014 för att fastställa ett enhetligt sätt att lagra raster- och vektordata i SQLite-databasen. GeoPackage-databasen är en enda fil som dock kan innehålla ett obegränsat antal separata vektor- och rasterkartlager. För användaren innebär detta ett mindre antal filer att ladda ner.  Av Lantmäteriverkets material är detta särskilt betydelsefullt när det gäller terrängdatabasen med mer än hundra objektklasser. GeoPackage-filer har ingen storleksbegränsning och därför är det inte nödvändigt att dela upp materialet.


GeoPackage är ett mångsidigt filformat som stöder nästan alla egenskaper som används i Lantmäteriverkets GML-produkter. Eftersom GeoPackage alltid använder sig av UTF-8 teckenkodning skapar till exempel inte specialtecken i samiskan några problem. GeoPackage är också snabbt, så det behöver inte konverteras till andra format utan är lämpligt för direkt användning. Som databas kan GeoPackage också utvidgas, och till exempel kan presentationsstilen hos vektormaterial lagras i samma databas tillsammans med materialet. Eftersom GeoPackage-standarden ännu inte är klar i detta avseende testar MML att spara stilar på det sätt som stöds av QGIS-programvaran.

Programvarustödet för GeoPackage-filer är bättre än för GML, men sämre än för Shapefile. De vanligaste geodataprogrammen, såsom QGIS, ArcGIS och MapInfo, kan använda GeoPackage-filer direkt.

 

ESRI Shapefile

Shapefile är ett filformat som presenterades 1994 av ESRI. Shapefile blev också allmänt tillgängligt för andra än ESRI:s program efter det att ESRI hade publicerat huvuddragen i formatets tekniska struktur 1998. Shapefile är förmodligen det vektorformat som för närvarande stöds av flest geodataprogram och som också används i stor utsträckning för att distribuera datamängder. Den största fördelen med Shapefile är ett brett mjukvarustöd samt snabbhet som gör att det passar både som överförings- och användningsformat.


Man har lärt känna Shapefiles egenskaper väl och därför kan man leva även med dess brister, men det här filformatet börjar ändå bli föråldrat. Den största bristen med Shapefile är att den inte kan förmedla all slags information. Formatet stöder till exempel inte datum med tidsstämpel (DATETIME), utan bara datum, strängar kan inte vara längre än 254 tecken, och NULL-värden kan inte sparas i fälten. Andra problem inkluderar den maximala storleken på 2 gigabyte för filerna, vilket innebär att stora datamängder måste delas upp. En annan faktor som ökar behovet av uppdelning är att Shapefile endast kan innehålla ett kartlager och att geometrin i en Shapefile måste vara av samma typ, dvs. antingen punkter, linjer eller områden. Allmänna problem är också svårigheterna med specialtecken, eftersom det inte finns någon allmänt accepterad metod för teckenkodning i Shapefile.


Lantmäteriverket distribuerar flera datamängder i Shapefile-format. Om det också finns en GML- eller GeoPackage-version av samma material är Shapefile en parallellprodukt vars datainnehåll avviker från de tidigare på grund av tekniska begränsningar i formatet.


Shapefile-filer kan behandlas med alla vanliga geodataprogram, inklusive ESRI-produkter, MapInfo Pro, QGIS och Tatuk GIS.


MapInfo MID/MIF

Det MID/MIF-filformat som utvecklats av MapInfo härstammar precis som ESRI Shapefile från mitten av 1990-talet. MID/MIF är ett textbaserat överföringsformat som motsvarar ett binärt TAB-format. TAB-formatet används endast i MapInfo-programmet, men MID/MIF har på grund av sin enkelhet också varit ett allmänt överföringsformat. Idag har GeoJSON mestadels ersatt MID/MIF-formatet för denna användning.


MapInfo-formatet har liknande begränsningar som Shapefile-formatet, t.ex. 2 gigabytes storleksbegränsning, maximal stränglängd 254 tecken och problem med användningen av specialtecken. MapInfo har också presenterat det nya filformatet "NativeX Extented Tab", som inte har några sådana begränsningar, men detta filformat stöds inte av Lantmäteriverket.


MapInfo MID/MIF-formatet har inte längre någon större betydelse som allmänt överföringsfilformat och MapInfo-användare behöver inte längre MID/MIF-formatet eftersom MapInfo kan använda både GeoPackage- och Shapefile-filer.


Utöver MapInfo-programmet kan MID/MIF-filer öppnas med QGIS-programmet.


GeoTIFF


GeoTIFF är en vanlig TIFF-bildfil som innehåller metadata för rumsliga data.  Den viktigaste av dessa metadata är georeferering, dvs. information om bildens geografiska läge och det koordinatsystem som bilden använder. Innan GeoTIFF utvecklades kunde bildens läge anges med en separat fil, så kallad "world file", och även ett koordinatsystem med en separat projektionsfil.  Georefereringsdata som lagras i bildfilen har den viktiga fördelen att den inte kan försvinna, men GeoTIFF kan också innehålla mer metadata. Den första GeoTIFF-specifikationen utarbetades 1994 och 2019 blev GeoTIFF också en OGC-standard.  GeoTIFF är förmodligen det mest använda filformatet för ortofoton och satellitbilder i världen.


TIFF är ett mångsidigt filformat.  Man tror ofta att alla TIFF-filer är okomprimerade och därför stora, men TIFF kan också vara komprimerat. För komprimering kan icke-förstörande komprimeringsmetoder användas, såsom LZW, eller mer effektiva, metoder som förändrar data permanent, såsom JPEG. Tidigare var det vanligt att bildgranskningsprogram inte kunde öppna alla TIFF-format, men i dag är dessa problem mer sällsynta.


Lantmäteriverket använder GeoTIFF-filformatet för distribution av vissa rasterkartmaterial och höjdmodeller. TIFF-filerna på rasterkartorna är 8-bitars, LZW-komprimerade enkanaliga bilder med färgpalett.  Höjdmodellfilerna är 16-bitars enkanaliga gråskalebilder.


TIFF- och GeoTIFF-bilder kan visas både med vanliga bildgranskningsprogram och med geodataprogram. För att kunna använda höjdmodellens 16-bitars TIFF-filer krävs dock programvara som är avsedd för detta.


JPEG 2000


JPEG 2000 är en bildkomprimeringsmetod med avancerade funktioner som utformats för att ersätta JPEG-filformatet från 1992. JPEG 2000 möjliggör både oförstörande och förstörande komprimering, och kvaliteten på den komprimerade bilden i förhållande till filstorleken är bättre än med JPEG-metoden.


JPEG 2000 är en mycket mångsidig och komplex metod. De bästa JPEG 2000-biblioteken är dyra och de få lösningarna med öppen källkod har varit långsamma fram till nyligen. Eftersom andra komprimeringsmetoder och fri programvara har gett snabbare komprimering och dekomprimering samt tillräckligt hög kvalitet genom att kompromissa lite om filstorleken, har JPEG 2000 inte blivit mer allmänt förekommande i geodataanvändning, utan GeoTIFF är ledande.  JPEG 2000 har dock införts i andra sammanhang, t.ex. digitala biografer och medicinsk avbildning.


I JPEG 2000-filer kan metadata för rumsliga data sparas på samma sätt som i GeoTIFF-filer. Metoden beskrivs i OGC:s standard "GML in JPEG 2000".


Fotografier från Lantmäteriverket i form av öppna data är förlustfritt komprimerade, enligt GML in JPEG 2000-standarden. Huvudskälet till valet av filformat har varit att JPEG 2000 är ett av de filformat som godkänts i INSPIRE-direktivets tekniska riktlinjer.


Lantmäteriverkets stora JPEG 2000-ortofoton kan inte öppnas med vanliga fotoprogram. Programvara från QGIS och ESRI samt GIMP bildbehandlingsprogram gör det möjligt att öppna dem.


PNG


PNG är ett mycket vanligt bildformat, särskilt på Internet. PNG-filens bilddata är komprimerad med en förlustfri metod som särskilt effektivt komprimerar bilder med många sammanhängande områden i samma färg. Traditionella kartor har precis den egenskapen. PNG-filformatet passar bra för att visa bilder, så länge bilderna är relativt små, men det krävs mycket minne för att öppna stora PNG-bilder och det kan vara långsamt.


PNG-bilder kan visas både med vanliga bildgranskningsprogram och med geodataprogram. Med hjälp av en separat .pgw-fil som är kopplad till kartfilen identifierar geodataprogram platsen för bilden, men inte dess koordinatsystem.


JPEG


JPEG är liksom PNG-filformatet ett mycket vanligt bildformat. JPEG-komprimeringen är förstörande, vilket innebär att den ändrar bilddata permanent. JPEG-komprimeringen har utvecklats för att komprimera foton och passar därför bäst för att komprimera bilder som flygbilder, som förändras kontinuerligt och gradvis. Metoden använder sig av det mänskliga ögats svagheter och tar bort information från bilderna som ögat ändå inte skulle märka. På detta sätt kan komprimeringsförhållandet förbättras, men å andra sidan är slutresultatet inte det bästa för maskinell bildtolkning. JPEG-komprimeringen packar också ihop vanliga kartor mer än PNG-komprimeringen, men kvaliteten på kartorna kan försämras märkbart, särskilt när det gäller linjer och texter.


Liksom PNG passar JPEG bäst för att betrakta mindre bilder. För att dekomprimera JPEG måste hela filen först öppnas, så det krävs mycket minne för att öppna stora bilder.


JPEG-bilder kan visas både med vanliga bildgranskningsprogram och med geodataprogram. Med hjälp av en separat .jgw-fil som är kopplad till kartfilen identifierar geodataprogram platsen för bilden, men inte dess koordinatsystem.


ARC/INFO ASCII Grid


ASCII Grid är en rasterfil i textformat. Filens titelrader anger rasterbildens storlek i rader och kolumner, följt av de numeriska värdena för varje pixel i bilden i följd. Formatet stöder endast enkanaliga raster. I typisk användning beskriver rastervärdena något mätresultat. För ett höjdmodellraster är detta mätvärde höjden på pixelns mittpunkt i terrängen.


ASCII Grid är ett enkelt filformat som vid behov kan studeras med en vanlig textredigerare. För tillämpningar behövs inga omfattande programbibliotek, som t.ex. när man använder GeoTIFF. GeoTIFF och andra binära filformat fungerar dock snabbare än ASCII Grid i tillämpningar.


ASCII Grid-filformatet stöds av bl.a. produkter från ESRI och QGIS.


CSV


Comma-Separated Values (CSV) är en textfil vars datafält skiljs åt med ett särskiljande tecken. I enlighet med namnet på filformatet är skiljetecknet ofta ett kommatecken, men CSV-formatet är inte på något sätt standardiserat och som skiljetecken används ofta även andra tecken, t.ex. semikolon och tabstopp.


Av Lantmäteriverkets datamängder finns fixpunktsregistret tillgängligt i CSV-format. Som fältavskiljare används semikolon.


CSV-filer behandlas oftast med ordbehandlingsprogram eller Excel, men kan också läsas med geodataprogram.


CityGML


CityGML är en datamodell och ett filformat för tredimensionella objekt, godkänt av OGC. Lantmäteriverket använder CityGML-filformatet för 3D-byggnader.
För att hantera CityGML-filer krävs särskild 3D-programvara.