Laserskanning Arealklassifikation baseret på laserskanningsdata. Stephen Hansen & Morten Nielsen



Relaterede dokumenter
Projektopgave Observationer af stjerneskælv

Analyse af måledata II

Danmarks byer fra nye vinkler

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Procesrapport. Laserscanning af Åmosen. BlomInfo A/S. Maj Skov- og Naturstyrelsen, Odsherred Statsskovdistrikt

Studieretningsprojekter i machine learning

Bilag 7 Analyse af alternative statistiske modeller til DEA Dette bilag er en kort beskrivelse af Forsyningssekretariatets valg af DEAmodellen.

Evaluering af Soltimer

Danmarks Højdemodel, DHM/Punktsky

Visualisering af punktskyer og ortofoto i Descartes. Morten M. Sørensen Niras BlomInfo (mmks@niras.dk)

Måling af turbulent strømning

Danmarks Højdemodel 2007, DHM-2007/Terræn

Danmarks Højdemodel, DHM/Terræn

Fysik 2 - Den Harmoniske Oscillator

Identifikation af planer der ikke findes i PlansystemDK vha. datasættet... 9

En sumformel eller to - om interferens

Integralregning Infinitesimalregning

En statistikstuderendes bekendelser Søren Wengel Mogensen

Løsninger til kapitel 1

GPS stiller meget præcise krav til valg af målemetode

Eksperimentelle øvelser, øvelse nummer 3 : Røntgenstråling målt med Ge-detektor

Analyse af en lineær regression med lav R 2 -værdi

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Analyse og sammenligning af Hellmann og Pluvio nedbørsmålere

Droner (UAS) - er det, det nye sort? Af Morten Sørensen mmks@niras.dk Projektleder Informatik, NIRAS A/S

Danmarks Højdemodel, DHM/Overflade

Nordkystens Fremtid. Forundersøgelser. Topografisk survey GRIBSKOV KOMMUNE

Mørk energi Anja C. Andersen, Dark Cosmology Centre, Niels Bohr Institutet, Københavns Universitet

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

ISCC. IMM Statistical Consulting Center. Brugervejledning til beregningsmodul til robust estimation af nugget effect. Technical University of Denmark

Danske koordinatsystemr (referencesystemer) MicroStation V8i. Begreber

Ekstremregn i Danmark

DANISH METEOROLOGICAL INSTITUTE MINISTRY OF TRANSPORT TECHNICAL REPORT KLIMAGRID - DANMARK

Løsning til eksaminen d. 14. december 2009

Binært LAS-format Denne indstilling import Laser scan datafiler, i LAS format.

Kapitel 13 Reliabilitet og enighed

Residualer i grundforløbet

Teknisk Rapport Klimagrid Danmark Referenceværdier Peter Riddersholm Wang

Arbejdet på kuglens massemidtpunkt, langs x-aksen, er lig med den resulterende kraft gange strækningen:

VisiRegn: En e-bro mellem regning og algebra

Denne pdf-fil er downloadet fra Illustreret Videnskabs website ( og må ikke videregives til tredjepart.

Specialkort med Valgdata

Indhold Problemstilling... 2 Solceller... 2 Lysets brydning... 3 Forsøg... 3 Påvirker vandet solcellernes ydelse?... 3 Gør det en forskel, hvor meget

Tilgroning af lysåbne. naturtyper i Danmark af metoder vha.. remote sensing. Thomas Hellesen, phd. stud. Skov og Landskab, KU, LIFE.

Der påvises en acceptabel kalibrering af kameraet, da det værdier kun er lidt lavere end luminansmeterets.

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Lysets hastighed. Navn: Rami Kaddoura Klasse: 1.4 Fag: Matematik A Skole: Roskilde tekniske gymnasium, Htx Dato:

Lineære sammenhænge, residualplot og regression

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Optisk gitter og emissionsspektret

SILKEBORG KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2018 SKOLE OG SFO

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Emneopgave: Lineær- og kvadratisk programmering:

INTRODUKTION TIL DIAGRAMFUNKTIONER I EXCEL

Modellering af stoftransport med GMS MT3DMS

Normalfordelingen og Stikprøvefordelinger

MODUL 1-2: ELEKTROMAGNETISK STRÅLING

Tilfældige rektangler: Et matematikeksperiment Variable og sammenhænge

Bilag 7. SFA-modellen

Vejledning til brug af Skanderborg Kommunes 3D-model

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

GRIBSKOV KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2019 DAGTILBUD, SKOLE, FO OG KLUB

DTU Campus Service DTU - BYGHERRERÅDGIVNING IKT Beskrivelse af DTU LOK koordinatsystemet. Den oprindelige definition af DTU-LOK er desværre gået tabt.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Beregning af licens for elbybiler

Lærervejledning Modellering (3): Funktioner (1):

Klimatilpasning og detaljerede højdedata

Vallensbæk Kommune Vallensbæk Stationstorv 100, 2665 Vallensbæk Strand

Undersøgelse af lyskilder

Maskinel køretøjsklassifikation ud fra mønstergenkendelse. Udarbejdet: Christian Overgård Hansen 28. september 2004

Grådige algoritmer. Et generelt algoritme-konstruktionsprincip ( paradigme ) for optimeringsproblemer.

Gennemsnit og normalfordeling illustreret med terningkast, simulering og SLUMP()

Kontrolstatistik dokumentation Vandkemi

RENTES REGNING SIMULATION LANDMÅLING MÅLSCORE I HÅNDBO . K R I S T I A N S E N KUGLE G Y L D E N D A L

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Produkt og marked - matematiske og statistiske metoder

REFLEKTION eller GLANS standarder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

SDL Digital Højde Model

Dæmpet harmonisk oscillator

Referencelaboratoriet for måling af emissioner til luften

Harmonisk oscillator. Thorbjørn Serritslev Nieslen Erik Warren Tindall

Teknisk Notat. Støj fra vindmøller ved andre vindhastigheder end 6 og 8 m/s. Udført for Miljøstyrelsen. TC Sagsnr.: T Side 1 af 15

Excel tutorial om lineær regression

Dig og din puls Lærervejleding

I dag: Digital projektering -formål. Give jer et indblik i, hvad det betyder at projektere digitalt, og hvad det kræver især med hensyn til data.

Indholdsfortegnelse. Miljørigtige køretøjer i Aarhus. Effekter af en mere miljørigtig vognpark i Aarhus Kommune. Aarhus Kommune. Notat - kort version

COWI når nye højder...

Byggeriets Evaluerings Center

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Impuls og kinetisk energi

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Afstande, skæringer og vinkler i rummet

Empirisk Miniprojekt 2

Men min oplevelse er, at det rigeligt er indsatsen og det lidt mere omstænde arbejde værd.

Metodenotat til analysen:

Accelerations- og decelerationsværdier

Transkript:

Laserskanning Arealklassifikation baseret på laserskanningsdata Stephen Hansen & Morten Nielsen

Laserskanning Arealklassifikation baseret på laserskanningsdata Stephen Hansen Morten Nielsen

Synopsis Denne rapport er blevet til på baggrund af et projekt der omhandler laserskanningsdata og muligheden for anvende disse til arealklassifikation. Projektet tager sit udgangspunkt i data skannet i foråret 21 over Djursland. Rapporten indledes med en kort general introduktion om laserskanning og de data som er stillet til rådighed beskrives. De vigtigste fejlkilder i forbindelse med laserskanning gennemgås og data forsøges filtreret for fejl. Herefter analyseres og tolkes forskellige direkte og afledte parametre i den indsamlede data. Dette gøres både visuelt og ved hjælp af histogrammer. Der søges efter statistiske karakteristika der kan adskille forskellige arealklasser fra hinanden. Til sidst forsøges det at opstille en automatiseret klassifikation ved hjælp af en Bayes klassifikation og resultatet vurderes. Det konkluderes at det er muligt at skelne mellem flere typer arealklasser ud fra laserskanningsdata. Det bliver vist at Bayesmetoden er i stand til at skelne mellem markog skovområder med en rimelig sikkerhed. Ønsker man en bedre eller mere detaljeret klassifikation, bør man dog overveje en anden metode. Abstract This report has been written on the basis of a project dealing with the practical application of laser-scanned data for area classification. The project is based on data scanned in the Spring of 21 in Djursland on the Danish mainland of Jutland. The report firstly introduces the concept of laser-scanning and the data available is described. The most significant sources of potential error in conjunction with laser scanning are then discussed and filtering techniques are applied in an attempt to eliminate such errors. Thereafter, analysis and interpretation of various direct and derived parameters extracted from the collected data are made. This is done both graphically and using histograms. Statistical characteristics are sought which enable identification of various area classes from one another. Finally an attempt is made to construct an automated classification using a Bayes classification, and the result is evaluated. It is concluded that is possible to differentiate between several types of area classifications on the basis of laser-scanned data. It is shown that the Bayes method can be used to differentiate between open country and wooded areas with a reasonable degree of certainty. However, if a more detailed classification is required, other methods should be considered.

Forord Nærværende rapport er blevet til i forbindelse med et kombineret special- og midtvejsprojekt ved IMM, Danmarks Tekniske Universitet i efteråret 21 og januar 22. I projektet undersøger vi muligheden for en automatisk arealklassifikation, baseret på laserskanningsdata. Rapporten er inddelt i nummererede kapitler og kildehenvisninger er angivet med firkantet parentes. Bagerst er der vedlagt en detaljeret beskrivelse af kilder og litteratur. Gennem rapporten er figurer og tabeller er nummereret med to tal. Det første refererer til kapitlet, mens det andet er fortløbende i det pågældende kapitel. Er der i forbindelse med figurer og tabeller ikke angivet en kilde, har vi selv udarbejdet denne. I projektet benyttes laserskannet data som venligst er stillet til rådighed af BlomInfo. Herudover er der brugt udtræk fra TOP1DK. Som sammenlignings grundlag er der benyttet et luftfoto venligst udlånt af Kampsax. I forbindelse vil med projektet vi gerne takke følgende: BlomInfo for levering af data, -herunder særligt Søren Buch og Gregers Nielsen for idéer og svar på generelle spørgsmål og Bent Hermansen for hjælp med ArcView scripts. Obtech Inc. for besvarelser af spørgsmål vedrørende deres laserskannere. Poul Larsen, Danmarks Jordbrugsundersøgelser, for svar på generelle spørgsmål. Allan Aasbjerg, IMM ved DTU, for idéer og svar på spørgsmål i forbindelse med de statistiske analyser. Keld Dueholm, IMM ved DTU, for hjælp og vejledning igennem hele projektet. Danmarks Tekniske Universitet, Lyngby d. 1. februar 22 Stephen Hansen c973729 Morten Ødegaard Nielsen - c973466

Indholdsfortegnelse Indholdsfortegnelse Forord... 4 Indholdsfortegnelse... 5 1 Indledning... 7 Princippet...8 Afstandsmålingen...8 To retursignaler...9 Problemformulering...9 2 Datagrundlag og laserskanneren... 11 2.1 Data...11 2.2 Optech ALTM121...12 Systembegrænsninger...13 3 Fejlssøgning... 16 3.1 Generelt om fejl i laserskanning...16 3.2 Fejlbehandling...17 Alternative metoder...21 Intensitets-afhængighed af skanningsvinklen...22 3.3 Del konklusion...23 4 Data-analyse... 24 4.1 Visuel analyse af rådata...24 Koter...25 Intensiteter...26 Histogrammer...27 Kort sammendrag...28 4.2 Visuel analyse af afledet data (grid-analyse)...29 Implementering i ArcView GIS...3 Visual analyse af hele dataområdet...34 4.3 Delkonklusion...35 5 Arealklassifikation... 36 5.1 Bayes klassifikation...36 5.2 Arealklasser - analyser / træning...38 Fjernelse af outliers...39 Normalfordelte bånd...42 5.3 Klassifikation i ArcView...46 5

Indholdsfortegnelse 5.4 Forsøg med klassificering...47 Klassificering på forskellige bånd...47 Threshold-værdiens effekt...5 5.5 Delkonklusion...53 6 Konklusion... 54 Perspektivering...56 7 Kilde-henvisninger og litteraturliste... 57 8 Bilag... 59 6

Indledning 1 Indledning Kortlægning og opmåling har længe været en vigtig faktor for opdagelsesrejsende, for krigsførende og til administrative formål. Kortlægningen har udviklet sig kraftigt i den senere tid. I dag forgår dette ofte digitalt og fortrinsvis vha. skannede luftfotos, der manuelt tolkes og omsættes til kort. Denne proces er ofte tidskrævende og derfor forbundet med en del omkostninger. Da efterspørgslen for kort og højdemodeller med god præcision er stor, er der derfor i de sidste år udviklet flere nye opmålings- og ajourføringsmetoder. 7 En af disse metoder er laserskanning fra fly. Baggrunden for metoden er laseren, som blev opfundet midt i 196 erne. Den åbner mulighed for at foretage meget præcise afstandsmålinger, og ideen om at scanne større arealer fra fly er heller ikke helt ny, men var fremme allerede 197 erne. Det er imidlertid først efter udbredelsen af GPS-systemerne, det er blevet muligt at bestemme et flys position så nøjagtigt, at egentlige opmålinger kan bruges i praksis. I Danmark har laserskanning først og fremmest været brugt til at lave deltaljerede digitale terræn- og overflademodeller (DTM og DSM). Sådanne modeller kan bruges i mange sammenhænge. Danmarks Jordbrugsforskning, som fik foretaget de første laserskanninger herhjemme, benyttede højdemodellerne til beregning af vandafstrømning i forbindelse med udarbejdelsen af et nyt vandløbsregulativ for Nørreå mellem Viborg og Randers. Nørreå løber i et område med lave omgivelser, og åen har næsten intet fald. Det var derfor nødvendigt at regne på hvilke konsekvenser, forskellige former for vedligeholdelse ville medføre. En traditionel opmåling med teodolit ville her være meget dyr, pga. terrænets beskaffenhed [Kortdage]. I forbindelse med større anlægsarbejder af f.eks. veje, spiller nøjagtige højdemodeller også en vigtig rolle. Her kan en nøjagtig model være en vigtig i forbindelse med beslutningen af hvilken linieføring, som skal vælges. Ydermere kan de afhjælpe volumenberegningerne, hvor den jordmængde som skal flyttes, hurtigt og præcist kan beregnes. Et andet meget aktuelt eksempel er udnyttelsen af laserskannning til en højdemodel af Salt Lake City i Utah, USA. Her har man som en del af forberedelserne til Vinter OL 22 skannet hele byen samt de olympiske anlæg. Formålet hermed, har været at lave en 3D-model, som udover PR-øjemed, kan bruges i bekæmpelse af eventuelle terroraktioner. En nøjagtig 3D-

Indledning model kunne både udnyttes i direkte kamp mod terrorister, men også i en evakueringssituation [Turner]. Det data som vi har brugt i projektet, er også foretaget med det formål at opbygge højdemodeller. Disse skulle bruges i forbindelse med nedgravninger af kloakker på Djursland samt i forbindelse med anlæggelsen af en omfartsvej nord for Århus. 8 Princippet Laserskanning består i princippet af en række afstandsmålinger fra fly til terræn. Afstandsmålingerne foretages ved at udsende en laserstråle fra flyet og ned mod terrænet, mens flyets position og orientering bestemmes ved hjælp af differentiel GPS (dgps) og et system af gyroer kaldet Inertial Navigation System (INS). Ved at sammenholde position og orientering med afstandsmålingerne, bestemmes X, Y, og Z- koordinater i terræn, og på den måde dannes en digital højdemodel. For hvert punkt registreres ofte også styrken på retursignalet. Intensiteten afhænger af det ramte punkts evne til at reflektere, og kan på den måde give informationer om det pågældende punkt. Afstandsmålingen Den enkelte afstandsmåling i laserskanning foretages ved at måle tiden det tager lasersignalet at tilbagelægge turen til terrænet og tilbage igen. Dette kan ske på to forskellige måder. Med impulsmetoden, som er langt den mest anvendte i dag, sendes lasersignalet af sted i impulser. Afstanden findes ved at måle den tid som strålen er om at tilbagelægge afstanden. Pulsfrekvensen skal være så lav, at signalet kan nå at tilbagelægge afstanden til terræn og tilbage igen, inden næste puls sendes af sted. Continuous Wave bygger derimod, som navnet antyder, på at laserstrålen udsendes konstant. Afstanden findes ved at måle faseforskydningen i laserens bærebølge når den returnerer. Metoden giver mere nøjagtige målinger, men stiller store krav til en jævn flyvehøjde. Afstandsmålingerne foretages med en meget høj repetitions-frekvens; typisk i et interval mellem 2 og 8 khz. Metoden til at indsamle data, varierer fra skanner til skanner, men den

Indledning mest almindelige metode består i at lade skanneren zig-zagge frem og tilbage på tværs flyveretningen, og derved opnås et bredt bånd at målinger. To retursignaler For at øge chancen for at laserstrålen ikke bliver helt blokeret af mindre objekter, såsom blade og grene, vælger man at lade laserstrålen have en vis bredde. Når det udsendte signal rammer terræn, bebyggelse eller vegetation, er der derfor en høj sandsynlighed for at det opsplittes i flere ekkoer/retursignaler, og ét af signalerne trænger helt ned til terræn. Dette gælder især for områder med vegetation som f.eks. skove, hvor en del af signalet returneres fra trækronerne, mens resten trænger igennem og først returneres når det rammer skovbunden. Se figur 1.1. 9 Højdeforskellene og intensitetsværdierne varierer mellem forskellige vegetationstyper, og kan derfor være en afgørende faktor i en areal-klassifikation. De fleste laserskannere er i stand til at registrere både det første og sidste returnerede signal. For en grundigere indføring i principperne bag laserskanning, henviser vi til [Flatman kap.2] Figur 1.1 Illustration af flere retur-signaler, hvor strålen rammer flere objekter. Problemformulering Projektet startede med et udgangspunkt i at opbygge en erfaring med laserskannede data. På baggrund af dette, har vi i dette projekt valgt at kigge på mulighederne for at bruge laserskanningsdata til en arealklassifikation. Da de fleste laserskannere registrerer både kote og retur-intensiteten på det første og sidste retursignal, vil vi forsøge at benytte disse parametre i en klassifikation. Denne anvendelse af laserdata, er noget der på verdensplan endnu forskes meget i. I projektet vil vi først prøve at analysere alle parametrene i signalerne for at finde karakteristiske træk, som kan benyttes til at adskille forskellige arealklasser. På basis af denne analyse, vil vi forsøge at automatisere klassifikationen. Til dette formål vil vi undersøge muligheden for at benytte Bayes klassifikationsmetode.

Indledning Gennem projektforløbet vil vi også prøve at forholde os til den enorme mængde af data som fås ved skanning af selv et mindre område. Mængden af data gør det svært at håndtere større områder på én gang og behandlingsprocessen bliver derfor tung. Omfanget af data er dog også en af styrkerne ved laserskanning da det bl.a. er de mange punkter som gør det muligt at lave detaljerede højdemodeller. Derfor er det også en målsætning at den udviklede metode er i stand til håndtere meget data. 1

Datagrundlag og laserskanneren 2 Datagrundlag og laserskanneren De laserdata dette projekt er baseret på, er venligst udlånt af BlomInfo A/S, og stammer fra foråret 21. Fotonor har udført laserskanningen. 2.1 Data Data består af fire del-områder på Djursland, hvis formål oprindelig blev indsamlet til kloakprojektering (se bilag 7A). Da flyvelinierne overlapper hinanden, er de fleste områder skannet dobbelt, hvorfor den nedenstående datatæthed i nogle tilfælde vil være større. I nogle områder krydser yderligere flyvelinier, så mindre områder er blevet skannet op til 4-6 gange. Dette gør at punkttætheden varierer meget, men i de fleste områder er der tale om en gennemsnitlig punkttæthed på.4 punkter pr. m 2, pga. flyvningernes 5% overlap. 11 Område: Djursland Flyvedato: 1. maj 21 mellem kl.14. og 2. (UTC) Datatæthed: ca..4 punkter / m 2 (.25 pr. flyvelinie) Flyve-hastighed: 15 knob / 77m/s Laserskanner: Optech ALTM121 Flyvelinie-overlap: ~5% Skanningsbredde pr. ~5m flyvelinie: Skanningsvinkel 2 halvvinkel Flyvehøjde: 7 meter Dataformat: ASCII Dataindhold: Første og sidste puls inkl. intensitet, og en arbitrær tidsenhed: Tid, X 1, Y 1, Z 1, X 2, Y 2, Z 2, I 1, I 2 Antal punkter i alt: ~ 42.3 mio. punktsæt Koordinatsystem: UTM Zone 32 (WGS84) Tabel 2.1 - Opsummering af data, bl.a. stammende fra Fotonors flyverapport. Data er blevet leveret på CD-ROM, med én ASCII tekstfil pr. flyvelinie. Tabel 2.2 er et eksempel på rådata.

Datagrundlag og laserskanneren Tid X 1 Y 1 Z 1 X 2 Y 2 Z 2 I 1 I 2 24316.1741 565959.59 625797.99 37.66 565959.6 6257971. 37.53 111 111 24316.17141 56596.3 6257973.79 36.97 565959.99 6257973.73 37.52 118 118 24316.17241 56596.35 6257976.33 37.58 56596.35 6257976.33 37.62 133 133 24316.17341 56596.73 6257978.95 37.54 56596.74 6257978.96 37.44 84 84 24316.17441 565961.1 6257981.76 37.94 565961.13 6257981.8 37.58 88 88... Tabel 2.2 Udsnit af rådata 2.2 Optech ALTM121 Optechs skanner benytter et skanningsmønster, der løber i zig-zag på tværs af flyveretning. Dvs. man får et sinus-formet skanningsmønster. Ved efter-processeringen bliver data i kanterne af flyvelinien dog skåret af, således at datatætheden er rimelig jævn over hele skanningsbredden. Dette kan også ses på tidskoden i de rå data hvor der mangler ca. 7 punkter pr. skannings-periode (i dette tilfælde pr. 2-1 sek.). 12 Skanneren udsender en laserpuls 1. gange i sekundet, mens den fejer frem og tilbage på tværs af flyveretningen 2 gange i sekundet. Skanningsbredden fås ved D= 2 (tan( 2 ) 7m = 51m Punkttætheden fås ved T 1 Hz = f = =.25punkter / Dv 51m 77m / s m Skanneren registrerer X,Y,Z og intensitet at det første og sidste objekt der returnerer laserpulsen. Se i øvrigt næste afsnit ang. skannerens begrænsninger. Optech ALTM 121 Laserskanner ([Fotonor] & [Optech]) Operations-højde: 4-2. m Puls: Første og sidste puls registreres Intensitet: Registrering af styrken på første og sidste puls. Dynamikområde: -6. Skanningsvinkel: - ±2 Afstands-præcision: 15 cm Vinkel-opløsning:,1 Skanningsfrekvens: Afhængig af skanningsvinkel. 2Hz ved ±2, 35Hz ved ±1 2

Datagrundlag og laserskanneren Nøjagtighed ved "roll" og,25 "pitch": Retningsnøjagtighed:,5 Bølgelængde: 164 nm (nær-infrarød) Laserpuls frekvens: 1. Hz Stråle-divergens:,3 mrad Nøjagtighed i planen: 1/2 af flyvehøjden Nøjagtighed i koten: 15cm RMS ved 1km flyvehøjde Tabel 2.3 - Obtech ALTM121 laserskanner - specifikationer 13 Systembegrænsninger Da vi begyndte at analysere vores data, stødte vi på to uregelmæssigheder i målingerne. Ved at kigge på forskellene i højderne på de to retur-signaler, og ved at lave histogrammer over intensiteterne blev vi opmærksomme på to problemer: Højdeforskelle (dz) i intervallet mellem ca. 1,5 og 3,5 meter eksisterer ikke. Intensiteter større end 199 optræder kun i intervaller af 29 Begge problemer viste sig at skyldes systembegrænsninger, som vil blive beskrevet herunder. Opløsning på Z-koordinaten Figur 2.1 viser et typisk histogram over højdeforskellene på de to retursignaler. Som det kan forventes, befinder langt de fleste værdier sig omkring nul. At der både findes negative og positive værdier omkring nul, er blot et udtryk for den spredning der er på målingerne og er ganske normale i alle laserskanningssystemer. Det egentlige problem, er hullet mellem ca. 1.5 og 3.5m, hvor der tilsyneladende ikke eksisterer data. Ifølge Obtech, skyldes dette at systemet ikke er i stand til at registrere det sidste signal, før den har haft tid til at nulstille. Dette skal den bruge 25ns til, hvilket svarer til: ½ c 25 1-9 s = 3.75m, hvor c er lysets hastighed. Obtech arbejder pt. på at halvere dette hul. Dette betyder i øvrigt at man ikke kan registrere højdeforskelle i f.eks. lav vegetation, eller andet der er gennemtrængeligt af laseren.

Datagrundlag og laserskanneren.2.18.16.14.12.1.8.6.4 14.2. -4-2 2 4 6 8 1 12 14 16 18 2 22 24 26 Figur 2.1 dz-histogram for flylinie nr. 36. Omkring dz = er hyppigheden så stor, at vi af hensyn til skalaen har valgt at skære toppen af på illustrationen her. I stedet har vi valgt at angive hyppigheden for de to dele i procent. Opløsning på intensiteten Figur 2.2, viser et typisk histogramplot at intensitetsværdierne. Her ses at der for de høje målinger, findes en masse toppe, med samme interval (i dette tilfælde 29). Igen kontaktede vi Obtech, for at forstå hvad der her skete. Forklaringen skal igen findes i skannerens teknik: Intensitetsmålingerne sendes igennem én af to forstærkere, alt efter styrken af retur-pulsen. Forskellen på de to forstærkere er i vores tilfælde en faktor 29 (denne faktor kan ifølge Optech variere). For intensitetsværdier mellem og 199, forstærkes signalet med den kraftigste forstærker, og lagres som et heltal mellem og 199. Ved retursignaler over 199, forstærkes signalet med den svage forstærker. Dvs. et signal på 265, bliver registreret som 265/29 = 9.13. Da der kun opereres med heltals-værdier, rundes dette tal op til 1, og intensitetsværdien registreres herefter som 1*29 = 29. Dvs. alle kraftige retur-pulser vil blive registreres i intervaller af 29. Dette er et forhold man bør være opmærksom på ved en intensitetsanalyse. Intensitetsmålingernes dynamikområde er i dette tilfælde mellem nul og (2 + 2 x 29) = 6.

Datagrundlag og laserskanneren 16 14 12 1 8 6 4 15 2 5 1 15 2 25 3 35 4 Figur 2.2 - Typisk histogramplot at intensitetsværdierne

Fejlsøgning 3 Fejlssøgning I alt observeret data vil der forekomme fejl som skyldes en kombination af fejlindstillinger af instrumenter, betjeningsfejl og fejlregistrering af måleresultater. Dette gælder også for laserskannede data. Da vi allerede tidligt i projektet, kunne konstatere at også vores datasæt indeholdte sådanne fejl, blev vi nødt til at tage højde for disse. Vi vil her kort beskrive de typer af fejl som har størst betydning for vores projekt, og senere beskrive hvordan vi har forsøgt at eliminere eller filtrere disse. 16 3.1 Generelt om fejl i laserskanning Indenfor laserskanning kan man overordnet inddele målefejl i følgende klasser [Flatman kap. 2.3]: Afstandsfejl Orienterings- og positionsfejl Intensitetsfejl Afstandsfejl dækker over fejlmålinger af afstanden som laserpulsen tilbagelægger. De kan skyldes en dårlig signalfortolkning, f.eks. som følge af dårlige forhold, såsom skarp sol eller dis der påvirker signalet. Præcisionen i tidsmåleren kan være et andet problem, da afstanden beregnes ud fra den tid som laserpulsen er om at tilbagelægge turen frem og tilbage til det ramte objekt. Til sidst kan nævnes, at overfladens sammensætning og hældning også spiller en rolle. Pulsen kan bremses eller afbøjes af f.eks. vand, eller absorberes af asfalt. Store hældninger kan medføre fejl i afstanden fordi pulsen har en vis udstrækning (se figur 3.1). Dårlig signalfortolkning vil komme til udtryk som en systematisk fejl, mens manglende præcision i tidsmåleren og overfladens beskaffenhed vil ses som tilfældige fejl. Figur 3.1 - Terrænets indflydelse på den målte afstand [Flatman]

Fejlsøgning Orienterings- og positionsfejl dækker over fejl i bestemmelsens af flyets og dermed scannerens position og orienteringen. Det er en selvfølge at skannerens position og drejning i rummet må kendes, for at kunne fastslå de enkelte skannede objekters position. Orienteringsfejl afhænger af INS ens præcision, mens positionsfejl er afhængige af GPSmålingernes nøjagtighed. Det er vigtigt at INS, GPS og laserskanneren er synkroniserede og deres indbyrdes placering er kendt. Ligeledes skal tidsmålerne i GPS og skanner være kalibrerede, så der ikke opstår en tidsforskydning. Fejl i GPS-målingen og flyets orientering i rummet vil oftest komme til udtryk som tilfældige fejl, mens manglende synkronisering og forkert indbyrdes placering vil resultere i systematiske fejl. Intensitetsfejl er fejlagtige registreringer af strålens intensitet. En sådan fejl kan opstå som resultatet af en fejl i laseren eller sensoren. I et sådant tilfælde ville der være tale om en systematisk fejl, som vil have størst betydning hvis to forskellige flyvninger skal sammenlignes. En anden intensitetsfejl kan opstå, da styrken af retur signalet bl.a. afhænger af skanningsvinklen. Når skanningsvinklen er stor, er den vinkel pulsen rammer jorden med, mere spids og noget af strålen reflekteres væk. Afstanden som strålen tilbagelægger er også længere og sandsynligheden for at gennemtrænge f.eks. et træ bliver mindre. 17 I vores projekt ville en sådan fejl kunne får stor betydning, da vi ønsker at intensiteten skal indgå i klassifikationen. I et senere afsnit har vi derfor undersøgt betydningen af dette. Figur 3.2 Laserstrålen returneres forskelligt, afhængig af skanningsvinklen. Udover de ovenfor nævnte problemer, findes der også nogle andre faktorer, der kan resultere i tilfældige fejl. Vigtigst af disse observationer, er de hvor laserpulsen rammer og returneres af ikke forudsete objekter. Dette kunne være en fugl, tåge eller lignende. 3.2 Fejlbehandling De her beskrevne fejl og problemer, vil naturligvis have en vis betydning i behandlingen og analysen af data og de må derfor forsøges elimineret.

Fejlsøgning Til det formål har vi valgt en relativ simpel løsning, som først og fremmest vil eliminere de tilfældige fejl. For de systematiske fejl gælder at de overvejende burde være blevet fjernet af den kalibrering der er forgået inden flyvningen. Vores metode til fjernelse af de tilfældige fejl, bygger på koternes værdier i de to signaler. Fra TOP1DK har vi fundet de mindste og højeste koter i hvert af de fire områder. Laveste kote Højeste kote Område 1, m 61, m Område 2 2,5 m 33,5 m Område 3-4, m 53,5 m Område 4-2, m 53, m Tabel 3.1 - Maksimale højder i terræn (Dansk Normal Nul) Kilde: TOP1DK 18 Ved hjælp af fra disse værdier har vi fastslået nogle grænser for koterne i data. Dette er sket på baggrund af kvalificerede gæt og forsøg med forskellige grænseværdier ud fra følgende betragtninger: Minimumskoter: Det er næppe realistisk, at der skulle være koter i data, der ligger under de mindste koter i terrænet. De punkter hvor den ene eller begge koter er væsentlig under mindstekoten i terræn må derfor indeholde fejl. Maksimumskoter: For de maksimale koter har vi defineret en grænse, der ligger ca. 2-25 m over terrænet. I de områder vi beskæftiger os med her, er der mest marker, skove og mindre byer. Ifølge TOP1DK, findes der ikke arealer af typen høj bebyggelse i vores områder, og bygninger er derfor kun meget sjældent højere end 1-15m. Desuden vil de højeste bygninger sandsynligvis ikke befinde sig på de højeste steder i terrænet. Træer i Danmark bliver normalt ikke over 25m høje. Koteforskelle mellem første og sidste signal: Træernes højde giver også en øvre grænse for koteforskellen mellem første og sidste signal. Typisk vil det første signal have ramt trækronen, mens det sidste signal returneres fra skovbunden. Den største koteforskel vil derfor være mindre end 25-3m. Derimod har det været sværere at fastsætte en nedre grænse. I teorien burde det ikke være muligt, at det første signal har en lavere kote end sidste signal. Signalet der kommer tilbage først, må have tilbagelagt den korteste afstand og dermed

Fejlsøgning ramt det højeste punkt. Når der alligevel er en stor andel af punkterne der har negativ koteforskel, skyldes dette usikkerheden på laserskannerens afstandsmålinger. Usikkerheden er som før omtalt ca. 15 cm i højdemålingerne. Antages det, at der er tale om en normalfordeling burde grænsen sættes til tre gange spredning altså ca. 45 cm. I princippet kunne det dog tænkes at målingen af koten for både første og sidste signal var forkerte i hver sin retning, således at det resulterede i en negativ koteforskel på 8-9 cm. Dette burde dog kun meget sjældent være tilfældet. Imidlertid har det vist sig, at grænser for den mindst tilladelige koteforskel på både -4 og -9 cm, medfører at for mange punkter tilsyneladende sorteres fra. For at finde en anden værdi for den nedre grænse, har vi derfor valgt at undersøge histogrammer over koteforskellen (figur 2.1). 19 Af histogrammet i figur 2.1 fremgår det, at der findes en grænse omkring en negativ koteforskel på 1,2m. For koteforskelle under -1,2m gælder det således, at der er meget få punkter. For koteforskelle højere end -1,2m gælder derimod at hyppigheden vokser kraftigt. Vi har derfor valgt at benytte -1,2m. som den nedre grænse for koteforskellen. I den følgende tabel er vist de parametre som benyttes i grovfejlssøgningen. Der skal her bemærkes, at disse er angivet i ellipsoidehøjder. For Djursland er højdeforskellen mellem DNN og WGS84-ellipsoiden, vha. KMSTrans, fundet til ca. 37,5m. Min Z1 Max Z1 Min Z2 Max Z2 Min dz Max dz Område 1 34 m 12 m 34 m 11 m - 1,2 m 3 m Område 2 34 m 9 m 34 m 9 m - 1,2 m 3 m Område 3 34 m 12 m 34 m 12 m - 1,2 m 3 m Område 4 34 m 12 m 34 m 12 m - 1,2 m 3 m Tabel 3.2 - Parametre brugt i grovfejlssøgningen (Ellipsoidehøjder) Selve grovfejlssorteringen er foretaget ved hjælp af et C-program vi har udviklet til formålet. Programmet indlæser ASCII-punktfilerne og kopierer linierne der opfylder de opstillede kriterier til en ny fil (se også bilag 5). Grovfejlssøgningen har med de ovenfor fastsatte kriterier resulteret i at cirka ét punkt ud af 2. fjernes. I tabellen herunder vises for hvert område hvor mange punker der frasorteres og hvilke kriterier de overskrider.

Fejlsøgning Område 1 Område 2 Område 3 Område 4 Punktsæt totalt 11.18.934 3.11.352 21.499.754 4.64.391 Frasorterede punktsæt 587 344 1.858 491 min z1,17 %,29 %,16 %, % max z1 5,45 % 4,7 % 11,36 % 33,81 % min z2 3,7 % 1,16 % 1,24 % 3,26 % max z2,51 %,87 %,27 % 7,54 % min dz 9,12 % 2,35 % 43,27 % 54,17 % max dz 7,84 % 78,78 % 48,76 % 35,85 % min z1 og min z2,17 %,29 %, %, % max z1 og max z2,51 %,87 %,27 % 7,54 % Tabel 3.3 - Procentsatserne viser andelen af de frasorterede punktsæt der ikke opfylder det pågældende kriterium. At summen af procentsatser ikke er 1 skyldes at et frasorteret punkt godt kan overskride mere end et kriterium. 2 Generelt kan det ses at minimums grænsen for koteforskellen stadig er skyld i at mange punkter frasorteres især når det ses i forhold til mængden af punkter der frasorteres i alt. For at få en forklaring på hvorfor hyppigheden af punkter med negativ koteforskel er så relativ høj, kontaktede vi Optech som har produceret skanneren. De mente vores data så meget støjfuldt ud, og at det måske til dels kunne skyldes en lille kalibreringsfejl mellem første og sidste signal, men at dette sandsynligvis ikke var den hovedsagelige grund til den kraftige støj. På samme måde som der er opstillet kriterier for koter og koteforskelle, kunne man også have forstillet sig, at de andre informationer i signalet - plankoordinater og intensiteter - kunne havde været inddraget i grovfejlssøgningen. For plankoordinaterne gælder, at der ikke burde være stor forskel mellem northing- og easting-koordinaternes første og sidste signal. Den tilladelige forskel er dog meget svær at beregne, da den både afhænger af afstanden til flylinien, flyvehøjden og de målte koter i de to signaler. Vi har derfor valgt ikke at inddrage plankoordinaterne i grovfejlssøgningen. Intensiteten afhænger af hvad der rammes, og det kan her ligeledes være svært at opstille kriterier for hvilke værdier der er tilladelige.

Fejlsøgning Alternative metoder Vores valgte metode til grovfejlssøgning er ikke så deltaljeret. Den vil ikke opdage et punkt med høj kote i et lavt område eller omvendt, så længe koterne bare ligger inden for de definerede grænser. Det er derfor kun en tilnærmelse at kigge på et så stort område af gangen, hvor koterne kan variere meget. En løsning kunne være at kigge på de enkelte flyvelinier hver for sig eller gå endnu længere ned og kigge på udsnit på f.eks. 1x1m. En anden mulighed er at lave flydende middel, hvor et punkt vurderes ud fra middelværdien af de omkringliggende punkter. Her skal der så defineres grænser for hvor store afvigelser der kan tillades. Når vi alligevel har valgt den mere simple måde, skyldes det til dels de krav vi stiller til grovfejlssøgningen, og til dels at data-strukturen ville have givet en række problemer i en mere deltaljeret søgning. 21 Vores målsætning med grovfejlssøgningen har været at få frasorteret alle de punkter hvor fejlen er af en sådan størrelse, at den kommer til at have en stor betydning i den videre analyse og behandling. Det er klart, at et punkt, som returnerer f.eks. 5m i Z1-koten vil få en stor betydning, når der regnes middelværdier og standardafvigelser for et lille område, hvor resten af Z1-koterne ligger omkring 4m. Derimod vil en mindre fejl på f.eks. 6m i det samme område ikke betyde så meget - især ikke når den enorme mængde af data, hvor en sådan fejl vil drukne, tages med i betragtningen. Vi mener derfor, at mindre fejl til vis grænse og i vist omfang kan accepteres i dette projekt. Skulle der i stedet benyttes en metode til grovfejlssøgning der sorterede ved hjælp af flydende middel, ville den pga. af den rækkefølge punkterne har i filerne, været blevet omstændelig og tidskrævende. Dette skyldes at der for hvert punkt skulle søges i et kæmpe datasæt for finde nærliggende punkter, og dette ville hurtigt blive en meget langsommelig og computerkrævende proces. Den anden mulighed med at opdele områderne i mindre delområder ville også være tidskrævende, da der for hvert af de enkelt områder skal fastsættes kriterier. Dette skal enten gøres manuelt som absolutte kriterier ud fra kendskab til de enkelt delområder, som vi gør i den valgte grovfejlssøgning, eller som afvigelseskriterier ud fra middelværdien af punkterne i delområdet. Absolutte kriterier ville kræve et indgående kendskab til de enkelte områder. Afvigelseskriterier ville give problemer, hvis man forestiller sig et delområde, hvor et enkelt

Fejlsøgning punkt tilhører en bygning mens resten ligger på flad mark. Punktet vil skille sig ud fra de andre i området og dermed frasorteres, hvis ikke afvigelseskriterierne er sat med en tilstrækkelig tolerance. Intensitets-afhængighed af skanningsvinklen Som beskrevet tidligere afhænger intensiteten i retursignalet bl.a. af skanningsvinklen. Da vi regner med at intensiteten skal være en afgørende parameter i klassificeringen, har vi derfor været nødsaget til at undersøge skanningsvinklens betydning for styrken af retursignalet lidt nærmere. Dette har vi gjort ved at inddele nogle flyvelinier i 16 lige brede striber langs med flyveretningen. Dernæst har vi beregnet middelværdien for hver af striberne og antaget at fordelingen af marker, skove osv. er nogenlunde homogen i hver stribe. Hvis skanningsvinklen ikke har nogen betydning, burde middelværdierne i hver stribe derfor være nogenlunde ens; uafhængigt af afstanden til flyvelinien. 22 I diagrammet herunder vises middel-intensitets- og spredningsværdier for de 16 striber. Værdierne der er afbildet i diagrammet, er en middel-kurve for seks flyvelinier i område 1, men hver enkelt flyvelinie viser i øvrigt den samme tendens. 25 2 Middel I Spredning I 15 1 5-25 -2-15 -1-5 5 1 15 2 25 Afstand til flyvelinie [m] Figur 3.3 Middelintensiteten af en flyvelinie, som funktion af afstanden fra centrum af flyvelinien.

Fejlsøgning Her ses det tydeligt, at der er en tendens til at middel-intensiteten er størst for de striber der ligger i midten og derefter er aftagende ud mod siderne. Det må betyde at der en sammenhæng mellem skanningsvinklen og styrken af retursignalet. For de 6 flyvelinier gælder således at retursignalet fra siderne af skanningsområdet er ca. 15% svagere end lodret under flyet. I den videre databehandling burde man derfor overveje at korrigere for dette. Det kunne ske ved at kigge på to flyvelinier med stort overlap og lave histogram-matching, hvor man forsøger at få de to histogrammer til at ligne hinanden. Vi har dog i første omgang valgt at undlade at korrigere data, da vi ikke mener at fejlen er vil få så stor betydning, at den spiller en væsentlig rolle i analysen. 23 3.3 Del konklusion Vi har gennemgået de forskellige fejltyper som man bør være opmærksom på i laserskannning, og opstillet en simpel metode til at frasortere tilfældige fejl, der bestod i at opstille kriterier på korterne. I den udleverede data fandt vi at ca. 1 af 2. punkter indeholdt sådanne fejl. Metoden frasorterer måske ikke alle de punkter som indeholder tilfældige fejl, men er vurderet god nok til den videre databehandling i dette projekt. Ligeledes blev det fundet at styrken af retursignalet er afhængig af skanningsvinklen. Signalet er ca. 15% svagere i kanten af skanningsområdet i forhold til centerlinien. Denne systematiske fejl har vi dog valgt ikke at korrigere for.

Data-analyse 4 Data-analyse For at kunne benytte vores data til en klassifikation, fandt vi det nødvendigt først og fremmest at visualisere vores laserdata baseret på deres koter og intensiteter. Dette for at få en bedre forståelse for, hvilken betydning de to retursignaler og intensiteterne har i forskellige typer af områder. Vi har delt dette afsnit i to, hvor vi i første afsnit ser på rådata fra laserskanningen, og i andet afsnit ser på værdier afledt fra rådata. 4.1 Visuel analyse af rådata I de rå data, findes en række umiddelbare parametre som kan undersøges. Disse er: 24 Lokation (X og Y koordinat) Kote (Z) Intensitet Forskelle i koten på de to retursignaler Forskelle i intensitet på de to retursignaler De følgende illustrationerne er lavet på basis af disse parametre, ved at triangulere imellem laserpunkterne i ArcView 3D Analyst. I bilag 1A til 1F findes forstørrelser af disse visualiseringer. Som reference til de kommende illustrationer, vises her et udsnit af Kort & Matrikelstyrelsens TOP1DK (bilag 1H), og et flyfoto fra http://www.kortal.dk venligst udlånt af Kampsax (bilag 1J). Det skal bemærkes at det topografiske kort er ajourført i 2, og flyfotoet er optaget i foråret 1999. Derfor kan f.eks. afgrøderne på billedet have ændret karakter op til tidspunktet hvor laserskanningen blev foretaget. Som supplement til disse, findes også 3D-renderinger af udsnittet i bilag 1I til 1K.

Data-analyse Topografisk kort fra TOP1DK Ortofoto fra Kampsax Koter Første signal Det første signal giver et klart billede af jordens overflade inkl. vegetationen; - en slags digital overflade model (DSM). Det er dog svært at skelne f.eks. bygninger og andre større objekter fra vegetationen. 25 Sidste signal Det sidste signal viser klare tegn på at det meste af vegetation er blevet barberet væk. Dvs. en tilnærmet Digital Terræn Model (DTM). Overfladen er også mindre støjfyldt end ved første signal; -dvs. en glattere flade. Bygningerne fremtræder nu tydeligt.

Data-analyse Kote-forskel Ved at kigge på forskellen på de to forrige billeder, får man et overblik over hvilke områder laserstrålen er i stand til at penetrere, og give flere retursignaler. Her fremtræder vegetationen tydeligt som uregelmæssigheder i et plant landskab. Intensiteter Ved at tildele intensiteten en gråtone-værdi, fremkommer et næsten vellignende sort/hvid flyfoto af området, hvor det er rimelig nemt at genkende objekter i terrænet. I det følgende er intensiteter fordelt lineært i 128 intervaller mellem og 377. 26 Første signal Her ses vegetationen i midten hovedsageligt som meget mørke områder. Marker er generelt ensformige og lyse, men hver mark med meget varierende middel-intensitet. Dette må skyldes forskellige typer afgrøder eller bar jord. Sidste signal I det sidste signal ses at vegetationen generelt har tilbagekastet et kraftigere signal, end ved det første. Dette må skyldes at jordbunden ofte returnerer et kraftigere signal end f.eks. trækronerne. De øvrige områder er så godt som identiske med første signal.

Data-analyse Intensitets-forskel Her ses igen, at forskellene mellem de to signalers intensitet udelukkende varierer i vegetationen. Dvs. træer og buske. Histogrammer For at analysere vores data på en anden måde, har vi forsøgt at afbilde intensiteternes hyppigheder på et histogram, for to typer områder; henholdsvis skov og markområde. Skovområde Figur 4.1 viser intensiteternes hyppighed hen igennem spektret. Den sorte graf viser første signal, og den grå det sidste signal. Vi har lavet en del af disse histogrammer, og ovenstående har vist sig at være et typisk histogram for et skovområde, hvor der blandt andet er mange lave intensiteter på første signal, og mange kraftige intensiteter på sidste signal. Dette er det samme man ser på intensitetsbillederne, hvor skovområderne er mørkere i det første signal. For intensiteter over 2, ses det intensitetsopløsnings-problem der blev nævnt i afsnittet om begrænsninger side 13. Dvs. at toppene er summeret, og derved viser en samlet hyppighed for et interval på 29. 27 6 5 4 3 2 1 5 1 15 2 25 3 35 4 Figur 4.1 Histogram af intensiteternes hyppighed i et skovområde. Den sorte kurve viser første signal, og den grå kurve sidste signal.

Data-analyse Markområde: Figur 4.2 viser intensiteternes hyppighed hen igennem spektret. Begge signaler er her fuldstændig sammenfaldende. Histogrammets form er meget typisk for markområder, men der sker kraftige middelværdi-forskydninger fra mark til mark, fra ca. 15 og op til ca. 3. I de høje intervaller, er der også her problemer med intensitetsopløsningen, men formen på kurven er den samme. 4.5 4 3.5 3 2.5 2 28 1.5 1.5 7 9 11 13 15 17 19 21 Figur 4.2 Histogram af intensiteternes hyppighed i et markområde. De to retursignaler er her sammenfaldende. Kort sammendrag Det er her klart at de to signaler ændrer sig meget i områder med vegetation; her er der både kote- og intensitetsforskel mellem første og sidste signal og stor variation i værdierne punkterne imellem. Derfor må vi kunne forvente at det vil være muligt at klassificere skovområder og anden høj vegetation, på baggrund af blandt andet disse parametre. Mark-områderne har næsten den helt modsatte karakteristika. Intensiteten varierer ikke, og kote-forskellene imellem de to retursignaler, er stort set kun et udtryk for den måleusikkerhed der er i forbindelse med laserskanningen. Middel-intensiteten varierer dog utrolig meget fra mark til mark, så søgning efter markområder bør være helt invariant overfor middelintensiteten.

Data-analyse Vejene har en meget ensformig mørk intensitet, men skiller sig ikke ud fra mark-områderne. Det er her sikkert nødvendigt at kigge på dens form. Bygningerne er også næsten usynlige, og må nok forventes kun at kunne identificeres, ved at kigge på bygningen og tagenes form. Vådområdet i nederste højre hjørne, ligner i dette tilfælde markområdet, selv i ortofotoet. Pga. TOP1DKs definition af vådområdet, vil dette ofte ligne et markområde (Vådområde defineres som et fladt, relativt lavtliggende areal, som har karakter af våd eng, marsk eller mose [TOP1DK].) 4.2 Visuel analyse af afledet data (grid-analyse) Ud over at se på de enkelte værdier i vores laserdata, har vi valgt og at se på nogle statistiske parametre for hvordan data f.eks. varierer i et mindre område. For at benytte denne metode, er det nødvendigt at se på mere end ét punkt ad gangen, og i stedet samle en lille mængde data, som ligger tæt op af hinanden. Dette kan gøres på mange måder, hvor f.eks. Nearest Neightbour er en af metoderne. Vi har valgt at ligge et grid henover vores data, og beregne de statistiske parametre på de laserdata der ligger inden for hver celle. Vi tager her ikke hensyn til afstanden fra de enkelte laserdata og ind til midten af cellen. 29 Vi har her valgt at benytte værdier som ofte bliver brugt inden for billedgenkendelse, og er beskrevet i bilag 2. Disse er: Middelværdi Spredning Skævhed Kurtosis Energi Entropi Vi har lagt hovedvægten af disse analyser på intensitetsværdierne, og har derfor valgt at analysere parametrene angivet i tabel 4.1, som indenfor for billedanalysen benævnes bånd.

Data-analyse Z1 Z2 dz I1 I2 di Middel v v v v Spredning v v v v v v Skævhed v v Kurtosis v v Energi v v Entropi v v Tabel 4.1 Oversigt over statiske parametre som vi har valgt at analysere på. Dette giver os 18 bånd, som vi håber at kunne benytte i en klassifikation senere hen. Da vi ønsker at gøre spredningen på intensitetsmålingerne invariante overfor en intensitetsmålingerne, vælger vi for spredningen på de to intensitetsværdier, i stedet at benytte sprednings-koefficienten; - dvs. forholdet mellem spredning- og middel-intensitet 3 Gridstørrelsen har vi sat til 1x1m. Hver celle i en flyvelinie indeholder ved denne gridstørrelse, gennemsnitligt 2 punkter, men da der forekommer en del overlap, ser vi i få tilfælde op til 8 punkter pr. celle. Dette har desværre betydning for f.eks. en øget spredning i de celler med et højt antal punkter, men vi har valgt at se bort fra dette. I modsatte ende, kan de hænde at der er for få punkter i en celle, til at få et acceptabelt estimat af parametrene. Vi har derfor valgt at sætte et krav om, en celle skal indeholde minimum seks punkter, for at blive inkluderet i analysen. Implementering i ArcView GIS I forbindelse med projektet, udviklede vi et værktøj til ArcView. Dette gjorde vi, for hurtigt at kunne udføre og illustrere data-analyser og klassificering. En anden tanke, var også at gøre det nemt for andre at benytte vores værktøjer. Der er visse begrænsninger ved at benytte ArcView, hvor det største problem er hastighedsog hukommelses-begrænsninger. ArcView kan sagtens indlæse over en million punkter og vise disse i et kort, men når de skal bearbejdes, søges i og analyseres, begrænses dette til nogle få hundrede tusinde punkter, hvis man stadig ønsker at data er rimelige at arbejde med. Blandt fordelene er muligheden for at integrere data med eksisterende kort, brugervenligt interface, og ikke mindst hurtig og enkel illustrering af analyser og klassificering. Da det er

Data-analyse tanken at vores data endvidere først analyseres ind i et grid, reduceres datamængden kraftigt efter den indledende dataanalyse. Værktøjet vi har udviklet til dette formål, kan enten findes på den vedlagte CD (se bilag 8), eller downloades fra http://www.student.dtu.dk/~c973466/lasertool/ hvor der også forefindes en vejledning. Vejledningen kan endvidere findes i bilag 6. I hovedtræk har programmet fire muligheder: Importering af ASCII laserdata Grid-analyse Klassificering af grid Histogramgenerering Import-funktionen gør det muligt at konvertere de rå laserdata til to ArcView punkttemaer; én for hvert signal. Disse data kan herefter benyttes til Grid-analyse eller hvilken som helst anden form for databehandling i ArcView. Dette kunne f.eks. være triangulering i 3D Analyst eller farvelægning efter f.eks. intensitetsværdier. Grid-analysen ligger et grid henover de importerede data, og beregner statistiske parametre, der beskriver laserpunkterne fundet i hver celle. Klassificeringen beskrives i næste kapitel side 36, men det skal kort nævnes at klassificeringen baseres på resultatet fra grid-analysen. Histogram genererer et lille histogram over en talkolonne i et valgt tema og begrænset til udvalgt data i temaet. Dette giver f.eks. mulighed for hurtigt at illustrere forskelle i data-områder og lave en indledende analyse. 31 Efter en importering af det rå ascii-data, og en efterfølgende grid-analyse i ArcView, oprettes automatisk et polygontema med celler der dækker alle laserdata. Hver celle indeholder de førnævnte 18 statistiske parametre for alle vores laserdata. Disse bånd kan hurtigt farvelægges i ArcView, og hermed bidrage til endnu en visuel analyse af vores bånd og hvor brugbare disse er. I det følgende er der vist et uddrag af disse bånd. Det gælder for dem alle, at hver pixel svarer til 1x1m.

Data-analyse I 1 middel Middelværdien af intensiteten på første signal. Her er groft sagt, blot tale om en nedskalering af intensitetsbilledet fra afsnittet om den visuelle analyse af rådata. Konturerne er dog stadig tydelige, og støjen er blevet udjævnet. I 1 sprednings-koefficient. Spredningen på intensiteten siger noget om ensartetheden i hver celle. Jo lysere værdi, jo mere ensartet. Her ses tydeligt at de fleste mark-områder er meget ensartede, til trods for deres forskellige middelintensitet. Bemærk at overgange mellem to områder får en højere værdi. 32 I 1 spredning Vi har medtaget denne illustration, for at vise hvorfor vi vælger sprednings-koefficienten frem for spredningen. Det ses, at hvad der i I 1 -middel var lyse mark-områder, her får en høj spredning (mørk farve), og ikke skiller sig ud fra vegetationen. di middel Intensitetsforskellenes middelværdi i hver gridcelle. En mørk værdi svarer til en lav middelværdi, og ligner meget di billedet fra afsnittet om den visuelle analyse af rådata.

Data-analyse di Varians Forskellene i intensiteterne er her vist som en udtryk for hvor meget disse varierer. Det ses tydeligt at det, ligesom di middel, faktisk kun er vegetationen som kommer til udtryk her, eftersom di for de fleste data uden for den høje vegetation. dz varians Her vises hvordan højdeforskellene i de to signaler varierer inden for en enkelt celle. Der optræder en anelse mere støj i områder uden for den høje vegation, men er ikke dominerende. 33 Skævhed I 2 Skævheden på de to intensiteter er stort set ens, og her vises det sidste signal. Det er tydeligt at se at dette bånd er meget støjfølsomt, men enkelte konturer kan anes. Kurtosis I 2 I stil med skævheden, er dette bånd også meget støjfyldt. Det skal dog bemærkes at kurtosis er det eneste bånd, ud over intensiteternes middelværdi hvor man f.eks. kan ane veje og jernbanen.

Data-analyse Af de viste illustrationer ses det, at det burde være muligt at fremhæve i hvert fald den høje vegetation.; dvs. skove og levende hegn. Markområderne viser også nogle karakteristika, men er tilsyneladende meget sammenfaldende med de resterende data. Veje, bygninger og lign. er tilsyneladende for små elementer at lokalisere i vores data. Det ville sandsynligvis også kræve en række andre parametre, som f.eks. form eller taghældning for at muliggøre en klassificering, men dette er uden for rapportens område. I afsnittet om grove fejl, blev det nævnt at intensiteterne varierer med afstanden til flyveliniens centerlinie. Eftersom ovennævnte datasæt indeholder tre overlappende flyvelinier, må vi forvente at vi i overlaps-områderne får en øget variation af intensiteten, eftersom der eksisterer to eller flere intensitets-niveauer i samme celle. Denne øgede variation er tilsyneladende så lille, at den ikke er synlig, og vi mener derfor at vi kan se bort fra dette problem. Derved undgår vi enten at forsøge at udvikle et program der er i stand til at lave histogram-matching, eller begrænse os til at behandle hver flyvelinie hver for sig. 34 Visual analyse af hele dataområdet Da vi på et senere tidspunkt i projektet, mente det var nødvendigt at kunne lave ovenstående illustrationer over større områder for at få et bedre visuelt overblik over vores dataanalyser, lavede vi et lille C-program, der kunne læse en griddata-fil, og farvelægge efter en hvilken som helst data-kolonne, og derefter lave et 24bit rasterbillede. På denne måde, kunne man f.eks. nemt omdanne en XYZ fil til et højdekort, med hele farvespektret til at angive koten. Ulempen var dog den manglende integration med de øvrige kortdata, så det var kun ment som et supplement til ArcView Analysen. Ved at kigge på så store områder, blev vi opmærksom på en pudsig forekomst. Hvor kurtosis på de to intensiteter generelt var meget ensartede, og i øvrigt støjfyldt, var det nogle steder muligt at se højspændningsledninger i forskellen på de to værdier, som nogle lange tynde linjer igennem terrænet. Dette til trods for at højspændingsledningerne kun fylder meget lidt i vores 1m grid. Figur 4.3 - Forskellen på intensiteternes kurtosis-værdi. De lange lige linjer i billedet har vist sig at være højspændingsledninger.

Data-analyse En illustration af dette ses på figur 4.3, som viser forskellen på de to kurtosis-værdier, i et udsnit af område 2. De lange lige linjer fandt vi frem til var højspændingslinjer, ved at kigge på Kampsax s Kortal [Kortal]. Vi vil i dette projekt dog ikke arbejde med søgning efter højspændningsledninger, men blot nævne dette faktum. 4.3 Delkonklusion Via den visuelle analyse af vores rådata og de statistisk afledede værdier, har vi vist, at vores laserdata s intensitets og Z-værdier indeholder nok information til at åbne mulighed for en areal-klassificering. Vi har vist nogle klare karakteristika for mark og skov/vegetations-områder, som ville kunne udnyttes i en arealklassifikation. 35 Endvidere fandt vi, at forskellen i de to kurtosis-værdier for intensiteterne, måske kan udnyttes til at lokalisere højspændingsledninger.

Arealklassifikation 5 Arealklassifikation På baggrund af den viden vi fik fra data-analyserne, vil vi forsøge at automatisere en arealklassifikation. Vi har i dette projekt valgt at benytte en Bayes klassifikations metode som er almindeligt kendt inden for billedbehandling. Vi havde undervejs i projektets selv opfundet en metode til klassifikation, men da denne i sidste ende minder utrolig meget om Bayes, valgte vi helt at droppe metoden. Bayes benytter Gauss-klokker til at bestemme sandsynligheden for at en celle/pixel tilhører en bestemt klasse; vores metode benyttede en halv periode i en cosinuskurve i stedet, og gav i øvrigt ikke bedre resultater ved nogle klassifikations-forsøg. I det følgende vil vi koncentrere os om Bayes, men da vores egen metode allerede er implementeret i ArcView-scriptet, er det også stadig muligt at klassificere efter denne. 5.1 Bayes klassifikation I forrige afsnit viste vi, at det var rimeligt nemt visuelt at tolke laserdata, og arealklassificere områder vha. almindelig sund fornuft. Vi ønsker dog at forsøge at automatisere denne proces. Til dette formål har vi valgt at forsøge at implementere Bayes klassifikation metode ([JMC21] & [Richards]). 36 Denne metode gør det muligt at finde sandsynligheden for at et givent laserpunkt tilhører en bestemt klasse; f.eks. skov eller mark. Variablerne (båndene) til denne klassifikation vil, hvis vi benytter vores rådata, være de to intensiteter, forskelle i koter (dz) og forskel i intensiteter (di). Da vi vurderer at fire bånd vil være et usikkert grundlag at klassificere ud fra, har vi valgt at basere klassifikationen på celler i et 1x1m grid. Dette giver os muligheden for at benytte de samme 18 bånd som vi undersøgte i analysen i forrige kapitel. Grundlæggende fungerer Bayes klassifikation, ved at se på hvilket bånd der har størst sandsynlighed for at tilhøre en bestemt klasse. Denne beregning er udelukkende baseret på de statistiske parametre middelværdi og spredning. Dette stiller dog også et krav til at vores bånd opfylder kravet om normalfordeling. Dette vender vi tilbage til senere i afsnittet. Hvis det antages at der er lige store chancer for at finde alle klasser i et datasæt, kan likelihood-faktoren beregnes ved [Richards p.176]: