Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/36
Estimation af varians/spredning Antag X 1,...,X n stokastiske variable med fælles middelværdi µ og varians σ 2. Hvis µ er kendt estimeres σ 2 ved Ŝ 2 = 1 n Hvis µ er ukendt estimeres σ 2 ved S 2 = 1 n 1 n (X i µ) 2 i=1 n (X i X) 2 NB: begge estimater er centrale (middelværdirette) men Ŝ2 har mindst varians (mest præcist). i=1 2/36
Dobbeltmålinger: X i1 og X i2 uafhængige middelværdi µ i og varians σ 2. Da har differens Y i = X i1 X i2 kendt middelværdi nul og varians σ 2 Y = 2σ2. σ 2 Y kan da estimeres ved Ŝ 2 Y = 1 n n i=1 Y 2 i og σ 2 estimeres ved Ŝ 2 Y/2 3/36
Linearisering Antag X har middelværdi 10 og spredning 0.1. Lad Y = log(x) (naturlig logaritme). Linearisering af log( ): Dermed log(x) log(10)+ 1 10 (x 10) = 1 10 x+log(10) 1 EY log(10) = 2.306 VarY ( ) 2 1 0.1 2 = 0.0001 10 4/36
Fortolkning af afledet Hvis Y = h(x) måler h (µ) hvor sensitiv Y er overfor ændringer i X omkring µ (hvor meget giver en ændring i X anledning til at Y ændres). Derfor giver det god mening at VarY (h (µ)) 2 VarX 5/36
Vægte motiverende eksempel Højdeforskellen mellem punkterne P 1 og P 2 er opmålt ved et geometrisk nivellement over to forskellige strækninger l 1 > l 2. l 1 h 1 P 2 P 1 l2 h 2 De to estimater h 1 og h 2 er realisationer af stokastiske variable H 1 og H 2 med varianser l 1 σ 2 k og l 2σ 2 k. Kan vi kombinere de to estimater h 1 og h 2 for at opnå et bedre estimat under hensyntagen til, at der er større usikkerhed for H 2 end for H 1? En mulighed: h = (h 1 +h 2 )/2 - men det kan gøres bedre! 6/36
Vægte Antag X 1,...,X n er uafhængige stokastiske variable med ens middelværdi µ men forskellige varianser σ 2 1,...,σ 2 n. F.eks. målinger med instrumenter af variende kvalitet eller nogle X i kunne repræsentere gennemsnit af gentagne målinger. Hvert X i tildeles en vægt p i > 0 som afspejler målingens kvalitet (stort p i svarer til god måling). Vi estimerer da µ ved det vægtede gennemsnit Definition: Vægtet gennemsnit For observationer X 1,...,X n med vægte p 1 > 0,...,p n > 0 er det vægtede gennemsnit X = p 1 n i=1 p X 1 + + i p n n i=1 p ix n = 1 n i=1 p i(p 1 X 1 + +p n X n ). 7/36
resulterende vægte w i = p i n l=1 p l summer sammen til en: n w i = 1 i=1 8/36
Centralitet af vægtet gennemsnit Det vægtede gennemsnit X = p 1 n i=1 p X 1 + + i er et centralt estimat af µ, dvs. p n n i=1 p ix n = E( X ) = µ for et hvilket som helst valg af vægte p 1 > 0,...,p n > 0. 1 n i=1 p i(p 1 X 1 + +p n X n ) 9/36
Optimale vægte Der er uendelig mange mulige valg af vægte. Hvad er det bedste valg? Bedst betyder variansen Var X mindst mulig! Sætning: Optimale vægte Variansen Var X er minimal hvis vægtrelationen p 1 σ1 2 = p 2 σ2 2 = = p n σn. 2 er opfyldt. 10/36
Vægtrelationen Antag vægtrelationen er opfyldt: p 1 σ 2 1 = p 2 σ 2 2 = = p n σ 2 n. Lad σ0 2 betegne den fælles værdi af p i σi 2 observation med vægt p 0 = 1). (svarer til varians for Da ser vi p i = σ2 0 σ 2 i Dvs. vi skal simpelthen vælge vægtene så de er omvendt proportionale med varianserne! 11/36
Vægtrelationen: Eksempel Antag variansen på første måling er dobbelt så stor som på den anden (σ 2 1 = 2σ 2 2). Et valg af vægte, der opfylder vægtrelationen, er p 1 = 1 og p 2 = 2 (σ 2 0 = 2σ 2 ), idet p 1 σ 2 1 = p 2 σ 2 2 1 2σ 2 2 = 2σ 2 2 Der er uendelig mange lige gode valg af vægte!! Et andet valg er p 1 = 1 2 og p 2 = 1 (σ 2 0 = σ 2 2). Bemærk: I eksemplet er vægten på den bedste måling dobbelt så stor som vægten på den dårlige måling. Begge valg af vægte giver samme X : p 1 /(p 1 +p 2 ) = 1/(1+2) = (1/2)/(1/2+1) = 1/3 12/36
Alle vægte der opfylder vægtrelationen giver samme resulterende vægte og dermed samme X. Dermed p i = σ2 0 σ 2 i w i = p i n l=1 p l = σ 2 0 σ 2 i n l=1 σ 2 0 σ 2 l = 1 σ 2 i n l=1 1 σ 2 l = 1 n l=1 σ 2 i σ 2 l Dvs. i sidste ende afhænger X ikke af σ 2 0. Med et andet sæt vægte p i = σ 2 0/σ 2 i fås nøjagtig samme w i! 13/36
Variansen for det vægtede gennemsnit Sætning: Variansen af vægtet gennemsnit Antag vægtrelationen er opfyldt, dvs. p 1 σ 2 1 = = p n σ 2 n = σ 2 0. Da gælder Var( X ) = σ0 2 n i=1 p. i 14/36
Eksempel X 1, X 2 og X 3 har fælles middelværdi µ og varianser hhv. 3,4,1. Et optimalt sæt af vægte er p 1 = 1/3, p 2 = 1/4 og p 3 = 1. Antag x 1 = 5, x 2 = 5.7 og x 3 = 4.9 er observeret. Da er x = 5.047 Endvidere er Var X 1 = 1 3 + 1 = 0.63 4 +1 15/36
Estimat af σ 2 0 Estimat af σ0 2 Som estimat af σ0 2 anvendes S0: 2 n S0 2 i=1 = p i(x i X ) 2 n 1 n i=1 = p ixi 2 ( X ) 2 n n 1 i=1 p i. Der gælder, at S 2 0 er et centralt estimat for σ 2 0: ES 2 0 = σ 2 0. 16/36
Estimat af Var( X ) Vi har, at s 2 0 er et centralt estimat for σ 2 0. Variansen for det vægtede gennemsnit er Var( X ) = σ 2 0 n i=1 p i Et centralt estimat for variansen af det vægtede gennemsnit er derfor s 2 0 n i=1 p i 17/36
Eksempel: Geometrisk nivellement En højdeforskel er nivelleret over n strækninger med samme kilometerspredning σ k. Variansen over en længde l er fra tidligere givet ved σ 2 k l. Højdeforskel h Længde l Varians på h over l h 1 l 1 σ 2 1 = σ 2 k l 1 h 2 l 2 σ2 2 = σk 2l 2... h n l n σ 2 n = σ 2 k l n Forskellige varianser pga. forskellige strækninger (l i l j ). 18/36
Eksempel: Geometrisk nivellement valg af vægte Vægtrelationen er opfyldt når σ 2 0 = p 1 σ 2 1 = = p n σ 2 n Indsættes udtrykket for σi 2 = l iσk 2 har vi: Heraf fremgår det at hvis p i = l 1 i σ 2 0 = p 1 σ 2 kl 1 = = p n σ 2 kl n er ligheden opfyldt: σ 2 0 = l 1 1 σ2 kl 1 = = l 1 n σ 2 kl n = σ 2 k = = σ 2 k. Dvs. vægte kan vælges til p i = (l i ) 1 (reciprokke længde). Bemærk: her svarer σ 2 0 til kilometervariansen σ 2 k. Hvis σ 2 k er ukendt kan den estimeres vha. S2 0! 19/36
Eksempel Højdeforskellen mellem punkterne P 1 og P 2 er opmålt ved et geometrisk nivellement over to forskellige strækninger. l 1 h 1 P 2 P 1 l2 h 2 Data: h 1 = 347mm, l 1 = 671m h 2 = 356mm, l 2 = 853m Estimat af højdeforskel (vægtet gennemsnit): x = 1/671 1/671+1/853 347+ 1/853 356 350,96mm 1/671+1/853 20/36
Antag yderligere at kilometerspredning σ k = 3mm/ km. Varians på estimatet: Var X = 3 2 /1000 1/671+1/853 = 3.3801 Til sammenligning er varianserne for X 1 og X 2 henholdsvis 6.039 og 7.677. NB: vi omregner kilometervarians 3 2 mm 2 /km til metervarians 3 2 /1000 mm 2 /m da længderne er angivet i m. 21/36
Eksempel - polygonvinkler Vi måler vinklerne i punkterne 1-4. Alle vinkler er målt med samme varians σv. 2 Lad σm,i 2 være variansen af middelsatsen i punkt i. Punkt Antal satser σ 2 m,i 1 2 σ 2 m,1 = σ2 v 2 2 3 σ 2 m,2 = σ2 v 3 3 4 σm,3 2 = σ2 v 4 4 4 6 σm,4 2 = σ2 v 6 1 3 2 22/36
Eksempel - fortsat Ifølge vægtrelationen skal p i σm,i 2 være ens for alle i, Jf. udtrykkene fra forrige slide p 1 σ 2 m,1 = p 2 σ 2 m,2 = p 3 σ 2 m,3 = p 4 σ 2 m,4. σv 2 p 1 2 = p σv 2 2 3 = p σv 2 3 4 = p σv 2 4 6. Således kan vægtene vælges lig antal satser for hvert punkt: Med disse vægte gælder σ 2 0 = σ 2 v. p 1 = 2 p 2 = 3 p 3 = 4 p 4 = 6 Igen kan σ 2 v om fornødent estimeres vha. S 2 0. 23/36
Fordeling af slutfejl Betragt en situation, hvor vi ved, at summen af vores observationer skal være lig en kendt værdi x 0. Dette kunne eksempelvis være: x 0 = 200 gon, hvor vores målinger er vinkler i en trekant. x 0 = 0 mm, hvor vi nivellerer i et lukket net, dvs. slut- og startpunkt er det samme.... Slutfejlen er afvigelsen mellem x 0 og den faktiske sum af observationer. 24/36
Nivellement bestemmelse af kote Vi ønsker at beregne koten µ til punktet P med højdeforskelle h 1 til P 1 og h 2 til P 2. Længderne fra P til de to punkter P 1 og P 2 er henholdvis l 1 og l 2. P 2 P 1 l 1 h 1 P µ l 2 h 2 µ 2 µ 1 Punkterne P 1 og P 2 har kendte koter, hhv. µ 1 og µ 2. To bud på koten i P: µ 1 +h 1 og µ 2 h 2. 25/36
Model P 2 P 1 l 1 h 1 P µ l 2 h 2 µ 2 µ 1 X 1 = µ 1 +H 1 og X 2 = µ 2 H 2 er uafhængige stokastiske variable med E(X 1 ) = E(X 2 ) = µ hvor H 1 og H 2 er de stokastiske variable svarende til h 1 og h 2. Fra før har vi, at Var(X 1 ) = l 1 σ 2 k og Var(X 2) = l 2 σ 2 k. 26/36
Estimat af µ Til at estimere µ anvendes det vægtede gennemsnit x idet varianserne på højdemålingerne ikke nødvendigvis er ens, x = p 1 p 1 +p 2 (µ 1 +h 1 )+ p 2 p 1 +p 2 (µ 2 h 2 ), hvor vægtene p 1 og p 2 opfylder vægtrelationen p 1 l 1 σ 2 k = p 2l 2 σ 2 k. Dvs. de reciprokke længder kan anvendes som vægte, Estimatet for µ er altså givet ved: x = l 1 1 l 1 1 +l 1 2 p 1 = l 1 1 og p 2 = l 1 2. (µ 1 +h 1 )+ l 1 2 l 1 1 +l 1 2 (µ 2 h 2 ). 27/36
Eksempel Højdeforskellen mellem punkterne P 1 og P 2 er opmålt ved et geometrisk nivellement over to forskellige strækninger. P 2 P 1 µ 1 l 1 h 1 P l 2 h 2 µ 2 Data: µ 1 = 7431mm, h 1 = 247mm, l 1 = 671m µ 2 = 7828mm, h 2 = 156mm, l 2 = 853m Estimat af koten i punktet P: x = 1/671 1/671+1/853 (7431+247)+ 1/853 (7828 156) 7675,36mm 1/671+1/853 28/36
Estimat af µ - en omskrivning Vi kan omskrive udtrykket for x således: x = l 1 1 l 1 1 +l 1 2 (µ 1 +h 1 )+ l 1 2 l 1 1 +l 1 2 (µ 2 h 2 ) = 1 l 1 l 1 l 2 1 l 1 + 1 (µ 1 +h 1 )+ l 2 l 1 l 2 1 l 2 l 1 l 2 1 l 1 + 1 (µ 2 h 2 ) l 2 l 1 l 2 = l 2 l 1 +l 2 (µ 1 +h 1 )+ l 1 l 1 +l 2 (µ 2 h 2 ) 29/36
Slutfejlen r På grund af målefejl er h 1 +h 2 µ 2 µ 1. Derfor indføres slutfejlen r r = µ 2 µ 1 (h 1 +h 2 ) µ 2 h 2 = µ 1 +h 1 +r. Indsættes dette i udtrykket for x får vi x = = l 2 l 2 +l 1 (µ 1 +h 1 )+ l 1 l 2 +l 1 (µ 2 h 2 ) l 2 l 2 +l 1 (µ 1 +h 1 )+ l 1 l 2 +l 1 (µ 1 +h 1 +r) = (µ 1 +h 1 )+ l 1 l 2 +l 1 r Slutfejlen på estimatet x af koten µ skal under de anvendte vægte (reciprokke længdemål) fordeles proportionalt med vejlængden. 30/36
Eksempel fortsat P 2 l 2 µ 2 P 1 l 1 h 1 P h 2 Data: µ 1 µ 1 = 7431mm, h 1 = 247mm, l 1 = 671m µ 2 = 7828mm, h 2 = 156mm, l 2 = 853m Slutfejl: µ 2 µ 1 = 7828 7431 = 397, h 1 +h 2 = 247+156 = 403mm Slutfejl r n = 397 403 = 6mm Estimat af koten i punktet P: (µ 1 +h 1 )+ l 1 671 r n = 7431+247+ ( 6) = 7431+247 2,64 l 2 +l 1 671+853 Højdeforskelen h 1 skal altså nedkorrigeres 2,64mm. 31/36
Slutfejl af vinkelmålinger i trekant β α Betragt trekanten med sande vinkler α, β og γ. Dvs α+β+γ = 200 gon. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med E(X α ) = α E(X β ) = β E(X γ ) = γ γ og Var(X α ) = Var(X β ) = Var(X γ ) = σ 2 32/36
Estimat af α X α er en direkte observation af α. Y α = 200 X β X γ er en indirekte observation af α: EY α = 200 EX β EX γ = α VarY α = 2σ 2 Idet varianserne for de to observationer X α og Y α er forskellige anvendes vægtet gennemsnit med p 1 = 2 og p 2 = 1 (da variansen på Y α to gange varians på X α ). Dvs. α estimeres ved x = 2 3 x α + 1 3 y α = 2 3 x α + 1 3 (200 x β x γ ) 33/36
Slutfejlen r v på vinkelsummen Som i foregående eksempel er summen af x α, x β og x γ ikke 200 pga. uundgålige målefejl. Derfor indføres slutfejl r v r v = 200 (x α +x β +x γ ) 200 x β x γ = x α +r v, som indsættes i udtrykke for x, x = 2 3 x α + 1 3 (200 x β x γ ) = 2 3 x α + 1 3 (x α +r v ) = x α + 1 3 r v. Dvs. slutfejlen fordeles ligeligt på alle vinkler når vinklerne er målt med samme varians (NB ikke tilfældet i eksamensopgave B). 34/36
Eksempel Slutfejl: Estimat af α: x α = 91 x β = 28 x γ = 87 r v = 200 91 28 87 = 6 x α + 1 3 r v = 91 2 = 89 Antag spredningen på vinkelmålingerne er σ = 0.1. Da er variansen på estimatet (med σ 2 0 = 2σ 2 ) Var X = 2σ2 3 = 2 3 σ2 og spredningen på estimatet er 2 3 σ = 0.816σ 35/36