Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Relaterede dokumenter
Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Geometrisk nivellement. Landmålingens fejlteori - Lektion 7 - Repetition - Fejlforplantning ved geometrisk nivellement. Modellen.

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Produkt og marked - matematiske og statistiske metoder

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Note om Monte Carlo metoden

Kvantitative Metoder 1 - Forår 2007

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

1 Hb SS Hb Sβ Hb SC = , (s = )

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Landmålingens fejlteori - Sandsynlighedsregning - Lektion 1

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Simpel Lineær Regression: Model

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Eksamen 2014/2015 Mål- og integralteori

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Statistik og Sandsynlighedsregning 2

Eksamen i Statistik for biokemikere. Blok

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Elementær sandsynlighedsregning

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Simpel Lineær Regression

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Elementær sandsynlighedsregning

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Kapitel 12 Variansanalyse

Betingede sandsynligheder Aase D. Madsen

Løsning eksamen d. 15. december 2008

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Normalfordelingen og Stikprøvefordelinger

Anvendt Lineær Algebra

Transkript:

Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/36

Estimation af varians/spredning Antag X 1,...,X n stokastiske variable med fælles middelværdi µ og varians σ 2. Hvis µ er kendt estimeres σ 2 ved Ŝ 2 = 1 n Hvis µ er ukendt estimeres σ 2 ved S 2 = 1 n 1 n (X i µ) 2 i=1 n (X i X) 2 NB: begge estimater er centrale (middelværdirette) men Ŝ2 har mindst varians (mest præcist). i=1 2/36

Dobbeltmålinger: X i1 og X i2 uafhængige middelværdi µ i og varians σ 2. Da har differens Y i = X i1 X i2 kendt middelværdi nul og varians σ 2 Y = 2σ2. σ 2 Y kan da estimeres ved Ŝ 2 Y = 1 n n i=1 Y 2 i og σ 2 estimeres ved Ŝ 2 Y/2 3/36

Linearisering Antag X har middelværdi 10 og spredning 0.1. Lad Y = log(x) (naturlig logaritme). Linearisering af log( ): Dermed log(x) log(10)+ 1 10 (x 10) = 1 10 x+log(10) 1 EY log(10) = 2.306 VarY ( ) 2 1 0.1 2 = 0.0001 10 4/36

Fortolkning af afledet Hvis Y = h(x) måler h (µ) hvor sensitiv Y er overfor ændringer i X omkring µ (hvor meget giver en ændring i X anledning til at Y ændres). Derfor giver det god mening at VarY (h (µ)) 2 VarX 5/36

Vægte motiverende eksempel Højdeforskellen mellem punkterne P 1 og P 2 er opmålt ved et geometrisk nivellement over to forskellige strækninger l 1 > l 2. l 1 h 1 P 2 P 1 l2 h 2 De to estimater h 1 og h 2 er realisationer af stokastiske variable H 1 og H 2 med varianser l 1 σ 2 k og l 2σ 2 k. Kan vi kombinere de to estimater h 1 og h 2 for at opnå et bedre estimat under hensyntagen til, at der er større usikkerhed for H 2 end for H 1? En mulighed: h = (h 1 +h 2 )/2 - men det kan gøres bedre! 6/36

Vægte Antag X 1,...,X n er uafhængige stokastiske variable med ens middelværdi µ men forskellige varianser σ 2 1,...,σ 2 n. F.eks. målinger med instrumenter af variende kvalitet eller nogle X i kunne repræsentere gennemsnit af gentagne målinger. Hvert X i tildeles en vægt p i > 0 som afspejler målingens kvalitet (stort p i svarer til god måling). Vi estimerer da µ ved det vægtede gennemsnit Definition: Vægtet gennemsnit For observationer X 1,...,X n med vægte p 1 > 0,...,p n > 0 er det vægtede gennemsnit X = p 1 n i=1 p X 1 + + i p n n i=1 p ix n = 1 n i=1 p i(p 1 X 1 + +p n X n ). 7/36

resulterende vægte w i = p i n l=1 p l summer sammen til en: n w i = 1 i=1 8/36

Centralitet af vægtet gennemsnit Det vægtede gennemsnit X = p 1 n i=1 p X 1 + + i er et centralt estimat af µ, dvs. p n n i=1 p ix n = E( X ) = µ for et hvilket som helst valg af vægte p 1 > 0,...,p n > 0. 1 n i=1 p i(p 1 X 1 + +p n X n ) 9/36

Optimale vægte Der er uendelig mange mulige valg af vægte. Hvad er det bedste valg? Bedst betyder variansen Var X mindst mulig! Sætning: Optimale vægte Variansen Var X er minimal hvis vægtrelationen p 1 σ1 2 = p 2 σ2 2 = = p n σn. 2 er opfyldt. 10/36

Vægtrelationen Antag vægtrelationen er opfyldt: p 1 σ 2 1 = p 2 σ 2 2 = = p n σ 2 n. Lad σ0 2 betegne den fælles værdi af p i σi 2 observation med vægt p 0 = 1). (svarer til varians for Da ser vi p i = σ2 0 σ 2 i Dvs. vi skal simpelthen vælge vægtene så de er omvendt proportionale med varianserne! 11/36

Vægtrelationen: Eksempel Antag variansen på første måling er dobbelt så stor som på den anden (σ 2 1 = 2σ 2 2). Et valg af vægte, der opfylder vægtrelationen, er p 1 = 1 og p 2 = 2 (σ 2 0 = 2σ 2 ), idet p 1 σ 2 1 = p 2 σ 2 2 1 2σ 2 2 = 2σ 2 2 Der er uendelig mange lige gode valg af vægte!! Et andet valg er p 1 = 1 2 og p 2 = 1 (σ 2 0 = σ 2 2). Bemærk: I eksemplet er vægten på den bedste måling dobbelt så stor som vægten på den dårlige måling. Begge valg af vægte giver samme X : p 1 /(p 1 +p 2 ) = 1/(1+2) = (1/2)/(1/2+1) = 1/3 12/36

Alle vægte der opfylder vægtrelationen giver samme resulterende vægte og dermed samme X. Dermed p i = σ2 0 σ 2 i w i = p i n l=1 p l = σ 2 0 σ 2 i n l=1 σ 2 0 σ 2 l = 1 σ 2 i n l=1 1 σ 2 l = 1 n l=1 σ 2 i σ 2 l Dvs. i sidste ende afhænger X ikke af σ 2 0. Med et andet sæt vægte p i = σ 2 0/σ 2 i fås nøjagtig samme w i! 13/36

Variansen for det vægtede gennemsnit Sætning: Variansen af vægtet gennemsnit Antag vægtrelationen er opfyldt, dvs. p 1 σ 2 1 = = p n σ 2 n = σ 2 0. Da gælder Var( X ) = σ0 2 n i=1 p. i 14/36

Eksempel X 1, X 2 og X 3 har fælles middelværdi µ og varianser hhv. 3,4,1. Et optimalt sæt af vægte er p 1 = 1/3, p 2 = 1/4 og p 3 = 1. Antag x 1 = 5, x 2 = 5.7 og x 3 = 4.9 er observeret. Da er x = 5.047 Endvidere er Var X 1 = 1 3 + 1 = 0.63 4 +1 15/36

Estimat af σ 2 0 Estimat af σ0 2 Som estimat af σ0 2 anvendes S0: 2 n S0 2 i=1 = p i(x i X ) 2 n 1 n i=1 = p ixi 2 ( X ) 2 n n 1 i=1 p i. Der gælder, at S 2 0 er et centralt estimat for σ 2 0: ES 2 0 = σ 2 0. 16/36

Estimat af Var( X ) Vi har, at s 2 0 er et centralt estimat for σ 2 0. Variansen for det vægtede gennemsnit er Var( X ) = σ 2 0 n i=1 p i Et centralt estimat for variansen af det vægtede gennemsnit er derfor s 2 0 n i=1 p i 17/36

Eksempel: Geometrisk nivellement En højdeforskel er nivelleret over n strækninger med samme kilometerspredning σ k. Variansen over en længde l er fra tidligere givet ved σ 2 k l. Højdeforskel h Længde l Varians på h over l h 1 l 1 σ 2 1 = σ 2 k l 1 h 2 l 2 σ2 2 = σk 2l 2... h n l n σ 2 n = σ 2 k l n Forskellige varianser pga. forskellige strækninger (l i l j ). 18/36

Eksempel: Geometrisk nivellement valg af vægte Vægtrelationen er opfyldt når σ 2 0 = p 1 σ 2 1 = = p n σ 2 n Indsættes udtrykket for σi 2 = l iσk 2 har vi: Heraf fremgår det at hvis p i = l 1 i σ 2 0 = p 1 σ 2 kl 1 = = p n σ 2 kl n er ligheden opfyldt: σ 2 0 = l 1 1 σ2 kl 1 = = l 1 n σ 2 kl n = σ 2 k = = σ 2 k. Dvs. vægte kan vælges til p i = (l i ) 1 (reciprokke længde). Bemærk: her svarer σ 2 0 til kilometervariansen σ 2 k. Hvis σ 2 k er ukendt kan den estimeres vha. S2 0! 19/36

Eksempel Højdeforskellen mellem punkterne P 1 og P 2 er opmålt ved et geometrisk nivellement over to forskellige strækninger. l 1 h 1 P 2 P 1 l2 h 2 Data: h 1 = 347mm, l 1 = 671m h 2 = 356mm, l 2 = 853m Estimat af højdeforskel (vægtet gennemsnit): x = 1/671 1/671+1/853 347+ 1/853 356 350,96mm 1/671+1/853 20/36

Antag yderligere at kilometerspredning σ k = 3mm/ km. Varians på estimatet: Var X = 3 2 /1000 1/671+1/853 = 3.3801 Til sammenligning er varianserne for X 1 og X 2 henholdsvis 6.039 og 7.677. NB: vi omregner kilometervarians 3 2 mm 2 /km til metervarians 3 2 /1000 mm 2 /m da længderne er angivet i m. 21/36

Eksempel - polygonvinkler Vi måler vinklerne i punkterne 1-4. Alle vinkler er målt med samme varians σv. 2 Lad σm,i 2 være variansen af middelsatsen i punkt i. Punkt Antal satser σ 2 m,i 1 2 σ 2 m,1 = σ2 v 2 2 3 σ 2 m,2 = σ2 v 3 3 4 σm,3 2 = σ2 v 4 4 4 6 σm,4 2 = σ2 v 6 1 3 2 22/36

Eksempel - fortsat Ifølge vægtrelationen skal p i σm,i 2 være ens for alle i, Jf. udtrykkene fra forrige slide p 1 σ 2 m,1 = p 2 σ 2 m,2 = p 3 σ 2 m,3 = p 4 σ 2 m,4. σv 2 p 1 2 = p σv 2 2 3 = p σv 2 3 4 = p σv 2 4 6. Således kan vægtene vælges lig antal satser for hvert punkt: Med disse vægte gælder σ 2 0 = σ 2 v. p 1 = 2 p 2 = 3 p 3 = 4 p 4 = 6 Igen kan σ 2 v om fornødent estimeres vha. S 2 0. 23/36

Fordeling af slutfejl Betragt en situation, hvor vi ved, at summen af vores observationer skal være lig en kendt værdi x 0. Dette kunne eksempelvis være: x 0 = 200 gon, hvor vores målinger er vinkler i en trekant. x 0 = 0 mm, hvor vi nivellerer i et lukket net, dvs. slut- og startpunkt er det samme.... Slutfejlen er afvigelsen mellem x 0 og den faktiske sum af observationer. 24/36

Nivellement bestemmelse af kote Vi ønsker at beregne koten µ til punktet P med højdeforskelle h 1 til P 1 og h 2 til P 2. Længderne fra P til de to punkter P 1 og P 2 er henholdvis l 1 og l 2. P 2 P 1 l 1 h 1 P µ l 2 h 2 µ 2 µ 1 Punkterne P 1 og P 2 har kendte koter, hhv. µ 1 og µ 2. To bud på koten i P: µ 1 +h 1 og µ 2 h 2. 25/36

Model P 2 P 1 l 1 h 1 P µ l 2 h 2 µ 2 µ 1 X 1 = µ 1 +H 1 og X 2 = µ 2 H 2 er uafhængige stokastiske variable med E(X 1 ) = E(X 2 ) = µ hvor H 1 og H 2 er de stokastiske variable svarende til h 1 og h 2. Fra før har vi, at Var(X 1 ) = l 1 σ 2 k og Var(X 2) = l 2 σ 2 k. 26/36

Estimat af µ Til at estimere µ anvendes det vægtede gennemsnit x idet varianserne på højdemålingerne ikke nødvendigvis er ens, x = p 1 p 1 +p 2 (µ 1 +h 1 )+ p 2 p 1 +p 2 (µ 2 h 2 ), hvor vægtene p 1 og p 2 opfylder vægtrelationen p 1 l 1 σ 2 k = p 2l 2 σ 2 k. Dvs. de reciprokke længder kan anvendes som vægte, Estimatet for µ er altså givet ved: x = l 1 1 l 1 1 +l 1 2 p 1 = l 1 1 og p 2 = l 1 2. (µ 1 +h 1 )+ l 1 2 l 1 1 +l 1 2 (µ 2 h 2 ). 27/36

Eksempel Højdeforskellen mellem punkterne P 1 og P 2 er opmålt ved et geometrisk nivellement over to forskellige strækninger. P 2 P 1 µ 1 l 1 h 1 P l 2 h 2 µ 2 Data: µ 1 = 7431mm, h 1 = 247mm, l 1 = 671m µ 2 = 7828mm, h 2 = 156mm, l 2 = 853m Estimat af koten i punktet P: x = 1/671 1/671+1/853 (7431+247)+ 1/853 (7828 156) 7675,36mm 1/671+1/853 28/36

Estimat af µ - en omskrivning Vi kan omskrive udtrykket for x således: x = l 1 1 l 1 1 +l 1 2 (µ 1 +h 1 )+ l 1 2 l 1 1 +l 1 2 (µ 2 h 2 ) = 1 l 1 l 1 l 2 1 l 1 + 1 (µ 1 +h 1 )+ l 2 l 1 l 2 1 l 2 l 1 l 2 1 l 1 + 1 (µ 2 h 2 ) l 2 l 1 l 2 = l 2 l 1 +l 2 (µ 1 +h 1 )+ l 1 l 1 +l 2 (µ 2 h 2 ) 29/36

Slutfejlen r På grund af målefejl er h 1 +h 2 µ 2 µ 1. Derfor indføres slutfejlen r r = µ 2 µ 1 (h 1 +h 2 ) µ 2 h 2 = µ 1 +h 1 +r. Indsættes dette i udtrykket for x får vi x = = l 2 l 2 +l 1 (µ 1 +h 1 )+ l 1 l 2 +l 1 (µ 2 h 2 ) l 2 l 2 +l 1 (µ 1 +h 1 )+ l 1 l 2 +l 1 (µ 1 +h 1 +r) = (µ 1 +h 1 )+ l 1 l 2 +l 1 r Slutfejlen på estimatet x af koten µ skal under de anvendte vægte (reciprokke længdemål) fordeles proportionalt med vejlængden. 30/36

Eksempel fortsat P 2 l 2 µ 2 P 1 l 1 h 1 P h 2 Data: µ 1 µ 1 = 7431mm, h 1 = 247mm, l 1 = 671m µ 2 = 7828mm, h 2 = 156mm, l 2 = 853m Slutfejl: µ 2 µ 1 = 7828 7431 = 397, h 1 +h 2 = 247+156 = 403mm Slutfejl r n = 397 403 = 6mm Estimat af koten i punktet P: (µ 1 +h 1 )+ l 1 671 r n = 7431+247+ ( 6) = 7431+247 2,64 l 2 +l 1 671+853 Højdeforskelen h 1 skal altså nedkorrigeres 2,64mm. 31/36

Slutfejl af vinkelmålinger i trekant β α Betragt trekanten med sande vinkler α, β og γ. Dvs α+β+γ = 200 gon. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med E(X α ) = α E(X β ) = β E(X γ ) = γ γ og Var(X α ) = Var(X β ) = Var(X γ ) = σ 2 32/36

Estimat af α X α er en direkte observation af α. Y α = 200 X β X γ er en indirekte observation af α: EY α = 200 EX β EX γ = α VarY α = 2σ 2 Idet varianserne for de to observationer X α og Y α er forskellige anvendes vægtet gennemsnit med p 1 = 2 og p 2 = 1 (da variansen på Y α to gange varians på X α ). Dvs. α estimeres ved x = 2 3 x α + 1 3 y α = 2 3 x α + 1 3 (200 x β x γ ) 33/36

Slutfejlen r v på vinkelsummen Som i foregående eksempel er summen af x α, x β og x γ ikke 200 pga. uundgålige målefejl. Derfor indføres slutfejl r v r v = 200 (x α +x β +x γ ) 200 x β x γ = x α +r v, som indsættes i udtrykke for x, x = 2 3 x α + 1 3 (200 x β x γ ) = 2 3 x α + 1 3 (x α +r v ) = x α + 1 3 r v. Dvs. slutfejlen fordeles ligeligt på alle vinkler når vinklerne er målt med samme varians (NB ikke tilfældet i eksamensopgave B). 34/36

Eksempel Slutfejl: Estimat af α: x α = 91 x β = 28 x γ = 87 r v = 200 91 28 87 = 6 x α + 1 3 r v = 91 2 = 89 Antag spredningen på vinkelmålingerne er σ = 0.1. Da er variansen på estimatet (med σ 2 0 = 2σ 2 ) Var X = 2σ2 3 = 2 3 σ2 og spredningen på estimatet er 2 3 σ = 0.816σ 35/36