Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Relaterede dokumenter
Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Geometrisk nivellement. Landmålingens fejlteori - Lektion 7 - Repetition - Fejlforplantning ved geometrisk nivellement. Modellen.

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Definition. Definitioner

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Produkt og marked - matematiske og statistiske metoder

Tema. Dagens tema: Indfør centrale statistiske begreber.

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Anvendt Lineær Algebra

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Økonometri Lektion 1 Simpel Lineær Regression 1/31

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Lineær Algebra

Statistik og Sandsynlighedsregning 2

Note om Monte Carlo metoden

Kvantitative Metoder 1 - Forår 2007

Landmålingens fejlteori - Sandsynlighedsregning - Lektion 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Statistik og Sandsynlighedsregning 2

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Nanostatistik: Opgavebesvarelser

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Kvantitative Metoder 1 - Forår 2007

Normalfordelingen og Stikprøvefordelinger

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Simpel Lineær Regression: Model

1 Hb SS Hb Sβ Hb SC = , (s = )

Uge 10 Teoretisk Statistik 1. marts 2004

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Kvantitative Metoder 1 - Forår Dagens program

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Opgaver til kapitel 3

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Hvorfor er normalfordelingen så normal?

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Statistik og Sandsynlighedsregning 2

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Module 12: Mere om variansanalyse

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Diverse opdateringer ved Rasmus Waagepetersen. Version 1.

Kvantitative Metoder 1 - Forår Dagens program

INSTITUT FOR MATEMATISKE FAG c

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Kvantitative Metoder 1 - Efterår Dagens program

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Løsning til eksaminen d. 29. maj 2009

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative metoder 2

4 Oversigt over kapitel 4

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Løsning eksamen d. 15. december 2008

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Kapitel 12 Variansanalyse

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Planen idag. Fin1 (mandag 16/2 2009) 1

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

Mat2SS Vejledende besvarelse uge 11

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Transkript:

Vægte motiverende eksempel Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@mathaaudk Institut for Matematiske Fag Aalborg Universitet Højdeforskellen mellem punkterne P og P er opmålt ved et geometrisk nivellement over to forskellige strækninger P l h l P h Første højdeforskel, h, er nivelleret over en strækning l Den tilhørende stokastiske variabel har varians l σ k, hvor σ k er kilemeterspredningen Variansen for h er større og målinger er dermed værre Spørgsmål: Hvordan kombinerer vi bedst gode og dårlige målinger af samme størrelse? /9 /9 Vægtet model Vægtrelationen Vi har n uafhængige målinger x,, x n af n størrelser µ,, µ n Målinger er ikke nødvendigvis af samme kvalitet Fx kan visse målinger være behæftet ved flere fejlkilder end andre, nogle kan være målt flere gange, etc Som tidligere er x,, x n realisationer af stokastiske variable X,, X n, hvor E(X i ) µ i og Var(X i ) σi, hvor σ i erne ikke nødvendigvis er ens Hver måling, x i, gives en vægt p i > 0, som afspejler kvaliteten af målingen desto højere vægt desto bedre måling Hver måling, x i, gives en vægt p i > 0, som afspejler kvaliteten af målingen desto højere vægt desto bedre måling Hvordan skal vægtene vælges? En måde (og den bedste) er at vægtene i overensstemelse med vægtrelationen: Definition: Vægtrelationen Vægtene, der er positive tal, siges at opfylde vægtrelationen, hvis p σ p σ p n σ n Vi antager altid at vægtrelationen er opfyldt 3/9 4/9

Vægtrelationen: Eksempel Vægtet gennemsnit Antag variansen på første måling er dobbelt så stor som på den anden (σ σ ) Et valg af vægte, der opfylder vægtrelationen, er p og p, idet p σ p σ σ σ Der er uendelig mange lige god valg af vægte!! Et andet valg er p 3 og p 3 Bemærk: I eksemplet er vægten på den bedste måling dobbelt så stor som vægten på den dårlige måling Antag at µ µ µ n µ, dvs alle observationer x,, x n er målinger af samme størrelse µ Fortsat er variansen ikke nødvendigvis den samme for alle målinger Fx kan der være anvendt måleudstyr af forskellige fabrikat og/eller kvalitet Til at estimere µ bruges det vægtede gennemsnit x således mere præcise målinger (observationer med lav varians) vægter mere i gennemsnittet end dårligere bestemte målinger Definition: Vægtet gennemsnit For observationer x,, x n med vægte p,, p n er det vægtede gennemsnit x p n i p x + + i p n x n (p x + + p n x n ) 5/9 6/9 Det vægtede gennemsnit: Egenskaber Variansen for det vægtede gennemsnit Sætning: Egenskaber for det vægtede gennemsnit For den stokastiske variabel X p n i p X + + i p n X n (p X + + p n X n ) gælder følgende udsagn E( X ) µ, dvs X er en central estimator for µ uanset om vægtene opfylder vægt relationen eller ej For positive vægte p,, p n er Var( X ) mindst når vægtene opfylder vægtrelationen, dvs p σ p n σ n Idet vægtrelationen foreskriver p i σ i er ens for alle i, kan σ 0 indføres som σ 0 p σ p σ p n σ n Indtil videre har σ 0 ikke nogen naturlig fortolkning Sætning: Variansen af vægtet gennemsnit Lad p + og dermed X p p + X + p p + X + + pn p + X n Antag vægtrelationen er opfyldt, dvs σ0 p σ p n σn Da gælder Var( X σ0 ) i p i 7/9 8/9

Estimat af σ 0 Estimat af Var( X ) Således er variansen på det vægtede gennemsnit givet ved ( Var( X ) og dermed X N µ, Estimat af σ 0 σ 0 Som estimat af σ0 anvendes s 0: s i 0 p i(x i x ) n i p ix i ( x ) n σ 0 ) Vi har, at s 0 er et centralt estimat for σ 0 Variansen for det vægtede gennemsnit er Var( X ) σ 0 Et centralt estimatet for variansen af det vægtede gennemsnit er derfor s 0 Der gælder desuden, at s 0 er et centralt estimat for σ 0 9/9 0/9 Estimat af Var(X i ) σ i Eksempel: Geometrisk nivellement Relationen mellem de enkelte varianser σi og σ 0 er givet ved vægtrelationen: σ0 p σ p n σn Dvs den i te varians σ i Estimat for σ i skrives som σ i σ 0/p i Variansen for σ i kan estimeres vha s i s 0/p i 3 En højdeforskel er nivelleret over n strækninger med samme kilometerspredning σ k Variansen over en længde l er fra tidligere givet ved σ k l Højdeforskel h Længde l Varians på h over l h l σ σ k l h l σ σk l h n l n σ n σ k l n Forskellig varianser på målinger pga forskellige strækninger, altså l i l j Da varianserne er forskellige benytter vi vægtede observationer /9 /9

Eksempel: Geometrisk nivellement valg af vægte Vægtrelationen er opfyldt når σ 0 p σ p n σ n Indsættes udtrykket for σi l iσk har vi: Heraf fremgår det at hvis p i l i σ 0 p σ kl p n σ kl n er ligheden opfyldt: σ0 l σ kl l n σkl n σk σk Dvs vægte kan vælges til p i (l i ) altså er vægten den resiprokke længde Bemærk: Her har σ 0 en fortolkning: kilometerspredningen Eksempel Højdeforskellen mellem punkterne P og P er opmålt ved et geometrisk nivellement over to forskellige strækninger Data: P h 347mm, l 67m h 356mm, l 853m Estimat af H H : x l h l P h /67 /67 + /853 347 + /853 356 350, 96mm /67 + /853 3/9 4/9 Eksempel - polygonvinkler Eksempel - fortsat Vi måler vinklerne i punkterne 3-6 Alle vinkler er målt med samme varians σ v Lad σm,i være variansen af middelsatsen i punkt i Punkt Antal satser σ m,i 3 σ m,3 σ v 4 3 σ m,4 σ v 3 5 4 σm,5 σ v 4 6 6 6 σm,6 σ v 6 3 5 4 4 Ifølge vægtrelationen skal p i σm,i være ens for alle i, p 3 σ m,3 p 4 σ m,4 p 5 σ m,5 p 6 σ m,6 Jf udtrykkene fra forrige slide σv p 3 p σv 4 3 p σv 5 4 p σv 6 6 Således kan vægtene vælges lig antal satser for hvert punkt: p 3 p 4 3 p 5 4 p 6 6 Med disse vægte gælder σ 0 σ v 5/9 6/9

Eksempel - Vinkelmålinger Fordeling af slutfejl Vinkler målt med forskellige satser med samme vinkelspredning σ v Variansen på vinkler målt med k satser er fra tidligere givet ved σ v/k Vinkel v Sats k Varians på middelsats v k σ σv/k v k σ σv/k v n k n σ n σ v/k n Forskellig varians på målinger pga forskelligt antal satser, dvs vægtede observationer Vægtrelationen er opfyldt når σ 0 p σ p n σ n Betragt en situation hvor vi ved at summen af vores observationer skal være lig en kendt værdi x 0 Dette kunne eksempelvis være: x 0 00 gon, hvor vores målinger er vinkler i en trekant x 0 0 mm, hvor vi nivellerer i et lukket net, dvs slut- og startpunkt er det samme x 0 H H, hvor målinger er for at bestemme kote til et punkt Slutfejlen er afvigelsen mellem x 0 og den faktiske sum af observationer Fra tabellen ses det at vægten kan vælges til p i k i dvs vægten er antal satser 7/9 8/9 Nivellement bestemmelse af kote Model Vi ønsker at beregne koten µ til punktet P med højdeforskelle h til P og h til P Længderne fra P til de to punkter P og P er henholdvis l og l P H l h P l h Punkterne P og P har kendte koter, hhv H og H To bud på koten i P : H + h og H h P H 5 P H l h P l h X H og X H er uafhængige stokatiske variable med E(X H ) E(X H ) µ, X H X H H + h H h Fra sidste gang har vi at Var(X H ) l σ k og Var(X H ) l σ k P H 9/9 0/9

Estimat af µ Til at estimere µ anvendes det vægtede gennemsnit x idet varianserne på højdemålingerne ikke nødvendigvis er ens, x p p + p (H + h ) + p p + p (H h ), hvor vægtene p og p opfylder vægtrelationen p l σ k p l σ k Eksempel Højdeforskellen mellem punkterne P og P er opmålt ved et geometrisk nivellement over to forskellige strækninger P l P l h P H Dvs de reciprokke længder kan anvendes som vægte, Estimatet for µ er altså givet ved: p l og p l x l l l + l (H + h ) + l + l (H h ) /9 Data: H h H 743mm, h 47mm, l 67m H 788mm, h 56mm, l 853m Estimat af koten i punktet P : x /67 /67 + /853 (743+47)+ /853 (788 56) 7675, 36mm /67 + /853 /9 Estimat af µ - en omskrivning Slutfejlen r n Vi kan omskrive udtrykket for x således: x l l l + l (H + h ) + l + l (H h ) l l l l l l l + (H + h ) + l l l l + (H h ) l l l l l + l (H + h ) + l l + l (H h ) 6 På grund af målefejl er h + h H H Derfor indføres slutfejlen r n som korrektion h + h + r n H H H h H + h + r n Indsættes dette i udtrykket for x får vi x l l + l (H + h ) + l l + l (H h ) l l + l (H + h ) + l l + l (H + h + r n ) (H + h ) + l l + l r n Slutfejlen på estimatet x af koten µ skal under de anvendte vægte (reciprokke længdemål) fordeles proportionalt med vejlængden 3/9 4/9

Eksempel fortsat Slutfejl af vinkelmålinger i trekant Data: P H l h P P l H h H 743mm, h 47mm, l 67m H 788mm, h 56mm, l 853m Slutfejl: H H 788 743 397, h + h 47 + 56 403mm Slutfejl r n 397 403 6mm Estimat af koten i punktet P : (H + h )+ l r n 743+47+ 67 ( 6) 743+47, 64 l + l 67 + 853 Højdeforskelen h skal altså nedkorrigeres,64mm 5/9 α Betragt trekanten med sande vinkler α, β og γ Dvs α + β + γ 00 gon β X α X β X γ x α x β x γ E(X α ) α, E(X β ) β og E(X γ ) γ Var(X α ) Var(X β ) Var(X γ ) σ γ 6/9 Model for vinkler i trekant Estimat af α På grund af betingelsen om en vinkelsum på 00 gon, kan modellen simplificeres, X α 00 X β X γ x α 00 x β x γ Fra vores viden om lineære transformationer om E og Var har vi at, E(X α ) α E(00 X β X γ ) 00 β γ Var(X α ) σ Var(00 X β X γ ) σ 7 Idet variansen for de to observationer er forskellig anvendes det vægtede gennemsnit til at estimere α Bemærk at både x α (direkte måling) og 00 x β x γ (indirekte måling) er observationer til at estimere den sande værdi α x p p + p x α + p p + p (00 x β x γ ) Igen skal vægtene p og p opfylde vægtrelationen p σ p σ Idet σ σ og σ σ vælges p og p Hermed har vi x 3 x α + 3 (00 x β x γ ) 7/9 8/9

Slutfejlen r v på vinkelsummen Som i foregående eksempel er summen af x α, x β og x γ ikke 00 pga uundgålige målefejl Derfor indføres r v således x α + x β + x γ + r v 00 00 x β x γ x α + r v, og dette indsættes i udtrykke for x, x 3 x α + 3 (00 x β x γ ) 3 x α + 3 (x α + r v ) x α + 3 r v Dvs slutfejlen fordeles ligeligt på alle vinkler uanset deres målte størrelser 9/9 8