Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X 1, X,..., X n : Da er variansen for Y givet ved Y = a + a 1 X 1 + a X + + a n X n Var(Y ) = a 1Var(X 1 ) + a Var(X ) + + a nvar(x n ). Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a VarX 1/ / Eksempel: Vinkelberegning R i Slutfejl af vinkelmålinger i trekant β V ij α γ Vinkler bestemmes som differensen mellem to retningsbestemmelser. Fx. er V ij = R j R i hvor både R j og R i er uafhængige stokastiske variable. Vi antager retningerne er målt med samme nøjagtighed, dvs Var(R j ) = Var(R i ) = σ R. Variansen på V ij er givet ved σ V = Var(V ij ) = Var(R j R i ) = Var(R j ) + ( 1) Var(R i ) = σ R. R j 1 Betragt trekanten med sande vinkler α, β og γ. Dvs α + β + γ = gon. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med E(X α ) = α E(X β ) = β E(X γ ) = γ og Var(X α ) =.3 Var(X β ) =.1 Var(X γ ) =.3 3/ /
Antag vi har målt x α = 61 x β = 7 x γ = 65. Da er slutfejlen Estimation af α: r = 61 7 65 = Sæt Y α = X β X γ. Da har Y middelværdi α og varians.1 +.3 =.. Vægtet gennemsnit (vægte henholdsvis 3 for X α og Y α ): x = 3 + x α + 3 3 + y α = 3 + x α + 3 3 + (r + x α) = x α + 3 3 + r = 61.8571 NB: her fordeles slutfejlen ikke ligeligt! Varians af vægtet gennemsnit (idet vinkelmålingerne antages uafhængige): ( ) ( ) Var X 3 = VarX α + VarY α =.171 3 + 3 + Alternativ beregning σ =.3 = 3. = 1. Var X = σ p 1 + p = 1. 7 =.171 5/ 6/ Fejlforplantning Landmåling involverer ofte bestemmelse af størrelser som ikke kan måles direkte, men kan beregnes ud fra andre målinger: Vinkler - vha differenser af retningsmålinger. Arealer - vha vinkler og længder. Længder - vha trigonometriske relationer.... I resten af kurset gennemgår vi hvorledes fejlene på de målbare størrelser forplanter sig til fejlen på den interessante ikke-målbare størrelse. Eksempelvis kan arealet, T, af en trekant bestemmes ved T = 1 ab sin C, hvor længdemålingerne a og b samt vinklen C måles med usikkerhed. Mere teknisk: Vi vil finde tilnærmede udtryk for (teoretiske) middelværdi og varians for de ikke-målbare størrelser på baggrund af middelværdi og varians for de målbare størrelser. 7/ Repetition: Linearisering Vi har tidligere set, hvordan vi finder tilnærmede udtryk for middelværdi og varians for Y, når Y ikke er en lineær funktion af én stokastisk variabel: Lineær approximation af g omkring µ: Y = g(x) g(µ) + g (µ)(x µ) = g (µ)x g (µ)µ + g(µ) = ax + b, hvor a = g (µ) og b = g (µ)µ + g(µ). g(µ) µ ax + b g(x) 8/
Linearisering: Flere variable Linearisering: Flere variable Antag X 1, X,..., X n er n uafhængige stokastiske variable. Middelværdi og varians for X i er hhv. µ i og σ i. Antag Y er en funktion af X 1, X,..., X n : hvor g er differentiabel. Y = g(x 1, X,..., X n ), Vi ønsker at finde (tilnærmede) udtryk for middelværdi og varians for Y. Hvis g ikke er lineær i X 1,..., X n kan vi ikke anvende de sædvanlige udtryk. Løsningen er at linearisere g omkring punktet (µ 1, µ,..., µ n ): Y g(µ 1, µ,..., µ n ) + (X 1 µ 1 ) + + (X n µ n ), hvor vi anvender notationen (x 1, x,..., x n ) x i x1=µ 1,x =µ,...,x n=µ n, dvs. betegner den i te partielle afledede evalueret i punktet (µ 1, µ,..., µ n ). I praksis kender vi typisk ikke µ 1,..., µ n. I stedet anvender vi estimater, fx. gennemsnit af en eller flere målinger af µ i. 9/ 1/ Eksempel Fejlforplantningsloven For n = svarer den lineære approksimation til at tilnærme en funktion med et tangent-plan. g(x, y) = 3 y + 1 y3 1 3 y x Tilnærm med tangent-plan i punktet (,): g(, ) = 8/3 (, ) = x g(x, y) 8/3 (x ) (, ) = y 3 Vi kan approximere variansen på Y ( Var(Y ) Var g(µ 1, µ,..., µ n ) + (X 1 µ 1 ) + + ( = Var g(µ 1, µ,..., µ n ) µ 1 µ n + X }{{ n } konstant ( = Var ( = X 1 + + X 1 + + ) X n ) ( ) Var(X 1 ) + + Var(X n ) ) (X n µ n ) ) X n 11/ 1/
Den simple fejlforplantningslov Antag X 1, X,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ1,..., Var(X n )=σn. Lad Y = g(x 1, X,..., X n ), hvor g er en differentiabel funktion. Et tilnærmet udtryk for variansen for Var(Y )=σy er ( ) ( ) σy σ1 + + σn Bemærk: X i s bidrag til den samlede varians (for Y ) afhænger af 1. Variansen σ i for X i.. Hvor sensitiv Y er overfor ændringer i X i - målt ved X i Bemærk: For en lineær transformation Y = a + a 1 X 1 + a X +... + a n X n gælder = a 1,..., = a n. I dette tilfælder giver ovenstående resultatet det samme som den sædvanlige variansregel for en linearkombination af stokastiske variabel. 13/ 1/ Fejlforplantning ved arealbestemmelse Fejlforplantning anvendt på (1) Vi analyserer arealudtrykket (1): T = 1 ab sin C. Jf. fejlforplantningsloven gælder der, A b c C a B Arealet T kan bestemmes på flere måder: T = 1 ab sin C (1) T = 1 ac sin B () T = 1 bc sin A (3) σ T ( T a ) σ a + De partielt afledte er: ( T b ) σ b + T a = 1 1 b sin C = ab sin C = T a a T b = 1 1 a sin C = ab sin C = T b b T C = 1 ab cos C 1 ω = 1 cos C ab sin C sin C Sidste omskrivning gælder idet tan x = sin x cos x ( T C ) σ C 1 ω = T cos C 1 sin C ω = 1 tan x = cos x sin x. T tan C 1, [ω = ω π ] 15/ 16/
Estimat af T Variansen σ T I et eksempel fra noterne er følgende oplysninger givet: a = 115.53 m, b = 15.17m σ a = σ b = 1cm. C = 93.73 gon Dvs. vi kan regne estimatet for T som σ C =.gon. T = 1 ab sin C = 1 115.53m 15.17m sin 93.73 = 871.7m Variansen σt på estimatet T er fra forrige slide påvirket af σ a, σ b og σ C på følgende måde, ( ) T ( ) T ( ) T σt σa + σb a b + 1 σc tan C ω ( 871m ) 871m = (.1m) +( ) 871m (.1m) ) 1 +( (.gon) 115.53m 15.17m tan 93.73 ω =.57m +.33m +.8m =.933m. Standard-afvigelsen er: σ T = σt =.95m. 17/ 18/ Eksempel - Extended edition Estimater af arealet T Antag nu at målene i trekanten er målt således: a b c A B C 1 115.563 15.163 181.136 3.755 6.9538 93.993 115.5397 15.11 181.16 3.785 6.998 93.38 3 115.557 15.17 181.131 6.951 93.73 115.535 181.111 6.9511 5 115.531 181.1138 6 115.531 7 115.5519 8 115.53 x 115.53 15.158 181.1 3.795 6.9515 93.91 Var( X) σ a 8 σ b 3 σ c 5 σ A σ B σ C 3 5 Fra tidligere kan arealet T beregnes på mindst tre måder (1)-(3). Hvis vi anvender gennemsnitsmålingerne fra forrige slide har vi: (1) T 1 = 1 ab sin C = 115.53 15.158 sin 93.91 = 871.681m () T = 1 ac sin B = 115.53 181.1 sin 6.9515 = 871.376m (3) T 3 = 1 bc sin A = 15.158 181.1 sin 3.795 = 871.71m 19/ /
Vægte til estimat af T vha x Tidligere så vi hvordan σt blev bestemt for (1) med data fra noternes eksempel. Nedenfor bestemmes σt 1, σt og σt 3 : σ T 1 σ T σ T 3 ( ) 871.1 ( ) 871 115.5 8 +.1 ( 871 15.16 3 + tan 93.9 =.18185m. ( ) 871.1 ( ) 871 115.5 8 +.1 ( 871 181.1 5 + tan 6.95 =.16968m. ( ) 871.1 ( ) 871 15.16 3 +.1 ( 871 181.1 5 + tan 3.75 =.16m. ) 1. ω 3 ) 1. ω ) 1. ω Vægte til estimat af T vha x Vægtene i det vægtede gennemsnit x skal opfylde vægtrelationen, p 1 σ T 1 = p σ T = p 3 σ T 3. Fx. kan vi vælge p 1 = 1, hvilket medfører at p = σ T 1 σ T =.1819.163 = 1.399 og p 3 = σ T 1 σ T 3 =.1819.16 =.8553 Således er p + = 1 + 1.399 +.8553 = 3.95 og estimatet af T, x = p 1 p + T 1 + p p + T + p 3 p + T 3 = 1 1.399.8553 871.681 + 871.376 + 3.95 3.95 3.95 871.71 = 871.55m 1/ / Konfidensinterval for T Varians af afhængige variable For at udregne konfidensinterval for T har vi brug for at kende variansen af X. Det er nemt hvis T 1, T og T 3 kan betragtes som realisationer af uafhængige stokastiske variable - men dette er ikke tilfældet! (hvorfor?) Vender tilbage til udregning af variansen i lektion 6. 6 Betragt X 1 og X som ikke antages at være uafhængige. Dette betyder at Var(X 1 + X ) bliver mere kompliceret. Lad E(X 1 ) = µ 1 og E(X ) = µ : Var(X 1 + X ) = E [[(X 1 + X ) (µ 1 + µ )] ] = E [[(X 1 µ 1 ) + (X µ )] ] = E [ (X 1 µ 1 ) + (X µ ) + (X 1 µ 1 )(X µ ) ] Middelværdien = E[(X 1 µ 1 ) ] + E[(X µ ) ] + E[(X 1 µ 1 )(X µ )] = Var(X 1 ) + Var(X ) + E[(X 1 µ 1 )(X µ )] E[(X 1 µ 1 )(X µ )] kaldes kovariansen mellem X 1 og X. 3/ /
Kovarians Hvis X 1 og X er uafhængige gælder E[(X 1 µ 1 )(X µ )] = E[X 1 µ 1 ]E[X µ ] = hvorved Var(X 1 + X ) = Var(X 1 ) + Var(X ) Definition: Kovarians Antag X 1 og X er to stokastiske variable med middelværdier hhv. µ 1 og µ. Kovariansen mellem X 1 og X er da defineret som Cov(X 1, X ) = E[(X 1 µ 1 )(X µ )]. Notation: Kovariansen mellem to stokastiske variable X 1 og X betegnes ofte σ 1. Egenskab: Kovarians og uafhængighed Hvis X 1 og X er uafhængige, så er Cov(X 1, X ) =. 5/ 6/ Fortolkning af kovarians Kovarians: Regneregler Kovariansen mellem a 1 X 1 og a X er Cov(a 1 X 1, a X ) = a 1 a Cov(X 1, X ). Kovarians > : (X 1 µ 1 ) og (X µ ) har overvejende samme fortegn. Kovarians < : (X 1 µ 1 ) og (X µ ) har overvejende modsat fortegn. Dvs. kovarians er et mål for om X 1 og X er positivt eller negativt associerede. 7 Det medfører at variansen for a 1 X 1 + a X er Var(a 1 X 1 + a X ) = Var(a 1 X 1 ) + Var(a X ) + Cov(a 1 X 1, a X ) = a 1Var(X 1 ) + a Var(X ) + a 1 a Cov(X 1, X ). Specialtilfælde: Var(aX) = Cov(aX, ax) = a a Cov(X, X) = a VarX Kovarians for summer: Cov(X, Y + Z) = Cov(X, Y ) + Cov(X, Z) 7/ 8/
Korrelation Antag Cov(X 1, X ) =. Så er kovarians mellem 3X 1 og X 1 gange så stor. Kovarians afhænger af skalering og er derfor ikke et velegnet mål for graden af afhængighed mellem to stokastiske variable - vi kan få vilkårlig stor kovarians ved blot at gange de stokastiske variable med store konstanter. Kovarians afhænger også af enheder. Kan virke underligt at måle afhængighed i f.eks. gon. Definition: Korrelation Antag X 1 og X er to stokastiske variable med varianser σ 1 and σ. Korrelation Corr(X 1, X ) mellem de stokastiske variable X 1 og X er defineret som Corr(X 1, X ) = Cov(X 1, X ) Var[X1 ]Var[X ]. Ofte skrives korrelation som ρ = Corr(X 1, X ). Med notationen Var[X i ] = σ i og Cov(X 1, X ) = σ 1 er korrelationen mellem X 1 og X ρ = σ 1 σ 1 σ. Hvis vi kender korrelation og varianserne har vi kovariansen som: σ 1 = σ 1 σ ρ. 9/ 3/ Korrelation: Egenskaber og Eksempler korrelation måler kovarians i forhold til varianser korrelation uafhængig af enheder 1 ρ 1 Mål for graden af lineær sammenhæng. ρ = 1 og ρ = 1 perfekt lineær sammenhæng. Uafhængighed ρ =. 8 Eksempler: ρ er korrelationen i populationen og r er den estimerede korrelation for de viste stikprøver. 1 8 6 ρ = 1 r = 1 6 8 1 ρ =. r =.5 6 8 1 1 1 8 6 6 6 ρ =.9 r =.9 6 8 1 ρ = r =.8 6 8 1 6 8 ρ = r =.53 6 8 1 ρ = r =.157 6 8 1 NB: de sidste (lidt patologiske) eksempler viser, at Cov(X 1, X ) = eller Corr(X 1, X ) = ikke medfører uafhængighed. 5 15 1 5 5 31/ 3/
Fejlforplantning: Afhængige målinger Eksempel: VarX 1 =, VarX = 3 ρ =.5 Var(X 1 + X ) = + 3 + 3.5 = 7.5 Dvs. positiv korrelation øger varians af sum. Med ρ =.5 fås Var(X 1 + X ) = + 3 3.5 =.55 Dvs. negativ korrelation mindsker varians af sum. Tidligere har vi set Y =g(x 1,X ) hvor g er en transformation af X 1 og X. En lineær approximation af Y omkring punktet (µ 1, µ ) er givet ved: Y = g(x 1, X ) g(µ 1, µ ) + (X 1 µ 1 ) + X (X µ ) Hvis X 1 og X er uafhængige har vi set, at ( ) ( ) Var(Y ) Var(X 1 ) + Var(X ) X Hvordan ser det ud, hvis X 1 og X er afhængige, dvs. når Cov(X 1, X )? 33/ 3/ Fejlforplantning - fortsat Variansen af afhængige variable Hvis Cov(X 1, X ) = σ 1 bliver variansen af Y : ( Var(Y ) Var g(µ 1, µ ) + (X 1 µ 1 ) + ) (X µ ) X = Var g(µ 1, µ ) µ 1 µ + X 1 + X X }{{ X } 1 X ( = Var = = ( konstant X 1 + ) X X ( ) ( σ1 + ) σ 1 + X ( X ) σ + ) σ + X Cov(X 1, X ) X σ 1 9 Varians for linearkombination af afhængige SV Antag X 1, X,..., X n er stokastiske variable, med varianser σ 1, σ,..., σ n. Antag desuden, at kovariansen mellem X i og X j er Cov(X i, X j ) = σ ij. Variansen for linearkombinationen er Var(a + a 1 X 1 + + a n X n ) = a 1σ 1 + + a nσ n + i j = n i=1 a i σ i + i<j a i a j σ ij a i a j σ ij Bemærk, at summen i<j = n 1 n i=1 j=i+1 betyder at vi lader i gennemløbe alle index 1,..., n og j skal hver gang være strengt større end i. 35/ 36/
i<j Variansen er altså Var(a + a 1 X 1 + + a n X n ) = a 1σ 1 + + a nσ n + i<j a i a j σ ij. Summen i<j svarer til de mørke celler nedenfor. Bemærk: σ ij = σ ji. i 1 3. n n 1 n j 1 3... n n 1 n Vilkårlig transformation Er transformationen af Y = g(x 1,..., X n ) en vilkårlig differentiabel funktion laver vi som tidligere en lineær approximation af g omkring middelværdierne af X i erne (µ 1,..., µ n ), g(x 1,..., X n ) g(µ 1,..., µ n ) + (X 1 µ 1 ) + + (X n µ n ) Dette svarer til at hvor g(x 1,..., X n ) a + a 1 X 1 + + a n X n, a = g(µ 1,..., µ n ) µ 1... µ n a i = i = 1,..., n X i 37/ 38/ Vi har altså hvor g(x 1,..., X n ) a + a 1 X 1 + + a n X n, a = g(µ 1,..., µ n ) µ 1... µ n a i = i = 1,..., n X i Dvs. et tilnærmet udtryk for variansen, σy, af Y er n σy a i σi + a i a j σ ij i=1 i<j ( ) ( ) = σ1 + + σn + i<j X i X j σ ij 1 Eksempel: X a og X b betegner målinger af sidelængderne a og b (kateterne) i en retvinklet trekant. Et estimat for hypotenusen c er da x a + x b Antag X a og X b har samme spredning.5 og korrelation ρ =.. Med c = a + b fås c a = a a + b c b = b a + b Dermed fås en tilnærmet spredning på estimatet af c som ( ) ( ) x a.5 x + b.5 +.5. x a x b x a + x b x a + x b x a + x b x a + x b Med x a = 3.1 og x b =.5 er estimatet for c 5.6 og variansen for estimatet af c bliver.96718. 39/ Hvis ρ = bliver variansen kun.5. /