Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet Defiitio: Normalfordelige E stokastisk variabel X med tæthedsfuktio f(x) = 1 ( ) (x µ) exp, x R, πσ σ siges at være ormalfordelt med middelværdi µ og varias σ, hvor µ og σ er reelle tal og σ > 0. Notatio: X N (µ, σ ). Klokkeformet symmetrisk tæthedsfuktio. σ µ 1/30 /30 Repetitio: Stadard Normalfordelige Sadsylighedsitervaller Defiitio: Stadard ormalfordelige Fordelige N (0,1) kaldes stadard ormalfordelig. Typisk oteres stadard ormal fordelte variable Z. Fordeligsfuktioe for e stadard ormalfordelt SV beteges Φ(z): Dvs: Hvis Z N (0,1) så gælder P (Z z) = Φ(z). Der fides ikke et lukket udtryk for fordeligsfuktioe Φ(z). f(z) Φ(z) z 3 1 0 1 3 Φ(z) 1.00 0.75 0.50 0.5 0 3 1 0 1 z 1 Lad X N (µ, σ ), dvs. Z = X µ σ N (0, 1). Fid sadsyligehde for at X ligger højst z stadardafvigelser fra middelværdie µ. Dvs. fid: p = P (µ zσ < X < µ + zσ) p =? µ zσ µ µ + zσ 3/30 4/30
Sadsylighedsitervaller Sadsylighedsitervaller: Eksempel Sadylighede for at X ligger højst z stadardafvigelser fra middelværdie µ er: p = P (µ zσ < X < µ + zσ) = P ( z < X µ < z) σ = P ( z < Z < z) P ( z Z z) z 0 z P (Z z) = 0 = P (Z < z) P (Z < z) = Φ(z) Φ( z) = Φ(z) (1 Φ(z)) = Φ(z) 1. z P (Z z) Bemærk: middelværdie µ og spredige σ idgår ikke! z 0 Atag X N (µ,σ ). Hvad er sadsyligehde for at X ligger højst stadardafvigelser fra middelværdie? p = P (µ σ < X < µ + σ) = Φ() 1 I ormalfordeligstabelle fider vi Φ() = 0,977. Dvs. p = 0,977 1 = 0,9544. Dvs. der 95,44% sadsylighed for at e ormalfordelt SV ligger idefor stadardafvigelser fra middelværdie. 95,44% µ σ µ µ + σ 5/30 6/30 Sadsylighedsitervaller: Eksempler Tæthedsfuktio Atag X N (µ,σ ). Givet e sadsylighed p fid z så P (µ zσ X µ + zσ) = p. Vi har set, at dette svarer til at løse p = Φ(z) 1. Isolerer vi Φ(z) får vi ). Φ(z) = p + 1 z = Φ 1 ( p + 1 99,9% 99% 95% Atag vi vil fide z, så itervallet ideholder X med 99% sadsylighed, dvs. p = 0,99. Da er z = Φ 1 ( 0,99+1 ) = Φ 1 (0,995). Fra Matlab får vi >> ormiv(0,995) as =.5758 Dvs. P (µ,58σ X µ +,58σ) = 0,99. 7/30 µ 3.9σ µ 1.96σ µ µ + 1.96σ µ + 3.9σ µ.58σ µ +.58σ 8/30
Uafhægige stokastiske variable Liearkombiatio Defiitio: Uafhægighed To stokastiske variable X 1 og X er uafhægige, hvis og ku hvis for alle x 1,x R. P (X 1 x 1 og X x ) = P (X 1 x 1)P (X x ) Geerelt: stokastiske variable X 1, X,..., X er uafhægige, hvis og ku hvis P (X 1 x 1 og X x og... og X x ) = for alle x 1,x,... x R. P (X 1 x 1)P (X x ) P (X x ) Sætig: Middelværdi af liearkombiatio Hvis X 1, X,..., X er stokastiske variable med edelig middelværdier E(X 1 ) = µ 1, E(X ) = µ,..., E(X ) = µ, og a 0, a 1,..., a R, så gælder E ( ) a 0 + a 1X 1 + + a X = a0 + a 1E(X 1) + + a E(X ) = a 0 + a 1µ 1 + + a µ Bemærk: Sætige kræver ikke at X 1, X,..., X er uafhægige! 9/30 10/30 Liearkombiatio Sum af uafhægige ormalfordelte SV Sætig: Varias af liearkombiatio af uafhægige SV Hvis X 1, X,..., X er uafhægige stokastiske variable med edelig variaser V(X 1) = σ 1, V(X ) = σ,..., V(X ) = σ, og a 0,a,..., a er reelle kostater, så gælder V ( a 0 + a 1X 1 + a X + + a X ) = a 1 V(X 1) + a V(X ) + + a V(X ) = a 1σ 1 + a σ + + a σ. 3 Sætig: Sum af uafhægige ormalfordelte SV Hvis X 1 og X er uafhægige stokastiske variable, hvor så er X 1 N (µ 1, σ 1) og X N (µ, σ ), X 1 + X N (µ 1 + µ, σ 1 + σ ). Geerelt: Hvis X 1, X,... X er uafhægige stokastiske variable, hvor så er X i N (µ i, σ i ) for i = 1,,...,, X 1 + X + + X N (µ 1 + µ + + µ, σ 1 + σ + + σ ). 11/30 Bemærk: E sum a ormalfordelte stokastiske variable er altid ormalfordelt uafhægighed eller ej. 1/30
Statistisk model Model for vikler I de fleste videskaber atages e model for det fæome som er uder observatio. Ofte bygger modelle på e række atagelser hvis påstade tidligere er vist valide. x 1x 3 x 5 x 4 Model for vikler i ladmålig: Vi atager at vikler i ladmålig er ormalfordelte med de sade vikel µ som middelværdi og spredig σ. Ydermere atages getage måleforsøg X 1,...,X af samme vikel at være uafhægige og idetisk fordelte (iid), X i N (µ,σ ), i = 1,...,. µ µ σ µ µ + σ 13/30 14/30 Observatioer Ved opmålig af e vikel foretages observatioer x 1,...,x som er realisatioer af de stokatiske variable X 1,...,X. Skematisk agives dette som, X 1... X x 1... x (X 1,...,X ) kaldes e stikprøve fra ormalfordelige N (µ,σ ). (x 1,...,x ) kaldes e observeret stikprøve fra ormalfordelige N (µ,σ ). 4 Eksempel Jf. eksempel fra otere observeres følgede 10 satser af e vikel. Sats x i Observatio 1 x 1 164.508 go x 164.509 go 3 x 3 164.511 go 4 x 4 164.507 go 5 x 5 164.510 go 6 x 6 164.511 go 7 x 7 164.517 go 8 x 8 164.510 go 9 x 9 164.514 go 10 x 10 164.513 go Dvs de observerede stikprøve, hvor = 10, er (x 1,x,...,x 1,x ) = (164.508,164.509,...,164.514,164.513). 15/30 16/30
Eksempel Histogram af observerede vikler Estimator og estimat Som estimator for µ avedes geemsittet X, der er defieret som Relativ frekves / Tæthedsfuktio 0 50 100 150 164.506 164.508 164.510 x 164.51 164.514 164.516 164.518 X = 1 X i = 1 (X 1 + X + + X ) i=1 Har vi observeret data ka vi estimere µ med x. Her udskiftes de stokatiske variable X i i X ud med de observerede xi, x = 1 x i = 1 (x 1 + x + + x ) i=1 Bemærk: X er e stokastisk variabel (e trasformatio af Xi ere), mes x er e realisatio af X, X 1... X X x 1... x x Observerede vikler 17/30 18/30 Eksempel - fortsat Egeskaber ved X Sætig: Middelværdi og varias for X For eksemplet ka vi estimere µ med x: x = 1 (164.508 + 164.509 + + 164.514 + 164.513) = 164.511 go 10 Atag (X 1,...,X ) er e stikprøve fra e fordelig med middelværdi µ og varias σ. Da gælder E( X) = µ og Var( X) = σ. 5 Hvis X i N (µ,σ ) gælder der ligeledes X N (µ, σ ). Estimatore X kaldes e cetral estimator for µ, idet E( X) = µ. Estimatet x kaldes et cetral estimat for µ. 19/30 0/30
Egeskaber for X: Bevis Vi har ataget at X 1,...,X er idbyrdes uafhægige og har samme middelværdi µ og samme varias σ : E(X i) = µ, V(X i) = σ i = 1,...,. Geemsittet af måliger beteges X ka skrives som Da gælder og V[ X] = V X = X1 + X +... + X = 1 X1 + 1 X +... + 1 X. E[ X] = 1 µ +... + 1 µ = 1 µ = µ. [ 1 X1 + 1 X +... + 1 ] X = ( 1 ) σ + ( 1 ) σ + + ( 1 ) σ Geemsit af uafhægige ormalfordelte SV Hvis X 1, X,... X er uafhægige idetiske fordelte stokastiske variable (i egelsk litteratur iid : Idepedet Idetically Distributed), hvor X i N (µ, σ ) for i = 1,,...,, så er Dvs. eller X 1 + X + + X = X = 1 i=1 X i N (µ, σ ). i=1 X i N ( µ, σ ) X µ σ/ N ( 0, 1 ). = 1 σ = 1 σ. 1/30 /30 Effekte af øget atal observatioer Kofidesiterval for µ Fordelige af geemsittet X for forskellige atal observatioer (). = 10 = 5 = Geemsittet x er et estimat for µ. Hvor præcist er dette estimat? Vores modelatagelse siger at (X 1,...,X ) er uafhægige og idetiske fordelte, X i N (µ,σ ) for i = 1,...,. Desude atages det her, at variase σ er kedt. Fra teorie om sadsylighedsitervaller har vi for hvert X i har: P (µ 1,96σ X i µ + 1,96σ) = 0,95. = 1 10.0 10.5 103.0 103.5 104.0 Bemærk: Jo større jo større sadsylighed for at X ligger tæt på µ. 6 Oveståede atagelser medfører, at X N (µ, σ ). Heraf følger, at for X gælder: P (µ 1,96 σ X µ + 1,96 σ ) = 0,95. 3/30 4/30
Kofidesiterval - fortsat Kofidesiterval - fortsat Sadyligehde for forrige slide ka u omskrives, så µ isoleres : P ( P ( P ( P ( µ 1.96 σ X µ + 1.96 σ ) = 0.95 X 1.96 σ µ X + 1.96 σ ) = 0.95 X + 1.96 σ µ X 1.96 σ ) = 0.95 X 1.96 σ µ X + 1.96 σ ) = 0.95 De sidste sadsylighed har følgede fortolkig: Sadsylighede for at X atager e værdi x så µ ligger i itervallet [ x 1.96 σ ; x + 1.96 σ ] er 0.95. Vi ka u defiere et kofidesiterval Defiitio: Kofidesiterval Atag x 1,...,x er e uafhægig stikpøve fra N (µ,σ ), og x er geemsittet af dee stikprøve. Da er et 95% kofidesiterval for µ givet ved x ± 1,96 σ. Fortolkig: Vi er 95% sikre på, at itervallet x ± 1,96 σ ideholder de sade middelværdi µ. Bemærk: Kofidesitervallet beytter estimatet x og ikke estimatore X. 5/30 6/30 Kofidesiterval - grafisk Kofidesiterval - fortolkig µ µ x + 1.96 σ x x 1.96 σ 7 Atag vi observerer de stokatiske variable k gage, dvs. vi får k observatiosrækker med tal. 1 : x 1,1, x 1,,..., x 1, x 1 : x,1, x,,..., x, x. k : x k,1, x k,,..., x k, x k Hermed fås k middelværdi estimater x 1,..., x k og k tilhørede kofidesitervaller. For k stor ka vi forvete at 95% af itervallere ideholder µ. 7/30 8/30
Eksempel Der foretages 0 gage 10 opmåliger af e lægde på 118.1 m. Det atages at der er e varias på observatioere på 0.0 m. Figure viser de 0 kofidesitervaller for hver forsøgsrække. Meter 118.05 118.10 118.15 118.0 118.5 118.30 118.35 Eksempel - fortsat Atag at vi kedte variase i vores eksempel med 10 observerede vikelmåliger. Det oplyses at σ = 0.00. Vi ka da bestemme et 95% kofidesiterval for µ, hvor x = 164.511 fra tidligere: [ 164.511 1.96 0.00 ; 164.511 + 1.96 0.00 ] = [164.5098 ; 164.51] 10 10 Per kostruktio ligger x altid midt i itervallet. Lægde på itervallet er et udtryk for øjagtighede, hvor et kortere iterval idikerer at µ er bedre estimeret ed et lægere. 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 Forsøgsrække 9/30 30/30 8