Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i BG. p. 1/??

Model M : X i N(µ,σ 2 ) for i = 1,...,n hvor µ R og σ 2 > 0 er ukendte. ( En normalfordelt observationsrække ). Kontrolleres ved et fraktildiagram. Tidligere antog vi at σ 2 er kendt. I Ex. 3.1 kan µ fortolkes som middel-diameteren fratrukket 5160 micrometer; σ 2 modellerer variationen. p. 2/??

Estimation Vi benytter x. µ s 2 σ 2 hvor s 2 = 1 n 1 n i=1 (x i x. ) 2. p. 3/??

Estimation Vi benytter x. µ s 2 σ 2 hvor s 2 = 1 n 1 n i=1 (x i x. ) 2. Vi kalder s 2 for det middelværdirette variansskøn, jvf. senere. p. 3/??

Fordelingerne X. N(µ, σ2 n ) 1 n 1 n (X i X. ) 2 σ 2 χ 2 (n 1)/(n 1) i=1 og disse stokastiske variable er uafhængige. Specielt er E 1 n 1 V ar n (X i X. ) 2 = σ 2 i=1 1 n 1 n (X i X. ) 2 = 2σ 4 /(n 1) i=1 p. 4/??

Huskeregel 1 n 1 n (x i x. ) 2 σ 2 χ 2 (n 1)/(n 1). i=1 Hvorfor n 1? n er antallet af observationer 1 svarer til at vi skal estimere een parameter (nemlig µ) i middelværdien. Dvs. n 1 er antallet af observationer minus antallet af ukendte parametre i middelværdien. p. 5/??

Hypotese og test Test: H 0 : µ = µ 0. (I Ex. 3.1 er µ 0 = 40). Når vi kender σ 2 benyttes som teststørrelse. u(x) = x. µ 0 σ 2 n p. 6/??

Hypotese og test Test: H 0 : µ = µ 0. (I Ex. 3.1 er µ 0 = 40). Når vi kender σ 2 benyttes som teststørrelse. u(x) = x. µ 0 σ 2 n Her kender vi ikke σ 2 så i stedet benyttes det middelværdirette variansskøn. Dvs t(x) = x. µ 0 s 2 n p. 6/??

Hypotese og test - fortsat Som tidligere har vi, at numerisk store værdier er kritiske for H 0. På tavlen vises: t(x) t(n 1). p. 7/??

Hypotese og test - fortsat Som tidligere har vi, at numerisk store værdier er kritiske for H 0. På tavlen vises: t(x) t(n 1). Dermed er p obs (x) = 2(1 F t(n 1) ( t(x) )). I Ex. 3.1 kan vi stadig acceptere H 0. p. 7/??

Konfidensinterval for µ Antag: niveauet er α. Hypotese H 0 : µ = µ 0. Dvs. H 0 accepteres hviss p obs (x) = 2(1 F t(n 1) ( t(x) )) α som er ækvivalent med F t(n 1) ( t(x) ) 1 α/2. p. 8/??

Konfidensinterval for µ - fortsat Dette er ækvivalent med t(x) (F t(n 1) ) 1 (1 α/2) = t 1 α/2 (n 1). p. 9/??

Konfidensinterval for µ - fortsat Dette er ækvivalent med t(x) (F t(n 1) ) 1 (1 α/2) = t 1 α/2 (n 1). Altså: H 0 accepteres hviss µ 0 tilhører intervallet med grænser x. ± t 1 α/2 (n 1) s 2 /n. p. 9/??

(1 α)-konfidensintervallet for µ Er intervallet bestående af de µ 0 for hvilke hypotesen µ = µ 0 accepteres. p. 10/??

(1 α)-konfidensintervallet for µ Er intervallet bestående af de µ 0 for hvilke hypotesen µ = µ 0 accepteres. Dvs. jvf. ovenfor har (1 α)-konfidensintervallet grænser x. ± t 1 α/2 (n 1) s 2 /n. Specielt har 95%-konfidensintervallet grænser givet ved x. ± t 0.975 (n 1) s 2 /n. (se (3.22) side 63 i BG). p. 10/??

Konfidensinterval - bemærkninger Løst skrevet består 95%-konfidensintervallet af de værdier af den ukendte parameter som vi kan tro på på baggrund af data. I BG, side 62, er det vist, at sandsynligheden for at µ tilhører 95%-konfidensintervallet er 95%. Læs selv om konfidensinterval for µ når σ 2 er kendt. (Side 62). p. 11/??

Test i variansen Model: En normalfordelt observationsrække - ukendt varians. Variansskønnet i Ex. 3.1 er s 2 = 53.31 σ 2 χ 2 (n 1)/(n 1). H 0 : σ 2 = σ 2 0 (I Ex. 3.1 er σ2 0 = 100). p. 12/??

Test i variansen - fortsat Hvis H 0 er sand, vil vi forvente at s 2 /σ 2 0 er tæt på 1. Derfor er både store og små værdier af s 2 /σ0 2 H 0. kritiske for p. 13/??

Test i variansen - fortsat I eksemplet er s 2 /σ0 2 = 05331 og sandsynligheden for at få en mindre observation er F χ2 (39)/39(0.5331) = 0.00743. Hvordan defineres de mere kritiske store værdier???? p. 14/??

Test i variansen - fortsat I eksemplet er s 2 /σ0 2 = 05331 og sandsynligheden for at få en mindre observation er F χ2 (39)/39(0.5331) = 0.00743. Hvordan defineres de mere kritiske store værdier???? Løsning: Der ganges med 2; Dvs. testsandsynligheden er p obs (x) = 2 0.00743 = 0.0148. Dermed forkastes H 0 i Ex. 3.1! p. 14/??

Test i variansen - fortsat Se (3.12) i BG for den generelle formel for testsandsynligheden. Se (3.14) i BG for formlen for konfidensintervallet. (f er antallet af frihedsgrader for variansskønnet; her f = n 1). p. 15/??

Beregningsformler: x. kaldes ofte for S (summen); Lad SSD = n i=1 (x i x. ) 2 (Sum of Squares of Deviations). Lad USS = n i=1 x2 i (Uncorrected Sum of Squares) p. 16/??

Beregningsformler: x. kaldes ofte for S (summen); Lad SSD = n i=1 (x i x. ) 2 (Sum of Squares of Deviations). Lad USS = n i=1 x2 i (Uncorrected Sum of Squares) Da gælder SSD = USS S2 n og dermed s 2 = 1 n 1 (USS S2 n ). p. 16/??

Intro til Std Error t-teststørrelsen for H 0 : µ = µ 0 er hvor x. µ. Nævneren t(x) = x. µ 0 s 2 n s 2 er den estimerede spredning på estimatet x. for µ og betegnes Std Error eller Std Error( x. ). n p. 17/??

Intro til Std Error - fortsat Strukturen af t-teststørrelsen er derfor t(x) = estimat µ 0 Std Error og 95%-konfidensintervallet har grænser estimat ± t 0.025 (f) Std Error. hvor f er frihedsgraderne for variansskønnet; her f = n 1. Ovenstående er nyttigt at vide, bl.a. når man skal aflæse udskrifter fra statistiske programpakker. p. 18/??

F -fordelingen - side 166 Lad Z i χ 2 (f i )/f i for i = 1, 2 være uafhængige. Tænk på Z i som et variansskøn. Definer F = Z 1 Z 2 Vi siger, at F er F -fordelt med f 1 frihedsgrader i tælleren og f 2 frihedsgrader i nævneren. Skrives F F(f 1,f 2 ). p. 19/??

F -fordelingen - fortsat Bemærk at t t(f) t 2 F(1,f) Vigtig formel i forbindelse med tabelopslag: F F(f1,f 2 )(x) = 1 F F(f2,f 1 )( 1 x ). p. 20/??