Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18"

Transkript

1 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

2 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve) Sample 1: Sample 2: Sample 10: 2/18

3 Empirisk middelværdi for alle stikprøver (gennemsnit af gennemsnit) Histogram of barx Frequency barx 3/18

4 Teoretisk fordeling af X E X = E 1 n (X X n ) = 1 n nµ = µ Var X = Var 1 n (X X n ) = 1 n 2nσ2 = σ 2 /n Normalfordelt stikprøve X normalfordelt. Ex: antag X gennemsnit af 20 normalfordelte variable med middelværdi 5 og varians 2. Hvad er sandsynligheden for, at P( X > 5.5)? 4/18

5 Centrale grænseværdisætning (CLT) Antag X 1,...,X n tilfældig stikprøve fra population f (x) med middelværdi µ og varians σ 2. Når n går mod uendelig vil blive standard normal fordelt. Z = X µ σ/ n NB: resultat gælder uanset hvad f (x) er! NB: Z N(0, 1) X = σz/ n + µ N(µ, σ 2 /n) 5/18

6 Ex Stikprøve fra χ 2 fordeling med 3 friheds grader. µ = 3 σ 2 = 6. Histogram af X når n er henholdsvis 10, 40 og 100: Histogram of barx Histogram of barx Histogram of barx Frequency Frequency Frequency barx barx barx 6/18

7 Ex 8.6 side 245 (levetid for elektriske pærer) X baseret på stikprøve med 16 observationer med µ = 800 og σ = 40. Hvad er sandsynligheden for at X < 775? 7/18

8 Ex 8.7 side 246 En underleverandør producerer komponenter der skal have middeldiameter 5 mm (det vides σ = 0.1). En stikprøve med n = 100 udtages og x = Giver det anledning til at sætte spørgsmål ved µ = 5? Løsning: x = er ikke en usædvanlig stor afvigelse fra µ = 5 hvis der er stor sandsynlighed for at observere en endnu større afvigelse (under antagelse af, at µ = 5) 8/18

9 To stikprøver X 1 baseret på stikprøve af størrelse n 1 fra population med middelværdi µ 1 og varians σ 2 1. X 2 baseret på stikprøve af størrelse n 2 fra population med middelværdi µ 2 og varians σ 2 2. Fordeling af differens X 1 X 2 : E( X 1 X 2 ) = E X 1 E X 2 = µ 1 µ 2 Var( X 1 X 2 ) = Var X 1 + Var X 2 = σ2 1 n 1 + σ2 2 n 2 X 1 og X 2 approksimativt normalfordelte (CLT) X 1 X 2 approximativt normalfordelt. 9/18

10 Ex 8.8 side 249 n 1 = n 2 = 18 og σ 1 = σ 2 = 1. Antag X 1 X 2 = 1. Giver det anledning til at betvivle µ 1 = µ 2? 10/18

11 Fordeling af S 2 = ( n i=1 (X i X) 2 )/(n 1) Sum af m uafhængige kvadrerede standardnormal fordelte stokastiske variable er χ 2 fordelt med m frihedsgrader Dvs. n ( ) Xi µ 2 χ 2 (n) fordelt i=1 σ Hvis µ er ukendt mistes en frihedsgrad (tab af information) n ( ) 2 Xi X χ 2 (n 1) fordelt Konklusion i=1 (n 1) σ 2 S 2 = σ n ( ) 2 Xi X χ 2 (n 1) fordelt i=1 σ Forudsætning: X 1,...,X n stikprøve fra normalfordelt population. 11/18

12 Ex 8.10 side 256 Stikprøve (levetider for batterier). Giver stikprøve anledning til at betvivle σ = 1? Løsning: s2 = 3.26 ligger mellem 2.5% og 97.5 % fraktiler for χ 2 (4). Dvs. observeret værdi af s 2 ikke ekstrem i forhold til fordelingen af S 2. 12/18

13 t-fordeling Antag σ ukendt. Kigger da på t = X µ S/ n i stedet for Z = X µ σ/ n Hvis normalfordelt stikprøve af størrelse n er X µ S/ n t fordelt med n 1 frihedsgrader Når n meget stor er S 2 stort set lig σ 2 hvorved t = Z. Dvs t(n 1) N(0, 1) når n stor. 13/18

14 Ex t fordeling med 2, 5 og 100 frihedsgrader: density t 14/18

15 Example 8.14 side 260 Påstand µ = 500. Antag n = 25, x = 518 og s = 40. Er dette i overeenstemmelse med påstand? 15/18

16 Statistisk inferens: parameter estimation Statistisk inferens: estimation af populationsparametre θ test af hypoteser vedr. θ Example 8.7 θ = µ og ˆθ = X estimat af θ. Hypotese µ = 5? 16/18

17 Middelværdirette estimater Fra slide 4 vides at E X = µ Dvs. X middelværdiret (unbiased) estimat af µ. Estimat rammer rigtigt i snit S 2 middelværdiret estimat af σ 2? ES 2 = E σ2 n 1 n 1 σ 2 S2 = σ2 n 1 E n 1 σ 2 S2 = σ2 (n 1) = σ2 n 1 (middelværdi for χ 2 (n 1) er lig n 1.) 17/18

18 Efficient estimat For en normalfordelt stikprøve er X og X (median) begge middelværdirette estimater af µ. Ex histogrammer af X og X for stikprøver hver med n = 10. Histogram of barx Histogram of medx Frequency Frequency barx medx Bemærk: Var X = 0.14 og Var X = 0.1. Dvs. X mere præcist (efficient) estimat end X. 18/18