Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve) Sample 1: 0.9707727 1.8184993-0.5679272 0.5848434 0.4286343-2.0832521 0.9132965 0.3623205-0.0942689-2.4659896 2.6249701 1.4474366-1.3709333 0.1721564-0.5703357-0.1290553-0.4665710-0.3825574 0.4134650 0.4252125 Sample 2: 0.32893797 1.47024795 0.03953137 0.68587009 1.04228253-0.36957645 0.55702599 1.54256912 0.42377482 0.53957533-0.17476243 0.50346420 1.06354010-0.33748767-0.24773729 0.17813650 0.74056791-2.72659878-0.20659909 0.86055465. Sample 10: 2/18
Empirisk middelværdi for alle stikprøver (gennemsnit af gennemsnit) Histogram of barx Frequency 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.2 0.0 0.1 0.2 0.3 0.4 barx 3/18
Teoretisk fordeling af X E X = E 1 n (X 1 + + X n ) = 1 n nµ = µ Var X = Var 1 n (X 1 + + X n ) = 1 n 2nσ2 = σ 2 /n Normalfordelt stikprøve X normalfordelt. Ex: antag X gennemsnit af 20 normalfordelte variable med middelværdi 5 og varians 2. Hvad er sandsynligheden for, at P( X > 5.5)? 4/18
Centrale grænseværdisætning (CLT) Antag X 1,...,X n tilfældig stikprøve fra population f (x) med middelværdi µ og varians σ 2. Når n går mod uendelig vil blive standard normal fordelt. Z = X µ σ/ n NB: resultat gælder uanset hvad f (x) er! NB: Z N(0, 1) X = σz/ n + µ N(µ, σ 2 /n) 5/18
Ex Stikprøve fra χ 2 fordeling med 3 friheds grader. µ = 3 σ 2 = 6. Histogram af 10000 X når n er henholdsvis 10, 40 og 100: Histogram of barx Histogram of barx Histogram of barx Frequency 0 500 1000 2000 Frequency 0 500 1000 1500 2000 Frequency 0 500 1500 2500 1 2 3 4 5 6 7 barx 2.0 2.5 3.0 3.5 4.0 4.5 5.0 barx 2.0 2.5 3.0 3.5 4.0 barx 6/18
Ex 8.6 side 245 (levetid for elektriske pærer) X baseret på stikprøve med 16 observationer med µ = 800 og σ = 40. Hvad er sandsynligheden for at X < 775? 7/18
Ex 8.7 side 246 En underleverandør producerer komponenter der skal have middeldiameter 5 mm (det vides σ = 0.1). En stikprøve med n = 100 udtages og x = 5.027. Giver det anledning til at sætte spørgsmål ved µ = 5? Løsning: x = 5.027 er ikke en usædvanlig stor afvigelse fra µ = 5 hvis der er stor sandsynlighed for at observere en endnu større afvigelse (under antagelse af, at µ = 5) 8/18
To stikprøver X 1 baseret på stikprøve af størrelse n 1 fra population med middelværdi µ 1 og varians σ 2 1. X 2 baseret på stikprøve af størrelse n 2 fra population med middelværdi µ 2 og varians σ 2 2. Fordeling af differens X 1 X 2 : E( X 1 X 2 ) = E X 1 E X 2 = µ 1 µ 2 Var( X 1 X 2 ) = Var X 1 + Var X 2 = σ2 1 n 1 + σ2 2 n 2 X 1 og X 2 approksimativt normalfordelte (CLT) X 1 X 2 approximativt normalfordelt. 9/18
Ex 8.8 side 249 n 1 = n 2 = 18 og σ 1 = σ 2 = 1. Antag X 1 X 2 = 1. Giver det anledning til at betvivle µ 1 = µ 2? 10/18
Fordeling af S 2 = ( n i=1 (X i X) 2 )/(n 1) Sum af m uafhængige kvadrerede standardnormal fordelte stokastiske variable er χ 2 fordelt med m frihedsgrader Dvs. n ( ) Xi µ 2 χ 2 (n) fordelt i=1 σ Hvis µ er ukendt mistes en frihedsgrad (tab af information) n ( ) 2 Xi X χ 2 (n 1) fordelt Konklusion i=1 (n 1) σ 2 S 2 = σ n ( ) 2 Xi X χ 2 (n 1) fordelt i=1 σ Forudsætning: X 1,...,X n stikprøve fra normalfordelt population. 11/18
Ex 8.10 side 256 Stikprøve 1.9 2.4 3.0 3.5 4.2 (levetider for batterier). Giver stikprøve anledning til at betvivle σ = 1? Løsning: 5 1 1 s2 = 3.26 ligger mellem 2.5% og 97.5 % fraktiler for χ 2 (4). Dvs. observeret værdi af s 2 ikke ekstrem i forhold til fordelingen af S 2. 12/18
t-fordeling Antag σ ukendt. Kigger da på t = X µ S/ n i stedet for Z = X µ σ/ n Hvis normalfordelt stikprøve af størrelse n er X µ S/ n t fordelt med n 1 frihedsgrader Når n meget stor er S 2 stort set lig σ 2 hvorved t = Z. Dvs t(n 1) N(0, 1) når n stor. 13/18
Ex t fordeling med 2, 5 og 100 frihedsgrader: density 0.0 0.1 0.2 0.3 0.4 6 4 2 0 2 4 6 t 14/18
Example 8.14 side 260 Påstand µ = 500. Antag n = 25, x = 518 og s = 40. Er dette i overeenstemmelse med påstand? 15/18
Statistisk inferens: parameter estimation Statistisk inferens: estimation af populationsparametre θ test af hypoteser vedr. θ Example 8.7 θ = µ og ˆθ = X estimat af θ. Hypotese µ = 5? 16/18
Middelværdirette estimater Fra slide 4 vides at E X = µ Dvs. X middelværdiret (unbiased) estimat af µ. Estimat rammer rigtigt i snit S 2 middelværdiret estimat af σ 2? ES 2 = E σ2 n 1 n 1 σ 2 S2 = σ2 n 1 E n 1 σ 2 S2 = σ2 (n 1) = σ2 n 1 (middelværdi for χ 2 (n 1) er lig n 1.) 17/18
Efficient estimat For en normalfordelt stikprøve er X og X (median) begge middelværdirette estimater af µ. Ex histogrammer af X og X for 10000 stikprøver hver med n = 10. Histogram of barx Histogram of medx Frequency 0 500 1000 1500 2000 Frequency 0 500 1000 1500 2000 1.0 0.5 0.0 0.5 1.0 barx 1.5 1.0 0.5 0.0 0.5 1.0 1.5 medx Bemærk: Var X = 0.14 og Var X = 0.1. Dvs. X mere præcist (efficient) estimat end X. 18/18