Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Relaterede dokumenter
t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Hvorfor er normalfordelingen så normal?

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Tema. Dagens tema: Indfør centrale statistiske begreber.

Produkt og marked - matematiske og statistiske metoder

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Højde af kvinder 2 / 18

Kvantitative Metoder 1 - Forår 2007

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Normalfordelingen og Stikprøvefordelinger

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Konfidensintervaller og Hypotesetest

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Nanostatistik: Opgavebesvarelser

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Nanostatistik: Konfidensinterval

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

StatDataN: Test af hypotese

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Nanostatistik: Test af hypotese

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Løsning eksamen d. 15. december 2008

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Lidt om fordelinger, afledt af normalfordelingen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Uge 10 Teoretisk Statistik 1. marts 2004

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

En Introduktion til SAS. Kapitel 5.

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Preben Blæsild og Jens Ledet Jensen

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Kvantitative Metoder 1 - Forår Dagens program

Vejledende besvarelser til opgaver i kapitel 14

Kursus Introduktion til Statistik. Oversigt, Inferens for gennemsnit (One-sample setup)

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Løsning til eksaminen d. 29. maj 2009

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Statistiske modeller

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Basal statistik. 11.september Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke

StatDataN: Plot af data

Basal statistik. 11.september 2007

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

1 Hb SS Hb Sβ Hb SC = , (s = )

Opgaver til kapitel 3

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Estimation og usikkerhed

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Statistiske principper

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse

Kvantitative Metoder 1 - Efterår Dagens program

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Kapitel 12 Variansanalyse

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Kvantitative Metoder 1 - Forår 2007

Løsninger til kapitel 6

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Transkript:

Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve) Sample 1: 0.9707727 1.8184993-0.5679272 0.5848434 0.4286343-2.0832521 0.9132965 0.3623205-0.0942689-2.4659896 2.6249701 1.4474366-1.3709333 0.1721564-0.5703357-0.1290553-0.4665710-0.3825574 0.4134650 0.4252125 Sample 2: 0.32893797 1.47024795 0.03953137 0.68587009 1.04228253-0.36957645 0.55702599 1.54256912 0.42377482 0.53957533-0.17476243 0.50346420 1.06354010-0.33748767-0.24773729 0.17813650 0.74056791-2.72659878-0.20659909 0.86055465. Sample 10: 2/18

Empirisk middelværdi for alle stikprøver (gennemsnit af gennemsnit) Histogram of barx Frequency 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.2 0.0 0.1 0.2 0.3 0.4 barx 3/18

Teoretisk fordeling af X E X = E 1 n (X 1 + + X n ) = 1 n nµ = µ Var X = Var 1 n (X 1 + + X n ) = 1 n 2nσ2 = σ 2 /n Normalfordelt stikprøve X normalfordelt. Ex: antag X gennemsnit af 20 normalfordelte variable med middelværdi 5 og varians 2. Hvad er sandsynligheden for, at P( X > 5.5)? 4/18

Centrale grænseværdisætning (CLT) Antag X 1,...,X n tilfældig stikprøve fra population f (x) med middelværdi µ og varians σ 2. Når n går mod uendelig vil blive standard normal fordelt. Z = X µ σ/ n NB: resultat gælder uanset hvad f (x) er! NB: Z N(0, 1) X = σz/ n + µ N(µ, σ 2 /n) 5/18

Ex Stikprøve fra χ 2 fordeling med 3 friheds grader. µ = 3 σ 2 = 6. Histogram af 10000 X når n er henholdsvis 10, 40 og 100: Histogram of barx Histogram of barx Histogram of barx Frequency 0 500 1000 2000 Frequency 0 500 1000 1500 2000 Frequency 0 500 1500 2500 1 2 3 4 5 6 7 barx 2.0 2.5 3.0 3.5 4.0 4.5 5.0 barx 2.0 2.5 3.0 3.5 4.0 barx 6/18

Ex 8.6 side 245 (levetid for elektriske pærer) X baseret på stikprøve med 16 observationer med µ = 800 og σ = 40. Hvad er sandsynligheden for at X < 775? 7/18

Ex 8.7 side 246 En underleverandør producerer komponenter der skal have middeldiameter 5 mm (det vides σ = 0.1). En stikprøve med n = 100 udtages og x = 5.027. Giver det anledning til at sætte spørgsmål ved µ = 5? Løsning: x = 5.027 er ikke en usædvanlig stor afvigelse fra µ = 5 hvis der er stor sandsynlighed for at observere en endnu større afvigelse (under antagelse af, at µ = 5) 8/18

To stikprøver X 1 baseret på stikprøve af størrelse n 1 fra population med middelværdi µ 1 og varians σ 2 1. X 2 baseret på stikprøve af størrelse n 2 fra population med middelværdi µ 2 og varians σ 2 2. Fordeling af differens X 1 X 2 : E( X 1 X 2 ) = E X 1 E X 2 = µ 1 µ 2 Var( X 1 X 2 ) = Var X 1 + Var X 2 = σ2 1 n 1 + σ2 2 n 2 X 1 og X 2 approksimativt normalfordelte (CLT) X 1 X 2 approximativt normalfordelt. 9/18

Ex 8.8 side 249 n 1 = n 2 = 18 og σ 1 = σ 2 = 1. Antag X 1 X 2 = 1. Giver det anledning til at betvivle µ 1 = µ 2? 10/18

Fordeling af S 2 = ( n i=1 (X i X) 2 )/(n 1) Sum af m uafhængige kvadrerede standardnormal fordelte stokastiske variable er χ 2 fordelt med m frihedsgrader Dvs. n ( ) Xi µ 2 χ 2 (n) fordelt i=1 σ Hvis µ er ukendt mistes en frihedsgrad (tab af information) n ( ) 2 Xi X χ 2 (n 1) fordelt Konklusion i=1 (n 1) σ 2 S 2 = σ n ( ) 2 Xi X χ 2 (n 1) fordelt i=1 σ Forudsætning: X 1,...,X n stikprøve fra normalfordelt population. 11/18

Ex 8.10 side 256 Stikprøve 1.9 2.4 3.0 3.5 4.2 (levetider for batterier). Giver stikprøve anledning til at betvivle σ = 1? Løsning: 5 1 1 s2 = 3.26 ligger mellem 2.5% og 97.5 % fraktiler for χ 2 (4). Dvs. observeret værdi af s 2 ikke ekstrem i forhold til fordelingen af S 2. 12/18

t-fordeling Antag σ ukendt. Kigger da på t = X µ S/ n i stedet for Z = X µ σ/ n Hvis normalfordelt stikprøve af størrelse n er X µ S/ n t fordelt med n 1 frihedsgrader Når n meget stor er S 2 stort set lig σ 2 hvorved t = Z. Dvs t(n 1) N(0, 1) når n stor. 13/18

Ex t fordeling med 2, 5 og 100 frihedsgrader: density 0.0 0.1 0.2 0.3 0.4 6 4 2 0 2 4 6 t 14/18

Example 8.14 side 260 Påstand µ = 500. Antag n = 25, x = 518 og s = 40. Er dette i overeenstemmelse med påstand? 15/18

Statistisk inferens: parameter estimation Statistisk inferens: estimation af populationsparametre θ test af hypoteser vedr. θ Example 8.7 θ = µ og ˆθ = X estimat af θ. Hypotese µ = 5? 16/18

Middelværdirette estimater Fra slide 4 vides at E X = µ Dvs. X middelværdiret (unbiased) estimat af µ. Estimat rammer rigtigt i snit S 2 middelværdiret estimat af σ 2? ES 2 = E σ2 n 1 n 1 σ 2 S2 = σ2 n 1 E n 1 σ 2 S2 = σ2 (n 1) = σ2 n 1 (middelværdi for χ 2 (n 1) er lig n 1.) 17/18

Efficient estimat For en normalfordelt stikprøve er X og X (median) begge middelværdirette estimater af µ. Ex histogrammer af X og X for 10000 stikprøver hver med n = 10. Histogram of barx Histogram of medx Frequency 0 500 1000 1500 2000 Frequency 0 500 1000 1500 2000 1.0 0.5 0.0 0.5 1.0 barx 1.5 1.0 0.5 0.0 0.5 1.0 1.5 medx Bemærk: Var X = 0.14 og Var X = 0.1. Dvs. X mere præcist (efficient) estimat end X. 18/18