Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Relaterede dokumenter
Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Forelæsning 9: Inferens for andele (kapitel 10)

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 11: Kapitel 11: Regressionsanalyse

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Eksamen i Statistik for biokemikere. Blok

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Vejledende besvarelser til opgaver i kapitel 14

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Tema. Dagens tema: Indfør centrale statistiske begreber.

Vejledende løsninger kapitel 8 opgaver

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

(studienummer) (underskrift) (bord nr)

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Kapitel 7 Forskelle mellem centraltendenser

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Kursus Introduktion til Statistik. Oversigt, Inferens for gennemsnit (One-sample setup)

Kapitel 12 Variansanalyse

Oversigt. Kursus Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Test nr. 4 af centrale elementer 02402

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Forsøgsplanlægning Stikprøvestørrelse

Løsning eksamen d. 15. december 2008

Test nr. 5 af centrale elementer 02402

Besvarelser til øvelsesopgaver i uge 6

Kapitel 12 Variansanalyse

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Multiple choice opgaver

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Løsninger til kapitel 9

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Løsning til eksamen d.27 Maj 2010

Test nr. 6 af centrale elementer 02402

Opgaver til kapitel 3

Løsning til eksaminen d. 14. december 2009

Forelæsning 11: Envejs variansanalyse, ANOVA

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Module 4: Ensidig variansanalyse

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

(studienummer) (underskrift) (bord nr)

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Forsøgsplanlægning Stikprøvestørrelse

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

1 Hb SS Hb Sβ Hb SC = , (s = )

Om hypoteseprøvning (1)

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Løsning til eksaminen d. 29. maj 2009

Personlig stemmeafgivning

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Kvantitative Metoder 1 - Efterår Dagens program

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Transkript:

Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbb@imm.dtu.dk Oversigt 1 Motiverende eksempel 2 3 Hypotesetest i praksis I P-værdi 4 Hypotesetest i praksis II Kritisk værdi - fortsat 5 One-sample hypotesetest uden "kendt varians 6 R (R note 7) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 1 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 2 / 34 Motiverende eksempel Motiverende eksempel Test af hypoteser En producent af pc skærme oplyser, at skærmen i gennemsnit bruger 83 W. Desuden kan det antages, at forbruget er normalfordelt med kendt varians σ 2 = 4 2 (W) 2. En forbrugergruppe vil nu afprøve producentens påstand og planlægger at udføre et antal målinger af strømforbruget for den pågældende type pc skærm. Formuler nul og alternativ hypotese. Vi betragter en parameter µ Ofte vil der være en forhåndsinteresse knyttet til en bestemt værdi af µ. Vi ønsker derfor at teste, dvs acceptere eller forkaste, hypotesen µ = µ 0 Da estimatet af µ er underkastet tilfældig variation, kan man ikke forvente at ˆµ = µ 0 selvom de faktisk er ens. Spørgsmålet er altså hvordan man skal forholde sig i sammenligningen af ˆµ og µ 0 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 4 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 6 / 34

Hypoteser tosidet alternativ nul hypotese testes mod en alternativ hypotese H 0 : µ = µ 0 H 1 : µ µ 0 Man vælger enten at acceptere H 0 eller at forkaste H 0 H 0 : µ = µ 0 H 1 : µ µ 0 Vælges et ensidet alternativ, bliver H 1 enten H 1 : µ < µ 0 eller H 1 : µ > µ 0 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 7 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 8 / 34 Hypoteseprøvning Et par tommelfingerregler ved formulering af hypoteser: I nulhypotesen anvendes så vidt som muligt lighedstegn I den alternative hypotese placeres det udsagn som man gerne vil vise Når man tester statistiske hypoteser, kan man i princippet begå to typer af fejl: Type I: Fejlagtig forkaste H 0 når H 0 er sand Type II: Fejlagtig acceptere H 0 når H 1 er sand Vi definerer P (fejl af type I) = α P (fejl af type II) = β Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 9 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 10 / 34

Analogi Analogi En mand stilles for en dommer, anklaget for noget kriminelt. Nulhypotese og alternativ hypotese bliver: H 0 : H 1 : Manden er ikke skyldig Manden er skyldig Hvilke fejl kan begås? Type I: Fejlagtig forkaste H 0 når H 0 er sand dvs. manden er uskyldig men dømmes skyldig (α) Type II: Fejlagtig acceptere H 0 når H 1 er sand dvs. manden er skyldig men frikendes (β) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 11 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 12 / 34 Trin ved Hypotesetest Hypotesetest i praksis I Hypotesetest Hypotesetest i praksis I 1 Opstil hypoteser og vælg signifikansniveau α (vælg "risiko-niveau") 2 Beregn teststørrelse (se på data) 3 Beregn p-værdi vha. teststørrelse(mål forskellen på data og hypotesen) 4 Samenlign p-værdi med signifikansniveau og drag en konklusion alternativt til (3)-(4) kan testet udføres ved at sammenligne teststørrelse med kritisk værdi Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 14 / 34 Antager at data (stikprøve) kommer fra en normalfordeling, dvs. x 1,..., x n N(µ, σ 2 ) ELLER: stor stikprøve (n > 30) vi ønsker at teste en nul hypotese om middelværdien, f.eks. H 0 : µ = µ 0 hvor µ 0 kan være en vilkårlig værdi af interesse. Afhængig af hvad vi ønsker at påvise vælges alternativ hypotese. Herefter vælges signifikansniveau α Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 15 / 34

Hypotesetest i praksis I Beregning af teststørrelse Beregning af p-værdi Hypotesetest i praksis I P-værdi Vi antager, at vi har formuleret en nulhypotese og en alternativ hypotese, og har valgt et signifikansniveau α. Herefter skal en teststørrelse beregnes. Ved hypotesetest af én middelværdi for data, der antages normalfordelt og σ er kendt, fås teststørrelsen: Z = X µ 0 σ/ n Testets p-værdi måler data s afvigelser fra H 0 Ved hypotesetest af én middelværdi for data der antages normalfordelt og σ er kendt, fås p-værdien for teststørrelsen Z ved opslag i normalfordelingen (tabel 3) Hvis p-værdien er mindre end signifikansniveauet, afvises H 0 Hvis p-værdien er større end signifikansniveauet, accepteres H 0 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 16 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 17 / 34 Hypotesetest i praksis I Hypotesetest i praksis I En producent af pc skærme oplyser, at skærmen i gennemsnit bruger 83 W. Desuden kan det antages, at forbruget er normalfordelt med kendt varians σ 2 = 4 2 (W) 2. En forbrugergruppe vil nu afprøve producentens påstand og planlægger at udføre et antal målinger af strømforbruget for den pågældende type pc skærm. Formuler nul og alternativ hypotese. Der udføres nu 12 målinger af forbruget: 82 86 84 84 92 83 93 80 83 84 82 86 Herfra estimeres middelforbruget til x = 84.92. Udfør hypotesetestet. Anvend signifikansniveau α = 1% Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 18 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 19 / 34

Hypotesetest i praksis I Hypotesetest i praksis II Kritisk værdi Sammenligning med kritisk værdi: Alternativt kan hypotesetestet udføres ved at sammenligne teststørrelse med kritisk værdi z α (eller z α/2 i et tosidet test) Ved hypotesetest af én middelværdi for data der antages normalfordelt og σ er kendt, fås Alternativ Afvis hypotese nul-hypotese hvis µ < µ 0 Z < z α µ > µ 0 Z > z α µ µ 0 Z < z α/2 eller Z > z α/2 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 20 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 22 / 34 Hypotesetest i praksis II - fortsat Eksempel I - nu med kritisk værdi i stedet One-sample hypotesetest uden "kendt varians Beregning af teststørrelse Ved hypoteseprøvning af én middelværdi for data der antages normalfordelt hvor σ er ukendt, men stor stikprøve (n > 30), fås teststørrelsen Z = X µ 0 s/ n Idet Z N(0, 1 2 ) fås p-værdien for teststørrelsen Z ved opslag i normalfordelingen (tabel 3) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 23 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 25 / 34

One-sample hypotesetest uden "kendt varians Sammenligning med kritisk værdi Alternativt kan hypotesetestet udføres ved at sammenligne teststørrelse med kritisk værdi z α (eller z α/2 i et tosidet test). Ved hypoteseprøvning af én middelværdi for data der antages normalfordelt hvor σ er ukendt, men stor stikprøve, fås Alternativ Afvis hypotese nul-hypotese hvis µ < µ 0 Z < z α µ > µ 0 Z > z α µ µ 0 Z < z α/2 eller Z > z α/2 One-sample hypotesetest uden "kendt varians Beregning af teststørrelse Ved hypoteseprøvning af én middelværdi for data der antages normalfordelt og σ er ukendt, og stikprøven er lille (n < 30), fås teststørrelsen t = X µ 0 s/ n Idet t t(n 1) fås p-værdien for teststørrelsen t ved opslag i t-fordelingen (tabel 4) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 26 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 27 / 34 One-sample hypotesetest uden "kendt varians Sammenligning med kritisk værdi Alternativt kan hypotesetestet udføres ved at sammenligne teststørrelse med kritisk værdi t α (eller t α/2 i et tosidet test). Ved hypoteseprøvning af én middelværdi for data der antages normalfordelt og σ er ukendt og stikprøven er lille, fås Alternativ Afvis hypotese nul-hypotese hvis µ < µ 0 t < t α µ > µ 0 t > t α µ µ 0 t < t α/2 eller t > t α/2 One-sample hypotesetest uden "kendt varians I et amerikansk studie ønskede man at sammenligne indhold af arsenik i drikkevandet ved 8 forskellige lokaliteter: lokalitet vandprøve (ppm) 1 2.2 2 4.1 3 2.1 4 0.8 5 0.1 6 3.2 7 2.9 8 2.2 x = 2.2 og s 2 x = 1.64 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 28 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 29 / 34

One-sample hypotesetest uden "kendt varians One-sample hypotesetest uden "kendt varians Sundhedsmyndighederne vil gerne teste om middelindhold i drikkevandet kan antages at være 2 ppm. Udfør dette hypotesetest ved anvendelse af signifikansniveau α = 5% Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 30 / 34 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 31 / 34 R (R note 7) R (R note 7) Oversigt R (R note 7) > x=c(10,13,16,19,17,15,20,23,15,16) > t.test(x,mu=20,conf.level=0.99) One-sample t-test data: x t = -3.1125, df = 9, p-value = 0.0125 alternative hypothesis: mean is not equal to 20 99 percent confidence interval: 12.64116 20.15884 sample estimates: mean of x 16.4 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 33 / 34 1 Motiverende eksempel 2 3 Hypotesetest i praksis I P-værdi 4 Hypotesetest i praksis II Kritisk værdi - fortsat 5 One-sample hypotesetest uden "kendt varians 6 R (R note 7) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 6 Foråret 2013 34 / 34