Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Relaterede dokumenter

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 9: Inferens for andele (kapitel 10)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Konfidensinterval for µ (σ kendt)

Note til styrkefunktionen

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Modul 5: Test for én stikprøve

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Konfidensintervaller og Hypotesetest

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Oversigt. Kursus Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Forelæsning 11: Kapitel 11: Regressionsanalyse

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

02402 Løsning til testquiz02402f (Test VI)

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Vejledende besvarelser til opgaver i kapitel 14

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Forelæsning 10: Statistik ved hjælp af simulering

Kapitel 7 Forskelle mellem centraltendenser

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

En intro til radiologisk statistik

Test nr. 4 af centrale elementer 02402

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Løsning eksamen d. 15. december 2008

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Susanne Ditlevsen Institut for Matematiske Fag susanne

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Eksamen i Statistik for biokemikere. Blok

To-sidet varians analyse

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Løsning til eksaminen d. 14. december 2009

c) For, er, hvorefter. Forklar.

Test nr. 5 af centrale elementer 02402

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Tema. Dagens tema: Indfør centrale statistiske begreber.

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Løsninger til kapitel 9

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

Forsøgsplanlægning Stikprøvestørrelse

Module 12: Mere om variansanalyse

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Schweynoch, Se eventuelt

Statistik i basketball

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

(studienummer) (underskrift) (bord nr)

Modul 12: Exercises Sukkersygepatienters vægt

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Kvantitative Metoder 1 - Forår Dagens program

Test nr. 6 af centrale elementer 02402

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Forelæsning 1: Intro og beskrivende statistik

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel

Forelæsning 11: Envejs variansanalyse, ANOVA

da er X 1 + X 2 N(µ 1 + µ 2,σ1 2 + σ2) Hvis X 1,...,X n er uafhængige og X r N(µ,σ 2 ), da er X = 1 n (X X n ) N(µ, σ2

Besvarelser til øvelsesopgaver i uge 6

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Løsning til eksaminen d. 29. maj 2009

Normalfordelingen. Statistik og Sandsynlighedsregning 2

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Vejledende løsninger kapitel 8 opgaver

Klasseøvelser dag 2 Opgave 1

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Kapitel 12 Variansanalyse

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Oversigt: De næste forelæsninger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Transkript:

Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: perbb@dtu.dk Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 1 / 40

Oversigt 1 Hypotesetest - en repetition Hypotesetest og konfidensintervaller 2 Styrke og stikprøvestørrelse 3 Hypotesetest for to gennemsnit Eksempel 1 Generel formulering Med kendt varians Med "ukendt" varians - store stikprøver Med "ukendt" varians - små stikprøver, normalfordelinger Eksempel 1 - fortsat 4 Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 2 5 Parret t-test Eksempel 2 - fortsat 6 R (R note 7) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 2 / 40

Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Hypotesetest (7.7-7.8,8.1-8.5) Test og konfidensintervaller Hypotesetest for to gennemsnit Randomisering og parring R Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 3 / 40

Hypotesetest - en repetition Oversigt 1 Hypotesetest - en repetition Hypotesetest og konfidensintervaller 2 Styrke og stikprøvestørrelse 3 Hypotesetest for to gennemsnit Eksempel 1 Generel formulering Med kendt varians Med "ukendt" varians - store stikprøver Med "ukendt" varians - små stikprøver, normalfordelinger Eksempel 1 - fortsat 4 Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 2 5 Parret t-test Eksempel 2 - fortsat 6 R (R note 7) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 4 / 40

Hypotesetest - en repetition Hypoteser nul hypotese testes mod en alternativ hypotese H 0 : µ = µ 0 H 1 : µ µ 0 Bemærk: bevisbyrden er lagt på H 0. Man vælger enten at acceptere H 0 eller at forkaste H 0 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 5 / 40

Hypotesetest - en repetition Hypoteser Et par tommelfingerregler ved formulering af hypoteser: I nulhypotesen anvendes så vidt muligt lighedstegn = I den alternative hypotese placeres det udsagn som man gerne vil vise Den alternative hypotese kan enten være ensidet eller tosidet, afhængig af hvad man gerne vil vise tosidet: ensidet: < eller > Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 6 / 40

Hypotesetest - en repetition Hypoteser Når man tester statistiske hypoteser, kan man i princippet begå to typer af fejl: Type I: Fejlagtig forkaste H 0 når H 0 er sand Type II: Fejlagtig acceptere H 0 når H 1 er sand Vi definerer: P (fejl af type I) = α P (fejl af type II) = β Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 7 / 40

Hypotesetest - en repetition Eksempel: formulering af hypoteser Et ambulancefirma påstår at det i gennemsnit tager 20 minutter fra et opkald til centralen modtages indtil en ambulance er på stedet. Eksempelvis kan vi have målt tiderne: 21.1 22.3 19.6 24.2... Hvis vi f.eks. ønsker at påvise, at det i gennemsnit tager længere tid end 20 minutter, bliver nul- og alternativ hypotese: H 0 : µ = 20 minutter H 1 : µ > 20 minutter Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 8 / 40

Hypotesetest - en repetition Eksempel Hvilke fejl kan begås? Type I: Fejlagtig forkaster H 0 når H 0 er sand dvs. man fejlagtig konkluderer at det tager længere tid for ambulancen at nå frem end 20 minutter Type II: Fejlagtig accepterer H 0 når H 1 er sand dvs. man fejlagtig konkluderer at det tager 20 minutter for ambulancen at nå frem Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 9 / 40

Hypotesetest - en repetition Valg af signifikansniveau α Man vælger signifikansniveau α ud fra hvor stor type I fejl man kan acceptere Typisk vælges α = 5% Såfremt man vil reducere fejlen for en type I fejl må α vælges mindre, f.eks. α = 1% Et mindre signifikansniveau betyder at det bliver sværere at påvise H 1 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 10 / 40

Hypotesetest - en repetition Trin ved Hypotesetest 1 Opstil hypoteser og vælg signifikansniveau α (vælg "risiko-niveau") 2 Beregn teststørrelse (se på data) 3 Beregn p-værdi vha. teststørrelse(mål forskellen på data og hypotesen) 4 Samenlign p-værdi med signifikansniveau og drag en konklusion alternativt til (3)-(4) kan testet udføres ved at sammenligne teststørrelse med kritisk værdi Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 11 / 40

Hypotesetest - en repetition Hypotesetest og konfidensintervaller Sammenhæng mellem hypoteseprøvning og konfidensintervaller Vi betragter (1 α)100% konfidensinterval for µ (eksempel for lille n og ukendt σ): x t α/2 s n < µ < x + t α/2 s n Konfidensintervallet svarer til acceptområdet (af H 0 ), når man tester hypotesen (med to-sidet alternativ): H 0 : µ = µ 0 H 1 : µ µ 0 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 12 / 40

Styrke og stikprøvestørrelse Oversigt 1 Hypotesetest - en repetition Hypotesetest og konfidensintervaller 2 Styrke og stikprøvestørrelse 3 Hypotesetest for to gennemsnit Eksempel 1 Generel formulering Med kendt varians Med "ukendt" varians - store stikprøver Med "ukendt" varians - små stikprøver, normalfordelinger Eksempel 1 - fortsat 4 Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 2 5 Parret t-test Eksempel 2 - fortsat 6 R (R note 7) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 13 / 40

Styrke og stikprøvestørrelse Styrke og stikprøvestørrelse Hvordan kan sandsynligheden for fejl påvirkes? Ændre signifikansniveau α Øge stikprøvestørrelsen, n Testets styrke defineres ved 1 β Afsnit 7.7 Krævet stikprøvestørrelse givet en ønsket styrke: ( n = σ z ) 2 β + z α (µ 0 µ 1 ) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 14 / 40

Hypotesetest for to gennemsnit Oversigt 1 Hypotesetest - en repetition Hypotesetest og konfidensintervaller 2 Styrke og stikprøvestørrelse 3 Hypotesetest for to gennemsnit Eksempel 1 Generel formulering Med kendt varians Med "ukendt" varians - store stikprøver Med "ukendt" varians - små stikprøver, normalfordelinger Eksempel 1 - fortsat 4 Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 2 5 Parret t-test Eksempel 2 - fortsat 6 R (R note 7) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 15 / 40

Hypotesetest for to gennemsnit Eksempel 1 Eksempel 1 I et ernæringsstudie ønsker man at undersøge om der er en forskel i energiforbrug for forskellige typer (moderat fysisk krævende) arbejde. I studiet har man målt energiforbruget for 9 sekretærer, som forventes at have et stillesiddende arbejde, og 9 sygeplejersker, som forventes at have et lidt mere fysisk betonet arbejde. Målingerne, angivet i MJ, er givet i nedenstående tabel: Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 16 / 40

Hypotesetest for to gennemsnit Eksempel 1 Eksempel 1 A (sekretærer) B (sygeplejersker) 7.53 9.21 7.48 11.51 8.08 12.79 8.09 11.85 10.15 9.97 8.40 8.79 10.88 9.69 6.13 9.68 7.90 9.19 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 17 / 40

Hypotesetest for to gennemsnit Generel formulering Hypotesetest for to gennemsnit Vi sammenligner gennemsnit (middelværdier) af 2 stikprøver Stikprøve 1: n 1, x 1 og s 2 1 Stikprøve 2: n 2, x 2 og s 2 2 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 18 / 40

Hypotesetest for to gennemsnit Generel formulering Formulering af Hypoteser nul hypotese testes mod en alternativ hypotese (her vist for et to-sidet alternativ) H 0 : H 1 : µ 1 µ 2 = δ µ 1 µ 2 δ Man vælger enten at acceptere H 0 eller at forkaste H 0 (Typisk er man interesseret i at teste med δ = 0) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 19 / 40

Hypotesetest for to gennemsnit Med kendt varians 2. Beregning af teststørrelse Ved hypoteseprøvning af 2 middelværdier (µ 1 og µ 2 ) for data, der antages normalfordelt og varianser σ 2 1 og σ 2 2 er kendte, fås teststørrelsen Z = ( X 1 X 2 ) δ σ 2 1 /n 1 + σ 2 2 /n 2 Det følger under nul hypotesen at Z N(0, 1 2 ). Herfra kan testets p-værdi beregnes Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 20 / 40

Hypotesetest for to gennemsnit Med kendt varians Sammenligning med kritisk værdi Ved hypoteseprøvning af to middelværdier (µ 1 og µ 2 ) for data, der antages normalfordelt og σ1 2 og σ2 2 er kendte, fås Alternativ Afvis hypotese nul-hypotese hvis µ 1 µ 2 < δ Z < z α µ 1 µ 2 > δ Z > z α µ 1 µ 2 δ Z < z α/2 eller Z > z α/2 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 21 / 40

Hypotesetest for to gennemsnit Med "ukendt" varians - store stikprøver Beregning af teststørrelse Ved hypoteseprøvning af to middelværdier (µ 1 og µ 2 ) for data hvor σ 2 1 og σ 2 2 er ukendte, men for store stikprøver, fås teststørrelsen Z = ( X 1 X 2 ) δ s 2 1 /n 1 + s 2 2 /n 2 Det følger under nul hypotesen at Z N(0, 1 2 ). Herfra kan testets p-værdi beregnes. Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 22 / 40

Hypotesetest for to gennemsnit Med "ukendt" varians - store stikprøver Sammenligning med kritisk værdi Ved hypoteseprøvning af to middelværdi for data hvor σ1 2 og σ2 2 er ukendte, men vi har store stikprøver, fås Alternativ Afvis hypotese nul-hypotese hvis µ 1 µ 2 < δ Z < z α µ 1 µ 2 > δ Z > z α µ 1 µ 2 δ Z < z α/2 eller Z > z α/2 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 23 / 40

Hypotesetest for to gennemsnit Med "ukendt" varians - små stikprøver, normalfordelinger Beregning af teststørrelse Ved hypoteseprøvning af to middelværdier for data der antages normalfordelt hvor σ 2 1 og σ 2 2 er ukendte (men med σ 2 1 = σ 2 2), og stikprøverne er små, fås teststørrelsen hvor t = ( X 1 X 2 ) δ s 2 p/n 1 + s 2 p/n 2 s 2 p = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 Idet t t(n 1 + n 2 2) kan testets p-værdi beregnes Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 24 / 40

Hypotesetest for to gennemsnit Med "ukendt" varians - små stikprøver, normalfordelinger Sammenligning med kritisk værdi Ved hypoteseprøvning af to middelværdi for data der antages normalfordelt og σ1 2 og σ2 2 er ukendte, og for små stikprøver: Alternativ Afvis hypotese nul-hypotese hvis µ 1 µ 2 < δ t < t α µ 1 µ 2 > δ t > t α µ 1 µ 2 δ t < t α/2 eller t > t α/2 Ved opslag i tab. 4 vælges v = n 1 + n 2 2 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 25 / 40

Hypotesetest for to gennemsnit Eksempel 1 - fortsat Eksempel 1 A (sekretærer) B (sygeplejersker) 7.53 9.21 7.48 11.51 8.08 12.79 8.09 11.85 10.15 9.97 8.40 8.79 10.88 9.69 6.13 9.68 7.90 9.19 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 26 / 40

Hypotesetest for to gennemsnit Eksempel 1 - fortsat Eksempel 1 - fortsat Udfør et hypotesetest om energiforbruget (i middel) ved de to typer arbejde er ens. Anvend signifikansniveau α = 5% Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 27 / 40

Konfidensinterval for forskel i middelværdi Oversigt 1 Hypotesetest - en repetition Hypotesetest og konfidensintervaller 2 Styrke og stikprøvestørrelse 3 Hypotesetest for to gennemsnit Eksempel 1 Generel formulering Med kendt varians Med "ukendt" varians - store stikprøver Med "ukendt" varians - små stikprøver, normalfordelinger Eksempel 1 - fortsat 4 Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 2 5 Parret t-test Eksempel 2 - fortsat 6 R (R note 7) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 28 / 40

Konfidensinterval for forskel i middelværdi Beregning af konfidensinterval for forskel i middelværdi For store stikprøver beregnes et (1 α)% konfidensinterval ved: s 2 1 x 1 x 2 ± z α/2 + s2 2 n 1 n 2 (kendes σ 2 1 og σ 2 2 anvendes disse i stedet for s 2 1 og s 2 2) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 29 / 40

Konfidensinterval for forskel i middelværdi Beregning af konfidensinterval for forskel i middelværdi For små stikprøver (ukendte σ 2 1 og σ 2 2) (men med σ 2 1 = σ 2 2) beregnes et (1 α)% konfidensinterval ved: x 1 x 2 ± t α/2 (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 1 n 1 + 1 n 2 Ved opslag i tabellen over t-fordelingen (tab. 4) vælges antal frihedsgrader v = n 1 + n 2 2 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 30 / 40

Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 1 - fortsat, konfidensinterval Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 31 / 40

Konfidensinterval for forskel i middelværdi Eksempel 2 Eksempel 2 I et studie er man interesseret i at sammenligne 2 sovemidler A og B. For 10 testpersoner har man fået følgende resultater, der er givet i forlænget søvntid (i timer) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 32 / 40

Konfidensinterval for forskel i middelværdi Eksempel 2 Eksempel 2 - fortsat person A B 1 +0.7 +1.9 2-1.6 +0.8 3-0.2 +1.1 4-1.2 +0.1 5-1.0-0.1 6 +3.4 +4.4 7 +3.7 +5.5 8 +0.8 +1.6 9 0 +4.6 10 +2.0 +3.4 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 33 / 40

Parret t-test Oversigt 1 Hypotesetest - en repetition Hypotesetest og konfidensintervaller 2 Styrke og stikprøvestørrelse 3 Hypotesetest for to gennemsnit Eksempel 1 Generel formulering Med kendt varians Med "ukendt" varians - store stikprøver Med "ukendt" varians - små stikprøver, normalfordelinger Eksempel 1 - fortsat 4 Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 2 5 Parret t-test Eksempel 2 - fortsat 6 R (R note 7) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 34 / 40

Parret t-test Parret t-test Vi betragter nu en situation hvor vi vil sammenligne 2 middelværdier, men hvor data er parret Hypotesetestet foregår derfor ved at undersøge forskellen, D i, mellem de parrede observationer: D i = X i Y i for i = 1, 2,..., n Vi kan herefter beregne middelværdi D og varians S 2 D for D. Test af D gøres nu som de sædvanlige test for én middelværdi Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 35 / 40

Parret t-test Eksempel 2 - fortsat Eksempel 2 - fortsat person A B D = B A 1 +0.7 +1.9 +1.2 2-1.6 +0.8 +2.4 3-0.2 +1.1 +1.3 4-1.2 +0.1 +1.3 5-1.0-0.1 +0.9 6 +3.4 +4.4 +1.0 7 +3.7 +5.5 +1.8 8 +0.8 +1.6 +0.8 9 0 +4.6 +4.6 10 +2.0 +3.4 +1.4 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 36 / 40

Parret t-test Eksempel 2 - fortsat Eksempel 2 - fortsat Udfør et hypotesetest sovemidlerne er lige effektive. Anvend signifikansniveau α = 5% Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 37 / 40

R (R note 7) Oversigt 1 Hypotesetest - en repetition Hypotesetest og konfidensintervaller 2 Styrke og stikprøvestørrelse 3 Hypotesetest for to gennemsnit Eksempel 1 Generel formulering Med kendt varians Med "ukendt" varians - store stikprøver Med "ukendt" varians - små stikprøver, normalfordelinger Eksempel 1 - fortsat 4 Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 2 5 Parret t-test Eksempel 2 - fortsat 6 R (R note 7) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 38 / 40

R (R note 7) R (R note 7) > x1=c(10,13,16,19,17,15,20,23,15,16) > x2=c(13,16,20,25,18,16,27,30,17,19) > t.test(x1,x2,alt="less",conf.level=0.95,var.equal=true) Pooled-Variance Two-Sample t-test data: x1 and x2 t = -1.779, df = 18, p-value = 0.04606 alternative hypothesis: difference in means is less than 0 95 percent confidence interval: -Inf -0.09349972 sample estimates: mean of x mean of y 16.4 20.1 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 39 / 40

R (R note 7) Oversigt 1 Hypotesetest - en repetition Hypotesetest og konfidensintervaller 2 Styrke og stikprøvestørrelse 3 Hypotesetest for to gennemsnit Eksempel 1 Generel formulering Med kendt varians Med "ukendt" varians - store stikprøver Med "ukendt" varians - små stikprøver, normalfordelinger Eksempel 1 - fortsat 4 Konfidensinterval for forskel i middelværdi Eksempel 1 - fortsat Eksempel 2 5 Parret t-test Eksempel 2 - fortsat 6 R (R note 7) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 7 Foråret 2014 40 / 40