Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning Køn Stikprøvesørrelse Gennemsnit Standardafvigelse Mænd 119 3 3 Kvinder 733 37 16 Der er to variable registeret for hver person Køn: Forklarende variabel Binær/dikotom (to mulige værdier) Tid: Afhængig variabel Kontinuert/skala Uafhængige grupper (mænd/kvinder)

Standardfejlen for forskellen Mål: Sammenligne middelværdier µ 1 og µ for to grupper. Ny parameter Differencen µ µ 1 er en parameter Estimat y y 1 er et estimat for µ µ 1 Husk: Et 95% konfidensinterval er af typen Punktestimat se hvis punktestimatet er (approks.) normalfordelt.

Standardfejlen for y 1 -y Antag vi har to uafhængige stikprøver, og at se 1 og se er standardfejlen for hhv. y 1 og y. Da er den estimerede standardfejl for y 1 -y se s hvor. i i se + se 1 se Eksempel: Oprydning/Madlavning se se n i ( 3) ( 16) s1 s 1 + se + + n1 n 119 733 1.09

Konfidensinterval for µ 1 µ For uafhængige stikprøver fra to grupper der har normale populationsfordelinger er et (1 α)100% konfidensintervallet for µ 1 µ givet ved ( y y ) ± t se 1 α hvor t har df n 1 + n - frihedsgrader. Eksempel: Oprydning/Madlavning

Konfidensintervaller Konfidensintervallerr for µ µ 1 0 Peger i retning af, at µ er mindre end µ 1. Ingen forskel ml. µ 1 og µ er plausibelt. Peger i retning af, at µ er større end µ 1.

Hypotesetest for µ µ 1 Antagelser: Normale populationer Nul-hypotese: H 0 : µ µ 1 0 (ingen forskel) Alternativ hypotese: H a : µ µ 1 0 (en forskel) Teststørrelse: t P-værdi ( y y ) Konklusion: 1 se 0 hvor Jo lavere P-værdi jo mindre tror vi på H 0. s1 se + n 1 s n punktestimat H0værdi t standardfejl -3 - -1 0 1 3 -t t P-værdien H a : µ µ 1 0

Éeksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning Køn Stikprøvesørrelse Gennemsnit Standardafvigelse Mænd n 1 119 y 1 3 s 1 3 Kvinder n 733 y 37 s 16 Hypoteser: H 0 : µ µ 1 0 vs H a : µ µ 1 0 se t s n 1 1 + s n ( y y ) se 1 0-3 - -1 0 1 3

SPSS SPSS: Analyze Compare Means Independent-Sample T Test Test Variable(s): Afhængig variabel Grouping variabel: Forklarende variabel Define Groups: Angiv hvilke værdier af den forklarende variabel, der svarer til de to grupper.

SPSS Output Opsummering af de to grupper Test af forskel i middelværdi: t-teststørrelse P-værdi to-sidet test Konfidensinterval:

Sammenligne µ 1 og µ for afhængige stikprøver Typisk eksempel på afhængige grupper, er hvor observationer i de to grupper er parrede. Eksempel: Hver af 8 studerende får målt reaktionstider under bilkørsel under to omstændigheder: 1) Mens de snakker i mobil (gruppe1) y i,1 ) Uden de snakker i mobil (gruppe) y i, For hver studerende har vi en forskel i reaktionstid: y,i - y 1,i Reaktionstider

Sammenligne µ 1 og µ for afhængige stikprøver Lad y 1 og y være gennemsnittet for hhv. gruppe 1 og gruppe. Lad y d være gennemsnittet af differencerne. Der gælder y d y y 1 Dvs. hvis vi vil teste forskelle er det nok at se på gennemsnittet af differencerne. Et (1 α)100% konfidensinterval for µ - µ 1 sd y ± t α df n-1 n hvor s d er standardafvigelsen for differencerne.

^ Signifikanstest for π - π 1 (parrede obs.) ^ Antagelser: Normale populationer Nul-hypotese: H 0 : µ D 0 (ingen effekt) Alternativ hypotese: H a : µ D 0 (en effekt) Teststørrelse: P-værdi Konklusion: yd 0 t se hvor se s Jo lavere P-værdi jo mindre tror vi på H 0 D n -3 - -1 0 1 3 -t t P-værdien H a : µ D 0

Eksempel Hypoteser Η 0 : µ D 0 vs Η α : µ D 0 Gennemsnit y D 50.65 Standardafvigelse s D 50.486 Teststørrelse t yd 0 s n D Uden mobil Med mobil Diff. 604 556 540 5 459 544 : 636 63 615 67 601 600 : -3 - -1 0 1 3 3 67 75 150 14 56 :

SPSS SPSS: Analyze Compare Means Paired-Samples T Test Gruppe 1 Gruppe

SPSS: Resultat se s n d 5.486 3 9.8 t yd 0 se 50.85 9.8 5.455

Test direkte på differencerne Lav et t-test af differencerne Bemærk at t-er præcis som før og dermed er P- værdien som før.

Test af forskel i andele Effekten af bøn på udfald af operation: Bøn Komplikationer Ej komplikationer Total Andel kompl. Ja 315 89 604 0.5 Nej 304 93 597 0.509 Der er to variable registeret for hver person Bøn: Forklarende variabel Binær/dikotom (to mulige værdier) Udfald: Afhængig variabel Binær/dikotom (to mulige værdier) Uafhængige grupper (Bøn/Ej bøn)

Standardfejlen for π - π 1 ^ ^ Standardfejlen for π π 1 er se se + ( 1 ˆ π ) i ni hvor. i ˆ π Eksempel: Bøn og operation i ^ ^ se 1 se se ˆ π 1 ( 1 ˆ π ) ˆ π ( 1 ˆ π ) n 1 1 0.5 1 604 + n ( 0.5) 0.509( 1 0.509) + 597 0.088

Konfidensinterval for π π 1 For store stikprøver er et (1 α)100% konfidensinterval for forskellen π π 1 mellem to populationer Eksempel: Bøn og operation ( ˆ π π ) ± z se ˆ1 α Et 95% konfidensinterval for forskellen i andele: ( π ˆ π ) ± se ( 0.509 0.5) ˆ 1 z α 0.013 ± 0.057 ± 1.96 0.088 ( 0.07 ; 0.04) Da KI et indeholder 0, er ingen forskel plausibelt.

Signifikanstest for π - π 1 ^ ^ Antagelser: Store stikprøver Nul-hypotese: H 0 : π π 1 0 (ingen effekt) Alternativ hypotese: H a : π π 1 0 (en effekt) Teststørrelse: P-værdi Konklusion: z ( ˆ π ˆ π ) 1 0 se 0 hvor se Jo lavere P-værdi jo mindre 0 ˆ π punktestimat H0værdi z standardfejl ( 1 ˆ π ) + n 1 n ^ 1 1 π er den overordnede andel, når grupper ignoreres. tror vi på H 0

Test af forskel i andele Effekten af bøn på udfald af operation: z Bøn Komplikationer Ej komplikationer Total Andel kompl. Ja 315 89 n 1 604 π 1 0.5 Nej 304 93 n 597 π 0.509 Hypoteser: H 0 : π π 1 0 vs H a : π π 1 0 315 + 304 ˆ π 0.515 604 + 597 1 1 se ˆ( ) + 0 π 1 ˆ π n1 n ( ˆ π ˆ π ) 1 0 se 0-3 - -1 0 1 3 ^ ^