Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Relaterede dokumenter
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Konfidensintervaller og Hypotesetest

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Løsning eksamen d. 15. december 2008

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik II 1. Lektion. Analyse af kontingenstabeller

Tema. Dagens tema: Indfør centrale statistiske begreber.

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Normalfordelingen og Stikprøvefordelinger

Multipel Lineær Regression

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Statistik II 4. Lektion. Logistisk regression

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Vejledende løsninger kapitel 8 opgaver

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Forsøgsplanlægning Stikprøvestørrelse

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Løsning til eksaminen d. 14. december 2009

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Forsøgsplanlægning Stikprøvestørrelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

En Introduktion til SAS. Kapitel 5.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Kvantitative metoder 2

(studienummer) (underskrift) (bord nr)

Vejledende besvarelser til opgaver i kapitel 14

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Statistiske principper

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Løsning til eksaminen d. 29. maj 2009

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Kvantitative metoder 2

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Statistik Lektion 16 Multipel Lineær Regression

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

MPH specialmodul Epidemiologi og Biostatistik

Forelæsning 11: Kapitel 11: Regressionsanalyse

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

1 Hb SS Hb Sβ Hb SC = , (s = )

Estimation og usikkerhed

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Opgaver til kapitel 3

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

(studienummer) (underskrift) (bord nr)

Klasseøvelser dag 2 Opgave 1

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksamen i Statistik for biokemikere. Blok

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Løsninger til kapitel 9

Module 4: Ensidig variansanalyse

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Forelæsning 9: Inferens for andele (kapitel 10)

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Nanostatistik: Opgavebesvarelser

Forelæsning 11: Envejs variansanalyse, ANOVA

Kapitel 12 Variansanalyse

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Transkript:

Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning Køn Stikprøvesørrelse Gennemsnit Standardafvigelse Mænd 119 3 3 Kvinder 733 37 16 Der er to variable registeret for hver person Køn: Forklarende variabel Binær/dikotom (to mulige værdier) Tid: Afhængig variabel Kontinuert/skala Uafhængige grupper (mænd/kvinder)

Standardfejlen for forskellen Mål: Sammenligne middelværdier µ 1 og µ for to grupper. Ny parameter Differencen µ µ 1 er en parameter Estimat y y 1 er et estimat for µ µ 1 Husk: Et 95% konfidensinterval er af typen Punktestimat se hvis punktestimatet er (approks.) normalfordelt.

Standardfejlen for y 1 -y Antag vi har to uafhængige stikprøver, og at se 1 og se er standardfejlen for hhv. y 1 og y. Da er den estimerede standardfejl for y 1 -y se s hvor. i i se + se 1 se Eksempel: Oprydning/Madlavning se se n i ( 3) ( 16) s1 s 1 + se + + n1 n 119 733 1.09

Konfidensinterval for µ 1 µ For uafhængige stikprøver fra to grupper der har normale populationsfordelinger er et (1 α)100% konfidensintervallet for µ 1 µ givet ved ( y y ) ± t se 1 α hvor t har df n 1 + n - frihedsgrader. Eksempel: Oprydning/Madlavning

Konfidensintervaller Konfidensintervallerr for µ µ 1 0 Peger i retning af, at µ er mindre end µ 1. Ingen forskel ml. µ 1 og µ er plausibelt. Peger i retning af, at µ er større end µ 1.

Hypotesetest for µ µ 1 Antagelser: Normale populationer Nul-hypotese: H 0 : µ µ 1 0 (ingen forskel) Alternativ hypotese: H a : µ µ 1 0 (en forskel) Teststørrelse: t P-værdi ( y y ) Konklusion: 1 se 0 hvor Jo lavere P-værdi jo mindre tror vi på H 0. s1 se + n 1 s n punktestimat H0værdi t standardfejl -3 - -1 0 1 3 -t t P-værdien H a : µ µ 1 0

Éeksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning Køn Stikprøvesørrelse Gennemsnit Standardafvigelse Mænd n 1 119 y 1 3 s 1 3 Kvinder n 733 y 37 s 16 Hypoteser: H 0 : µ µ 1 0 vs H a : µ µ 1 0 se t s n 1 1 + s n ( y y ) se 1 0-3 - -1 0 1 3

SPSS SPSS: Analyze Compare Means Independent-Sample T Test Test Variable(s): Afhængig variabel Grouping variabel: Forklarende variabel Define Groups: Angiv hvilke værdier af den forklarende variabel, der svarer til de to grupper.

SPSS Output Opsummering af de to grupper Test af forskel i middelværdi: t-teststørrelse P-værdi to-sidet test Konfidensinterval:

Sammenligne µ 1 og µ for afhængige stikprøver Typisk eksempel på afhængige grupper, er hvor observationer i de to grupper er parrede. Eksempel: Hver af 8 studerende får målt reaktionstider under bilkørsel under to omstændigheder: 1) Mens de snakker i mobil (gruppe1) y i,1 ) Uden de snakker i mobil (gruppe) y i, For hver studerende har vi en forskel i reaktionstid: y,i - y 1,i Reaktionstider

Sammenligne µ 1 og µ for afhængige stikprøver Lad y 1 og y være gennemsnittet for hhv. gruppe 1 og gruppe. Lad y d være gennemsnittet af differencerne. Der gælder y d y y 1 Dvs. hvis vi vil teste forskelle er det nok at se på gennemsnittet af differencerne. Et (1 α)100% konfidensinterval for µ - µ 1 sd y ± t α df n-1 n hvor s d er standardafvigelsen for differencerne.

^ Signifikanstest for π - π 1 (parrede obs.) ^ Antagelser: Normale populationer Nul-hypotese: H 0 : µ D 0 (ingen effekt) Alternativ hypotese: H a : µ D 0 (en effekt) Teststørrelse: P-værdi Konklusion: yd 0 t se hvor se s Jo lavere P-værdi jo mindre tror vi på H 0 D n -3 - -1 0 1 3 -t t P-værdien H a : µ D 0

Eksempel Hypoteser Η 0 : µ D 0 vs Η α : µ D 0 Gennemsnit y D 50.65 Standardafvigelse s D 50.486 Teststørrelse t yd 0 s n D Uden mobil Med mobil Diff. 604 556 540 5 459 544 : 636 63 615 67 601 600 : -3 - -1 0 1 3 3 67 75 150 14 56 :

SPSS SPSS: Analyze Compare Means Paired-Samples T Test Gruppe 1 Gruppe

SPSS: Resultat se s n d 5.486 3 9.8 t yd 0 se 50.85 9.8 5.455

Test direkte på differencerne Lav et t-test af differencerne Bemærk at t-er præcis som før og dermed er P- værdien som før.

Test af forskel i andele Effekten af bøn på udfald af operation: Bøn Komplikationer Ej komplikationer Total Andel kompl. Ja 315 89 604 0.5 Nej 304 93 597 0.509 Der er to variable registeret for hver person Bøn: Forklarende variabel Binær/dikotom (to mulige værdier) Udfald: Afhængig variabel Binær/dikotom (to mulige værdier) Uafhængige grupper (Bøn/Ej bøn)

Standardfejlen for π - π 1 ^ ^ Standardfejlen for π π 1 er se se + ( 1 ˆ π ) i ni hvor. i ˆ π Eksempel: Bøn og operation i ^ ^ se 1 se se ˆ π 1 ( 1 ˆ π ) ˆ π ( 1 ˆ π ) n 1 1 0.5 1 604 + n ( 0.5) 0.509( 1 0.509) + 597 0.088

Konfidensinterval for π π 1 For store stikprøver er et (1 α)100% konfidensinterval for forskellen π π 1 mellem to populationer Eksempel: Bøn og operation ( ˆ π π ) ± z se ˆ1 α Et 95% konfidensinterval for forskellen i andele: ( π ˆ π ) ± se ( 0.509 0.5) ˆ 1 z α 0.013 ± 0.057 ± 1.96 0.088 ( 0.07 ; 0.04) Da KI et indeholder 0, er ingen forskel plausibelt.

Signifikanstest for π - π 1 ^ ^ Antagelser: Store stikprøver Nul-hypotese: H 0 : π π 1 0 (ingen effekt) Alternativ hypotese: H a : π π 1 0 (en effekt) Teststørrelse: P-værdi Konklusion: z ( ˆ π ˆ π ) 1 0 se 0 hvor se Jo lavere P-værdi jo mindre 0 ˆ π punktestimat H0værdi z standardfejl ( 1 ˆ π ) + n 1 n ^ 1 1 π er den overordnede andel, når grupper ignoreres. tror vi på H 0

Test af forskel i andele Effekten af bøn på udfald af operation: z Bøn Komplikationer Ej komplikationer Total Andel kompl. Ja 315 89 n 1 604 π 1 0.5 Nej 304 93 n 597 π 0.509 Hypoteser: H 0 : π π 1 0 vs H a : π π 1 0 315 + 304 ˆ π 0.515 604 + 597 1 1 se ˆ( ) + 0 π 1 ˆ π n1 n ( ˆ π ˆ π ) 1 0 se 0-3 - -1 0 1 3 ^ ^