Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Størrelse: px

Starte visningen fra side:

Download "Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver"

Hans Johannsen
5 år siden
Visninger:

1 Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver - konfidensinterval Afhængige stikprøver 3 Sammenligning af 2 andele Uafhængige stikprøver Uafhængige stikprøver - approksimativt test Fishers eksakte test 4 Agresti: Oversigt over test for middelværdi og andel PSE (I17) ASTA - 7. lektion 1 / 18

2 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Responsvariabel og forklarende variabel Vi gennemfører et studie, hvor vi tilfældigt udvælger 50 IT-virksomheder og 50 servicevirksomheder og måler deres overskudsgrad. Er der sammenhæng mellem virksomhedstype og overskudsgrad? Vi skal mao sammenligne stikprøver fra 2 forskellige populationer. For hver virksomhed registreres: Den binære variabel Virsomhedstype, som kaldes den forklarende variabel, inddeler data i 2 grupper. Den kvantitative variabel Overskudsgrad, som kaldes responsvariablen. PSE (I17) ASTA - 7. lektion 2 / 18

3 Sammenligning af 2 grupper Afhængige/uafhængige stikprøver Afhængige/uafhængige stikprøver Vi gennemfører et studie, hvor vi tilfældigt udvælger 50 IT-virksomheder og 50 servicevirksomheder og måler deres overskudsgrad. Er der sammenhæng mellem virksomhedstype og overskudsgrad? I dette eksempel er der tale om uafhængige stikprøver, idet den samme virksomhed ikke kan indgå i begge grupper. Vi gennemfører et studie, hvor vi tilfældigt udvælger 50 IT-virksomheder og måler deres overskudsgrad i 2009 og Er der sammenhæng mellem driftsår og overskudsgrad? I dette eksempel er der tale om afhængige stikprøver, idet den samme virksomhed indgår i begge grupper. PSE (I17) ASTA - 7. lektion 3 / 18

4 Sammenligning af 2 middelværdier Sammenligning af middelværdier Vi betragter situationen, hvor vi har to kvantitative stikprøver: Population 1 har middelværdi µ 1, som estimeres af ˆµ 1 = ȳ 1 ud fra en stikprøve af størrelse n 1. Population 2 har middelværdi µ 2, som estimeres af ˆµ 2 = ȳ 2 ud fra en stikprøve af størrelse n 2. Vi er interesseret i forskellen µ 2 µ 1, som estimeres ved d = ȳ 2 ȳ 1. Antag at vi kan finde den estimerede standardfejl se d på differensen og at denne har frihedsgrader df. Vi kan da angive Konfidensinterval: (ȳ 2 ȳ 1 ) ± tse d, hvor t-scoren bestemmer konfidensniveauet. Signifikanstest for H 0 : µ 2 µ 1 = 0. Teststatistik: t = ȳ2 ȳ 1 se d, som skal vurderes i en t-fordeling med df frihedsgrader. PSE (I17) ASTA - 7. lektion 4 / 18

5 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver I situationen med uafhængige stikprøver kan det vises at se d = se1 2 + se2 2 hvor se 1 og se 2 er estimerede standardfejl for stikprøvemiddelværdier i hhv population 1 og 2. Vi husker, at der for sådanne gælder se = s n, dvs se d = s 2 1 n 1 + s2 2 n 2 hvor s 1 og s 2 er estimerede standardafvigelser i hhv population 1 og 2. Frihedsgradstallet df for se d kan estimeres via en kompliceret formel, som vi ikke skal se. Ift konfidensinterval og signifikanstest bemærkes: Hvis både n 1 og n 2 er over 30, så kan vi bruge z-score i stedet for t-score. Hvis n 1 eller n 2 er under 30, så lader vi Rcmdr beregne frihedsgradstal og p-værdi/konfidensinterval. PSE (I17) ASTA - 7. lektion 5 / 18

Sammenligning af 2 middelværdier Uafhængige stikprøver Eksempel Vi vender tilbage til Chile datasættet fra car pakken, hvor vi studerer sammenhængen mellem variablene sex og statusquo: Scale of

6 Sammenligning af 2 middelværdier Uafhængige stikprøver Eksempel Vi vender tilbage til Chile datasættet fra car pakken, hvor vi studerer sammenhængen mellem variablene sex og statusquo: Scale of support for the status-quo. Vi kigger først på Statistics/Summaries/numerical summaries... med option Summarize by group... sat til sex. Vi kan konstatere at Der mangler(na) måling på 11 kvinder(f) og 6 mænd(m). Det ser ud til at kvinder har en højere middelværdi(mean) for status quo end mænd. Men er der reelt en signifikant forskel? PSE (I17) ASTA - 7. lektion 6 / 18

Eksempel Sammenligning af 2 middelværdier Uafhængige stikprøver Differens: d = 0.0657 ( 0.0684) = 0.1341. Estimeret standardafvigelse kvinder: s 1 = 1.003 og mænd s 2 = 0.993.

7 Eksempel Sammenligning af 2 middelværdier Uafhængige stikprøver Differens: d = ( ) = Estimeret standardafvigelse kvinder: s 1 = og mænd s 2 = Med samplestørrelser n 1 = 1368 og n 2 = Estimeret standardfejl på differens: se = s 2 1 n 1 + s2 2 n 2 = = t-score for H 0 : µ 1 µ 2 = 0: t obs = d 0 se = = 3.48 Da begge samplestørrelser er meget store (> 60),behøver vi ikke bruge t-score, men kan bruge z-score, dvs vurdering i standardnormalfordelingen. P-værdi: = , dvs vi forkaster nulhypotesen. PSE (I17) ASTA - 7. lektion 7 / 18

Sammenligning af 2 middelværdier Uafhængige stikprøver Eksempel Statistics/Means/Independent samples t-test... Vi kan overlade alle beregninger til Rcmdr.

8 Sammenligning af 2 middelværdier Uafhængige stikprøver Eksempel Statistics/Means/Independent samples t-test... Vi kan overlade alle beregninger til Rcmdr. Vi genkender t-scoren 3.48 og p-værdien Det estimerede frihedsgradstal df = 2679 er så højt at der ikke er forskel på z-score og t-score. PSE (I17) ASTA - 7. lektion 8 / 18

9 Sammenligning af 2 middelværdier Uafhængige stikprøver - konfidensinterval Konfidensinterval Vi har allerede udviklet alle ingredienser til at konstruere et konfidensinterval for µ 2 µ 1 : d = ȳ 2 ȳ 1 estimerer µ 2 µ 1. se d = s 2 1 n 1 + s2 2 n 2 estimerer standardfejlen på d. Dermed er d ± tse d et konfidensinterval for µ 2 µ 1. t-scoren vælges så vi opnår den ønskede konfidensgrad. Hvis n 1 og n 2 begge er større end 30, så vil t = 2 give en konfidensgrad på ca. 95%. PSE (I17) ASTA - 7. lektion 9 / 18

10 Sammenligning af 2 middelværdier Afhængige stikprøver Parret t-test I udvælger tilfældigt 10 Netto-butikker, hvor I over en periode måler den gennemsnitlige ekspeditionstid ved kasserne. Der installeres nye kasseterminaler i de 10 butikker, og I gentager eksperimentet. Det er interessant om de nye terminaler har ændret ekspeditionstiden. Vi har således 2 stikprøver svarende til gammel/ny teknologi. I dette tilfælde er der tale om afhængige stikprøver, idet vi har 2 målinger på hver butik. Dette giver anledning til følgende analysestrategi. Beregn for hver butik ændringen i gennemsnitlig ekspeditionstid når vi går fra gammel til ny teknologi. Ændringerne d 1, d 2,..., d 10 betragtes nu som EN stikprøve fra en population med middelværdi µ. Test hypotesen H 0 : µ = 0 på sædvanlig vis. PSE (I17) ASTA - 7. lektion 10 / 18

gennemsnitlig ekspeditionstid før hhv efter installation af ny

11 Sammenligning af 2 middelværdier Afhængige stikprøver Eksempel Date er organiseret i en dataramme med 2 variable: before og after, som angiver gennemsnitlig ekspeditionstid før hhv efter installation af ny teknologi. Statistics/ Means/ Paired t-test... PSE (I17) ASTA - 7. lektion 11 / 18

12 Sammenligning af 2 andele Sammenligning af andele Vi betragter situationen, hvor vi har to kvalitative stikprøver, hvor vi undersøger om en given egenskab er til stede eller ej: Andelen af population 1 som har egenskaben er π 1, som estimeres af ˆπ 1 ud fra en stikprøve af størrelse n 1. Andelen af population 2 som har egenskaben er π 2, som estimeres af ˆπ 2 ud fra en stikprøve af størrelse n 2. Vi er interesseret i forskellen π 2 π 1, som estimeres ved d = ˆπ 2 ˆπ 1. Antag at vi kan finde den estimerede standardfejl se d på differensen. Vi kan da approksimativt angive Konfidensinterval: (ˆπ 2 ˆπ 1 ) ± zse d, hvor z-scoren bestemmer konfidensniveauet. PSE (I17) ASTA - 7. lektion 12 / 18

13 Sammenligning af 2 andele Uafhængige stikprøver Uafhængige stikprøver I situationen med uafhængige stikprøver kan det som bekendt vises at se d = se1 2 + se2 2 hvor se 1 og se 2 er estimerede standardfejl for stikprøveandelen i hhv population 1 og 2. ˆπ(1 ˆπ) Vi husker, at der for sådanne gælder se = n, dvs se d = ˆπ1 (1 ˆπ 1 ) n 1 + ˆπ 2(1 ˆπ 2 ) n 2 Ift konfidensinterval opnår vi den sædvanlige konstruktion: Approksimativt konfidensinterval for π 2 π 1 : (π 2 π 1 ) ± zse d. PSE (I17) ASTA - 7. lektion 13 / 18

14 Sammenligning af 2 andele Uafhængige stikprøver - approksimativt test Approksimativt test Nulhypotese: H 0 π 1 = π 2. Antag H 0 og kald den fælles andel for π, som estimeres ved ˆπ = n 1ˆπ 1 +n 2ˆπ 2 n 1 +n 2, dvs vi slår populationerne sammen og beregner den relative frekvens af egenskaben. Når H 0 er sand bliver standardfejl og z-score: se 0 = ˆπ(1 ˆπ)( 1 n n 2 ) z = ˆπ 2 ˆπ 1 se 0, som vurderes i standardnormalfordelingen. P-værdi beregnes på sædvanlig vis - afhængigt af alternativ. WARNING: Approksimationen er kun god, når n 1ˆπ, n 1 (1 ˆπ), n 2ˆπ, n 2 (1 ˆπ) alle er større end 5. PSE (I17) ASTA - 7. lektion 14 / 18

Vi beregner via Data/Manage variables in active dataset/compute new variable... en ny binær faktor voteno.

15 Sammenligning af 2 andele Uafhængige stikprøver - approksimativt test Eksempel Vi vender tilbage til Chile datasættet fra car pakken. Vi beregner via Data/Manage variables in active dataset/compute new variable... en ny binær faktor voteno. Vi studerer sammenhængen mellem variablene sex og voteno. Vi kigger først på tabellen fra Statistics/Proportions/ Two-sample proportion test... PSE (I17) ASTA - 7. lektion 15 / 18

16 Sammenligning af 2 andele Uafhængige stikprøver - approksimativt test Eksempel Andele som ikke stemmer nej er ˆπ 1 = 0.723, ˆπ 2 = 0.570, hvoraf ˆπ = = Estimeret forskel d = ˆπ 2 ˆπ 1 = = Standardfejl på forskel se d = ˆπ1 (1 ˆπ 1 ) n 1 + ˆπ 2(1 ˆπ 2 ) 0.723( ) n 2 = (1 0.57) 1223 = Approksimativt 95% konfidensinterval for forskel d ± 1.96se d = ( 0.190; 0.116) Standardfejl på forskel når H 0 : π 1 = π 2 er opfyldt se 0 = ˆπ(1 ˆπ)( 1 n n 2 ) = z = d se 0 = Testet for H 0 mod H a : π 1 π 2 giver en p-værdi på nul, dvs klar forskel. PSE (I17) ASTA - 7. lektion 16 / 18

17 Sammenligning af 2 andele Fishers eksakte test Fishers eksakte test Hvis ikke n 1ˆπ, n 1 (1 ˆπ), n 2ˆπ, n 2 (1 ˆπ) alle er større end 5, så er det approksimative test upålideligt. I stedet kan man anvende Fishers eksakte test. Statistics/Contingency tables/two-way table... PSE (I17) ASTA - 7. lektion 17 / 18

18 Agresti: Oversigt over test for middelværdi og andel Agresti:Oversigt PSE (I17) ASTA - 7. lektion 18 / 18

Relaterede dokumenter

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2 Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier