Statistik & Skalavalidering

Størrelse: px
Starte visningen fra side:

Download "Statistik & Skalavalidering"

Transkript

1 å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k a b E k s a m e n s n u m r e : 6, 5 3 Side 1 af 17

2 Indholdsfortegnelse Introduktion... 3 Formål med analysen... 3 Kausaldiagram... 3 Indledende databeskrivelse... 3 Fordelingsbeskrivelse... 4 Marginale analyser... 6 Opgave 1. Differentiel item funktion (DIF)... 9 Opgave 2. Generel lineær analyse Modelsøgning Modelkontrol Forudsætning om varianshomogenitet Forudsætning om normalfordelte residualer Forudsætning om linearitet Tolkning af parameterestimater i slutmodellen Side 2 af 17

3 Introduktion Formål med analysen I opgaven ønsker vi for det første at undersøge om den givne motivationsskala har problemer med differentiel item funktion (DIF), og på baggrund heraf om skalaen om muligt bør reduceres så DIF undgås. Derefter vil vi vha. generel lineær analyse vurdere, om graden af motivation, målt som den samlede score på motivationsskalaen, afhænger af variablene alder, køn, kommune, anciennitet, arbejdstid og overarbejde. Herunder klarlægge på hvilken måde disse variable eventuelt influerer på graden af motivation. Kausaldiagram Figur 1 Indledende databeskrivelse Det datamateriale (EKS2010.SAV) som opgaven tager udgangspunkt i, indeholder data fra en undersøgelse af arbejdsmiljøet blandt socialrådgivere og kommunale sagsbehandlere i 12 kommuner fra hele landet. Datamaterialet belyser fem items, og består derfor af fem spørgsmål, som alle er besvaret ud fra fire svarkategorier. Tabel 1: Itembeskrivelse Spørgsmål: S71 S72 S73 S74 S75 Jeg har et godt Det er kun lønnen, arbejde der betyder noget Jeg ville stoppe, hvis jeg havde penge nok Jeg ville vælge noget mere interessant, hvis jeg havde mulighed for det Jeg er stolt over mit arbejde Tabel 2: Svarkategorier Svarkategorier: JA, passer i høj grad JA, passer i nogen grad NEJ, passer ikke NEJ, passer slet ikke Side 3 af 17

4 Ved spørgsmål S71 og S75 er der i datamaterialet foretaget to omkodninger (til variablene V71 og V75), da spørgsmålene har et positivt indhold modsat de resterende tre spørgsmål. Vægtningen af svarkategorierne skal afspejle at svarkategorien 1 er et udtryk for lavest grad af motivation, mens svarkategorien 4 er udtryk for højest grad af motivation. Udover belysning af de nævnte fem items, indeholder datamaterialet oplysninger om seks baggrundsvariable variable. Dette drejer sig om køn, alder (opdelt i 10-års intervaller), kommune (kodet anonymt fra 1-12), anciennitet (antal år på nuværende arbejdsplads), arbejdstid (ansættelse på heltid eller deltid) og overarbejde (hyppighed for overarbejde ved fire ordinale kategorier). Vi har indledningsvist konstrueret en variabel for motivationsskalaen, som er givet ved: Motivation = V71 + S72 + S73 + S74 + V75 Fordelingsbeskrivelse Vores datamateriale inkluderer data fra i alt 895 socialrådgivere og kommunale sagsbehandlere (størstedelen kvinder 84%), med en gennemsnitlig anciennitet på arbejdspladsen på 9,5 år (SD = 10). I nedenstående histogram (figur 2) ses den afhængige variabel, motivation. Det ses, at den marginale fordeling er tilnærmelsesvist normalfordelt, der dog er en anelse venstreskæv. I den videre analyse giver det ikke nogen mening at transformere denne variabel, for at opnå en bedre normalfordeling, når der ses en venstreskæv fordeling. Vi er opmærksomme på, at ti personer ikke har besvaret et eller flere af de fem spørgsmål, hvorfor der ikke er beregnet en samlet skalaværdi for disse. Figur 2: Fordeling af motivation I tabel 3 ses frekvensfordelingen af alle uafhængige variable, på nær anciennitet. Anciennitet er en kontinuert variabel og kan derfor med fordel beskrives ved et histogram (dette histogram findes som figur 3). Side 4 af 17

5 Tabel 3: Fordeling af baggrundsvariable Total N (valid%*) Total 895 (100) Alder 18 år 1 (0,1) år 89 (10) år 177 (19,8) år 265 (29,7) år 295 (33) 60 år 66 (7,4) Køn Mand 144 (16,1) Kvinde 749 (83,9) Kommune 1 34 (3,8) (16,2) (14,7) 4 22 (2,5) (11,6) 6 53 (5,9) 7 39 (4,4) 8 47 (5,3) 9 37 (4,1) (16,1) (7,9) (7,5) Arbejdstid Heltid 708 (79,6) Deltid 181 (20,4) Overarbejde Sjældent 215 (24,2) 2-3 gange pr. måned 288 (32,4) 2-3 gange pr. uge 277 (31,2) Næsten dagligt 109 (12,3) * Vi har pga. missing -værdier valgt den procentvise fordeling, som tager højde for dette, således at procenterne inden for hver variabel summerer til 100 %. Ud fra ovenstående fordelingstabel ses det, at antal cases i kategorierne inden for hver variabel fordeler sig acceptabelt med undtagelse af alder. Her ses det, at kun ét individ er 18 år. Af denne årsag slår vi de to yngste alderskategorier sammen ( 29 år, n=90). Det vurderes at være vanskeligt at påvise, at der er statistisk forskel variabelgrupperne imellem, hvis der er så få individer i en eller flere grupper. Risikoen højnes for type 2 fejl, når gruppernes størrelser er små. Side 5 af 17

6 Figur 3: Fordeling af anciennitet Vi ser ud fra ovenstående histogram, at den uafhængige variabel, anciennitet, ikke kan siges at være normalfordelt. Dette er dog ikke noget problem, da der ikke er noget krav om, at uafhængige variable i en generel lineær regressionsanalyse skal være normalfordelte. Vi ser at 25 % af personerne i datasættet har en anciennitet på 2 år eller mindre, mens 50 % af personerne har en anciennitet på 5 år eller mindre. Marginale analyser Den deskriptive sammenhæng mellem motivation og hhv. køn og arbejdstid kan beskrives ved brug af t- test, da disse to uafhængige variable er binære, og vi derfor ved brug af t-test kan sammenligne fordelingen af motivation indenfor hver af variablens to grupper. Dog er t-test en forsimpling af den ensidede variansanalyse (ANOVA), hvorfor denne lige så vel kan anvendes. Sammenhængen mellem de kategoriske variable, alder, kommune og overarbejde, og den afhængige variabel motivation undersøges vha. ensidet variansanalyse (ANOVA). Resultatet heraf ses i tabel 4. Tabel 4: Karakteristik af sammenhæng mellem baggrundsvariable og motivation Gennemsnitlig motivationsscore (SD) Test for varianshomogenitet* Test for middelværdiforskelle** Total 15,44 (2,68) Alder 0,827 0, år 15,26 (2,87) år 15,05 (2,76) år 15,46 (2,58) år 15,60 (2,68) 60 år 15,98 (2,58) Køn 0,700 0,002 Mand 14,81 (2,71) Kvinde 15,57 (2,67) Kommune 0,115 0, ,47 (2,77) 2 15,10 (2,68) 3 15,48 (2,60) 4 15,64 (2,42) Side 6 af 17

7 5 15,49 (2,28) 6 15,17 (2,91) 7 15,38 (3,38) 8 14,85 (2,47) 9 15,97 (2,24) 10 15,59 (2,73) 11 16,16 (3,17) 12 15,79 (2,42) Arbejdstid 0,830 0,113 Heltid 15,50 (2,67) Deltid 15,15 (2,71) Overarbejde 0,119 0,147 Sjældent 15,45 (2,76) 2-3 gange pr. 15,71 (2,47) måned 2-3 gange pr. uge 15,20 (2,73) Næsten dagligt 15,32 (2,97) * p-værdier fra Levenes test. ** p-værdi fra ANOVA test. Som følge af Levenes test konkluderes det, at alle variable i tabellen ovenfor har homogene varianser (nulhypotese om ens varianser godtages). Derudover ses det i tabellen, at hverken alder, kommune, arbejdstid eller overarbejde ved brug af ensidet variansanalyse (ANOVA) har en marginal sammenhæng med motivation. Som den eneste uafhængige variabel, viste køn en signifikant sammenhæng med motivation. Kvinder ses at have en signifikant højere motivation sammenlignet med mænd. Den uafhængige variabel, anciennitet, er kontinuert fordelt, og derfor undersøger vi anciennitetens betydning for motivation ved at se på variablen som den tegner sig i et såkaldt scatterplot. Dette plot kan afsløre, om der findes en tendens, som eventuelt er lineær, kvadratisk eller kubisk. Figur 4: Karakteristik af sammenhængen mellem anciennitet og motivation Vi ser en meget svag tendens til en lineær sammenhæng mellem anciennitet og motivation. Dvs. at jo længere anciennitet på arbejdspladsen des højere motivation. Dog er forklaringskraften ikke stor, da Side 7 af 17

8 hældningen på den fittede linje er meget lille grundet den store spredning. Vi testede desuden sammenhængen ved lineær regression og fandt, at anciennitet kunne tillægges signifikant betydning for motivation (p = 0,022) ved et signifikansniveau på 5 %. Side 8 af 17

9 Opgave 1. Differentiel item funktion (DIF) Undersøgelse af DIF er en metode til at foretage skalavalidering ved at afprøve skalaens begrebsvaliditet. DIF kan opfattes som et konfounderproblem og betyder, at besvarelsen af et spørgsmål (item), som skalaen indeholder, påvirkes af andre baggrundsvariable udover den latente variabel. Målingen af fx motivation vil derfor blive konfoundet af den uafhængige variabels direkte effekt på besvarelsen af det enkelte item, som det ses eksemplificeret i figur 5. Figur 5: DIF For at undgå, at målingen af den latente variabel konfoundes, er det nødvendigt at identificere og eventuelt fjerne items, som medfører DIF. En valid skala uden DIF opfylder: Dvs. at den indirekte sammenhæng mellem items og baggrundsvariable bør forsvinde, når der kontrolleres for den totale motivationsscore. Som følge af ovenstående ønsker vi at konstruere og afprøve en skala, der måler arbejdsmæssig motivation blandt socialrådgivere og kommunale sagsbehandlere, uden DIF i forhold til køn, alder, kommune, anciennitet, arbejdstid og overarbejde. Dette gør vi ved at foretage en logistisk regressionsanalyse for hvert af de fem items i motivationsskalaen, hvor hvert item optræder som afhængig variabel, mens den totale motivationsscore og samtlige seks baggrundsvariable indgår som uafhængige variable. Til disse analyser dikotomiseres de fem items, da logistiske regressionsmodeller kun kan håndtere binære afhængige variable. Vi slår derfor svarkategorierne 1 og 2 sammen til en samlet kategori JA, passer i høj grad/nogen grad, mens svarkategorierne 3 og 4 bliver til NEJ passer ikke/slet ikke. I analyserne kontrollerer vi for non-uniform DIF ved at inddrage et interaktionsled mellem motivationsskalaen og hver af de uafhængige variable. Non-uniform DIF optræder, når sammenhængen mellem en baggrundsvariabel, fx alder, og et item er forskellig alt efter hvor på den totale motivationsskala kan befinder sig. Dvs. at der findes en interaktion mellem motivationsscore og placering indenfor den uafhængige variabels undergrupper. Efter analyser for hvert af de fem items, hvor alle uafhængige variable, den totale motivationsscore og interaktionsled inddrages samtidig, finder vi ikke signifikant evidens for non-uniform DIF. Dette fordi ingen af analyserne viser tegn på interaktion mellem skala og de uafhængige variable. Som følge af baglæns manuel modelsøgning, hvor de insignifikante interaktionsled én efter én fjernes fra modellen, finder vi heller ingen tegn på uniform DIF for nogle af de uafhængige variable. Side 9 af 17

10 For at sikre os, at der ikke kan være tale om uniform DIF, foretager vi yderligere et antal logistiske regressionsanalyser, hvor hvert item igen indgår som afhængig variabel, mens baggrundsvariablene inddrages på skift. Dvs. at vi i alt foretager yderligere 5 x 6 analyser. Analysernes signifikante fund ses i tabel 5. Tabel 5: Tegn på uniform DIF i motivationsskalaen Item* DIF (p-værdi < 0,001) DIF (0,001 p-værdi < 0,01) DIF (0,01 p-værdi 0,05) v s s s Anciennitet (p-værdi = 0,026) v * Dikotome items er benyttet Det ses nu, at variablen anciennitet har svag signifikant direkte sammenhæng med det dikotome item S74. Jo kortede anciennitet på arbejdspladsen, jo større er tilbøjeligheden til at ville vælge noget mere interessant arbejde, hvis muligheden var der, efter at der er taget højde for den totale motivationsscore. På baggrund af det store antal gennemførte logistiske regressionsanalyser er det dog afgørende ikke at overvurdere det svagt signifikante testresultat. Ved meget analysearbejde er der risiko for falske resultater, fx i forbindelse med type 1 fejl. Af denne årsag vælger vi kun at bekymre os om p-værdier mindre end 1 %, og sådanne værdier afsløres ikke i analyserne. Vi vurderer på baggrund heraf, at motivationsskalaen fungerer bedst indeholdende alle fem items og derfor ikke bør reduceres. Side 10 af 17

11 Opgave 2. Generel lineær analyse Her er den overordnede problemstilling, hvilken betydning de uafhængige variable har for motivationsscoren, samt om effekten af de uafhængige variable interagerer. Underordnede problemstillinger består i, om forudsætningerne for generel lineær regressionsanalyse opfyldes. Indledningsvist foretager vi en generel lineær regressionsanalyse med motivation som afhængig variabel og variablene køn, alder, kommune, anciennitet, arbejdstid og overarbejde som uafhængige variable. Vi inddrager desuden samtlige to-vejsinteraktioner mellem de uafhængige variable. Da der herved er tale om et stort antal parametre i vores start-model vælger vi gennem analysen at benytte et signifikansniveau på 1 %. Nedenfor ses en tabel med de kategoriske variable i regressionsanalysen. Tabel 6: Kategoriske variable i den generelle lineære analyse Ydre/eksogen variabel Værdi Label N Alder* 1 29 år år år år år 62 Køn 1 Mand Kvinde 722 Kommune Arbejdstid 1 Heltid Deltid 173 Overarbejde 1 Sjældent gange pr. måned gange pr. uge Næsten dagligt 108 * To yngste alderskategorier slået sammen. Modelsøgning Første trin i den generelle lineære regression består af vores mættede startmodel, som inkluderer alle parametre, dvs. de uafhængige variable og deres interaktionsled (se tabel 7). Det bemærkes, at kommune (p = 0,003), overarbejde (p = 0,006) og kommune*overarbejde (p = 0,001) viser signifikant forklaringskraft i startmodellen. Resten af parametrene er insignifikante, og modellen kan derfor siges at være overparametriceret i forhold til data, hvilket nødvendiggør en baglæns modelsøgning for at eliminere de parametre, som ikke er troværdige udtryk for hverken interaktioner eller effekter. I Side 11 af 17

12 modelsøgningens trin udregnes F-teststørrelser og signifikansniveau for hver enkelt parameter, og den mindst signifikante parameter fjernes fra modellen. Denne procedure foretages i overensstemmelse med det hierarkiske princip, som benyttes ved inddragelsen af interaktionsled i modelsøgningen, og betyder at man ikke må fjerne en hovedvariabel førend alle interaktionsled, som er sammensat af denne er fjernet i modellen. Modelsøgningen fortsættes indtil det ikke længere er muligt at fjerne insignifikante parametre. Vores eksklusionsproces af parametre i modelsøgningen ses i tabel 8. I tabel 7 ses modelsøgningens start- og slutmodel fra vores generelle lineære regressionsanalyse. Sammenlignes slutmodellens signifikante p-værdier med tendenserne ved de marginale analyser ses det, at køn og anciennitet ikke længere har signifikant betydning for motivation. Til gengæld har det vist sig, at kommune, arbejdstid og overarbejde er signifikant associeret med motivation. Tovejsinteraktionsleddene alder*køn, køn*overarbejde og kommune*overarbejde har tillige signifikant forklaringskraft. Dog bemærkes det, at hverken alder eller køn har signifikant forklaringskraft alene. Tabel 7: Den mættede startmodel og slutmodellen Startmodel Slutmodel Variabel F-teststørrelse p-værdi* F-teststørrelse p-værdi* Alder 2,358 0,052 2,173 0,070 Køn 2,201 0,138 0,637 0,425 Kommune 2,561 0,003 2,611 0,003 Anciennitet 1,027 0, Arbejdstid 4,821 0,028 9,754 0,002 Overarbejde 4,127 0,006 4,328 0,005 Alder*Køn 2,087 0,081 3,986 0,003 Alder*Kommne 0,956 0, Alder*Anciennitet 0,586 0, Alder*Arbejdstid 0,659 0, Alder*Overarbejde 1,754 0, Køn*Kommune 1,544 0, Køn*Anciennitet 2,308 0, Køn*Arbejdstid 1,006 0, Køn*Overarbejde 2,481 0,060 4,609 0,003 Kommune*Anciennitet 0,605 0, Kommune*Arbejdstid 0,771 0, Kommune*Overarbejde 1,947 0,001 2,157 < 0,001 Anciennitet*Arbejdstid 0,186 0, Anciennitet*Overarbejde 2,395 0, Arbejdstid*Overarbejde 1,911 0, * p-værdi baseret på F-teststørrelsen fra ANOVA. Side 12 af 17

13 Tabel 8: Baglæns modelsøgning Trin Fjernet variabel p-værdi* 1 Kommune*Anciennitet 0,825 2 Anciennitet*Arbejdstid 0,688 3 Kommune*Arbejdstid 0,672 4 Alder*Arbejdstid 0,606 5 Alder*Anciennitet 0,507 6 Køn*Arbejdstid 0,531 7 Alder*Kommune 0,193 8 Køn*Kommune 0,107 9 Køn*Anciennitet 0, Alder*Overarbejde 0, Anciennitet*Overarbejde 0, Anciennitet 0, Arbejdstid*Overarbejde 0,084 * p-værdi baseret på F-teststørrelse fra ANOVA. Modelkontrol For at analyseresultaterne i vores slut-model er brugbare og tolkningsværdige, er det nødvendigt, at forudsætningerne for gennemførelsen af variansanalysen i rimeligt omfang er opfyldte. Modelkontrol af generelle lineære modeller består primært af residualanalyse, som er en analyse af de standardiserede residualer. Forudsætning om varianshomogenitet Modelforudsætningen om varianshomogenitet undersøges vha. Levenes homogenitetstest for slutmodellen og et grafisk scatterplot med de standardiserede residualer mod de prædikterede værdier af den afhængige variabel motivation. Ud fra Levenes homogenitetstest godtager vi nul-hypotesen om varianshomogenitet (p = 0,144). Nedenstående figur 6 viser desuden, at der i plottet ikke er en systematisk, men tilfældig, spredning mellem de standardiserede residualer og de prædikterede værdier af motivation, hvorfor forudsætningen om varianshomogenitet understøttes. Figur 6: Scatterplot af de standardiserede residualer mod de prædikterede værdier af motivation Side 13 af 17

14 Forudsætning om normalfordelte residualer Denne forudsætning undersøges ved et histogram over de standardiserede residualer for motivation med indtegning af en normalfordelingskurve, som det ses i figur 7. Det ses, at fordelingen af residualerne ikke afviger betydeligt fra normalfordelingskurven. Herudover undersøges den betingede normalfordeling af residualerne ved at sætte den kumulerede observerede fordeling af motivation mod den kumulerede forventede fordeling. Plottet viser som histogrammet, at residualerne er tilnærmelsesvist identisk normalfordelte, hvorfor residualerne må være uafhængige af alle baggrundsvariable i datamaterialet og kun afhænge af den afhængige variabel. Forudsætningen vurderes at være opfyldt. Figur 7: Fordeling af de standardiserede residualer for motivation Figur 8: P-P plot med de standardiserede residualer for motivation Forudsætning om linearitet Denne forudsætning er umiddelbart kun interessant i forhold til den uafhængige variabel, anciennitet, da denne er den eneste kontinuerte ydre variabel i vores datasæt. En enkelt måde at afprøve, hvorvidt effekten af den uafhængige variabel er lineær, er ved at inkludere et kvardratisk og/eller kubisk led af variablen i regressionsmodellen. Hvis effekten rent faktisk er lineær, må beta-værdien knyttet til det kvardratiske eller kubiske led ikke være signifikant forskelligt fra nul. Dette undersøgte vi allerede indledningsvist ved den marginale analyse af anciennitet, hvor vi i figur 4 så en svag lineær tendens, fordi observationerne fordelte sig nogenlunde pænt omkring en ret linje. Ved afprøvning af effekten af det kvardratiske og kubiske led, fandt vi ingen signifikante værdier, hvorfor disse led ikke kan tilskrives nogen forklaringskraft for motivation og derfor ikke blev bibeholdt i den lineære regressionsmodel. Tolkning af parameterestimater i slutmodellen Modelkontrollen afslørede ingen problemer med de tre forudsætninger for gennemførelsen af den generelle lineære analyse, og resultaterne i vores slutmodel vurderes på denne baggrund at være tolkningsværdige. Som beskrevet til slut i vores analyse, har de uafhængige variable kommune, arbejdstid og overarbejde signifikant forklaringskraft for motivation. To-vejsinteraktionsleddene alder*køn, køn*overarbejde og kommune*overarbejde har tillige en signifikant effekt. I det følgende redegøres for estimaterne af de signifikante parametre i slutmodellen. Parameterestimaterne (β) for samtlige signifikante hovedvariable og interaktioner er ikke vist her, da en Side 14 af 17

15 sådan tabel ville være meget lang. Vi viser kun parameterestimatet for hovedvariablen arbejdstid (se tabel 9), da denne er den eneste, som ikke også indgår i ét eller flere signifikante interaktionsled. Parameterestimaterne svarer til middelværdiforskelle. Parameterestimaterne for de signifikante hovedvariable kommune og overarbejde og de signifikante interaktioner er som nævnt udeladt i tabel 9, og effekterne af disse vil blive berørt separat, når vi redegør for effekten af interaktionerne. Tabel 9: Parameterestimater for den signifikante hovedvariabel arbejdstid Variabel β (95 % CI) p-værdi** Arbejdstid Heltid 0,715 (0,266 1,164) 0,002 Deltid 0* - * Referencegruppe. ** p-værdi ved t-test. Testet angiver, om der er forskel mellem de enkelte variabelgrupper og referencen. Af tabel 9 ser vi, at personer med fuldtidsarbejde gennemsnitlig har en motivation på 0,715 point højere end personer, som kun arbejder på deltid. Vores slutmodel kompliceres en hel del ved at indeholde flere signifikante interaktioner: mellem alder og køn, mellem køn og overarbejde samt mellem kommune og overarbejde. Interaktionerne betyder, at styrken af den ene uafhængige variabels effekt afhænger af værdien af den anden uafhængige variabel. En manglende interaktion vil omvendt sige, at en uafhængig variabel, har homogen effekt på den afhængige variabel, uanset værdierne de andre uafhængige variable. Interaktionen mellem alder og køn (p=0,003) betyder, at der opstår en synergieffekt, fordi variablene skaber lokale sammenhænge, hvor variablene effektmodificerer hinanden. Da køn udover at modificere effekten af alder, modificeres af overarbejde, mens overarbejde udover at modificere effekten af køn modificeres af kommune, er der tale om et kompliceret net af indbyrdes modificerende interaktioner. For at undersøge hvad en given interaktion har af betydning, er det nødvendigt at beregne den samlede effekt af variablene i interaktionen samt af de variable der modificerer effekten af interaktionens variable. Dette er forsøgt eksemplificeret i tabel 10, hvor den samlede effekt er beregnet ud fra slutmodellens parameterestimater. I tabellen vælger vi kun at indsætte beregninger på baggrund af kommune "1" matchet med overarbejde sjældent. Beregningerne bygger på følgende formel:,, ø ø ø ø Side 15 af 17

16 Tabel 10: Samlet effekt af kommune, overarbejde, køn og alder Kommune Sjældent* 2-3 gange pr. måned* 2-3 gange pr. uge* Næsten dagligt* Mand Kvinde Mand Kvinde Mand Kvinde Mand Kvinde Alder 29 år -1,961-3, år -5,203-3, år -4,238-3, år -5,224-2, år -5,146-2,519 0** * Hyppighed af overarbejde. ** Reference: Kommune = 1, overarbejde = næsten dagligt, køn = kvinde og alder 60 år. Side 16 af 17

17 På baggrund af ovenstående tabel 10 med udregnede samlede effekter ses det fx, at mænd under eller lig 29 år, som sjældent har overarbejde og hører til kommune 1 gennemsnitlig har 1,961 point lavere motivation sammenlignet med referencegruppen, som består af kvinder i alderen ældre eller lig 60 år, som næsten dagligt har overarbejde og tilhører kommune 12. Det ses samtidig i tabellen, at den gennemsnitlige motivation blandt mænd, som sjældent har overarbejde og tilhører kommune 1 falder med alderen. Den modsatte tendens ses blandt kvinderne, hvor den gennemsnitlige motivation stiger med alderen. For at afprøve, om disse teoretiske udregninger stemmer overens med de rå observationer fra datasættet, har vi i nedenstående figur 9 plottet den additive effekt af alder og køn mod motivation for personer, som sjældent har overarbejde og tilhører kommune 1. Figur 9: Samlet effekt af alder og køn hos personer, som sjældent har overarbejde og tilhører kommune "1" Vi er opmærksomme på, at der i data kun findes meget få personer (n = 7), som udover at tilhøre kommune 1 sjældent har overarbejde. Figuren kan derfor ikke benyttes til en gyldig tolkning af interaktionernes samlede effekt på motivationsscore. Vi ser dog, at linjerne i figuren tegner samme billede som tabel 10. Side 17 af 17

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE

Læs mere

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45 Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af

Læs mere

Eksamen i statistik 2009-studieordning

Eksamen i statistik 2009-studieordning Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Eksamen Efterår 2013

Eksamen Efterår 2013 Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Hver anden vil benytte øget åbningstid i dagtilbud

Hver anden vil benytte øget åbningstid i dagtilbud Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Udbrændthed og brancheskift

Udbrændthed og brancheskift Morten Bue Rath Oktober 2009 Udbrændthed og brancheskift Hospitalsansatte sygeplejersker der viser tegn på at være udbrændte som konsekvens af deres arbejde, har en væsentligt forøget risiko for, at forlade

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Dansk Erhvervs gymnasieanalyse Sådan gør vi

Dansk Erhvervs gymnasieanalyse Sådan gør vi METODENOTAT Dansk Erhvervs gymnasieanalyse Sådan gør vi FORMÅL Formålet med analysen er at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Denne opgavetype kan tage sig ud på forskellig vis, da det udleverede materiale enten kan være en tabel eller en figur. Nedenfor

Læs mere

Dansk Erhvervs gymnasieeffekt - sådan gør vi

Dansk Erhvervs gymnasieeffekt - sådan gør vi Dansk Erhvervs gymnasieeffekt - sådan gør vi FORMÅL Formålet har været at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge blot ved at

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

LUP Fødende læsevejledning til afdelingsrapporter

LUP Fødende læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Lineære normale modeller (4) udkast

Lineære normale modeller (4) udkast E6 efterår 1999 Notat 21 Jørgen Larsen 2. december 1999 Lineære normale modeller (4) udkast 4.5 Regressionsanalyse 4.5.1 Præsentation 1 Regressionsanalyse handler om at undersøge hvordan én målt størrelse

Læs mere

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006 Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Virksomhedspraktik til flygtninge

Virksomhedspraktik til flygtninge Virksomhedspraktik til flygtninge Af Lasse Vej Toft, LVT@kl.dk Formålet med dette analysenotat er, at give viden om hvad der har betydning for om flygtninge kommer i arbejde efter virksomhedspraktik Analysens

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

De variable, som er inkluderet i de forskellige modeller, er følgende:

De variable, som er inkluderet i de forskellige modeller, er følgende: DUL II. Undersøgelse af hvilke faktorer, der er væsentlige for at understøtte, at der er klare og veltilrettelagte mål tilstede i arbejdet med elevernes læring Følgende er en statistisk analyse af ovenstående

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative

Læs mere

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger

Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Eksempel , opg. 2

Eksempel , opg. 2 Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere