Statistik & Skalavalidering

å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k a b E k s a m e n s n u m r e : 6, 5 3 Side 1 af 17

Indholdsfortegnelse Introduktion... 3 Formål med analysen... 3 Kausaldiagram... 3 Indledende databeskrivelse... 3 Fordelingsbeskrivelse... 4 Marginale analyser... 6 Opgave 1. Differentiel item funktion (DIF)... 9 Opgave 2. Generel lineær analyse... 11 Modelsøgning... 11 Modelkontrol... 13 Forudsætning om varianshomogenitet... 13 Forudsætning om normalfordelte residualer... 14 Forudsætning om linearitet... 14 Tolkning af parameterestimater i slutmodellen... 14 Side 2 af 17

Introduktion Formål med analysen I opgaven ønsker vi for det første at undersøge om den givne motivationsskala har problemer med differentiel item funktion (DIF), og på baggrund heraf om skalaen om muligt bør reduceres så DIF undgås. Derefter vil vi vha. generel lineær analyse vurdere, om graden af motivation, målt som den samlede score på motivationsskalaen, afhænger af variablene alder, køn, kommune, anciennitet, arbejdstid og overarbejde. Herunder klarlægge på hvilken måde disse variable eventuelt influerer på graden af motivation. Kausaldiagram Figur 1 Indledende databeskrivelse Det datamateriale (EKS2010.SAV) som opgaven tager udgangspunkt i, indeholder data fra en undersøgelse af arbejdsmiljøet blandt socialrådgivere og kommunale sagsbehandlere i 12 kommuner fra hele landet. Datamaterialet belyser fem items, og består derfor af fem spørgsmål, som alle er besvaret ud fra fire svarkategorier. Tabel 1: Itembeskrivelse Spørgsmål: S71 S72 S73 S74 S75 Jeg har et godt Det er kun lønnen, arbejde der betyder noget Jeg ville stoppe, hvis jeg havde penge nok Jeg ville vælge noget mere interessant, hvis jeg havde mulighed for det Jeg er stolt over mit arbejde Tabel 2: Svarkategorier Svarkategorier: 1 2 3 4 JA, passer i høj grad JA, passer i nogen grad NEJ, passer ikke NEJ, passer slet ikke Side 3 af 17

Ved spørgsmål S71 og S75 er der i datamaterialet foretaget to omkodninger (til variablene V71 og V75), da spørgsmålene har et positivt indhold modsat de resterende tre spørgsmål. Vægtningen af svarkategorierne skal afspejle at svarkategorien 1 er et udtryk for lavest grad af motivation, mens svarkategorien 4 er udtryk for højest grad af motivation. Udover belysning af de nævnte fem items, indeholder datamaterialet oplysninger om seks baggrundsvariable variable. Dette drejer sig om køn, alder (opdelt i 10-års intervaller), kommune (kodet anonymt fra 1-12), anciennitet (antal år på nuværende arbejdsplads), arbejdstid (ansættelse på heltid eller deltid) og overarbejde (hyppighed for overarbejde ved fire ordinale kategorier). Vi har indledningsvist konstrueret en variabel for motivationsskalaen, som er givet ved: Motivation = V71 + S72 + S73 + S74 + V75 Fordelingsbeskrivelse Vores datamateriale inkluderer data fra i alt 895 socialrådgivere og kommunale sagsbehandlere (størstedelen kvinder 84%), med en gennemsnitlig anciennitet på arbejdspladsen på 9,5 år (SD = 10). I nedenstående histogram (figur 2) ses den afhængige variabel, motivation. Det ses, at den marginale fordeling er tilnærmelsesvist normalfordelt, der dog er en anelse venstreskæv. I den videre analyse giver det ikke nogen mening at transformere denne variabel, for at opnå en bedre normalfordeling, når der ses en venstreskæv fordeling. Vi er opmærksomme på, at ti personer ikke har besvaret et eller flere af de fem spørgsmål, hvorfor der ikke er beregnet en samlet skalaværdi for disse. Figur 2: Fordeling af motivation I tabel 3 ses frekvensfordelingen af alle uafhængige variable, på nær anciennitet. Anciennitet er en kontinuert variabel og kan derfor med fordel beskrives ved et histogram (dette histogram findes som figur 3). Side 4 af 17

Tabel 3: Fordeling af baggrundsvariable Total N (valid%*) Total 895 (100) Alder 18 år 1 (0,1) 19-29 år 89 (10) 30-39 år 177 (19,8) 40-49 år 265 (29,7) 50-59 år 295 (33) 60 år 66 (7,4) Køn Mand 144 (16,1) Kvinde 749 (83,9) Kommune 1 34 (3,8) 2 145 (16,2) 3 132 (14,7) 4 22 (2,5) 5 104 (11,6) 6 53 (5,9) 7 39 (4,4) 8 47 (5,3) 9 37 (4,1) 10 144 (16,1) 11 71 (7,9) 12 67 (7,5) Arbejdstid Heltid 708 (79,6) Deltid 181 (20,4) Overarbejde Sjældent 215 (24,2) 2-3 gange pr. måned 288 (32,4) 2-3 gange pr. uge 277 (31,2) Næsten dagligt 109 (12,3) * Vi har pga. missing -værdier valgt den procentvise fordeling, som tager højde for dette, således at procenterne inden for hver variabel summerer til 100 %. Ud fra ovenstående fordelingstabel ses det, at antal cases i kategorierne inden for hver variabel fordeler sig acceptabelt med undtagelse af alder. Her ses det, at kun ét individ er 18 år. Af denne årsag slår vi de to yngste alderskategorier sammen ( 29 år, n=90). Det vurderes at være vanskeligt at påvise, at der er statistisk forskel variabelgrupperne imellem, hvis der er så få individer i en eller flere grupper. Risikoen højnes for type 2 fejl, når gruppernes størrelser er små. Side 5 af 17

Figur 3: Fordeling af anciennitet Vi ser ud fra ovenstående histogram, at den uafhængige variabel, anciennitet, ikke kan siges at være normalfordelt. Dette er dog ikke noget problem, da der ikke er noget krav om, at uafhængige variable i en generel lineær regressionsanalyse skal være normalfordelte. Vi ser at 25 % af personerne i datasættet har en anciennitet på 2 år eller mindre, mens 50 % af personerne har en anciennitet på 5 år eller mindre. Marginale analyser Den deskriptive sammenhæng mellem motivation og hhv. køn og arbejdstid kan beskrives ved brug af t- test, da disse to uafhængige variable er binære, og vi derfor ved brug af t-test kan sammenligne fordelingen af motivation indenfor hver af variablens to grupper. Dog er t-test en forsimpling af den ensidede variansanalyse (ANOVA), hvorfor denne lige så vel kan anvendes. Sammenhængen mellem de kategoriske variable, alder, kommune og overarbejde, og den afhængige variabel motivation undersøges vha. ensidet variansanalyse (ANOVA). Resultatet heraf ses i tabel 4. Tabel 4: Karakteristik af sammenhæng mellem baggrundsvariable og motivation Gennemsnitlig motivationsscore (SD) Test for varianshomogenitet* Test for middelværdiforskelle** Total 15,44 (2,68) Alder 0,827 0,091 29 år 15,26 (2,87) 30-39 år 15,05 (2,76) 40-49 år 15,46 (2,58) 50-59 år 15,60 (2,68) 60 år 15,98 (2,58) Køn 0,700 0,002 Mand 14,81 (2,71) Kvinde 15,57 (2,67) Kommune 0,115 0,091 1 14,47 (2,77) 2 15,10 (2,68) 3 15,48 (2,60) 4 15,64 (2,42) Side 6 af 17

5 15,49 (2,28) 6 15,17 (2,91) 7 15,38 (3,38) 8 14,85 (2,47) 9 15,97 (2,24) 10 15,59 (2,73) 11 16,16 (3,17) 12 15,79 (2,42) Arbejdstid 0,830 0,113 Heltid 15,50 (2,67) Deltid 15,15 (2,71) Overarbejde 0,119 0,147 Sjældent 15,45 (2,76) 2-3 gange pr. 15,71 (2,47) måned 2-3 gange pr. uge 15,20 (2,73) Næsten dagligt 15,32 (2,97) * p-værdier fra Levenes test. ** p-værdi fra ANOVA test. Som følge af Levenes test konkluderes det, at alle variable i tabellen ovenfor har homogene varianser (nulhypotese om ens varianser godtages). Derudover ses det i tabellen, at hverken alder, kommune, arbejdstid eller overarbejde ved brug af ensidet variansanalyse (ANOVA) har en marginal sammenhæng med motivation. Som den eneste uafhængige variabel, viste køn en signifikant sammenhæng med motivation. Kvinder ses at have en signifikant højere motivation sammenlignet med mænd. Den uafhængige variabel, anciennitet, er kontinuert fordelt, og derfor undersøger vi anciennitetens betydning for motivation ved at se på variablen som den tegner sig i et såkaldt scatterplot. Dette plot kan afsløre, om der findes en tendens, som eventuelt er lineær, kvadratisk eller kubisk. Figur 4: Karakteristik af sammenhængen mellem anciennitet og motivation Vi ser en meget svag tendens til en lineær sammenhæng mellem anciennitet og motivation. Dvs. at jo længere anciennitet på arbejdspladsen des højere motivation. Dog er forklaringskraften ikke stor, da Side 7 af 17

hældningen på den fittede linje er meget lille grundet den store spredning. Vi testede desuden sammenhængen ved lineær regression og fandt, at anciennitet kunne tillægges signifikant betydning for motivation (p = 0,022) ved et signifikansniveau på 5 %. Side 8 af 17

Opgave 1. Differentiel item funktion (DIF) Undersøgelse af DIF er en metode til at foretage skalavalidering ved at afprøve skalaens begrebsvaliditet. DIF kan opfattes som et konfounderproblem og betyder, at besvarelsen af et spørgsmål (item), som skalaen indeholder, påvirkes af andre baggrundsvariable udover den latente variabel. Målingen af fx motivation vil derfor blive konfoundet af den uafhængige variabels direkte effekt på besvarelsen af det enkelte item, som det ses eksemplificeret i figur 5. Figur 5: DIF For at undgå, at målingen af den latente variabel konfoundes, er det nødvendigt at identificere og eventuelt fjerne items, som medfører DIF. En valid skala uden DIF opfylder: Dvs. at den indirekte sammenhæng mellem items og baggrundsvariable bør forsvinde, når der kontrolleres for den totale motivationsscore. Som følge af ovenstående ønsker vi at konstruere og afprøve en skala, der måler arbejdsmæssig motivation blandt socialrådgivere og kommunale sagsbehandlere, uden DIF i forhold til køn, alder, kommune, anciennitet, arbejdstid og overarbejde. Dette gør vi ved at foretage en logistisk regressionsanalyse for hvert af de fem items i motivationsskalaen, hvor hvert item optræder som afhængig variabel, mens den totale motivationsscore og samtlige seks baggrundsvariable indgår som uafhængige variable. Til disse analyser dikotomiseres de fem items, da logistiske regressionsmodeller kun kan håndtere binære afhængige variable. Vi slår derfor svarkategorierne 1 og 2 sammen til en samlet kategori JA, passer i høj grad/nogen grad, mens svarkategorierne 3 og 4 bliver til NEJ passer ikke/slet ikke. I analyserne kontrollerer vi for non-uniform DIF ved at inddrage et interaktionsled mellem motivationsskalaen og hver af de uafhængige variable. Non-uniform DIF optræder, når sammenhængen mellem en baggrundsvariabel, fx alder, og et item er forskellig alt efter hvor på den totale motivationsskala kan befinder sig. Dvs. at der findes en interaktion mellem motivationsscore og placering indenfor den uafhængige variabels undergrupper. Efter analyser for hvert af de fem items, hvor alle uafhængige variable, den totale motivationsscore og interaktionsled inddrages samtidig, finder vi ikke signifikant evidens for non-uniform DIF. Dette fordi ingen af analyserne viser tegn på interaktion mellem skala og de uafhængige variable. Som følge af baglæns manuel modelsøgning, hvor de insignifikante interaktionsled én efter én fjernes fra modellen, finder vi heller ingen tegn på uniform DIF for nogle af de uafhængige variable. Side 9 af 17

For at sikre os, at der ikke kan være tale om uniform DIF, foretager vi yderligere et antal logistiske regressionsanalyser, hvor hvert item igen indgår som afhængig variabel, mens baggrundsvariablene inddrages på skift. Dvs. at vi i alt foretager yderligere 5 x 6 analyser. Analysernes signifikante fund ses i tabel 5. Tabel 5: Tegn på uniform DIF i motivationsskalaen Item* DIF (p-værdi < 0,001) DIF (0,001 p-værdi < 0,01) DIF (0,01 p-værdi 0,05) v71 - - - s72 - - - s73 - - - s74 - - Anciennitet (p-værdi = 0,026) v75 - - - * Dikotome items er benyttet Det ses nu, at variablen anciennitet har svag signifikant direkte sammenhæng med det dikotome item S74. Jo kortede anciennitet på arbejdspladsen, jo større er tilbøjeligheden til at ville vælge noget mere interessant arbejde, hvis muligheden var der, efter at der er taget højde for den totale motivationsscore. På baggrund af det store antal gennemførte logistiske regressionsanalyser er det dog afgørende ikke at overvurdere det svagt signifikante testresultat. Ved meget analysearbejde er der risiko for falske resultater, fx i forbindelse med type 1 fejl. Af denne årsag vælger vi kun at bekymre os om p-værdier mindre end 1 %, og sådanne værdier afsløres ikke i analyserne. Vi vurderer på baggrund heraf, at motivationsskalaen fungerer bedst indeholdende alle fem items og derfor ikke bør reduceres. Side 10 af 17

Opgave 2. Generel lineær analyse Her er den overordnede problemstilling, hvilken betydning de uafhængige variable har for motivationsscoren, samt om effekten af de uafhængige variable interagerer. Underordnede problemstillinger består i, om forudsætningerne for generel lineær regressionsanalyse opfyldes. Indledningsvist foretager vi en generel lineær regressionsanalyse med motivation som afhængig variabel og variablene køn, alder, kommune, anciennitet, arbejdstid og overarbejde som uafhængige variable. Vi inddrager desuden samtlige to-vejsinteraktioner mellem de uafhængige variable. Da der herved er tale om et stort antal parametre i vores start-model vælger vi gennem analysen at benytte et signifikansniveau på 1 %. Nedenfor ses en tabel med de kategoriske variable i regressionsanalysen. Tabel 6: Kategoriske variable i den generelle lineære analyse Ydre/eksogen variabel Værdi Label N Alder* 1 29 år 89 2 30-39 år 174 3 40-49 år 258 4 50-59 år 281 5 60 år 62 Køn 1 Mand 142 2 Kvinde 722 Kommune 1-34 2-139 3-127 4-22 5-101 6-52 7-39 8-45 9-35 10-138 11-65 12-67 Arbejdstid 1 Heltid 691 2 Deltid 173 Overarbejde 1 Sjældent 204 2 2-3 gange pr. måned 284 3 2-3 gange pr. uge 268 4 Næsten dagligt 108 * To yngste alderskategorier slået sammen. Modelsøgning Første trin i den generelle lineære regression består af vores mættede startmodel, som inkluderer alle parametre, dvs. de uafhængige variable og deres interaktionsled (se tabel 7). Det bemærkes, at kommune (p = 0,003), overarbejde (p = 0,006) og kommune*overarbejde (p = 0,001) viser signifikant forklaringskraft i startmodellen. Resten af parametrene er insignifikante, og modellen kan derfor siges at være overparametriceret i forhold til data, hvilket nødvendiggør en baglæns modelsøgning for at eliminere de parametre, som ikke er troværdige udtryk for hverken interaktioner eller effekter. I Side 11 af 17

modelsøgningens trin udregnes F-teststørrelser og signifikansniveau for hver enkelt parameter, og den mindst signifikante parameter fjernes fra modellen. Denne procedure foretages i overensstemmelse med det hierarkiske princip, som benyttes ved inddragelsen af interaktionsled i modelsøgningen, og betyder at man ikke må fjerne en hovedvariabel førend alle interaktionsled, som er sammensat af denne er fjernet i modellen. Modelsøgningen fortsættes indtil det ikke længere er muligt at fjerne insignifikante parametre. Vores eksklusionsproces af parametre i modelsøgningen ses i tabel 8. I tabel 7 ses modelsøgningens start- og slutmodel fra vores generelle lineære regressionsanalyse. Sammenlignes slutmodellens signifikante p-værdier med tendenserne ved de marginale analyser ses det, at køn og anciennitet ikke længere har signifikant betydning for motivation. Til gengæld har det vist sig, at kommune, arbejdstid og overarbejde er signifikant associeret med motivation. Tovejsinteraktionsleddene alder*køn, køn*overarbejde og kommune*overarbejde har tillige signifikant forklaringskraft. Dog bemærkes det, at hverken alder eller køn har signifikant forklaringskraft alene. Tabel 7: Den mættede startmodel og slutmodellen Startmodel Slutmodel Variabel F-teststørrelse p-værdi* F-teststørrelse p-værdi* Alder 2,358 0,052 2,173 0,070 Køn 2,201 0,138 0,637 0,425 Kommune 2,561 0,003 2,611 0,003 Anciennitet 1,027 0,311 - - Arbejdstid 4,821 0,028 9,754 0,002 Overarbejde 4,127 0,006 4,328 0,005 Alder*Køn 2,087 0,081 3,986 0,003 Alder*Kommne 0,956 0,554 - - Alder*Anciennitet 0,586 0,673 - - Alder*Arbejdstid 0,659 0,620 - - Alder*Overarbejde 1,754 0,052 - - Køn*Kommune 1,544 0,111 - - Køn*Anciennitet 2,308 0,129 - - Køn*Arbejdstid 1,006 0,316 - - Køn*Overarbejde 2,481 0,060 4,609 0,003 Kommune*Anciennitet 0,605 0,825 - - Kommune*Arbejdstid 0,771 0,670 - - Kommune*Overarbejde 1,947 0,001 2,157 < 0,001 Anciennitet*Arbejdstid 0,186 0,666 - - Anciennitet*Overarbejde 2,395 0,067 - - Arbejdstid*Overarbejde 1,911 0,126 - - * p-værdi baseret på F-teststørrelsen fra ANOVA. Side 12 af 17

Tabel 8: Baglæns modelsøgning Trin Fjernet variabel p-værdi* 1 Kommune*Anciennitet 0,825 2 Anciennitet*Arbejdstid 0,688 3 Kommune*Arbejdstid 0,672 4 Alder*Arbejdstid 0,606 5 Alder*Anciennitet 0,507 6 Køn*Arbejdstid 0,531 7 Alder*Kommune 0,193 8 Køn*Kommune 0,107 9 Køn*Anciennitet 0,104 10 Alder*Overarbejde 0,054 11 Anciennitet*Overarbejde 0,133 12 Anciennitet 0,274 13 Arbejdstid*Overarbejde 0,084 * p-værdi baseret på F-teststørrelse fra ANOVA. Modelkontrol For at analyseresultaterne i vores slut-model er brugbare og tolkningsværdige, er det nødvendigt, at forudsætningerne for gennemførelsen af variansanalysen i rimeligt omfang er opfyldte. Modelkontrol af generelle lineære modeller består primært af residualanalyse, som er en analyse af de standardiserede residualer. Forudsætning om varianshomogenitet Modelforudsætningen om varianshomogenitet undersøges vha. Levenes homogenitetstest for slutmodellen og et grafisk scatterplot med de standardiserede residualer mod de prædikterede værdier af den afhængige variabel motivation. Ud fra Levenes homogenitetstest godtager vi nul-hypotesen om varianshomogenitet (p = 0,144). Nedenstående figur 6 viser desuden, at der i plottet ikke er en systematisk, men tilfældig, spredning mellem de standardiserede residualer og de prædikterede værdier af motivation, hvorfor forudsætningen om varianshomogenitet understøttes. Figur 6: Scatterplot af de standardiserede residualer mod de prædikterede værdier af motivation Side 13 af 17

Forudsætning om normalfordelte residualer Denne forudsætning undersøges ved et histogram over de standardiserede residualer for motivation med indtegning af en normalfordelingskurve, som det ses i figur 7. Det ses, at fordelingen af residualerne ikke afviger betydeligt fra normalfordelingskurven. Herudover undersøges den betingede normalfordeling af residualerne ved at sætte den kumulerede observerede fordeling af motivation mod den kumulerede forventede fordeling. Plottet viser som histogrammet, at residualerne er tilnærmelsesvist identisk normalfordelte, hvorfor residualerne må være uafhængige af alle baggrundsvariable i datamaterialet og kun afhænge af den afhængige variabel. Forudsætningen vurderes at være opfyldt. Figur 7: Fordeling af de standardiserede residualer for motivation Figur 8: P-P plot med de standardiserede residualer for motivation Forudsætning om linearitet Denne forudsætning er umiddelbart kun interessant i forhold til den uafhængige variabel, anciennitet, da denne er den eneste kontinuerte ydre variabel i vores datasæt. En enkelt måde at afprøve, hvorvidt effekten af den uafhængige variabel er lineær, er ved at inkludere et kvardratisk og/eller kubisk led af variablen i regressionsmodellen. Hvis effekten rent faktisk er lineær, må beta-værdien knyttet til det kvardratiske eller kubiske led ikke være signifikant forskelligt fra nul. Dette undersøgte vi allerede indledningsvist ved den marginale analyse af anciennitet, hvor vi i figur 4 så en svag lineær tendens, fordi observationerne fordelte sig nogenlunde pænt omkring en ret linje. Ved afprøvning af effekten af det kvardratiske og kubiske led, fandt vi ingen signifikante værdier, hvorfor disse led ikke kan tilskrives nogen forklaringskraft for motivation og derfor ikke blev bibeholdt i den lineære regressionsmodel. Tolkning af parameterestimater i slutmodellen Modelkontrollen afslørede ingen problemer med de tre forudsætninger for gennemførelsen af den generelle lineære analyse, og resultaterne i vores slutmodel vurderes på denne baggrund at være tolkningsværdige. Som beskrevet til slut i vores analyse, har de uafhængige variable kommune, arbejdstid og overarbejde signifikant forklaringskraft for motivation. To-vejsinteraktionsleddene alder*køn, køn*overarbejde og kommune*overarbejde har tillige en signifikant effekt. I det følgende redegøres for estimaterne af de signifikante parametre i slutmodellen. Parameterestimaterne (β) for samtlige signifikante hovedvariable og interaktioner er ikke vist her, da en Side 14 af 17

sådan tabel ville være meget lang. Vi viser kun parameterestimatet for hovedvariablen arbejdstid (se tabel 9), da denne er den eneste, som ikke også indgår i ét eller flere signifikante interaktionsled. Parameterestimaterne svarer til middelværdiforskelle. Parameterestimaterne for de signifikante hovedvariable kommune og overarbejde og de signifikante interaktioner er som nævnt udeladt i tabel 9, og effekterne af disse vil blive berørt separat, når vi redegør for effekten af interaktionerne. Tabel 9: Parameterestimater for den signifikante hovedvariabel arbejdstid Variabel β (95 % CI) p-værdi** Arbejdstid Heltid 0,715 (0,266 1,164) 0,002 Deltid 0* - * Referencegruppe. ** p-værdi ved t-test. Testet angiver, om der er forskel mellem de enkelte variabelgrupper og referencen. Af tabel 9 ser vi, at personer med fuldtidsarbejde gennemsnitlig har en motivation på 0,715 point højere end personer, som kun arbejder på deltid. Vores slutmodel kompliceres en hel del ved at indeholde flere signifikante interaktioner: mellem alder og køn, mellem køn og overarbejde samt mellem kommune og overarbejde. Interaktionerne betyder, at styrken af den ene uafhængige variabels effekt afhænger af værdien af den anden uafhængige variabel. En manglende interaktion vil omvendt sige, at en uafhængig variabel, har homogen effekt på den afhængige variabel, uanset værdierne de andre uafhængige variable. Interaktionen mellem alder og køn (p=0,003) betyder, at der opstår en synergieffekt, fordi variablene skaber lokale sammenhænge, hvor variablene effektmodificerer hinanden. Da køn udover at modificere effekten af alder, modificeres af overarbejde, mens overarbejde udover at modificere effekten af køn modificeres af kommune, er der tale om et kompliceret net af indbyrdes modificerende interaktioner. For at undersøge hvad en given interaktion har af betydning, er det nødvendigt at beregne den samlede effekt af variablene i interaktionen samt af de variable der modificerer effekten af interaktionens variable. Dette er forsøgt eksemplificeret i tabel 10, hvor den samlede effekt er beregnet ud fra slutmodellens parameterestimater. I tabellen vælger vi kun at indsætte beregninger på baggrund af kommune "1" matchet med overarbejde sjældent. Beregningerne bygger på følgende formel:,, ø ø ø ø Side 15 af 17

Tabel 10: Samlet effekt af kommune, overarbejde, køn og alder Kommune 1 2 3 4 5 6 7 8 9 10 11 12 Sjældent* 2-3 gange pr. måned* 2-3 gange pr. uge* Næsten dagligt* Mand Kvinde Mand Kvinde Mand Kvinde Mand Kvinde Alder 29 år -1,961-3,699 30-39 år -5,203-3,627 40-49 år -4,238-3,200 50-59 år -5,224-2,868 60 år -5,146-2,519 0** * Hyppighed af overarbejde. ** Reference: Kommune = 1, overarbejde = næsten dagligt, køn = kvinde og alder 60 år. Side 16 af 17

På baggrund af ovenstående tabel 10 med udregnede samlede effekter ses det fx, at mænd under eller lig 29 år, som sjældent har overarbejde og hører til kommune 1 gennemsnitlig har 1,961 point lavere motivation sammenlignet med referencegruppen, som består af kvinder i alderen ældre eller lig 60 år, som næsten dagligt har overarbejde og tilhører kommune 12. Det ses samtidig i tabellen, at den gennemsnitlige motivation blandt mænd, som sjældent har overarbejde og tilhører kommune 1 falder med alderen. Den modsatte tendens ses blandt kvinderne, hvor den gennemsnitlige motivation stiger med alderen. For at afprøve, om disse teoretiske udregninger stemmer overens med de rå observationer fra datasættet, har vi i nedenstående figur 9 plottet den additive effekt af alder og køn mod motivation for personer, som sjældent har overarbejde og tilhører kommune 1. Figur 9: Samlet effekt af alder og køn hos personer, som sjældent har overarbejde og tilhører kommune "1" Vi er opmærksomme på, at der i data kun findes meget få personer (n = 7), som udover at tilhøre kommune 1 sjældent har overarbejde. Figuren kan derfor ikke benyttes til en gyldig tolkning af interaktionernes samlede effekt på motivationsscore. Vi ser dog, at linjerne i figuren tegner samme billede som tabel 10. Side 17 af 17