Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Relaterede dokumenter
Synopsis til eksamen i Statistik

Eksamen i statistik 2009-studieordning

Eksamen i Statistik og skalavalidering

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Statistik & Skalavalidering

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

Generelle lineære modeller

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Multipel Lineær Regression

Statistik Lektion 4. Variansanalyse Modelkontrol

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Statistik og skalavalidering. Opgave 1

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Eksamen i Statistik for biokemikere. Blok

Løsning til eksamen d.27 Maj 2010

1 Regressionsproblemet 2

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

1 Hb SS Hb Sβ Hb SC = , (s = )

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Løsning eksamen d. 15. december 2008

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Forelæsning 11: Kapitel 11: Regressionsanalyse

Logistisk Regression - fortsat

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Modul 11: Simpel lineær regression

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

To-sidet varians analyse

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Eksamen Efterår 2013

Kapitel 11 Lineær regression

Statistik Lektion 16 Multipel Lineær Regression

Bilag 12 Regressionsanalysens tabeller og forklaringer

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Lineær regression i SAS. Lineær regression i SAS p.1/20

Løsning til eksaminen d. 14. december 2009

Module 12: Mere om variansanalyse

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Psykisk arbejdsmiljø og stress

Modul 12: Regression og korrelation

Statistik II 1. Lektion. Analyse af kontingenstabeller

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Test nr. 6 af centrale elementer 02402

Konfidensintervaller og Hypotesetest

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

Statistik II 4. Lektion. Logistisk regression

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Appendiks Økonometrisk teori... II

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk regression

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og Biostatistik

Reeksamen i Statistik for Biokemikere 6. april 2009

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

(studienummer) (underskrift) (bord nr)

Kapitel 12 Variansanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Fokus på Forsyning. Datagrundlag og metode

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Normalfordelingen og Stikprøvefordelinger

Modelkontrol i Faktor Modeller

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kapitel 12 Variansanalyse

Transkript:

Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010

Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af data... 3 Graf 1: Normalfordelingen af motivationsskalaen... 3 2.0 Opgave 1... 4 Tabel 1: p-værdier fra DIF-analysen... 4 Figur 1: Differentiel item funktion... 5 2.1 Delkonklusion... 5 3.0 Opgave 2... 6 Tabel 2: Signifikansniveau for den kausale relation... 6 Figur 2: DAG... 6 Tabel 3: Insignifikante interaktionsled og hovedeffekt... 7 Tabel 4: Slutmodel... 7 Tabel 5: Insignifikante interaktioner og hovedeffekt ved analyse for kvinder... 8 Tabel 6: Slutmodel for kvinder... 8 3.1 Modelkontrol... 9 Figur 5: Kontrol for linearitet... 10 Figur 6: Kontrol for varianshomogenitet af motivation... 10 Figur 7: Histogram over de standardiserede residualer... 10 Figur 8: PP-plot over de standardiserede residualer for kvinder... 10 3.2 Resultater... 10 Tabel 7: β-parametre for hovedeffekter og interaktioner... 11 Tabel 8: Samlet effekt af kommune og overarbejde... 12 Graf 2: De samlede effekter af kommune og overarbejde... 12 4.0 Diskussion og konklusion... 13 2

1.0 Indledning Denne eksamensopgave tager udgangspunkt i resultaterne fra en undersøgelse af arbejdsmiljøet blandt socialrådgivere og kommunale sagsbehandlere i 12 anonymiserede kommuner fordelt over hele landet. På baggrund heraf er det, ud fra statistiske analyseredskaber, muligt at måle de ansattes motivation i forhold til deres arbejde. Dette er relevant for både de ansatte og deres chef, men også resten af samfundet, da resultaterne giver en fornemmelse af trivslen og arbejdet som kommunalansat socialrådgiver og sagsbehandler samt mulighed for forbedringer af arbejdsmiljøet. Der har i mange år været fokus på forskellige motivationsteorier, blandt andet for at fremme arbejdsmiljøet. En af de mest kendte er Abraham Marslows behovspyramide, der grafisk fremstiller de menneskelige behov i syv trin med de basale behov nederst 1. Disse behov er ligeledes et udtryk for motivationen idet jo flere behov individet har opfyldt, des mere motiveret er det. 1.1 Karakteristika af data For at klarlægge karakteristikken af populationen, er der foretaget en deskriptiv analyse. Populationen består af 895 socialrådgivere og sagsbehandlere, hvoraf 83,7 % er kvinder. Den største aldersgruppe er fra 50-59 år med 33%. Fordelingen af populationen i de 12 kommuner er ikke lige fordelt, hvor spændvidden går fra 34 personer i den mindste kommune til 145 personer i den største. 79,1% arbejder på heltid, mens halvdelen af populationen, 51,6%, har været ansat 5 år eller derunder. Yderligere oplever 56,6% af de ansatte overarbejde 2-3 gange pr. måned eller sjældnere. Datasættet består af følgende uafhængige variable; køn, alder, kommune, ansættelsestid 2, overarbejde 3 og anciennitet. Desuden er der fem items (V71, S72, S73, S73 og V75), der sammenlagt danner en skala, som måler motivationen blandt de ansatte. Nedenstående histogram viser skalaens fordeling. Graf 1: Normalfordelingen af motivationsskalaen Som det ses, er motivationsskalaen en anelse højreforskudt, hvor variansen bliver lidt større med en venstre-hale. Vi vurderer, at den er normalfordelt, men skal være opmærksomme på loftseffekt 4. Det kan bemærkes, at personer, der mangler et svar på et eller flere spørgsmål ikke får beregnet en skalaværdi. Det drejer sig her om 10 personer (ca. 1 %). Den deskriptive statistik viste, at der kun er én person i aldersgruppen 18 år eller yngre. Denne person er ikke blevet lagt sammen med den næste aldersgruppe 19-29 år, hvilket kan give et skævt estimat. 1 A. Huczynski & D. Buchanan, 2007, s. 242 244. 2 Efterfølgende benævnt heltid. 3 Overarbejde er delt op i fire kategorier, fra næsten dagligt til sjældent. 4 S. Kreiner, 2007, s. 23. 3

Data for anciennitet så ikke helt normalfordelt ud, hvilket betyder at vi har taget logaritmen til anciennitet samt undersøgt anden og tredje grads polynomiet uden et forbedret resultat. Det betyder, at vi arbejder videre med anciennitet uden at ændre den (figurer ikke vist). 2.0 Opgave 1 Formålet i opgave 1 er at undersøge, om skalaen har problemer med differentiel item funktion (DIF) og om det i givet fald er muligt at konstruere en reduceret skala uden DIF. For statistisk at kunne vurdere om skalaens items er betinget uafhængige af de eksogene variable, er det yderst relevant at undersøge for DIF. Indeholder en skala DIF betyder det, at den ikke fungerer ens på alle af de undersøgte grupper. I så fald er der risiko for, at estimaterne bliver konfoundet. Det er derfor et krav, at den anvendte skala ikke indeholder DIF. Vi foretager logistisk regressionsanalyse for at undersøge dette. I den forbindelse har vi valgt at dikotomisere items, hvorved ja, passer i høj grad og ja, passer i nogen grad er lagt sammen til ja, og nej, passer ikke og nej, passer slet ikke er lagt sammen til nej. Det betyder, at vi eventuelt mister noget forklaringsgrad. Vi sætter vores items som de afhængige variable, og tester hvert af dem mod baggrundsvariable (køn, alder, kommune, anciennitet, heltid og overarbejde) og skalaen. Eftersom vi ikke fandt det nødvendigt at anvende anden og tredjes polynomium for anciennitet, er de heller ikke medtaget i DIF analysen. Derved testes eksempelvis om sandsynligheden for at det kun er lønnen, der har betydning 5, givet den samlede score, afhænger af de ovennævnte eksogene variable. Er dette tilfældet er itemet biased i forhold til den eksogene variabel, og informationen fra det item er ikke sufficient opsummeret i den samlede score. Vi vælger at teste på niveau 1%, da vi vurderer, at et test på niveau 5% giver øget risiko for type I fejl, når mange test foretages. Type I fejl forekommer, når en rigtig nulhypotese forkastes, mens type 2 fejl forekommer, når en forkert nulhypotese accepteres. Det kan derfor siges, at valget af kritisk niveau er en vurderingssag idet det handler om at finde den rette balance mellem risikoen for type I og type II fejl. Vi er klar over, at vi øger risikoen for type II fejl, mens risici for type I fejl mindskes 6. Tabel 1: p-værdier fra DIF-analysen Spørgsmål: V71 S72 S73 S74 V75 Sig. Sig. Sig. Sig. Sig. Kommune,989,609,253,463,311 Køn(1) 7,077,243,994,615,087 Alder,871,431,356,965,409 Anciennitet,519,949,584,061,346 Heltid(1),430,777,303,816,526 Overarbejde,314,603,833,384,959 Motivationsskala,000,000,000,000,000 Vi er endt ud med fem tabeller, svarende til de fem items (tabel 1), hvor sammenhængen mellem det afhængige item variabel og de eksogene variable (skalavariabel, køn, kommune m.v.) er undersøgt. Hver tabel er gennemgået for at se om der er DIF på niveau 1%, hvilket findes ved de signifikante værdier for de eksogene variable. Motivationsskalaen er signifikant ved test af alle 5 Item s72. 6 S. Kreiner, 2007, s. 266. 7 (1) står for referencegruppen. 4

items eftersom det er skalaen. Der er dog ingen af de eksogene variable, der er signifikante, hvilket betyder, at der ikke er DIF. Vi har ligeledes testet item variable i forhold til skala og én uafhængig variabel af gangen. I den forbindelse fandt vi ligeledes ingen DIF. Et tænkt eksempel med DIF vil se ud som nedenstående figur 1, hvor kommune både påvirker et item direkte og indirekte igennem motivationsskalaen. Figur 1: Differentiel item funktion V71: Jeg har et godt arbejde DIF Kommune S72: Det er kun lønnen, der betyder noget S73: Jeg ville stoppe, hvis jeg havde penge nok Motivationsskala Køn Alder Anciennitet S74: Jeg ville vælge noget mere interessant arbejde, hvis jeg havde mulighed for det Heltid Overarbejde V75: Jeg er stolt over mit arbejde 2.1 Delkonklusion Hensigten med opgave 1 er at undersøge om skalaen indeholder DIF, og i den forbindelse er der ikke fundet DIF. Dette er et udtryk for, at der er betinget uafhængighed mellem de eksogene variable og items. Det er dog kun de variable tilhørende datasættet, der er taget højde for. Det vil sige, at skalaen kan være konfoundet af andre eksogene variable, som der ikke er taget højde for. Et eksempel herfor kan være civilstatus, altså om man er gift eller bor alene. De dikotomiserede items forårsager en datareduktion og de mange test, der foretages, medfører risiko for type II fejl, men da vi har anvendt logistisk regression har vi vurderet, at det har været en nødvendighed for at undgå type I fejl. DIF kunne være undersøgt ved for eksempel partielle gammakoefficienter, hvor datareduktionen kunne være undgået, men det ville have været mere omfattende. Vi finder, at det giver mest mening at fastholde den originale skala, da der ikke er forskel på, hvad man svarer på items i forhold til de eksogene variable. 5

3.0 Opgave 2 Der foretages, i opgave 2, en generel lineær analyse med motivationsskalaen som afhængig variabel, der kan fortælle om og i givet fald på hvilken måde graden af motivation afhænger af de øvrige variable. Det undersøges med en generel lineær model, hvorledes ligningen ser ud som følgende: Y= α + β 1 *X 1 + β 2 * X 2 + β 3 * X 1 * X 2 + ε, hvor α svarer til skæringen på y-aksen, β svarer til ligningens hældning og ε er N (0;σ 2 ). I sammenhæng med ovenstående har vi valgt at opstille en kausal relation mellem variablene: Køn alder kommune anciennitet heltid overarbejde motivationsskala Dette har vi valgt at gøre for at skabe sammenhæng mellem de forskellige variable og danne et directed acyclic graph (DAG). Det fremstilles for at vide hvilke variable, der skal medtages i den generelle lineære model. Derfor har vi testet signifikansniveauerne i forhold til om der er en kausal relation mellem variablene (tabel 2). Den kausale relation er valgt ud fra vores egen mening i forhold til, hvordan variablene hører sammen, og derfor er det en subjektiv vurdering, der eventuelt vil vurderes anderledes af andre personer. Tabel 2: Signifikansniveau for den kausale relation Afhængige variable Signifikansniveau (5%) Motivationsskala Køn (0,001), Heltid(0,006) Overarbejde Kommune (0,003) Heltid Alder (0,015), køn (0,000) Anciennitet Alder (0,000), køn (0,027) Kommune Køn (0,011) Alder Køn (0,000) Variablene er beregnet ud fra deres type, og der er anvendt generel lineær model med undtagelse af heltid, hvor vi har anvendt logistisk regression. Tabel 2 viser signifikante p-værdier, hvilket angiver, at der er en kausal relation. Det betyder, at vi får et DAG, der ser ud som nedenstående figur 2. Figur 2: DAG Vi kan se at kommune, overarbejde og anciennitet ikke har direkte indflydelse på skalaen. Idet vi ikke har det store kendskab til variablenes betydning for motivationen, har vi forsøgt at finde litteratur, der kan klarlægge dette. Det har dog ikke været muligt at finde litteratur om de pågældende variables indflydelse på motivation. Ligeledes mener vi, at det videre arbejde med dette DAG, vil ende ud med en overforsimplificeret model. Derfor vurderes det, at vi ikke har mulighed for at fremsætte om de nævnte variable skal undlades af analysen, og derfor vælger vi at anvende generelle lineære modeller med alle variable inkluderet. Vi er klar over, at det har betydning for analysens resultater, at vi inddrager alle variable. 6

Før vi kan gå i gang med den generelle lineære model, ser vi på den bivariate analyse, hvor vi har testet for varianshomogenitet ved hjælp af t-test og ensidet ANOVA test, hvor Levene s test påviser homogenitet eller ej. Den tester nulhypotesen (H 0 ), der siger, at varianserne er ens. Hvis p- værdien er under 0,05 kan dette afvises og betyder, at der er forskel over varianserne. For køn er der varianshomogenitet (p=0,700), men vi fandt dog, at der er forskel på mænd og kvinders gennemsnitlige motivation (p=0,002), hvilket et box-plot også viser (ikke vist). Levene s test for overarbejde viser varianshomogenitet (p=0,117), men der er en tendens til at graden af overarbejde har betydning for motivationen (p=0,044). Det betyder, at heltid, alder og kommune ikke udviser indflydelse på motivationen. Som skrevet tidligere er analysen lavet ved hjælp af generel lineær model, og i den forbindelse er det valgt at trække data med missing values ud af analysen, for at sikre et ens antal individer. Skalaen er sat som den afhængige, mens de eksogene variable er sat som uafhængige. Derfor indeholder startmodellen alle hovedeffekterne samt alle interaktionsled (ikke vist). Der er kun medtaget tovejsinteraktioner, da risikoen for en overparametriseret model øges. Tabel 3: Insignifikante interaktionsled og hovedeffekt Trin Interaktion Sig. (5%) 1: Kommune*anciennitet 0,823 2: Heltid*anciennitet 0,689 3: Kommune*heltid 0,681 4: Alder*heltid 0,606 5: Køn*heltid 0,550 6: Alder*anciennitet 0,490 7: Kommune*alder 0,195 8: Kommune*køn 0,110 9: Køn*anciennitet 0,102 10: Alder*overarbejde 0,057 11: Overarbejde*anciennitet 0,132 12: Overarbejde*heltid 0,059 13: Anciennitet 0,264 Med udgangspunkt i baglæns modelsøgning, og ud fra det hierarkiske princip 8, eliminerer vi de insignifikante variable. Dette princip er baseret på den højeste ordens-interaktion, hvilket første gang er interaktionen mellem kommune og anciennitet (p = 0,823). Herefter bliver modellen genestimeret. Således forsætter vi med at eliminere et led af gangen, indtil der ikke er flere insignifikante variable (tabel 3 og 4). De variable, der indgår i en interaktion kan ikke elimineres. Anciennitet tages ud, da den er høj insignifikant og ikke indgår i en interaktion (tabel 3). Vi vurderer ligeledes, at anciennitet korrelerer med alder og derfor godt kan udelades. Tabel 4: Slutmodel Tests of Between-Subjects Effects Dependent Variable:Motivationsskala Source Type III Sum of Squares df Mean Square F Sig. Corrected Model 926,453 a 61 15,188 2,289,000 Intercept 10912,116 1 10912,116 1644,702,000 Kommune 184,058 11 16,733 2,522,004 Køn 5,135 1 5,135,774,379 8 S. Kreiner, 2007, s. 505. 7

Alder 64,016 5 12,803 1,930,087 Heltid 72,994 1 72,994 11,002,001 Overarbejde 87,089 3 29,030 4,375,005 Køn * Alder 88,493 4 22,123 3,334,010 Kommune * Overarbejde 465,636 33 14,110 2,127,000 Køn * Overarbejde 91,866 3 30,622 4,615,003 Error 5321,037 802 6,635 Total 211505,000 864 Corrected Total 6247,490 863 a. R Squared =,148 (Adjusted R Squared =,084) Vi ender med en model, hvor der er interaktion mellem alder & køn, kommune & overarbejde og køn & overarbejde, hvor effekten af overarbejde og alder påvirkes af køn, og effekten af kommune og køn påvirkes af overarbejde (tabel 4). Derudover indeholder modellen de signifikante uafhængige variable samt de variable, der er forbundet i interaktioner. De variable, der indgår i interaktionerne, gør, at vi ikke kan udtale os om hovedeffekterne 9. Ligeledes kan R 2 ses i tabel 4. Vi har testet modelantagelserne, hvilke er opfyldte. De bliver ikke vist her, da vi går videre med analysen. Dette er også grunden til, at vi ikke tolker på den første analyses resultater. Det er derfor nødvendigt at lave en ny analyse, hvor vi deler køn op. Dette vælger vi at gøre, da køn indgår i to af interaktionerne. Idet vi foretager en ny analyse laver vi indledende bivariat analyse for kvinder. Der påvises varianshomogenitet og variablen heltid viser også en forskel i middelværdien (p=0,020). Vi tester desuden varianshomogeniteten for analysen med kvinder (p= 0,050) ved Levene s test og konstaterer, at der er varianshomogenitet. Analysen køres forfra med alle hovedeffekter og tovejsinteraktioner, men kun for kvinder (tabel 5). Det har vi valgt at gøre, da populationen for mænd er få (n = 144). Tabel 5: Insignifikante interaktioner og hovedeffekt ved analyse for kvinder Trin Interaktion Sig. (5%) 1: Kommune*anciennitet 0,773 2: Heltid*anciennitet 0,754 3: Alder*anciennitet 0,647 4: Alder*heltid 0,629 5: Kommune*heltid 0,624 6: Heltid*overarbejde 0,139 7: Alder*overarbejde 0,066 8: Kommune*alder 0,118 9: Overarbejde*anciennitet 0,073 10: Alder 0,331 Som nævnt tidligere korrelerer alder og anciennitet, og da alder er mere insignifikant end anciennitet i denne model, vælger vi at eliminere den. Det betyder også at sammenlægning af aldersgrupperne ikke har den store betydning, da den ikke er med i vores slutmodel. Vi ender derved op med nedenstående slutmodel (tabel 6). Tabel 6: Slutmodel for kvinder Tests of Between-Subjects Effects Dependent Variable:Motivationsskala Source Type III Sum of Squares df Mean Square F Sig. Corrected Model 545,421 a 48 11,363 1,660,004 Intercept 44017,210 1 44017,210 6428,632,000 Kommune 100,441 11 9,131 1,334,201 9 T. Nielsen & S. Kreiner (2008), s. 422. 8

Heltid 58,613 1 58,613 8,560,004 Overarbejde 45,101 3 15,034 2,196,087 Kommune * Overarbejde 332,970 32 10,405 1,520,034 Ancien 71,580 1 71,580 10,454,001 Error 4608,070 673 6,847 Total 179452,000 722 Corrected Total 5153,490 721 a. R Squared =,106 (Adjusted R Squared =,042) Slutmodellen indeholder signifikante hovedeffekter og interaktionen kommune,overarbejde, og på grund af dette, kan vi ikke udtale os om hovedeffekterne for kommune og overarbejde. Vi kunne i den sammenhæng have valgt at stratificere vores undersøgelse på kommune og overarbejde for at udtale os om hovedeffekterne. Dette ville dog være endt op med en meget stor analyse, hvilken vi ville have foretaget i et forskningsprojekt. Analysen for mænd er foretaget, men eftersom populationen er lille, vurderer vi, at der er for stor usikkerhed i estimaterne til at anvende i denne opgave. For at undersøge hvilken model der, for kvinder, forklarer variablenes indflydelse på motivationsskalaen bedst, anvender vi likelihood ratio testet, hvor nulhypotesen (H 0 ) er, at modellerne forklarer variablene på motivation lige godt. Dette skyldes, at vi ønsker en model, der med det samme udgangspunkt kan forklare variablene på motivationen lige godt, dog uden overflødig forklaring. Følgende formel bliver brugt til at udregne -2loglikelihood: AIC = n[log(2πrss/n +1)], hvor n er # data og RSS er residual sum of squares. Startmodel: 721[log(2π3858,727/721+1] = 1109,918 Slutmodel: 721[log(2π4608,070/721+1] = 1164,015 De beregnede værdier kan benyttes i en syntaksfil 10, hvor værdierne og frihedsgraderne 11 benyttes til at beregne p-værdien. Vi får en p-værdi på 0,99977, hvilket indikerer, at den beregnede p-værdi i log-likelihoodtestet er insignifikant. Det betyder, at vi accepterer vores nulhypotese. Vi mener hermed, at slutmodellen forklarer variablenes indflydelse på motivationen lige så godt som startmodellen. 3.1 Modelkontrol For at kunne forklare og tolke modellen meningsfuldt skal modelantagelserne om betinget varianshomogenitet og normalfordeling for motivation givet de uafhængige variable være opfyldt 12. Levene s Test viser en p-værdien på 0,112 og der er dermed varianshomogenitet. Ligeledes blev lineariteten (figur 5) og variansen undersøgt grafisk ved at plotte de standardiserede residualer mod de prædikterede værdier af motivationen (figur 6), hvorfra antagelsen om varianshomogenitet accepteres. Det kan ses, at data ikke fordeler sig helt systematisk mellem de standardiserede residualer og de prædikterede værdier for motivation, men med en tendens til en lidt mindre spredning for højere værdier af motivation. 10 Pchi.sps. 11 Aflæst i tabel. (df slutmodel = 673 & df startmodel = 578). 12 S. Kreiner, 2007 s. 567. 9

Figur 5: Kontrol for linearitet Figur 6: Kontrol for varianshomogenitet af motivation Normalfordelingsantagelsen blev accepteret, da Kolmogorov-Smirnov testet for de standardiserede residualer var insignifikant (p=0,086), og da histogram og PP-plot ligeledes for de standardiserede residualer begge viser normalfordeling (figur 7 og 8). Figur 7: Histogram over de standardiserede residualer Figur 8: PP-plot over de standardiserede residualer for kvinder 3.2 Resultater I dette afsnit vil analysens resultater blive præsenteret og gennemgået. Tabel 7 viser α, β- parametrene for hovedeffekter og interaktioner, t-testet samt 95%-konfidensintervallet. p- værdien er ikke angivet i tabel 7, da de 95%-konfidensinterval, der indeholder 1 er insignifikante. Der er en afvigelse fra dette med heltid (p =0,004). 10

Tabel 7: β-parametre for hovedeffekter og interaktioner β parameter (t-værdi) 95% CI Heltid 0,711 (2,926) (,234-1,188) Anciennitet 0,033 (3,233) (,013-,052) β -parameter for interaktionerne Kategorier 1 2 3 4 Overarbejde -0,23 (-,326) 0,136 (,214) -0,078 (,048) (1,615-1,155) (-1,115-1,388) (-1,385-1,228) Kommune1-0,045 (-,036) 0-0,464 (-,295) 0,078 (,048) (-2,523-2,433) (-3,551-2,623) (-3,219-3,286) Kommune2 0,838 (1,115) -1,914 (-1,687) -1,939 (-1,971) -0,262 (-,0267) (-0,638-2,314) (-4,142-0,313) (-3,87-(-0,007) (-2,192-1,668) Kommune3 0,403 (,565) -0,195 (,-157) -1,513 (-1,615) -0,387 (-,405) (-0,997-1,804) (-2,636-2,246) (-3,52-,326) (-2,265-1,49) Kommune4 0,779 (,617) -1,053 (-,516) -1,177 (-,584) 0,048 (,028) (-1,7-3,258) (-5,057-2,951) (-5,133-2,779) (-3,326-3,422) Kommune5-0,307 (-,381) 1,153 (,888) 0,407 (,384) 0,075 (,074) (-1,889-1,276) (-1,395-3,701) (-1,673-2,487) (-1,923-2,073) Kommune6-0,691 (-,631) 0,473 (,293) 0,074 (,057) 1,214 (,784) (-2,844-1,461) (-2,494-2,643) (-2,494-2,643) (-1,828-4,256) Kommune7-0,959 (-1,108) 2,911 (1,761) 1,47 (1,199) 0,82 (,607) (-2,659-0,741) (-0,335-6,158) (-,937-3,878) (-1,835-3,475) Kommune8-2,387 (-2,045) -0,555 (-,247) 1,301 (,931) 2,991 (2,077) (-4,679-(-0,095) (-4,974-3,864) (-1,441-4,043) (,164-5,818) Kommune9 0,485 (,385) 0,321 (,178) -0,594 (-,375) 1,307 (,8) (-1,992-2,963) (-3,214-3,856) (-3,701-2,513) (-1,9-4,515) Kommune10 0,684 (,971) 1,47 (,933) -0,925 (,718) -0,897 (-,885) (-0,698-2,065) (-1,624-4,564) (-3,456-1,605) (-2,886-1,093) Kommune11-0,075 (-,084) -6,03 (-2,842) 0,882 (,768) 1,503 (1,263) (-1,824-1,674) (-10,197-(-1,864) (-1,374-3,138) (-,834-3,84) Kommune12 0 (ref.) 0 (ref.) 0 (ref.) 0 (ref.) α=14,717 95%-konfidensintervallerne er brede, og derfor skal tolkningerne vurderes forsigtigt. Heltid og anciennitet indgår i slutmodellen, og er derfor medtaget i tabel 7. Anciennitet angiver derfor en vurdering af hvor meget motivationen afhænger af denne. Når anciennitet stiger med 1 år stiger motivationen med 0,033 point. Det er et udtryk for, at jo længere tid man har været ansat des mere motiveret er man. Vi fandt i den deskriptive analyse, at 51,6% har været ansat under 5 år. Det kan derfor tyde på, at de personer, der har været ansat i kortere tid end 5 år er mindre motiverede end deres kollegaer, der har været ansat i mere end 5 år. Vi ser ligeledes at personer, der er ansat på heltid er 0,77 point mere motiverede end deres kollegaer, der er ansat på deltid. Som nævnt tidligere testede vi middelværdien for heltid, og der fandt vi forskel, hvilket et boxplot ligeledes angav (ikke vist). Det giver derfor mening, at der er forskel i motivationen om man arbejder heltid eller deltid. 11

I tilknytning til udregning af de samlede effekter, havde SPSS angivet en kommune med få personer og overarbejde dagligt som reference. Dette mente vi ikke var den bedste reference, eftersom de angivne referencer ikke indeholder mange personer. Det betyder, at vi har omkodet og fået nye referencer. Kommune 12 og overarbejde sjældent er referencerne. Den samlede effekt er beregnet ved at lægge hovedeffekt kommune, hovedeffekt overarbejde og interaktion kommune, overarbejde sammen 13. Resultaterne er vist i tabel 8. Dette er gjort, for at vi kan udtale os om den samlede effekt af de uafhængige variable, kommune og overarbejde, på motivationen (graf 2). Tabel 8: Samlet effekt af kommune og overarbejde Samlede effekter Kategorier af overarbejde 1 2 3 4 Kommune 1-0,275 14-0,373-0,045-0,045 Kommune 2-1,306-0,965 0,498 0,838 Kommune 3-0,022-0,974-0,062 0,403 Kommune 4-0,504-0,262 0,749 0,779 Kommune 5 0,616 0,236-0,31-0,307 Kommune 6-0,448-0,481 0,445-0,691 Kommune 7 1,722 0,647-0,217-0,959 Kommune 8-3,172-0,95 0,526-2,387 Kommune 9 0,576 0,027 1,714 0,485 Kommune 10 1,924-0,105-0,291 0,684 Kommune 11-6,335 0,943 1,35-0,075 Kommune 12-0,23 0,136-0,078 0 Graf 2: De samlede effekter af kommune og overarbejde 2 0-2 1 2 3 4 5 6 7 8 9 10 11 12-4 -6-8 Næsten dagligt 2-3 gange pr. uge 2-3 gange pr. måned Sjældent Som det fremgår af graf 2, er de 12 kommuner angivet på x-aksen, overarbejde er opdelt i 4 kategorier angivet på z-aksen, og den samlede effekt ses på y-aksen. Tabel 8 og graf 2 viser hvorledes den samlede effekt har indflydelse på motivationen. Det er ikke muligt at udtale sig om 13 Se fodnote 14. 14 Eksempelregning af effektværdi: β kommune=1 +β overarbejde=1 +β kommune=1*overarbejde=1 =-0,045+(-0,23)+0=-0,275. 12

hovedeffekter, hvilket betyder, at vi må se, om der er generelle tendenser. Kommune 9 har medarbejdere, der er motiverede uanset hvor ofte de har overarbejde. Dette er i modsætning til kommune 1, der har medarbejdere, der er mindre motiverede uanset, hvor ofte de har overarbejde. Ligeledes er det påfaldende, at der i kommune 11 ses et stort udsving i forhold til motivationen ved næsten dagligt overarbejde. I analysen for kvinder fremkom der en determinationskoefficient, R 2, på 0,106, hvilket er et udtryk for hvor stor en andel af den afhængige variabels varians, der forklares af de uafhængige variable i modellen 15. Pearsons korrelationskoefficient kan beregnes ud fra R 2 ved at tage kvadratroden. Denne anfører hvor stærk sammenhængen mellem to variable er. Eftersom vi mener, at alder og anciennitet korrelerer, ville det være relevant at beregne Pearsons korrelationskoefficient, og derefter erstatte variablene med hinanden i modellen 16, men vi har valgt ikke at fokusere på det i denne opgave. R 2 viser, at af den totale variation er kun 10,6% forklaret af modellen. Havde vores R 2 været tæt på 1, havde den prædikteret perfekt. Vi kan derfor sige, at hvis vi ønsker at anvende modellen til at prædiktere med, er modellen ikke den bedste på grund af den lave R 2 værdi. Vi vælger alligevel at opstille en ligning for kvinder. Dette begrunder vi ligeledes med, at generelle lineære modeller kan præsenteres ved lineære sammenhænge, og som nævnt tidligere er den nedenstående formel den generelle for dette. Y= α + β 1 *X 1 + β 2 * X 2 + β 3 * X 1 * X 2 + ε Med baggrund i undersøgelsen opstilles følgende ligning for kvinder: E (motivation anciennitet, kommune, heltid, overarbejde, kommune * overarbejde) Y = α + β anciennitet * x anciennitet + β kommune * x kommune + β heltid * x heltid + β overarbejde * x overarbejde + β kommune,overarbejde * x kommune * x overarbejde Der sættes (sum) for de kategoriske variable med flere end to kategorier, og bliver for hver udregning multipliceret med værdien af dummy-variablen. Det betyder, at vi kan prædiktere motivationen for en kvinde, der har været ansat i et bestemt antal år, arbejder i en bestemt kommune, har overarbejde og arbejder på heltid eller deltid. β-parametrene fra tabel 7 anvendes såfremt der ønskes at se nærmere på en bestemt målgruppe. 4.0 Diskussion og konklusion Formålet med opgaven var at skabe en skala, der måler motivation blandt medarbejdere ansat i 12 kommuner uden at eksogene variable påvirker skalaen. Dette blev undersøgt ved logistisk regression, og der blev ikke fundet DIF. Det betyder, at skalaen kunne bruges til det næste formål i opgaven, hvilket var at undersøge om og i givet fald på hvilken måde graden af motivation afhænger af de øvrige variable. Den bivariate statistik blev først undersøgt, og i den forbindelse var det køn og overarbejde, der viste en sammenhæng. Sidenhen blev der foretaget analyse ved hjælp af generelle lineære modeller, hvor der blev fundet tre interaktioner, hvilket betød at 15 S. Kreiner, 2007, s. 552. 16 S. Kreiner, 2007, s. 214. 13

analysen igen blev kørt, blot for mænd og kvinder (kun kvinder vist). Der kom én interaktion frem (kommune & overarbejde), hvilken også kom frem i den første analyse. Det kan være et udtryk for, at kommune og overarbejde sammen har betydning for motivationen. På grund af interaktionen blev den samlede effekt efterset. I den forbindelse blev det påvist, at det at være ansat i en kommune og have overarbejde har betydning for motivationen. Det kan derfor siges, at det at være kvinde, arbejde i en kommune og have overarbejde har betydning for motivation blandt de kvindelige offentlige ansatte. Heltid blev efterfølgende testet for kvinder, hvilket viste, at der er forskel på at arbejde heltid og deltid i forhold til motivationen. Grundene til dette kan være flere forskellige ting, som vi ikke kan tage højde for eftersom kommune og overarbejde kan være udtryk for mere og andet end det de er. Desuden er kommunerne anonymiserede, hvilket gør, at vi ikke kan forholde os til dem. Det kan tænkes, at det at arbejde i kommune 9 indebærer en god chef, et godt kollegialt samarbejde eller klienterne ikke volder problemer for de ansatte. Dette er også i relation til vores R 2, der kun forklarer 11% af variationen (tabel 6). Modelkontrollen viste, at modelantagelserne er opfyldte, men det vurderes dog, at de uafhængige variables forklaring af motivationen er lav. Som nævnt tidligere og i relation til Maslows motivationsteori mener vi, for eksempel at kommune kan være udtryk for flere ting. Det betyder, at det vil være en god ide at medtænke variabler, der uddyber påvirkningen på motivation bedre. Eksempel derpå er et godt kollegialt samvær og samarbejde. Det er ligeledes relevant at medarbejdere føler anerkendelse og påskønnelse, er god til sit job og får ros, for at føle sig motiveret. Dette kan vi dog ikke se med vores data. Vi kan derfor, på baggrund af resultaterne, konkludere at der er grundlag for at forbedre undersøgelsens målinger, og skal undersøgelsen gentages vil det være relevant at medtænke nye variable og items til måling af motivationen. Det er ligeledes relevant at sikre et forholdsvis jævnt fordelt data grundlag, for at kunne udtale sig om for eksempelvis kønsforskelle i forhold til motivation. På grund af, at der ikke har været en ligelig fordeling af mænd og kvinder, har vi valgt ikke at medtage mænd i den sidste del af analysen. Havde vi arbejdet videre med den kausale relation og DAG et, ville vi have fundet andre resultater, og derfor kan vi konkludere at vurderingen af hvilke variable, der har betydning og bør inddrages i en analyse, har stor betydning for resultatet. 14