Synopsis til eksamen i Statistik

Størrelse: px
Starte visningen fra side:

Download "Synopsis til eksamen i Statistik"

Transkript

1 Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: (svarende til 9,9 normalsider) - 1 -

2 Indholdsfortegnelse 1. Introduktion Karakteristik af populationen... 3 Tabel 1. Svarfordelingen for items der indgår i sumskalaen for motivation... 4 Figur 1 og 2. Histogram over hhv. anciennitet og motivation... 4 Tabel 2. Karakteristisk af data Differentiel Item Funktion - Opgave Figur 3. DIF analysernes struktur... 6 Tabel 3. DIF analyseresultater for strategi 1 og Generel lineær model - Opgave Modelsøgning... 7 Tabel 4. Modelsøgning... 8 Figur 4 og 5. Histogram og P-P plot over residualerne for sumskala for motivation... 8 Figur 6. Plot af de prædikterede værdier op imod residualerne for motivation... 9 Tabel 5. Teststørrelser og p-værdier for den endelige model Tolkning af modellen Model for hhv. mandlige og kvindelige socialrådgivere og kommunale sagsbehandlere Tabel 6. Modelsøgning for hhv. mænd og kvinder Figur 7 og 8. Test for normalfordelte residualer (Mænd) Figur 9. Test for varianshomogenitet (Mænd) Figur 10 og 11. Test for varianshomogenit (Kvinder) Figur 12 og 13. Test for normalfordelte residualer (Kvinder) Tabel 7. Model for mandlige og kvindelige socialrådgivere og kommunale sagsbehandlere Tabel 8. Interaktionsparametre for kommune*overarbejde blandt kvinder Tolkning af modellerne opdelt på køn

3 1. Introduktion Formålet med denne opgave var at vurdere hvilke faktorer, der havde indflydelse på motivationen blandt socialrådgivere og kommunale sagsbehandlere i 12 anonymiserede kommuner fordelt over hele landet. Baggrunden for denne analyse var et datamateriale indsamlet i forbindelse med en arbejdsmiljøundersøgelse. Ud over spørgsmål vedrørende de ansattes motivation var der i datamaterialet desuden indsamlet information om de ansattes køn, alder (angivet i ti års intervaller), deres anciennitet (antal år på nuværende arbejdsplads), hvor ofte de overarbejdede (angivet i fire kategorier), samt de ansattes ansættelsesforhold, dvs. hvorvidt de var ansat ved deltid eller heltid. I opgavens første del blev en motivationsskala konstrueret og afprøvet for at undersøge, om der var problemer med differentiel item funktion (DIF). I opgavens anden del blev skalaen anvendt som afhængig variabel i en generel lineær model med det formål at undersøge, hvilke faktorer motivationen blandt socialrådgivere og kommunale sagsbehandlere kunne siges at afhænge af. To individer blev ekskluderet fra datamaterialet grundet mangelfulde eller urealistiske svar. Ved det ene individ var kun information om vedkommendes kommune oplyst, mens der ved det andet var angivet, at vedkommende var 18 år eller yngre samt have 9 års anciennitet, hvilket blev fundet logisk umuligt. Efter at have ekskluderet de to individer, indgik 893 ansatte socialrådgivere og kommunale sagsbehandlere i analyserne. Inden resultaterne fra de to opgaver gennemgås, gives indledningsvis en karakteristik af populationen. 2. Karakteristik af populationen Populationen omfattede 893 socialrådgivere og kommunale sagsbehandlere (84 procent kvinder), hvoraf 79 procent var heltidsansatte. Omtrent en ottendedel af de ansatte angav, at de næsten dagligt arbejder over, mens en fjerdedel af de ansatte rapporterede, at de sjældent arbejdede over. Ancienniteten blandt personalet var fra nul til 45 år med en gennemsnitsanciennitet på 9,5 år. Populationen var inddelt efter tiårs aldersintervaller. Ti procent af de ansatte var 19 til 29, 20 procent var mellem 30 og 39 år, 30 procent var mellem 40 og 49 år, 33 procent var mellem 50 til 59 år, mens 7 procent var 60 år eller ældre. I undersøgelsen blev personalet desuden bedt om at forholde sig til følgende udsagn vedrørende deres arbejdsglæde og motivation: Jeg har et godt arbejde; Det er kun lønnen, der betyder noget; Jeg - 3 -

4 ville stoppe, hvis jeg havde penge nok; Jeg ville vælge noget mere interessant, hvis jeg havde mulighed for det; Jeg er stolt over mit arbejde. Svarfordelingen ses i tabel 1 nedenfor. Tabel 1. Svarfordelingen for items der indgår i sumskalaen for motivation Item Udsagn Ja, passer i høj grad N (%) Ja, passer i nogen grad N (%) Nej, passer ikke N (%) Nej, passer slet ikke N (%) Missing 1 Jeg har et godt arbejde 169 (18,9) 566 (63,4) 129 (14,4) 22 (2,5) 7 (0,8) 2 Det er kun lønnen, der betyder noget 4 (0,4) 52 (5,8) 354 (39,6) 478 (53,5) 5 (0,6) 3 Jeg vil stoppe, hvis jeg havde penge nok 77 (8,6) 195 (21,8) 353 (49,5) 264 (29,6) 4 (0,4) 4 Jeg ville vælge noget mere interessant, Hvis 70 (7,8) 180 (20,2) 376 (42,1) 263 (29,5) 4 (0,4) jeg havde mulighed for det 5 Jeg er stolt over mit arbejde 231 (25,9) 555 (62,2) 93 (10,4) 10 (1,1) 4 (0,4) N (%) Figur 1 og 2. Histogram over hhv. anciennitet og motivation Ud fra svarene på de ovennævnte fem items blev en sumskala for motivation konstrueret som et udtryk for den latente variabel for motivationen blandt socialrådgivere og kommunale sagsbehandlere. Skalaen blev konstrueret ved at kode svarene på items, således at svaret svarende til den laveste motivation blev kodet 1 og den højeste motivation blev kodet 4. Den summerede skala havde værdier fra 5 til 20 (figur 2). Skalaen vil i den resterende opgave blive omtalt motivation. Tabel 2 viser fordelingen af de resterende kategoriske og binære variable i datamaterialet, samt et T-test eller en-sidet variansanalyse (ANOVA) for sammenhængen mellem de enkelte variable og motivation

5 Tabel 2. Karakteristisk af data Total N (%)* Total 893 (100) Køn Missing 1 Motivation Gennemsnit (SE) Kvinde 749 (83,9) 15,57 (0,098) Mand 143 (16,0) 14,79 (0,227) Alder Missing år 89 (10,0) 15,22 (0,304) år 177 (19,8) 15,05 (0,208) år 265 (29,7) 15,46 (0,160) år 295 (33,0) 15,60 (0,157) 60 år 66 (7,4) 15,98 (0,320) Ansættelsesforhold Missing 5 Heltid 707 (79,2) 15,50 (0,101) Deltid 181 (20,3) 15,14 (0,203) Overarbejde Missing 5 Sjældent 215 (24,1) 15,45 (0,190) 2-3 gange pr. måned 288 (32,3) 15,71 (0,146) 2-3 gange pr uge 276 (30,9) 15,19 (0,165) Næsten dagligt 109 (12,2) 15,32 (0,284) Kommune Missing (3,8) 14,47 (0,474) (16,2) 15,10 (0,224) (14,7) 15,48 (0,228) 4 22 (2,5) 15,64 (0,516) (11,6) 15,49 (0,225) 6 53 (5,9) 15,17 (0,400) 7 39 (4,4) 15,38 (0,542) 8 47 (5,3) 14,85 (0,364) 9 37 (4,1) 15,97 (0,373) (16,0) 15,57 (0,228) (8,0) 16,16 (0,384) (7,5) 15,79 (0,296) *I procentangivelserne er inkluderet missing-værdierne. Varianshomogenitet p-værdi (Levenes test-værdier) 0,723 (0,125) 0,842 (0,354) 0,832 (0,045) 0,120 (1,951) 0,116 (1,528) Forskel i middelværdi p-værdi (test-værdi, df) 0,002 (-3,178 df=881) 0,086 (2,047 df 1=4 df 2=878) 0,117 (1,570 df=877) 0,136 (1,856 df 1=3 df 2=876) 0,094 (1,599 df 1=11 df 2=872) Resultaterne viser, at den gennemsnitlige score på motivationsskalaen var signifikant højere for kvinder sammenlignet med mænd. Der var ingen marginal sammenhæng mellem motivation og hhv. alder, ansættelsesforhold, overarbejde eller kommune. I samtlige analyser af de marginale sammenhæng mellem variablene og motivation forekom varianshomogenitet mellem grupperne. Den marginale sammenhæng mellem den kontinuerte variabel anciennitet og motivation blev endvidere undersøgt grafisk og ved at indsætte det kvadratiske og kubiske led i en lineær - 5 -

6 regressionsanalyse af sammenhængen mellem anciennitet og motivation. Resultaterne viste, at intet talte imod en lineær regression mellem anciennitet og motivation, hverken grafisk eller i en lineær regressionsanalyse (Plot og regressionsanalysen er ikke vist). Der er endvidere gjort overvejelser omkring sammenhængen mellem alder og anciennitet. Man kan forestille sig, at disse to variable er meget stærk korrelerede, og teoretisk set i nogen grad er et udtryk for det samme. Ikke overraskende viste en en-sidet variansanalyse (ANOVA) en højsignifikant sammenhæng mellem alder og anciennitet. 3. Differentiel Item Funktion - Opgave 1 I opgave 1 blev sumskalaen for motivation undersøgt i forhold til, om der var problemer med DIF. I tilfælde af DIF vil der være en sammenhæng mellem de enkelte items i skalaen og en eller flere eksogene variable, når man betinger med motivation (figur 3). De enkelte items blev omkodet til dikotome variable, hvor hhv. de to JA og de to NEJ kategorier blev slået sammen. DIF undersøges ved en logistisk regressionsanalyse med de enkelte dikotomiserede items som afhængige variable, og de eksogene variable inddrages i modellen som uafhængige variable sammen med motivation. For at mindske risikoen for type 1 fejl i forbindelse med, at der blev foretaget mange test, vurderedes resultaterne af DIF ud fra et 1 procent signifikansniveau. Der blev anlagt to forskellige analysestrategier for DIF analysen. I den første blev de eksogene variable medtaget i den logistiske regressionsmodel enkeltvis sammen med motivationsskalaen. I den anden analysestrategi blev alle seks eksogene variable og motivation indsat samtidig i en samlet model for hver af de fem items. Desuden blev det testet om anciennitet bedre kunne beskrives kvadratisk eller kubisk i den betingede sammenhæng. I analyserne blev DIF vurderet ud fra et likelihood ratio test og tilhørende p-værdi. Figur 3. DIF analysernes struktur Item 1 Item 2 Item 3 Item 4 Item 5 Sumskalaen for MOTIVATION Eksogen Variabel - 6 -

7 Tabel 3. DIF analyseresultater for strategi 1 og 2 P-værdierne for likelihood ratio testet Items Køn Alder Kommune Overarbejde Ansættelsesforhold Anciennitet Anciennitet 2 Anciennitet 3 Strategi 1 1 0,082 0,612 0,982 0,242 0,310 0,292 0,675 0, ,682 0,344 0,369 0,678 0,910 0,985 0,460 0, ,892 0,066 0,204 0,915 0,183 0,095 0,607 0, ,546 0,589 0,378 0,241 0,979 0,023 0,059 0, ,055 0,580 0,191 0,806 0,470 0,868 0,587 0,013 Strategi 2 1 0,079 0,757 0,989 0,312 0,428 0,520 0,681 0, ,248 0,254 0,258 0,583 0,776 0,949 0,374 0, ,994 0,224 0,209 0,834 0,304 0,584 0,992 0, ,614 0,914 0,434 0,391 0,815 0,057 0,058 0, ,077 0,272 0,182 0,959 0,528 0,341 0,511 0,027 Resultaterne viste, at der ikke syntes at være problemer med DIF i forbindelse med motivationsskalaen. Det blev desuden undersøgt, om der var non-uniform DIF i forbindelse med skalaen, det vil sige om der forekom effektmodifikation mellem motivation og baggrundsvariablen i forhold til de enkelte items. Ingen analyser viste tegn på non-uniform DIF. Ud over at analysere DIF i en logistisk regressionsanalyse, kan man teste for betinget uafhængighed mellem den eksogene variabel og item givet motivation ved beregningen af en partiel gamma koefficient. Denne metode blev undersøgt, men da datamaterialet indbefattede så relativt få individer, var der for få individer i hvert stratum til at beregningerne af partielle gamma koefficienter ville være meningsfulde at gennemføre ud fra de af metoder, som er opgivet i pensum. På baggrund af de ovennævnte resultater syntes der ikke at være problemer med DIF i forhold til sumskalaen for motivation. Der blev derfor ikke foretaget en reduktion af skalaen, og motivationsskalaen med alle fem items blev anvendt i de videre analyser. 4. Generel lineær model - Opgave 2 I opgave 2 blev effekten af køn, alder, kommune, anciennitet, ansættelsesforhold og overarbejde på motivation undersøgt ved en generel lineær analyse. De indledende analyser af den marginale sammenhæng mellem anciennitet og motivation viste, at intet talte mod en lineær regression, hvilket medførte, at det kvadratiske og kubiske led af anciennitet ikke blev medtaget i modelsøgning. 4.1 Modelsøgning For at opstille den bedst mulige model for, hvilke faktorer motivation afhænger af, blev der foretaget en baglæns modelsøgning med udgangspunkt i en mættet model, som indeholdt alle - 7 -

8 hovedeffekter og alle tovejsinteraktioner mellem variablene køn, alder, kommune, ansættelsesforhold, anciennitet og overarbejde. Ud fra den mættede model ekskluderedes variablene én ad gangen i overensstemmelse med det hierarkiske princip, hvor en hovedeffekt kun må fjernes fra modellen, hvis den ikke indgår i en interaktion (se tabel 4). Tabel 4. Modelsøgning Trin Elimineret modelled (P-værdi) Trin Elimineret modelled (P-værdi) 1 Ancienitet*Kommune (0,823) 8 Køn*Kommune (0,110) 2 Anciennitet*Ansættelsesforhold (0,689) 9 Køn*Anciennitet (0,102) 3 Kommune* Ansættelsesforhold (0,681) 10 Overarbejde*Alder (0,057) 4 Alder* Ansættelsesforhold (0,606) 11 Overarbejde*Ancienitet (0,132) 5 Ansættelsesforhold *Køn (0,550) 12 Ancienitet (0,279) 6 Alder*Anciennitet (0,490) 13 Overarbejde* Ansættelsesforhold (0,057) 7 Kommune*Alder (0,195) Den endelige model bestod af hovedeffekterne alder, køn, kommune, overarbejde og ansættelsesforhold samt interaktionerne køn*alder, køn*overarbejde og kommune*overarbejde. Forud for meningsfuldt at kunne tolke på modellens resultater, blev antagelserne for generelle lineære modeller testet: Betinget normalfordeling af motivation, varianshomogenitet og linearitet. Antagelsen om betinget normalfordeling af motivation blev testet grafisk ved et histogram samt et P-P plot af residualerne for motivation og numerisk ved et Kolmogorov-Smirnov Test. Varianshomogeniteten blev testet grafisk ved et plot af de standardiserede residualer for motivation op mod de prædikterede værdier for motivation og numerisk ved Levenes Test. Figur 4 nedenfor ses det, at residualerne forekom tilnærmelsesvis normalfordelte. Det kunne desuden bekræftes af figur 5, hvor punkterne ikke syntes at afvige systematisk fra den rette linje. Ydermere viste Kolmogorov-Smirnov testet, at nul-hypotesen om en betinget normalfordelt motivationsskala kunne accepteres (p = 0,148). Figur 4 og 5. Histogram og P-P plot over residualerne for sumskala for motivation - 8 -

9 I forhold til antagelsen om varianshomogenitet viser figur 6, at spredningen af residualerne i forhold til de forventede værdier af motivation forekom nogenlunde homogen, dog med en lille tendens til at være tragtformet med åbning mod venstre. Figur 6. Plot af de prædikterede værdier op imod residualerne for motivation Levenes Test for varianshomogenitet var insignifikant (p = 0,142), og på baggrund af disse analyser kunne antagelsen om varianshomogenitet accepteres. Da alder og anciennitet teoretisk til dels kunne være udtryk for det samme, blev en model testet, hvor ancienniteten blev medtaget i stedet for alder. Denne model var tilnærmelsesvis lig modellen med alder og interaktionen mellem ancienitet*køn blev signifikant (0,008), hvilket kunne bekræfte at det ud fra data var muligt at opstille to brugbare modeller, som viser at motivation afhænger af køn, overarbejde, kommune, ansættelsesforhold og hhv. anciennitet eller alder. Nedenfor er vist modellen med alder. Tabel 5. Teststørrelser og p-værdier for den endelige model β (95% CI)* F-test (p-værdi)** Alder --- 3,007 (0,018) Køn --- 0,733 (0,392) Ansættelsesforhold Deltid -0,713 (-1,163;-0,264) 9,691 (0,002) Heltid 0 (ref.) Kommune --- 2,539 (0,003) Overarbejde --- 4,521 (0,004) Køn*Alder --- 3,502 (0,008) Køn*Overarbejde --- 4,627 (0,003) Overarbejde*Kommune --- 2,148 (<0,001) * β-parametrene er kun vist for de variable der ikke indgår i interaktionsled ** Test for sammenhæng mellem de enkelte baggrundsvariable og motivation i den betingede model - 9 -

10 4.2 Tolkning af modellen Den endelige model indeholdt hovedeffekterne, køn, alder, ansættelsesforhold, overarbejde og kommune samt interaktionerne mellem køn*alder, overarbejde*alder samt kommune*overarbejde og opskrives som følgende: E(Motivation køn, alder, ansættelsesforhold, kommune, overarbejde) = α + Σβ køn x køn + Σβ alder x alder Σβ ansættelsesforhold x ansættelsesforhold + Σβ kommune x kommune + Σβ overarbejde x overarbejde + Σβ køn*alder x køn*alder + Σβ køn*overarbejde x overarbejde*alder + Σβ overarbejde*kommune x overarbejde*kommune Modellens resultater viste, at der var en forskel i middelværdien på sumskalaen mellem heltids- og deltidsansatte ansatte på -0,713 scorer, hvilket betyder at deltidsansatte gennemsnitligt havde en mindre score på motivationsskalaen sammenlignet med heltidsansatte. De øvrige fire hovedeffekter i modellen indgik i mindst en interaktion og derved blev effekten af køn, alder, kommune og overarbejde på motivation meget kompleks og kunne ikke umiddelbart tolkes ud fra de af modellen givne parametre. Køn indgik i to interaktioner i modellen, hvilket tydede på, at effekten nogle af motivationsfaktorerne syntes at være væsentligt forskellig for kvinder og mænd. På baggrund af dette fund valgte jeg at opstille to separate modeller for hhv. mænd og kvinder. Modelsøgningen og modelkontrol for disse to modeller blev foretaget i overensstemmelse med proceduren gennemgået i forbindelse med den samlede model ovenfor. 4.3 Model for hhv. mandlige og kvindelige socialrådgivere og kommunale sagsbehandlere To separate modeller baseret på data fra hhv. 143 mandlige og 749 kvindelige socialrådgivere og kommune sagsbehandlere blev opstillet. På grund af de relativt få mænd i datamaterialet, syntes en mættet model med alle hovedinteraktioner samt tovejsinteraktioner at være et overfit, hvilket gav sig til udtryk ved, at det ikke var muligt at undersøge interaktionerne mellem ansættelsesforhold og de øvrige variable i en mættet model for mænd. Det skyldtes formentligt, at kun otte mænd var på deltid (svarende til 5,6 procent). Modelsøgning for mænd blev derfor foretaget ud fra en mættet model uden disse interaktioner

11 Tabel 6. Modelsøgning for hhv. mænd og kvinder Mænd Kvinder Trin Elimineret modelled (p-værdi) Trin Elimineret modelled (p-værdi) 1 Overarbejde*Anciennitet (0,960) 1 Kommune*Anciennitet (0,773) 2 Anciennitet*Kommune (0,607) 2 Anciennitet*Ansættelsesforhold (0,754) 3 Kommune*Alder (0,509) 3 Alder*Ancienitet (0,647) 4 Alder*Overarbejde (0,744) 4 Alder*Ansættelsesforhold (0,629) 5 Alder*Anciennitet (0,571) 5 Kommune*Ansættelsesforhold (0,624) 6 Anciennitet (0,141) 6 Overarbejde*Ansættelsesforhold (13,9) 7 Overarbejde*Alder (0,066) 8 Kommune*Alder (0,118) 9 Alder (0,264) 10 Anciennitet*Overarbejde (0,096) Efter modelsøgningen for mænd blev de tre interaktionsled, hvori ansættelsesforhold indgik, indsat enkeltvis i den endelige model, men de var alle insignifikante. For at det ville give mening, at tolke på modellernes resultater, blev en modelkontrol gennemført for begge modeller. I modelkontrollen, af modellen for mandlige socialrådgivere og kommunale sagsbehandlere, viste både histogrammet og P-P plottet over de standardiserede residualer en afvigelse fra normalfordelingen (figur 7 og 8). Omvendt var resultatet af Kolmogorov-Smirnov testet insignifikant (p = 0,676). Levenes test insignifikant (p = 0,324) og plottet af de prædikterede værdier mod de standardiserede residualer for motivation viste en tilnærmelsesvis homogen spredning. Ud fra disse resultater syntes antagelserne varianshomogenitet at kunne accepteres, mens resultaterne for antagelsen om en betinget normalfordelt sumskala for motivation var mere tvetydige. Figur 7 og 8. Test for normalfordelte residualer (Mænd)

12 Figur 9. Test for varianshomogenitet (Mænd) Ved modelkontrollen af modellen for kvinderne, viste histogrammet af de standardiserede residualer for motivation, at normalfordelingen syntes en smule forskudt mod højre (figur 12). Samtidig viste P-P plottet, at de standardiserede residualer afveg systematisk fra den rette linje (figur 13). Disse resultater tydede på, at den betingede sumskala for motivation ikke var normalfordelt. Dog var Kolmogorov-Smirnov testet insignifkant (p = 0,083), hvilket omvendt tydede på at antagelsen kunne accepteres. I forhold til antagelsen om varianshomogenitet viste plottene af hhv. de prædikterede værdier af motivation og anciennitet op mod de standardiserede residualer for motivation, at variansen var tilnærmelsesvis homogen, dog kunne spredningen syntes en smule større ved de lave værdier af hhv. de prædikterede værdier af motivation og anciennitet (Figur 10 og 11). Levenes test var insignifikant (p = 0,112) og antagelsen om varianshomogenitet ansås samlet set at kunne accepteres. Linearitetsanatagelsen blev testet ved at indsætte det kvadratiske og kubiske led af anciennitet i modellen enkeltvis. Ingen af leddene viste sig at have en betinget sammenhæng med motivation, og linearitetsantagelsen blev dermed accepteret. Modelkontrollen af begge modeller fandt ingen væsentlige tegn på, at modelantagelserne ikke var opfyldt. Nedenfor ses modellerne for hhv. mænd og kvinder. Figur 10 og 11. Test for varianshomogenit (Kvinder)

13 Figur 12 og 13. Test for normalfordelte residualer (Kvinder) Tabel 7. Model for mandlige og kvindelige socialrådgivere og kommunale sagsbehandlere β (95% CI)* T-test (p-værdi)** F-test (p-værdi)*** Mandlige socialrådgivere og kommunale sagsbehandlere Alder 2,736 (0,033) 29 år 3,073 (-0,341; 6,487) 1,787 (0,077) år -0,270 (-2,854; 2,315) -0,207 (0,836) år 0,799 (-1,620; 3,219) 0,662 (0,509) år -0,380 (-2,741; -1,981) -0,321 (0,749) 60 år 0 (ref.) --- Kommune 2,920 (0,002) Overarbejde 4,658 (0,004) Ansættelsesforhold 4,220 (0,043) Deltid -2,316 (-4,554; -0,077) -2,054 (0,043) Heltid 0 (ref.) --- Overarbejde*Kommune 1,676 (0,036) Kvindelige socialrådgivere og kommunale sagsbehandlere Anciennitet 10,454 (0,001) Antal år 0,033 (0,013; 0,052) 3,233 (0,001) Kommune 1,334 (0,201) Overarbejde 2,196 (0,087) Ansættelsesforhold 8,560 (0,004) Deltid -0,711 (-1,188; -0,234) -2,924 (0,004) Heltid 0 (ref.) --- Overarbejde*Kommune 1,520 (0,034) * β-parametrene er kun vist for de variable der ikke indgår i interaktionsled ** Test for forskelle mellem beta-parametrene for de enkelte undergrupper sammenlignet med referencegruppen indenfor samme variabel. *** Test for sammenhæng mellem de enkelte baggrundsvariable og motivation Både i forhold til modellen for mænd og for kvinder blev det testet om man kunne opstille en alternativ model, hvor alder blev udskiftet med anciennitet og omvendt. Det var ikke muligt at

14 opstille en tilsvarende alternativ model for mænd med anciennitet i stedet for alder, mens alder i en alternativ model for kvinder var signifikant associeret med motivation, når man betingede med de resterende variable. I begge modeller optrådte en interaktion mellem overarbejde og kommune, således at effekten af overarbejde på motivation modificeres af, hvilken kommune man arbejder i. For mænd er den samlede effekt af overarbejde og kommune på motivationen generelt negativ sammenlignet med referencegruppen, som her er dem, der har overarbejde 2-3 gange om ugen i kommune 12 1, men der var igen stor usikkerhed om estimaterne grundet de få mænd i datamaterialet. Tabel 8 nedenfor viser den beregnede samlede effekt af overarbejde og kommune for de kvindelige socialrådgivere og kommunale sagsbehandlere. Tabel 8. Interaktionsparametre for kommune*overarbejde blandt kvinder β (CI 95%) p-værdi Kommune Overarbejde Sjældent 2-3 gange om måneden 1-1,969 (-5,418; 1,480) -1,969 (-5,116; 1,480) 0,263 0, ,086 (-3,901; 1,730) -1,426 (-4,127; 1,275) 0,449 0, ,520 (-4,296; 1,255) -1,986 (-4,691; 0,719) 0,283 0, ,144 (-4,593; 2,305) -1,175 (-4,494; 2,145) 0,515 0, ,230 (-5,103; 0,642) -2,233 (-4,922; 0,455) 0,128 0, ,615 (-5,838; 0,608) -1,479 (-4,700; 1,741) 0,112 0, ,882 (-5,821; 0,056) -2,140 (-5,289; 1,009) 0,055 0, ,311 (-7,628; 0,994) -1,398 (-4,311; 1,514) 0,011 0, ,439 (-4,887; 2,010) -0,210 (-3,356; 2,937) 0,413 0, ,924 (-4,654; 0,806) -2,002 (-4,732; 0,728) 0,167 0, ,999 (-4,967; 0,969) -0,574 (-3,431; 2,284) 0,187 0, ,240 (-4,007; 1,527) -2,215 (-5,008; 0,578) 0,379 0,120 *Kunne ikke estimeres grundet manglende personer i stratum. 2-3 gange om ugen Næsten dagligt -2,296 (-5,338; 0,745) 0,139-2,888 (-5,613; -0,163) 0,038-2,897 (-5,601; -0,192) 0,036-2,185 (-6,113; 1,742) 0,275-1,686 (-4,463; 1,089) 0,233-2,404 (-5,209; 0,400) 0,093-1,276 (-4,244; 1,692) 0,399-2,874 (-5,730; 0,018) 0,049-1,896 (-4,947; 1,155) 0,223-1,787 (-4,967; 0,969) 0,187-0,980 (-3,795; 1,835) 0,495-2,029 (-5,250; 1,192) 0,217 * -3,230 (-6,105; -0,355) 0,028-1,945 (-5,033; 1,143) 0,217-2,428 (-6,356; 1,501) 0,225-1,307 (-4,396; 1,782) 0,406-2,372 (-5,689; 0,945) 0,161-0,201 (-3,834; 3,432) 0,914-5,096 (-9,547; 0,645) 0,025-1,348 (-4,795; 2100) 0,443-2,154 (-4,922; 0,615) 0,127-8,259 (-12,711; -3,808) <0, (ref.) 1 Der var ingen mænd i kommune 12, der havde overarbejde næsten dagligt, hvorfor referencegruppen er dem, der har mest arbejde svarende til 2-3 gange om ugen

15 4.4 Tolkning af modellerne opdelt på køn Analysens resultater viste, at motivation afhænger af forskellige faktorer alt efter, om det gælder for mandlige eller kvindelige socialrådgivere og kommunalansatte sagsbehandlere. I lighed med i den samlede model inkluderende begge køn, kunne der for kvinder opstilles to modeller; en med anciennitet og en med alder 2. Således viser analyserne af dette datamateriale, at motivationen for mænd afhænger af alder, mens den for kvinder afhænger af anciennitet eller alder (modellen for kvinder med alder ikke vist). For kvinder har de to yngste grupper gennemsnitligt hhv. 1,066 og 1,036 signifikant lavere motivationsscorer sammenlignet med de ældste kvinder. Modsat viser resultaterne for mænd, at de yngste mænd gennemsnitligt har 3,073 scorer højere motivation sammenlignet med de ældste. Det skal dog bemærkes, at forskellen mellem disse to grupper mænd er svagt insignifikant, hvilket kan skyldes, at der de relativt få mænd i analysen og dermed manglende statistisk styrke til at påvise en signifikant sammenhæng. I modellen for kvinder ses en positiv sammenhæng mellem anciennitet og motivation, således at motivationen stiger med 0,033 scorer, for hvert år ancienniteten stiger. For både mænd og kvinder er den gennemsnitlige score på motivationsskalaen lavere blandt deltidsansatte sammenlignet med heltidsansatte. Resultaterne angiver, at denne effekt synes stærkere blandt mænd sammenlignet med kvinder. Både i modellen for de mandlige og kvindelige socialrådgivere og kommunale sagsbehandlere er effekten af overarbejde modificeret af, hvilken kommune man arbejder i. Det er svært at se noget mønster i effektmodifikationen, men som det ses af tabel 8 for kvinder, er alle de samlede effekter af overarbejde og kommune negativt associeret med motivation i alle grupperne sammenlignet med referencegruppen, som er de, der næsten dagligt har overarbejde i kommune 12. Eksempelvis har de, der har overarbejde næsten dagligt i kommune 11, signifikant lavere motivation, svarende til at de gennemsnitligt ligger 8 scorer lavere på sumskalaen. Opsummerende kan det konkluderes, at motivationen blandt socialrådgivere og kommunale sagsbehandlere afhænger af væsentligt forskellige faktorer for hhv. kvinder og mænd. På den baggrund er det fundet hensigtsmæssigt at undersøge, hvad motivationen afhænger af i to separate modeller. Til dette formål havde det dog været mere optimalt med et større datamateriale for derigennem at opnå større statistisk styrke. 2 Begge modeller inkluderede de resterende variable og interaktionen mellem kommune og overarbejde

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Statistik & Skalavalidering

Statistik & Skalavalidering å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k

Læs mere

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende

Læs mere

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45 Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af

Læs mere

Eksamen i statistik 2009-studieordning

Eksamen i statistik 2009-studieordning Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens

Læs mere

Eksamen Efterår 2013

Eksamen Efterår 2013 Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kausale modeller. Konstruktion og analyse

Kausale modeller. Konstruktion og analyse Kausale modeller Konstruktion og analyse 1 Kausale modeller = DAGs (Directed acyclic graphs) defineret ved Fuldstændig ordnet kausal struktur Definition af direkte kausal effekt Antagelser om fravær af

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Hver anden vil benytte øget åbningstid i dagtilbud

Hver anden vil benytte øget åbningstid i dagtilbud Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2 Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Ref. PIL/- 17.02.2016 Indledning I dette notat præsenteres resultater fra en analyse af lønforskellen mellem mænd og kvinder. Analysen

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Kønsbestemt lønforskel? Analyse på baggrund af IDAs lønstatistik 2018 om forskel på privatansatte kvinder og mænds løn

Kønsbestemt lønforskel? Analyse på baggrund af IDAs lønstatistik 2018 om forskel på privatansatte kvinder og mænds løn Kønsbestemt lønforskel? Analyse på baggrund af IDAs lønstatistik 2018 om forskel på privatansatte kvinder og mænds løn Februar 2018 Kønsbestemt lønforskel? Resume Denne analyse ser alene på de privatansatte

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Bilag 1. Om læsning og tolkning af kort udformet ved hjælp af korrespondanceanalysen.

Bilag 1. Om læsning og tolkning af kort udformet ved hjælp af korrespondanceanalysen. Bilag 1. Om læsning og tolkning af kort udformet ved hjælp af korrespondanceanalysen. Korrespondanceanalysen er en multivariat statistisk analyseform, som i modsætning til mange af de mere traditionelle

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen STATISTIK Skriftlig evaluering, 3. semester, mandag den 6. januar 004 kl. 9.00-13.00. Alle hjælpemidler er tilladt. Opgaveløsningen forsynes med navn og CPR-nr. OPGAVE 1 Et firma tuner biler. Antallet

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne 3. ARBEJDSMILJØET OG ARBEJDSMILJØARBEJDET I dette afsnit beskrives arbejdsmiljøet og arbejdsmiljøarbejdet på de fem FTF-områder. Desuden beskrives resultaterne af arbejdsmiljøarbejdet, og det undersøges

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier

Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier Af: Juniorkonsulent Christoffer Thygesen og cheføkonom Martin Kyed Notat 6. februar 06 Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier Analysens hovedresultater Kun hver

Læs mere

TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03.

TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03. 05:2009 ARBEJDSPAPIR Mette Deding Trine Filges APPENDIKS TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03. FORSKNINGSAFDELINGEN

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS

LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS LØNSPREDNINGSOPGØRELSER NU TILGÆNGELIG I LOPAKS INDHOLD 2 Formål 2 LOPAKS 3 Begreber 6 Eksempler 6. december 2010 LOPAKS er nu udvidet med en ny tabel, der giver mulighed for at opgøre lønspredning på

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Indledning I dette notat analyseres lønforskelle mellem privat ansatte kvinder og mænd. Analysen er gennemført på baggrund af Djøf Privats

Læs mere