Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Størrelse: px
Starte visningen fra side:

Download "Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab"

Transkript

1 D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23 og 29 Antal anslag svarende til 9,9 normalsider

2 Eksamensnummer: 16, 23 og 29 2 Indholdsfortegnelse 1. Introduktion Præsentation af variable Motivationsskala Eksogene variable Opgave Tendenser mellem skala, items og eksogene variable Differentiel Item Funktion (DIF) Opgave Marginale sammenhænge Generel lineær analyse Modelsøgning Modelkontrol Separate analyser for kvinder og mænd Tolkning af de endelige modeller Opsamling... 17

3 Eksamen i statistik Introduktion Denne opgave søger at belyse motivationen blandt 895 socialrådgivere og kommunale sagsbehand- lere i 12 kommuner. For at måle graden af motivation konstrueres en skala ud fra fem udsagn. Da- tamaterialet indeholder oplysninger om, hvilken kommune respondenterne er ansat i (kommune), hvor længe de har været ansat i den pågældende kommune (anciennitet), hvorvidt de er heltids- eller deltidsansatte (ansættelsesforhold), hvor ofte de har overarbejde (overarbejde) samt deres køn og alder. I afsnit 2 præsenteres deskriptive analyser af datamaterialets variable. I afsnit 3 undersøges hvorvidt motivationsskalaen har problemer med Differentiel Item Funktion (DIF). Til sidst i afsnit 4 foreta- ges en generel lineær analyse med formål at undersøge, hvorledes graden af motivation afhænger af de ovenstående variable. 2. Præsentation af variable 2.1 Motivationsskala Den afhængige variabel (motivation) konstrueres ud fra fem variable (V71, S72, S73, S74, V75) således, at motivationsskalaen er givet ved: Motivation=V71+S72+S73+S74+V75. For variablene S72, S73 og S74 er svarkategorien nej, passer slet ikke opfattet som et udtryk for højeste grad af motivation (4 point), mens svarkategorien ja, passer i høj grad er udtryk for laveste grad af moti- vation (1 point). Det modsatte er tilfældet for variablene V71 og V75. De ansatte har mulighed for at score mellem 5 og 20 point på motivationsskalaen. I figur 1 og 2 ses svarfordelingerne for de fem variable. 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% 53,8% Figur 1 Histogram af svarfordelingerne for S72, S73 og S74 39,9% 5,8% 0,4% S72: Det er kun lønnen der betyder noget Nej, passer slet ikke (4 point) 39,7% 29,8% 29,7% 21,9% 8,7% S73: Jeg ville stoppe, hvis jeg havde penge nok Nej, passer ikke (3 point) 42,2% Ja, passer i nogen grad (2 point) Ja, passer i høj grad (1 point) 20,2% 7,9% S74: Jeg ville vælge noget mere interessant, hvis jeg havde muligheden for det

4 Eksamensnummer: 16, 23 og ,0% 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% Figur 2 Histogram af svarfordelingerne for V71 og V5 63,8% 62,5% 26,0% 19,2% 14,5% 10,4% 2,5% 1,1% V71: Jeg har et godt arbejde V75: Jeg er stolt over mit arbejde Ja, passer i høj grad (4 point) Nej, passer ikke (2 point) Ja, passer i nogen grad (3 point) Nej, passer slet ikke (1 point) 2.2 Eksogene variable Fordelingen af de eksogene variable ses i tabel 1. Variablen alder er omkodet så gruppen 18 år og yngre er ekskluderet fra undersøgelsen (n=1), idet vi mener, at en færdiguddannet må være over som 18 år. Tabel 1: Fordelingen af de eksogenee variable Variabel N % Variabel N Kommune Kommune ,8 Overarbejde Sjældent 215 Kommune ,,2 2-3 gange pr. måned 288 Kommune ,,7 2-3 gange pr. uge 277 Kommune ,5 Næsten dagligt 109 Kommune ,,6 Total 889 Kommune ,9 Køn Kommune ,44 Mand 144 Kommune ,3 Kvinde 749 Kommune ,1 Total 893 Kommune ,,1 Alder Kommune , år 89 Kommune , år 177 Total , år 265 Ansættelsesforhold Heltid ,, år 60 år og ældre Deltid ,,4 Total 892 Total ,0 % 24,2 32,4 31,2 12,3 100,0 16,1 83,9 100,0 10,0 19,8 29,7 33,1 7,4 100,0 Det bemærkes, at relativt få mænd er med i undersøgelsen, hvilket viser sig at få betydning i opgave 2. Figur 3 og 4 viser fordelingenn af henholdsvis den kontinuerte variabel anciennitet og motivationsskalaen.

5 Eksamen i statistik Figur 3: Histogram af svarfordelingen af anciennitet Figur 4: Histogram af svarfordeling af motivation Fordelingen af anciennitetsvariablen i figur 3 er tydelig venstreskæv med få individer i de sidste kategorier. Motivationsskalaen i figur 4 er en smule højreskæv. Personer, der mangler svar på ét eller flere spørgsmål får ikke beregnet en skalaværdi, hvilket drejer sig om 10 personer (1,1 %). 3. Opgave Tendenser mellem skala, items og eksogene variable Når et abstrakt begreb som motivation skal måles, kan det være nødvendigt at inkludere mere end ét enkelt item i målingen. Der skal således konstrueres en skala, som kan anvendes som proxy for den latente variabel. Relationen mellem de enkelte items og de eksogene variable skal i det store hele udvise samme tendens som sammenhængen mellem skalaen og de eksogene variable. Dette undersøges i det følgende.

6 Eksamensnummer: 16, 23 og 29 6 Tabel 2: Den marginale sammenhæng mellem de eksogene variable og henholdsvis motivationsskalaen og de enkelte items Motivation V71 S72 S73 S74 V75 Kommune p-værdi 0,044* 0,337 0,229 0,002* 0,061 0,260 γ 0,191 0,199 0,248 0,193 0,200-0,058 Køn p-værdi 0,001* 0,019* 0,003* 0,007* 0,005* 0,496 Alder Anciennitet Ansættelsesforhold Overarbejde Testet med χ 2 Anciennitet er kategoriseret i fem næsten lige store grupper *Signifikante sammenhænge γ 0,083 0,071 0,106 0,053 0,145 0,023 p-værdi 0,010* 0,130 0,022* 0,170 0,000* 0,614 γ 0,058 0,060 0,005 0,025 0,140 0,003 p-værdi 0,105 0,189 0,906 0,509 0,000* 0,952 γ -0,085-0,066 0,032-0,079-0,113-0,138 p-værdi 0,114 0,394 0,683 0,225 0,085 0,076 γ -0,043-0,010-0,023-0,064-0,050-0,041 p-værdi 0,204 0,840 0,640 0,118 0,232 0,405 Gammakoefficienterne har for de fleste items samme fortegn som motivation, selvom ikke alle p- værdier er signifikante. Tendensen for ansættelsesforhold og S72 samt køn og V75 er den modsatte som for motivation. Disse gammakoefficienter er dog tætte på nul, hvilket er udtryk for svag marginal sammenhæng. Desuden er p-værdierne for disse koefficienter tydeligt insignifikante på et 5 % niveau. Der behøver derfor ikke at være problemer med disse items. 3.2 Differentiel Item Funktion (DIF) Et af kriterierne for en begrebsvalid skala er, at skalaen ikke har problemer med DIF. En skala kan både have uniform og non-uniform DIF. Ved uniform DIF forstås, at en eksogen variabel stadig har en effekt på et item, når der betinges for skalaen, og denne effekt er ens på alle niveauer af skalaen. Ved non-uniform DIF er der derimod interaktion mellem skalaen og en eksogen variabel. DIF-analyser foretages for hvert enkelt item ved hjælp af logistisk regression. Dette kræver at alle items omdannes til binære variable med svarkategorierne ja og nej. For hvert item gennemføres seks separate analyser med de eksogene variable, samt én samlet analyse med alle eksogene variable inkluderet. Skalaen inkluderes i alle analyser som uafhængig variabel. Da der beregnes et stort antal teststørrelser, sættes signifikantniveauet til 1 % for at mindske risikoen for type 1 fejl. Resultaterne af DIF-analyserne ses i tabel 3.

7 Eksamen i statistik Tabel 3: P-værdier fra logistisk regression V71 S72 S73 S74 V75 Kommune Seperat 0,982 0,671 0,244 0,417 0,315 Samlet 0,989 0,609 0,253 0,463 0,311 Køn Seperat 0,080 0,680 0,888 0,546 0,064 Samlet 0,077 0,243 0,994 0,615 0,087 Alder Seperat 0,624 0,364 0,077 0,586 0,591 Samlet 0,765 0,300 0,239 0,914 0,281 Anciennitet Seperat 0,289 0,985 0,094 0,026 0,868 Samlet 0,519 0,949 0,584 0,061 0,346 Seperat 0,314 0,911 0,181 0,979 0,466 Ansættelsesforhold Samlet 0,430 0,777 0,303 0,816 0,526 Overarbejde Seperat 0,244 0,690 0,915 0,232 0,800 Samlet 0,314 0,603 0,833 0,384 0,959 Da ingen af p-værdierne i tabel 3 er signifikante på et 1 % niveau, tyder det ikke på, at der er problemer med DIF i forhold til motivationsskalaen. Sammenhængen mellem anciennitet og S74 ville dog have været signifikant på et 5 % niveau (p=0,026). Denne sammenhæng er dog ikke signifikant i den samlede analyse, og vi har ingen god faglig begrundelse for, at der kan være en sammenhæng mellem S74 og anciennitet. Da anciennitet er en kontinuert variabel, blev der foretaget DIF-analyser med anciennitet i første, anciennitet i anden og anciennitet i tredje. Resultaterne for disse analyser er ikke vist, da de ikke påvirkede resultatet. I ovenstående analyse er der ikke inddraget interaktioner mellem motivationsskalaen og de eksogene variable. Der tages derfor ikke højde for non-uniform DIF. For at undersøge, om det er for simpelt ikke at tage højde for interaktioner, sammenlignes den samlede model uden interaktioner med en mættet model inklusiv alle interaktioner for samtlige items. Sammenligningen sker ved hjælp af et likelihood ratio test, som beregnes som forskellen mellem -2Log Likelihood værdierne for de to modeller. For item S72 er p-værdien for likelihood ratio testet signifikant på et 5 % niveau (p=0,019). Den simple model for S72 forkastes derfor, og det tyder på, at der kan være problemer med non-uniform DIF. For at undersøge dette nærmere gennemføres en baglæns modelsøgning for S72, hvor alle interaktioner er inkluderet i start modellen. Interaktionen mellem ansættelsesforhold og motivation giver en p-værdi på 0,022 for likelihood ratio testet. Da signifikantniveauet er 1 %, betragtes denne interaktionen som insignifikant, og det antages, at der ikke er tale om uniform DIF i forhold til item S72. Skalaen bevares derfor i sin oprindelige form, hvor alle items er inkluderet.

8 Eksamensnummer: 16, 23 og Opgave 2 For at belyse en eventuel sammenhæng mellem de eksogene variable og graden af motivation, gennemføres en generel lineær analyse, hvor motivationsskalaen, fra opgave 1, udgør den afhængige variabel. Vi indleder opgavebesvarelsen med en undersøgelse af marginale sammenhænge. 4.1 Marginale sammenhænge De marginale sammenhænge mellem motivation og de eksogene variable undersøges med en t-test for de binære variable og en ensidet variansanalyse, ANOVA, for de kategoriske variable. Resultaterne for disse tests er vist i tabel 4. Tabel 4: Marginale sammenhænge mellem de eksogene variable og motivationsskalaen Køn Ansættelsesforhold Kommune Alder Overarbejde Levenes test (p-værdi) 0,700 0,830 0,115 0,842 0,119 Variansanalyse 0,002 0,113 0,091 0,086 0,147 Testet med t-test Testet med ANOVA Levenes test for varianshomogenitet accepterer nulhypotesen for samtlige variable. Der er altså ikke forskel på varianserne inden for grupperne af disse variable. Køn er den eneste variabel, hvor der kan påvises en signifikant forskel på det gennemsnitlige motivationsniveau (p=0,002). Den marginale sammenhæng mellem anciennitet og motivation er belyst ved et scatter-plot i figur 5. Det bemærkes, at der hverken synes at være en tilnærmelsesvis lineær, kvadratisk eller kubisk relation imellem anciennitet og motivation. Figur 5: Scatter-plot af sammenhængen mellem anciennitet og motivation

9 Eksamen i statistik I en generel lineær analyse i SPSS anvendes sidste kategori som reference. Dette kan være uhensigtsmæssigt, hvis der er få personer i denne gruppe, da flere individer i referencegruppen mindsker standardfejlene på estimaterne af modellens parametre. Vi har derfor omkodet variablene; kommune, alder, ansættelsesforhold og overarbejde, således at referencegruppen indeholder mange individer Generel lineær analyse I det følgende gennemføres en analyse af effekten af de eksogene variable på motivation, samt en undersøgelse af eventuelle interaktioner. En generel lineær analyse bygger på følgende forudsætninger: 1) Linearitet 2) Varianshomogenitet 3) Betinget normalfordeling Jævnfør figur 4 lader motivation ikke til at være helt normalfordelt. Dette er dog ikke et problem i forhold til en generel lineær analyse, da det er den betingede fordeling af den afhængige variabel, som forudsættes at være normalfordelt. I det følgende foretages først en trinvis baglæns modelsøgning efter det hierarkiske princip. Herefter kontrolleres modellen i forhold til forudsætningerne, og endeligt estimeres parametrene i den endelige model Modelsøgning I modelsøgningen inddrages alle uafhængige variable samt alle tovejsinteraktioner i startmodellen. For denne analyse accepteres nulhypotesen om varianshomogenitet ved Levenes test (p=0,073). Dette skal dog testes igen, når den endelige model foreligger. I tabel 5 ses en oversigt over de hovedvirkninger og interaktionsled, der elimineres i modelsøgningen. 1 Referencegrupperne er som følger: kommune = kommune 10, alder = årige, ansættelsesforhold = heltid, overarbejde = sjældent

10 Eksamensnummer: 16, 23 og Tabel 5: Model-led der elimineres i modelsøgningen Trin Model-led p-værdi 1 Kommune * Anciennitet 0,823 2 Ansættelsesforhold * Anciennitet 0,689 3 Kommune * Ansættelsesforhold 0,681 4 Alder * Ansættelsesforhold 0,606 5 Ansættelsesforhold * Køn 0,550 6 Alder * Anciennitet 0,490 7 Kommune * Alder 0,195 8 Kommune * Køn 0,110 9 Køn * Anciennitet 0, Alder * Overarbejde 0, Overarbejde * Anciennitet 0, Anciennitet 0, Ansættelsesforhold * Overarbejde 0,083 Den samlede model ses i tabel 6, hvor der indgår tre interaktioner mellem henholdsvis kommune og overarbejde, alder og køn samt overarbejde og køn. Det bemærkes, at anciennitet udgår af modellen. Tabel 6: Den samlede model F p-værdi Køn 0,733 0,392 Kommune 2,593 0,003 Alder 1,896 0,109 Ansættelsesforhold 9,691 0,002 Overarbejde 4,350 0,005 Køn * Alder 3,502 0,008 Køn * Overarbejde 4,627 0,003 Overarbejde * Kommune 2,148 0, Modelkontrol Ved modelkontrol vurderes det, om modellens tre forudsætninger i et rimeligt omfang er opfyldt. Modelkontrollen består af en såkaldt residualanalyse, som er en grafisk visuelt baseret analyse, hvor modellens forudsætninger vurderes på grundlag af forskellige figurer. 1) Linearitet Undersøges med udgangspunkt i et scatter-plot (figur 6), hvor residualerne er plottet mod de prædikterede værdier. Hvis lineariteten er acceptabel, skal der ikke være nogen systematik i residualværdiernes variation, hvilket ikke er tilfældet i figur 6. Forudsætningen om linearitet accepteres. 2) Varianshomogenitet Undersøges grafisk i samme scatter-plot (figur 6). En vandret tendenslinje i y=0 er markeret, og denne hjælper til at vurdere, om variansen stiger eller falder for højere værdier af motivation, sva-

11 Eksamen i statistik rende til variansheterogenitet. Da værdierne spreder sig nogenlunde ligeligt omkring den vandrette tendenslinje, tyder det på, at der er tale om varianshomogenitet. Vi har desuden foretaget et Levenes test for varianshomogenitet af den samlede model som accepteres (p=0,142). Det bemærker, at Levenes test kun tager højde for de kategoriske variable, idet det er variansen imellem grupper, der testes. 3) Normalfordeling Histogrammet i figur 7 viser fordelingen af residualværdierne. Hvis forudsætningen, om at motivation er betinget normalfordelt, er opfyldt, vil residualværdierne være normalfordelte med en middelværdi lig nul. Dette lader til at være tilfældet i figur 7. Antagelsen om normalfordelte residualer kan også kontrolleres i et P-P-plot som vist i figur 8. Her ses, at der ikke er bemærkelsesværdig afvigelse fra den identitetslinje som punkterne skal følge, hvis der er fuldstændig overensstemmelse mellem den empirisk kumulerede fordeling og fordelingsfunktionen for normalfordelingen. Grafisk tyder det således på, at residualerne er normalfordelte. Som supplement til de grafiske fremstillinger testes normalfordelingskriteriet ved hjælp af Kolmogorov-Smirnov testet, som tilsvarende sammenligner den kumulerede fordeling af residualerne med den standardiserede normalfordeling. Kolmogorov-Smirnov testet bekræfter, at residualerne er normalfordelte, idet nulhypotesen accepteres (p=0,148). Intet tyder således på, at residualerne afviger fra normalfordelingen. Figur 6: Scatter-plot af standardiserede residualer og prædikterede værdier Figur 7: Histogram over residualerne Figur 8: P-P-plot for standardiserede residualer Samlet viser modelkontrollen, at alle tre forudsætninger for generelle lineære modeller er opfyldt. Den samlede model er forholdsvist kompliceret med interaktioner mellem køn og alder, køn og overarbejde, samt overarbejde og kommune. Det giver derfor ikke mening at se på effekterne af

12 Eksamensnummer: 16, 23 og disse variable hver for sig. For at lette fortolkningen af den komplicerede model vælger vi at gennemføre separate analyser for mænd og kvinder. 4.3 Separate analyser for kvinder og mænd Der foretages modelsøgning, modelkontrol og slutteligt opstilles en endelig model for henholdsvis kvinder og mænd. De endelige modeller ses i tabel 7. Tabel 7: Model for henholdsvis kvinder og mænd Kvinder Mænd F p-værdi F p-værdi Kommune 1,334 0,201 2,920 0,002 Ansættelsesforhold 8,560 0,004 4,220 0,043 Overarbejde 2,196 0,087 4,658 0,004 Alder - - 2,736 0,033 Anciennitet 10,454 0, Overarbejde * Kommune 1,520 0,034 1,676 0,036 Modelkontrollen gennemføres ligesom for den samlede model og de grafiske fremstillinger ses i figur 9. Figur 9: Grafisk fremstilling af linearitet og varianshomogenitet vist ved et scatter-plot, normalfordelingen vist ved et histogram og P-P-plot for henholdsvis kvinder og mænd Scatter-plot af de standardiserede residualer mod prædikterede værdier Histogram over residualerne P-P-plot for de standardiserede Residualer Kvinder

13 Eksamen i statistik Mænd Kvinder: Forudsætningen om linearitet accepteres. Varianshomogenitet accepteres ligeledes og bekræftes, idet Levenes test er insignifikant (p=0,112). Det accepteres desuden, at residualerne følger en normalfordeling, hvilket bekræftes af Kolmogorov-Smirnov testet, som er insignifikant (p=0,083). Mænd: Forudsætningen om linearitet og varianshomogenitet accepteres (Levenes test p=0,324). I forhold til forudsætningen om normalfordelte residualer er de grafiske fremstillinger mere uklare grundet få individer. Kolmogorov-Smirnov testet er dog insignifikant (p=0,676), så forudsætningen accepteres. Forudsætningerne for den generelle lineære model accepteres for både mænd og kvinder, og de endelige modeller er som vist i tabel 7. Alder indgår i den samlede model og den endelige model for mænd. Alder har således kun betydning for motivationen hos mænd. Anciennitet indgår kun i modellen for kvinder, hvilket eventuelt kan skyldes en interaktion mellem anciennitet og køn, som dog ikke fremgår af den samlede model. Hvis de kategoriske variable erstattes af binære dummy-variable, kan den samlede effekt af de uafhængige variable opskrives som en lineær funktion af middelværdien. Funktionerne for henholdsvis kvinder og mænd ses nedenfor: Kvinder E(Y K, A, O, C) = α + βkkk + βaaa + βooo + βccc + βkokkoo Mænd E(Y K, Z, A, O) = α + βkkk + βzzz + βaaa + βooo + βkokkoo K = kommune, Z = alder, A = ansættelsesforhold, O = overarbejde og C = anciennitet

14 Eksamensnummer: 16, 23 og Tolkning af de endelige modeller For at tolke β-estimaterne er det nødvendigt at undersøge hovedvirkninger og interaktioner for sig. β-estimaterne for hovedvirkningerne og dertilhørende konfidensintervaller ses i tabel 8. Tabel 8: β-estimater for hovedvirkninger i slutmodellerne Kvinder Mænd β CI 95 % β CI 95 % Alpha (α) 15,428 [14,481;16,375] 14,638 [12,879;16,396] Ansættelsesforhold Deltid -0,711 [-1,188;-0,234] -2,316 [-4,554;-0,077] Heltid 0,0 0,0 Anciennitet 0,033 [0,013;0,052] - - Alder år - - 3,453 [0,924;5,982] år - - 0,110 [-1,120; 1,340] år - - 1,179 [0,141; 2,217] ,380 [-1,981;2,741] år - - 0,0 Kvinder: Deltidsansattes motivationsgrad ligger, alt andet lige, ca. 0,7 point lavere end fuldtidsansattes, mens graden af motivation stiger med stigende anciennitet (0,033 point pr. år, alt andet lige). Mænd: Det har stor betydning for mænds motivation hvorvidt de er ansat på hel- eller deltid. Deltidsansattes motivationsgrad er således 2,3 point lavere end heltidsansatte, alt andet lige. De årige ligger ca. 3,5 point højere på motivationsskalaen end de årige, alt andet lige. P- værdierne for aldersgrupperne årrige og 60 år og ældre er insignifikante, hvilket betyder, at disse grupper i princippet kan have samme motivationsgrad som referencegruppen (50-59-årige). Begge modeller indeholder en interaktion mellem kommune og overarbejde. Dette betyder, at det ikke giver mening at se på effekterne af disse variable hver for sig. For at kunne sige noget om variablenes indflydelse på motivation er det nødvendigt at udregne den samlede effekt af de forskellige kombinationer af variablene. De samlede effekter og konfidensintervaller for interaktionen mellem kommune og overarbejde for kvinder og mænd, er vist i henholdsvis tabel 9 og 10. Konfidensintervallerne er udregnet ved at konstruere en ny variabel for interaktionen og efterfølgende indsætte denne i modellen. Herved bliver det muligt at angive konfidensintervaller for β-værdierne.

15 Eksamen i statistik Tabel 9: Samlet effekt af interaktion mellem kommune og overarbejde for kvinder Kvinder Overarbejde Næsten dagligt 2-3 gange pr. uge 2-3 gange pr. mdr. Sjældent Kommune 1 β -0,373-0,045-0,045 [CI 95 %] [-2,246;1,500] [-2,084;1,993] [-2,523;2,433] Kommune 2 β -1,306-0,964 0,498 0,838 [CI 95 %] [-2,891;0,279] [-2,259;0,331] [-0,747;1,743] [-0,638;2,314] Kommune 3 β -0,021-0,973-0,062 0,403 [CI 95 %] [-1,969;1,926] [-2,224;0,279] [-1,317;1,193] [-0,997;1,804] Kommune 4 β -0,504-0,261 0,749 0,779 [CI 95 %] [-3,615;2,607] [-3,371;2,848] [-1,548;3,046] [-1,700;3,258] Kommune 5 β 0,616 0,237-0,31-0,307 [CI 95 %] [-1,334;2,567] [-1,164;1,638] [-1,526;0,907] [-1,889;1,276] Kommune 6 β -0,448-0,481 0,444-0,691 [CI 95 %] [-2,742;1,845] [-1,934;0,973] [-1,706;2,595] [-2,844;1,461] Kommune 7 β 1,723 0,648-0,217-0,959 [CI 95 %] [-1,008;4,453] [-1,101;2,396] [-2,261;1,828] [-2,659;0,741] Kommune 8 β -3,172-0,95 0,525-2,387* [CI 95 %] [-6,922;0,577] [-2,502;0,602] [-1,130;2,181] [-4,679;-0,095] Kommune 9 β 0,576 0,028 1,714 0,485 [CI 95 %] [-1,903;3,055] [-1,866;1,921] [-0,324;3,753] [-1,992;2,963] Kommune 11 β -6,336* 0,944 1,350-0,075 [CI 95 %] [-10,085;-2,586] [-0,531;2,418] [-0,203;2,903] [-1,824;1,674] Kommune 12 β 1,924-0,105-0,291 0,684 [CI 95 %] [-0,806;4,654] [-2,257;2,047] [-1,727;1,144] [-0,698;2,065] Kommune 10 β -0,230 0,136-0,078 0 [CI 95 %] [-1,615;1,155] [-1,115;1,388] [-1,385;1,228] Ingen personer i denne kategori *Signifikante p-værdier For kvinderne er tendenserne for interaktionen generelt uklare, fordi visse kombinationer af kommune og overarbejde indeholder meget få individer. En enkelt kombination indeholder slet ingen individer. Desuden er de fleste p-værdier (undtagen to) insignifikante. Det kan således være svært at se åbenbare sammenhænge. Med disse forbehold forsøger vi at tolke interaktionerne, og det lader til, at der ingen entydig sammenhæng er mellem hyppigheden af overarbejde og graden af motivation. Effekten af overarbejde på graden af motivation afhænger af hvilken kommune man er ansat i. Det tyder på, at det at være ansat i kommune 11 og næsten dagligt have overarbejde påvirker motivationen negativt, mens motivationen er høj for ansatte i kommune 7 og 12 med dagligt overarbejde. Profilen af kvinden med lavest grad af motivation er som følger: Hun er deltidsansat, netop ansat i kommune 11 og har overarbejde næsten dagligt.

16 Eksamensnummer: 16, 23 og Tabel 10: Samlet effekt af interaktion mellem kommune og overarbejde for mænd Mænd Overarbejde Næsten dagligt 2-3 gange pr. uge 2-3 gange pr. mdr. Sjældent Kommune 1 β -3,748-3,000* -1,734-3,193 [CI 95 %] [-8,699;1,204] [-5,683;-0,317] [-4,865;1,397] [-6,857;0,472] Kommune 2 β 0,471-1,669-0,02-2,701* [CI 95 %] [-1,995;2,936] [-3,963;0,625] [-2,284;2,244] [-5,149;-0,252] Kommune 3 β 1,963-0,453 0,691 1,796 [CI 95 %] [-0,576;4,501] [-4,284;3,377] [-1,859;3,242] [-0,742;4,334] Kommune 4 β -2,477 6,298* [CI 95 %] [-5,300;0,345] [0,469;12,127] Kommune 5 β 3,678-1,364 0,691-1,638 [CI 95 %] [-1,659;9,015] [-4,472;1,744] [-1,945;3,327] [-6,470;3,195] Kommune 6 β 3,773* -2,437 0,029-2,757 [CI 95 %] [0,163;7,383] [-5,643;0,769] [-3,109;3,167] [-5,873;0,359] Kommune 7 β -6,017* -3,817 [CI 95 %] [-11,364;-0,671] [-8,665;1,032] Kommune 8 β -2,748-0,072-3,090 [CI 95 %] [-7,699;2,204] [-2,958;2,814] [-8,498;2,317] Kommune 9 β 1,659-3,817 2,807-2,817 [CI 95 %] [-1,487;4,805] [-8,665;1,032] [-0,857;6,472] [-7,665;2,032] Kommune 11 β -4,817 2,371 2,321-1,827 [CI 95 %] [-9,665;0,032] [-0,839;5,582] [-0,108;4,751] [-5,628;1,973] Kommune 12 β 1,718-2,193 0,651 [CI 95 %] [-1,948;5,384] [-5,857;1,472] [-2,031;3,332] Kommune 10 β 0,362-0,470-0,817 0 [CI 95 %] [-4,470;5,195] [-3,427;2,487] [-5,665;4,032] Ingen personer i denne kategori * Signifikante p-værdier Som for kvinder er tendenserne uklare og mange p-værdier insignifikante. Ligeledes afhænger effekten af hyppigheden af overarbejde på motivationen i høj grad af, hvilken kommune man er ansat i. Det må være en stærk interaktion, idet vi finder signifikante p-værdier for relativt mange kombinationer blandt mænd, selvom der er få individer. Profilen af manden med lavest grad af motivation er som følger: Han er deltidsansat, mellem 50 og 59 år, ansat i kommune 7 og har overarbejde 2-3 gange per uge. Det bør bemærkes, at interaktionen mellem kommune og overarbejde virker forskelligt blandt kvinder og mænd, dette kan eventuelt skyldes en trevejsinteraktion mellem kommune, overarbejde og køn. Vores datamateriale er dog så beskedent og usikkerheden på estimaterne så stor, at det ikke kan udelukkes, at den samlede effekt for kommune og overarbejde faktisk er den samme for mænd og kvinder.

17 Eksamen i statistik Opsamling Vi fandt i opgave 1, at motivationsskalaen ikke havde problemer med DIF. I opgave 2 fandt vi, at motivationsgraden blandt socialrådgivere og sagsbehandlere afhænger af, hvorvidt man er heltidseller deltidsansat. Alder lod til kun at have betydning for mænd, mens antal år på arbejdspladsen kun havde betydning for kvinder. Kønsforskellen i forhold til effekten af anciennitet var dog ikke synlig i den samlede model. Vi fandt en interaktion mellem hyppigheden af overarbejde og ansættelseskommune. Dermed er effekten af overarbejde på graden af motivation afhængig af, hvilken kommune man er ansat i.

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE

Læs mere

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende

Læs mere

Statistik & Skalavalidering

Statistik & Skalavalidering å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k

Læs mere

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45 Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af

Læs mere

Eksamen i statistik 2009-studieordning

Eksamen i statistik 2009-studieordning Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Eksamen Efterår 2013

Eksamen Efterår 2013 Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Hver anden vil benytte øget åbningstid i dagtilbud

Hver anden vil benytte øget åbningstid i dagtilbud Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot Program Residualanalyse Flersidet variansanalyse Helle Sørensen Modelkontrol (residualanalyse) i tosidet ANOVA med vekselvirkning. Test og konklusion i tosidet ANOVA (repetition) Tresidet ANOVA: the works

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1 Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere

Læs mere

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Kausale modeller. Konstruktion og analyse

Kausale modeller. Konstruktion og analyse Kausale modeller Konstruktion og analyse 1 Kausale modeller = DAGs (Directed acyclic graphs) defineret ved Fuldstændig ordnet kausal struktur Definition af direkte kausal effekt Antagelser om fravær af

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Indledning I dette notat analyseres lønforskelle mellem privat ansatte kvinder og mænd. Analysen er gennemført på baggrund af Djøf Privats

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen STATISTIK Skriftlig evaluering, 3. semester, mandag den 6. januar 004 kl. 9.00-13.00. Alle hjælpemidler er tilladt. Opgaveløsningen forsynes med navn og CPR-nr. OPGAVE 1 Et firma tuner biler. Antallet

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007 KM2: F21 1 Program for de to næste forelæsninger Emnet er specifikation og dataproblemer (Wooldridge kap. 9) Fejlleddet kan være korreleret

Læs mere

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006 Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy

Læs mere