Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab
|
|
- Filippa Damgaard
- 7 år siden
- Visninger:
Transkript
1 D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23 og 29 Antal anslag svarende til 9,9 normalsider
2 Eksamensnummer: 16, 23 og 29 2 Indholdsfortegnelse 1. Introduktion Præsentation af variable Motivationsskala Eksogene variable Opgave Tendenser mellem skala, items og eksogene variable Differentiel Item Funktion (DIF) Opgave Marginale sammenhænge Generel lineær analyse Modelsøgning Modelkontrol Separate analyser for kvinder og mænd Tolkning af de endelige modeller Opsamling... 17
3 Eksamen i statistik Introduktion Denne opgave søger at belyse motivationen blandt 895 socialrådgivere og kommunale sagsbehand- lere i 12 kommuner. For at måle graden af motivation konstrueres en skala ud fra fem udsagn. Da- tamaterialet indeholder oplysninger om, hvilken kommune respondenterne er ansat i (kommune), hvor længe de har været ansat i den pågældende kommune (anciennitet), hvorvidt de er heltids- eller deltidsansatte (ansættelsesforhold), hvor ofte de har overarbejde (overarbejde) samt deres køn og alder. I afsnit 2 præsenteres deskriptive analyser af datamaterialets variable. I afsnit 3 undersøges hvorvidt motivationsskalaen har problemer med Differentiel Item Funktion (DIF). Til sidst i afsnit 4 foreta- ges en generel lineær analyse med formål at undersøge, hvorledes graden af motivation afhænger af de ovenstående variable. 2. Præsentation af variable 2.1 Motivationsskala Den afhængige variabel (motivation) konstrueres ud fra fem variable (V71, S72, S73, S74, V75) således, at motivationsskalaen er givet ved: Motivation=V71+S72+S73+S74+V75. For variablene S72, S73 og S74 er svarkategorien nej, passer slet ikke opfattet som et udtryk for højeste grad af motivation (4 point), mens svarkategorien ja, passer i høj grad er udtryk for laveste grad af moti- vation (1 point). Det modsatte er tilfældet for variablene V71 og V75. De ansatte har mulighed for at score mellem 5 og 20 point på motivationsskalaen. I figur 1 og 2 ses svarfordelingerne for de fem variable. 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% 53,8% Figur 1 Histogram af svarfordelingerne for S72, S73 og S74 39,9% 5,8% 0,4% S72: Det er kun lønnen der betyder noget Nej, passer slet ikke (4 point) 39,7% 29,8% 29,7% 21,9% 8,7% S73: Jeg ville stoppe, hvis jeg havde penge nok Nej, passer ikke (3 point) 42,2% Ja, passer i nogen grad (2 point) Ja, passer i høj grad (1 point) 20,2% 7,9% S74: Jeg ville vælge noget mere interessant, hvis jeg havde muligheden for det
4 Eksamensnummer: 16, 23 og ,0% 60,0% 50,0% 40,0% 30,0% 20,0% 10,0% 0,0% Figur 2 Histogram af svarfordelingerne for V71 og V5 63,8% 62,5% 26,0% 19,2% 14,5% 10,4% 2,5% 1,1% V71: Jeg har et godt arbejde V75: Jeg er stolt over mit arbejde Ja, passer i høj grad (4 point) Nej, passer ikke (2 point) Ja, passer i nogen grad (3 point) Nej, passer slet ikke (1 point) 2.2 Eksogene variable Fordelingen af de eksogene variable ses i tabel 1. Variablen alder er omkodet så gruppen 18 år og yngre er ekskluderet fra undersøgelsen (n=1), idet vi mener, at en færdiguddannet må være over som 18 år. Tabel 1: Fordelingen af de eksogenee variable Variabel N % Variabel N Kommune Kommune ,8 Overarbejde Sjældent 215 Kommune ,,2 2-3 gange pr. måned 288 Kommune ,,7 2-3 gange pr. uge 277 Kommune ,5 Næsten dagligt 109 Kommune ,,6 Total 889 Kommune ,9 Køn Kommune ,44 Mand 144 Kommune ,3 Kvinde 749 Kommune ,1 Total 893 Kommune ,,1 Alder Kommune , år 89 Kommune , år 177 Total , år 265 Ansættelsesforhold Heltid ,, år 60 år og ældre Deltid ,,4 Total 892 Total ,0 % 24,2 32,4 31,2 12,3 100,0 16,1 83,9 100,0 10,0 19,8 29,7 33,1 7,4 100,0 Det bemærkes, at relativt få mænd er med i undersøgelsen, hvilket viser sig at få betydning i opgave 2. Figur 3 og 4 viser fordelingenn af henholdsvis den kontinuerte variabel anciennitet og motivationsskalaen.
5 Eksamen i statistik Figur 3: Histogram af svarfordelingen af anciennitet Figur 4: Histogram af svarfordeling af motivation Fordelingen af anciennitetsvariablen i figur 3 er tydelig venstreskæv med få individer i de sidste kategorier. Motivationsskalaen i figur 4 er en smule højreskæv. Personer, der mangler svar på ét eller flere spørgsmål får ikke beregnet en skalaværdi, hvilket drejer sig om 10 personer (1,1 %). 3. Opgave Tendenser mellem skala, items og eksogene variable Når et abstrakt begreb som motivation skal måles, kan det være nødvendigt at inkludere mere end ét enkelt item i målingen. Der skal således konstrueres en skala, som kan anvendes som proxy for den latente variabel. Relationen mellem de enkelte items og de eksogene variable skal i det store hele udvise samme tendens som sammenhængen mellem skalaen og de eksogene variable. Dette undersøges i det følgende.
6 Eksamensnummer: 16, 23 og 29 6 Tabel 2: Den marginale sammenhæng mellem de eksogene variable og henholdsvis motivationsskalaen og de enkelte items Motivation V71 S72 S73 S74 V75 Kommune p-værdi 0,044* 0,337 0,229 0,002* 0,061 0,260 γ 0,191 0,199 0,248 0,193 0,200-0,058 Køn p-værdi 0,001* 0,019* 0,003* 0,007* 0,005* 0,496 Alder Anciennitet Ansættelsesforhold Overarbejde Testet med χ 2 Anciennitet er kategoriseret i fem næsten lige store grupper *Signifikante sammenhænge γ 0,083 0,071 0,106 0,053 0,145 0,023 p-værdi 0,010* 0,130 0,022* 0,170 0,000* 0,614 γ 0,058 0,060 0,005 0,025 0,140 0,003 p-værdi 0,105 0,189 0,906 0,509 0,000* 0,952 γ -0,085-0,066 0,032-0,079-0,113-0,138 p-værdi 0,114 0,394 0,683 0,225 0,085 0,076 γ -0,043-0,010-0,023-0,064-0,050-0,041 p-værdi 0,204 0,840 0,640 0,118 0,232 0,405 Gammakoefficienterne har for de fleste items samme fortegn som motivation, selvom ikke alle p- værdier er signifikante. Tendensen for ansættelsesforhold og S72 samt køn og V75 er den modsatte som for motivation. Disse gammakoefficienter er dog tætte på nul, hvilket er udtryk for svag marginal sammenhæng. Desuden er p-værdierne for disse koefficienter tydeligt insignifikante på et 5 % niveau. Der behøver derfor ikke at være problemer med disse items. 3.2 Differentiel Item Funktion (DIF) Et af kriterierne for en begrebsvalid skala er, at skalaen ikke har problemer med DIF. En skala kan både have uniform og non-uniform DIF. Ved uniform DIF forstås, at en eksogen variabel stadig har en effekt på et item, når der betinges for skalaen, og denne effekt er ens på alle niveauer af skalaen. Ved non-uniform DIF er der derimod interaktion mellem skalaen og en eksogen variabel. DIF-analyser foretages for hvert enkelt item ved hjælp af logistisk regression. Dette kræver at alle items omdannes til binære variable med svarkategorierne ja og nej. For hvert item gennemføres seks separate analyser med de eksogene variable, samt én samlet analyse med alle eksogene variable inkluderet. Skalaen inkluderes i alle analyser som uafhængig variabel. Da der beregnes et stort antal teststørrelser, sættes signifikantniveauet til 1 % for at mindske risikoen for type 1 fejl. Resultaterne af DIF-analyserne ses i tabel 3.
7 Eksamen i statistik Tabel 3: P-værdier fra logistisk regression V71 S72 S73 S74 V75 Kommune Seperat 0,982 0,671 0,244 0,417 0,315 Samlet 0,989 0,609 0,253 0,463 0,311 Køn Seperat 0,080 0,680 0,888 0,546 0,064 Samlet 0,077 0,243 0,994 0,615 0,087 Alder Seperat 0,624 0,364 0,077 0,586 0,591 Samlet 0,765 0,300 0,239 0,914 0,281 Anciennitet Seperat 0,289 0,985 0,094 0,026 0,868 Samlet 0,519 0,949 0,584 0,061 0,346 Seperat 0,314 0,911 0,181 0,979 0,466 Ansættelsesforhold Samlet 0,430 0,777 0,303 0,816 0,526 Overarbejde Seperat 0,244 0,690 0,915 0,232 0,800 Samlet 0,314 0,603 0,833 0,384 0,959 Da ingen af p-værdierne i tabel 3 er signifikante på et 1 % niveau, tyder det ikke på, at der er problemer med DIF i forhold til motivationsskalaen. Sammenhængen mellem anciennitet og S74 ville dog have været signifikant på et 5 % niveau (p=0,026). Denne sammenhæng er dog ikke signifikant i den samlede analyse, og vi har ingen god faglig begrundelse for, at der kan være en sammenhæng mellem S74 og anciennitet. Da anciennitet er en kontinuert variabel, blev der foretaget DIF-analyser med anciennitet i første, anciennitet i anden og anciennitet i tredje. Resultaterne for disse analyser er ikke vist, da de ikke påvirkede resultatet. I ovenstående analyse er der ikke inddraget interaktioner mellem motivationsskalaen og de eksogene variable. Der tages derfor ikke højde for non-uniform DIF. For at undersøge, om det er for simpelt ikke at tage højde for interaktioner, sammenlignes den samlede model uden interaktioner med en mættet model inklusiv alle interaktioner for samtlige items. Sammenligningen sker ved hjælp af et likelihood ratio test, som beregnes som forskellen mellem -2Log Likelihood værdierne for de to modeller. For item S72 er p-værdien for likelihood ratio testet signifikant på et 5 % niveau (p=0,019). Den simple model for S72 forkastes derfor, og det tyder på, at der kan være problemer med non-uniform DIF. For at undersøge dette nærmere gennemføres en baglæns modelsøgning for S72, hvor alle interaktioner er inkluderet i start modellen. Interaktionen mellem ansættelsesforhold og motivation giver en p-værdi på 0,022 for likelihood ratio testet. Da signifikantniveauet er 1 %, betragtes denne interaktionen som insignifikant, og det antages, at der ikke er tale om uniform DIF i forhold til item S72. Skalaen bevares derfor i sin oprindelige form, hvor alle items er inkluderet.
8 Eksamensnummer: 16, 23 og Opgave 2 For at belyse en eventuel sammenhæng mellem de eksogene variable og graden af motivation, gennemføres en generel lineær analyse, hvor motivationsskalaen, fra opgave 1, udgør den afhængige variabel. Vi indleder opgavebesvarelsen med en undersøgelse af marginale sammenhænge. 4.1 Marginale sammenhænge De marginale sammenhænge mellem motivation og de eksogene variable undersøges med en t-test for de binære variable og en ensidet variansanalyse, ANOVA, for de kategoriske variable. Resultaterne for disse tests er vist i tabel 4. Tabel 4: Marginale sammenhænge mellem de eksogene variable og motivationsskalaen Køn Ansættelsesforhold Kommune Alder Overarbejde Levenes test (p-værdi) 0,700 0,830 0,115 0,842 0,119 Variansanalyse 0,002 0,113 0,091 0,086 0,147 Testet med t-test Testet med ANOVA Levenes test for varianshomogenitet accepterer nulhypotesen for samtlige variable. Der er altså ikke forskel på varianserne inden for grupperne af disse variable. Køn er den eneste variabel, hvor der kan påvises en signifikant forskel på det gennemsnitlige motivationsniveau (p=0,002). Den marginale sammenhæng mellem anciennitet og motivation er belyst ved et scatter-plot i figur 5. Det bemærkes, at der hverken synes at være en tilnærmelsesvis lineær, kvadratisk eller kubisk relation imellem anciennitet og motivation. Figur 5: Scatter-plot af sammenhængen mellem anciennitet og motivation
9 Eksamen i statistik I en generel lineær analyse i SPSS anvendes sidste kategori som reference. Dette kan være uhensigtsmæssigt, hvis der er få personer i denne gruppe, da flere individer i referencegruppen mindsker standardfejlene på estimaterne af modellens parametre. Vi har derfor omkodet variablene; kommune, alder, ansættelsesforhold og overarbejde, således at referencegruppen indeholder mange individer Generel lineær analyse I det følgende gennemføres en analyse af effekten af de eksogene variable på motivation, samt en undersøgelse af eventuelle interaktioner. En generel lineær analyse bygger på følgende forudsætninger: 1) Linearitet 2) Varianshomogenitet 3) Betinget normalfordeling Jævnfør figur 4 lader motivation ikke til at være helt normalfordelt. Dette er dog ikke et problem i forhold til en generel lineær analyse, da det er den betingede fordeling af den afhængige variabel, som forudsættes at være normalfordelt. I det følgende foretages først en trinvis baglæns modelsøgning efter det hierarkiske princip. Herefter kontrolleres modellen i forhold til forudsætningerne, og endeligt estimeres parametrene i den endelige model Modelsøgning I modelsøgningen inddrages alle uafhængige variable samt alle tovejsinteraktioner i startmodellen. For denne analyse accepteres nulhypotesen om varianshomogenitet ved Levenes test (p=0,073). Dette skal dog testes igen, når den endelige model foreligger. I tabel 5 ses en oversigt over de hovedvirkninger og interaktionsled, der elimineres i modelsøgningen. 1 Referencegrupperne er som følger: kommune = kommune 10, alder = årige, ansættelsesforhold = heltid, overarbejde = sjældent
10 Eksamensnummer: 16, 23 og Tabel 5: Model-led der elimineres i modelsøgningen Trin Model-led p-værdi 1 Kommune * Anciennitet 0,823 2 Ansættelsesforhold * Anciennitet 0,689 3 Kommune * Ansættelsesforhold 0,681 4 Alder * Ansættelsesforhold 0,606 5 Ansættelsesforhold * Køn 0,550 6 Alder * Anciennitet 0,490 7 Kommune * Alder 0,195 8 Kommune * Køn 0,110 9 Køn * Anciennitet 0, Alder * Overarbejde 0, Overarbejde * Anciennitet 0, Anciennitet 0, Ansættelsesforhold * Overarbejde 0,083 Den samlede model ses i tabel 6, hvor der indgår tre interaktioner mellem henholdsvis kommune og overarbejde, alder og køn samt overarbejde og køn. Det bemærkes, at anciennitet udgår af modellen. Tabel 6: Den samlede model F p-værdi Køn 0,733 0,392 Kommune 2,593 0,003 Alder 1,896 0,109 Ansættelsesforhold 9,691 0,002 Overarbejde 4,350 0,005 Køn * Alder 3,502 0,008 Køn * Overarbejde 4,627 0,003 Overarbejde * Kommune 2,148 0, Modelkontrol Ved modelkontrol vurderes det, om modellens tre forudsætninger i et rimeligt omfang er opfyldt. Modelkontrollen består af en såkaldt residualanalyse, som er en grafisk visuelt baseret analyse, hvor modellens forudsætninger vurderes på grundlag af forskellige figurer. 1) Linearitet Undersøges med udgangspunkt i et scatter-plot (figur 6), hvor residualerne er plottet mod de prædikterede værdier. Hvis lineariteten er acceptabel, skal der ikke være nogen systematik i residualværdiernes variation, hvilket ikke er tilfældet i figur 6. Forudsætningen om linearitet accepteres. 2) Varianshomogenitet Undersøges grafisk i samme scatter-plot (figur 6). En vandret tendenslinje i y=0 er markeret, og denne hjælper til at vurdere, om variansen stiger eller falder for højere værdier af motivation, sva-
11 Eksamen i statistik rende til variansheterogenitet. Da værdierne spreder sig nogenlunde ligeligt omkring den vandrette tendenslinje, tyder det på, at der er tale om varianshomogenitet. Vi har desuden foretaget et Levenes test for varianshomogenitet af den samlede model som accepteres (p=0,142). Det bemærker, at Levenes test kun tager højde for de kategoriske variable, idet det er variansen imellem grupper, der testes. 3) Normalfordeling Histogrammet i figur 7 viser fordelingen af residualværdierne. Hvis forudsætningen, om at motivation er betinget normalfordelt, er opfyldt, vil residualværdierne være normalfordelte med en middelværdi lig nul. Dette lader til at være tilfældet i figur 7. Antagelsen om normalfordelte residualer kan også kontrolleres i et P-P-plot som vist i figur 8. Her ses, at der ikke er bemærkelsesværdig afvigelse fra den identitetslinje som punkterne skal følge, hvis der er fuldstændig overensstemmelse mellem den empirisk kumulerede fordeling og fordelingsfunktionen for normalfordelingen. Grafisk tyder det således på, at residualerne er normalfordelte. Som supplement til de grafiske fremstillinger testes normalfordelingskriteriet ved hjælp af Kolmogorov-Smirnov testet, som tilsvarende sammenligner den kumulerede fordeling af residualerne med den standardiserede normalfordeling. Kolmogorov-Smirnov testet bekræfter, at residualerne er normalfordelte, idet nulhypotesen accepteres (p=0,148). Intet tyder således på, at residualerne afviger fra normalfordelingen. Figur 6: Scatter-plot af standardiserede residualer og prædikterede værdier Figur 7: Histogram over residualerne Figur 8: P-P-plot for standardiserede residualer Samlet viser modelkontrollen, at alle tre forudsætninger for generelle lineære modeller er opfyldt. Den samlede model er forholdsvist kompliceret med interaktioner mellem køn og alder, køn og overarbejde, samt overarbejde og kommune. Det giver derfor ikke mening at se på effekterne af
12 Eksamensnummer: 16, 23 og disse variable hver for sig. For at lette fortolkningen af den komplicerede model vælger vi at gennemføre separate analyser for mænd og kvinder. 4.3 Separate analyser for kvinder og mænd Der foretages modelsøgning, modelkontrol og slutteligt opstilles en endelig model for henholdsvis kvinder og mænd. De endelige modeller ses i tabel 7. Tabel 7: Model for henholdsvis kvinder og mænd Kvinder Mænd F p-værdi F p-værdi Kommune 1,334 0,201 2,920 0,002 Ansættelsesforhold 8,560 0,004 4,220 0,043 Overarbejde 2,196 0,087 4,658 0,004 Alder - - 2,736 0,033 Anciennitet 10,454 0, Overarbejde * Kommune 1,520 0,034 1,676 0,036 Modelkontrollen gennemføres ligesom for den samlede model og de grafiske fremstillinger ses i figur 9. Figur 9: Grafisk fremstilling af linearitet og varianshomogenitet vist ved et scatter-plot, normalfordelingen vist ved et histogram og P-P-plot for henholdsvis kvinder og mænd Scatter-plot af de standardiserede residualer mod prædikterede værdier Histogram over residualerne P-P-plot for de standardiserede Residualer Kvinder
13 Eksamen i statistik Mænd Kvinder: Forudsætningen om linearitet accepteres. Varianshomogenitet accepteres ligeledes og bekræftes, idet Levenes test er insignifikant (p=0,112). Det accepteres desuden, at residualerne følger en normalfordeling, hvilket bekræftes af Kolmogorov-Smirnov testet, som er insignifikant (p=0,083). Mænd: Forudsætningen om linearitet og varianshomogenitet accepteres (Levenes test p=0,324). I forhold til forudsætningen om normalfordelte residualer er de grafiske fremstillinger mere uklare grundet få individer. Kolmogorov-Smirnov testet er dog insignifikant (p=0,676), så forudsætningen accepteres. Forudsætningerne for den generelle lineære model accepteres for både mænd og kvinder, og de endelige modeller er som vist i tabel 7. Alder indgår i den samlede model og den endelige model for mænd. Alder har således kun betydning for motivationen hos mænd. Anciennitet indgår kun i modellen for kvinder, hvilket eventuelt kan skyldes en interaktion mellem anciennitet og køn, som dog ikke fremgår af den samlede model. Hvis de kategoriske variable erstattes af binære dummy-variable, kan den samlede effekt af de uafhængige variable opskrives som en lineær funktion af middelværdien. Funktionerne for henholdsvis kvinder og mænd ses nedenfor: Kvinder E(Y K, A, O, C) = α + βkkk + βaaa + βooo + βccc + βkokkoo Mænd E(Y K, Z, A, O) = α + βkkk + βzzz + βaaa + βooo + βkokkoo K = kommune, Z = alder, A = ansættelsesforhold, O = overarbejde og C = anciennitet
14 Eksamensnummer: 16, 23 og Tolkning af de endelige modeller For at tolke β-estimaterne er det nødvendigt at undersøge hovedvirkninger og interaktioner for sig. β-estimaterne for hovedvirkningerne og dertilhørende konfidensintervaller ses i tabel 8. Tabel 8: β-estimater for hovedvirkninger i slutmodellerne Kvinder Mænd β CI 95 % β CI 95 % Alpha (α) 15,428 [14,481;16,375] 14,638 [12,879;16,396] Ansættelsesforhold Deltid -0,711 [-1,188;-0,234] -2,316 [-4,554;-0,077] Heltid 0,0 0,0 Anciennitet 0,033 [0,013;0,052] - - Alder år - - 3,453 [0,924;5,982] år - - 0,110 [-1,120; 1,340] år - - 1,179 [0,141; 2,217] ,380 [-1,981;2,741] år - - 0,0 Kvinder: Deltidsansattes motivationsgrad ligger, alt andet lige, ca. 0,7 point lavere end fuldtidsansattes, mens graden af motivation stiger med stigende anciennitet (0,033 point pr. år, alt andet lige). Mænd: Det har stor betydning for mænds motivation hvorvidt de er ansat på hel- eller deltid. Deltidsansattes motivationsgrad er således 2,3 point lavere end heltidsansatte, alt andet lige. De årige ligger ca. 3,5 point højere på motivationsskalaen end de årige, alt andet lige. P- værdierne for aldersgrupperne årrige og 60 år og ældre er insignifikante, hvilket betyder, at disse grupper i princippet kan have samme motivationsgrad som referencegruppen (50-59-årige). Begge modeller indeholder en interaktion mellem kommune og overarbejde. Dette betyder, at det ikke giver mening at se på effekterne af disse variable hver for sig. For at kunne sige noget om variablenes indflydelse på motivation er det nødvendigt at udregne den samlede effekt af de forskellige kombinationer af variablene. De samlede effekter og konfidensintervaller for interaktionen mellem kommune og overarbejde for kvinder og mænd, er vist i henholdsvis tabel 9 og 10. Konfidensintervallerne er udregnet ved at konstruere en ny variabel for interaktionen og efterfølgende indsætte denne i modellen. Herved bliver det muligt at angive konfidensintervaller for β-værdierne.
15 Eksamen i statistik Tabel 9: Samlet effekt af interaktion mellem kommune og overarbejde for kvinder Kvinder Overarbejde Næsten dagligt 2-3 gange pr. uge 2-3 gange pr. mdr. Sjældent Kommune 1 β -0,373-0,045-0,045 [CI 95 %] [-2,246;1,500] [-2,084;1,993] [-2,523;2,433] Kommune 2 β -1,306-0,964 0,498 0,838 [CI 95 %] [-2,891;0,279] [-2,259;0,331] [-0,747;1,743] [-0,638;2,314] Kommune 3 β -0,021-0,973-0,062 0,403 [CI 95 %] [-1,969;1,926] [-2,224;0,279] [-1,317;1,193] [-0,997;1,804] Kommune 4 β -0,504-0,261 0,749 0,779 [CI 95 %] [-3,615;2,607] [-3,371;2,848] [-1,548;3,046] [-1,700;3,258] Kommune 5 β 0,616 0,237-0,31-0,307 [CI 95 %] [-1,334;2,567] [-1,164;1,638] [-1,526;0,907] [-1,889;1,276] Kommune 6 β -0,448-0,481 0,444-0,691 [CI 95 %] [-2,742;1,845] [-1,934;0,973] [-1,706;2,595] [-2,844;1,461] Kommune 7 β 1,723 0,648-0,217-0,959 [CI 95 %] [-1,008;4,453] [-1,101;2,396] [-2,261;1,828] [-2,659;0,741] Kommune 8 β -3,172-0,95 0,525-2,387* [CI 95 %] [-6,922;0,577] [-2,502;0,602] [-1,130;2,181] [-4,679;-0,095] Kommune 9 β 0,576 0,028 1,714 0,485 [CI 95 %] [-1,903;3,055] [-1,866;1,921] [-0,324;3,753] [-1,992;2,963] Kommune 11 β -6,336* 0,944 1,350-0,075 [CI 95 %] [-10,085;-2,586] [-0,531;2,418] [-0,203;2,903] [-1,824;1,674] Kommune 12 β 1,924-0,105-0,291 0,684 [CI 95 %] [-0,806;4,654] [-2,257;2,047] [-1,727;1,144] [-0,698;2,065] Kommune 10 β -0,230 0,136-0,078 0 [CI 95 %] [-1,615;1,155] [-1,115;1,388] [-1,385;1,228] Ingen personer i denne kategori *Signifikante p-værdier For kvinderne er tendenserne for interaktionen generelt uklare, fordi visse kombinationer af kommune og overarbejde indeholder meget få individer. En enkelt kombination indeholder slet ingen individer. Desuden er de fleste p-værdier (undtagen to) insignifikante. Det kan således være svært at se åbenbare sammenhænge. Med disse forbehold forsøger vi at tolke interaktionerne, og det lader til, at der ingen entydig sammenhæng er mellem hyppigheden af overarbejde og graden af motivation. Effekten af overarbejde på graden af motivation afhænger af hvilken kommune man er ansat i. Det tyder på, at det at være ansat i kommune 11 og næsten dagligt have overarbejde påvirker motivationen negativt, mens motivationen er høj for ansatte i kommune 7 og 12 med dagligt overarbejde. Profilen af kvinden med lavest grad af motivation er som følger: Hun er deltidsansat, netop ansat i kommune 11 og har overarbejde næsten dagligt.
16 Eksamensnummer: 16, 23 og Tabel 10: Samlet effekt af interaktion mellem kommune og overarbejde for mænd Mænd Overarbejde Næsten dagligt 2-3 gange pr. uge 2-3 gange pr. mdr. Sjældent Kommune 1 β -3,748-3,000* -1,734-3,193 [CI 95 %] [-8,699;1,204] [-5,683;-0,317] [-4,865;1,397] [-6,857;0,472] Kommune 2 β 0,471-1,669-0,02-2,701* [CI 95 %] [-1,995;2,936] [-3,963;0,625] [-2,284;2,244] [-5,149;-0,252] Kommune 3 β 1,963-0,453 0,691 1,796 [CI 95 %] [-0,576;4,501] [-4,284;3,377] [-1,859;3,242] [-0,742;4,334] Kommune 4 β -2,477 6,298* [CI 95 %] [-5,300;0,345] [0,469;12,127] Kommune 5 β 3,678-1,364 0,691-1,638 [CI 95 %] [-1,659;9,015] [-4,472;1,744] [-1,945;3,327] [-6,470;3,195] Kommune 6 β 3,773* -2,437 0,029-2,757 [CI 95 %] [0,163;7,383] [-5,643;0,769] [-3,109;3,167] [-5,873;0,359] Kommune 7 β -6,017* -3,817 [CI 95 %] [-11,364;-0,671] [-8,665;1,032] Kommune 8 β -2,748-0,072-3,090 [CI 95 %] [-7,699;2,204] [-2,958;2,814] [-8,498;2,317] Kommune 9 β 1,659-3,817 2,807-2,817 [CI 95 %] [-1,487;4,805] [-8,665;1,032] [-0,857;6,472] [-7,665;2,032] Kommune 11 β -4,817 2,371 2,321-1,827 [CI 95 %] [-9,665;0,032] [-0,839;5,582] [-0,108;4,751] [-5,628;1,973] Kommune 12 β 1,718-2,193 0,651 [CI 95 %] [-1,948;5,384] [-5,857;1,472] [-2,031;3,332] Kommune 10 β 0,362-0,470-0,817 0 [CI 95 %] [-4,470;5,195] [-3,427;2,487] [-5,665;4,032] Ingen personer i denne kategori * Signifikante p-værdier Som for kvinder er tendenserne uklare og mange p-værdier insignifikante. Ligeledes afhænger effekten af hyppigheden af overarbejde på motivationen i høj grad af, hvilken kommune man er ansat i. Det må være en stærk interaktion, idet vi finder signifikante p-værdier for relativt mange kombinationer blandt mænd, selvom der er få individer. Profilen af manden med lavest grad af motivation er som følger: Han er deltidsansat, mellem 50 og 59 år, ansat i kommune 7 og har overarbejde 2-3 gange per uge. Det bør bemærkes, at interaktionen mellem kommune og overarbejde virker forskelligt blandt kvinder og mænd, dette kan eventuelt skyldes en trevejsinteraktion mellem kommune, overarbejde og køn. Vores datamateriale er dog så beskedent og usikkerheden på estimaterne så stor, at det ikke kan udelukkes, at den samlede effekt for kommune og overarbejde faktisk er den samme for mænd og kvinder.
17 Eksamen i statistik Opsamling Vi fandt i opgave 1, at motivationsskalaen ikke havde problemer med DIF. I opgave 2 fandt vi, at motivationsgraden blandt socialrådgivere og sagsbehandlere afhænger af, hvorvidt man er heltidseller deltidsansat. Alder lod til kun at have betydning for mænd, mens antal år på arbejdspladsen kun havde betydning for kvinder. Kønsforskellen i forhold til effekten af anciennitet var dog ikke synlig i den samlede model. Vi fandt en interaktion mellem hyppigheden af overarbejde og ansættelseskommune. Dermed er effekten af overarbejde på graden af motivation afhængig af, hvilken kommune man er ansat i.
Synopsis til eksamen i Statistik
Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse
Læs mereEksamen i Statistik og skalavalidering
Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer
Læs mereINDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4
Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal
Læs mereSYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING
SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE
Læs mereSynopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab
Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende
Læs mereStatistik & Skalavalidering
å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k
Læs mereStatistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45
Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af
Læs mereEksamen i statistik 2009-studieordning
Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereRegressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereOpsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller
Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende
Læs mereLogistisk regression
Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereEksamen Efterår 2013
Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereStatistik og skalavalidering. Opgave 1
Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereMPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereSammenhængen mellem elevernes trivsel og elevernes nationale testresultater.
Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereModelkontrol i Faktor Modeller
Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereØkonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
Læs mereRettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereStatistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Læs mereDagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Læs mereProgram. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot
Program Residualanalyse Flersidet variansanalyse Helle Sørensen Modelkontrol (residualanalyse) i tosidet ANOVA med vekselvirkning. Test og konklusion i tosidet ANOVA (repetition) Tresidet ANOVA: the works
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs mereØkonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
Læs mereSammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.
Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner
Læs mereMultipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereKausale modeller. Konstruktion og analyse
Kausale modeller Konstruktion og analyse 1 Kausale modeller = DAGs (Directed acyclic graphs) defineret ved Fuldstændig ordnet kausal struktur Definition af direkte kausal effekt Antagelser om fravær af
Læs mereUge 13 referat hold 4
Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereStatistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs merePsykisk arbejdsmiljø og stress
Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.
Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mere1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable
Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereDagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22
Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som
Læs mereForelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereLigelønsanalyse sammenligning af privatansatte kvinder og mænds løn
Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Indledning I dette notat analyseres lønforskelle mellem privat ansatte kvinder og mænd. Analysen er gennemført på baggrund af Djøf Privats
Læs mereBenchmarking af kommunernes sagsbehandling antagelser, metode og resultater
Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereUNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER
UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs merea) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?
Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereBaggrundsnotat: Søskendes uddannelsesvalg og indkomst
17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser
Læs mereEt firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen
STATISTIK Skriftlig evaluering, 3. semester, mandag den 6. januar 004 kl. 9.00-13.00. Alle hjælpemidler er tilladt. Opgaveløsningen forsynes med navn og CPR-nr. OPGAVE 1 Et firma tuner biler. Antallet
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf
Læs mereProgram. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007 KM2: F21 1 Program for de to næste forelæsninger Emnet er specifikation og dataproblemer (Wooldridge kap. 9) Fejlleddet kan være korreleret
Læs mereØkonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006
Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy
Læs mere