Statistik & Skalavalidering
|
|
- Aksel Jepsen
- 7 år siden
- Visninger:
Transkript
1 å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k a b E k s a m e n s n u m r e : 6, 5 3 Side 1 af 17
2 Indholdsfortegnelse Introduktion... 3 Formål med analysen... 3 Kausaldiagram... 3 Indledende databeskrivelse... 3 Fordelingsbeskrivelse... 4 Marginale analyser... 6 Opgave 1. Differentiel item funktion (DIF)... 9 Opgave 2. Generel lineær analyse Modelsøgning Modelkontrol Forudsætning om varianshomogenitet Forudsætning om normalfordelte residualer Forudsætning om linearitet Tolkning af parameterestimater i slutmodellen Side 2 af 17
3 Introduktion Formål med analysen I opgaven ønsker vi for det første at undersøge om den givne motivationsskala har problemer med differentiel item funktion (DIF), og på baggrund heraf om skalaen om muligt bør reduceres så DIF undgås. Derefter vil vi vha. generel lineær analyse vurdere, om graden af motivation, målt som den samlede score på motivationsskalaen, afhænger af variablene alder, køn, kommune, anciennitet, arbejdstid og overarbejde. Herunder klarlægge på hvilken måde disse variable eventuelt influerer på graden af motivation. Kausaldiagram Figur 1 Indledende databeskrivelse Det datamateriale (EKS2010.SAV) som opgaven tager udgangspunkt i, indeholder data fra en undersøgelse af arbejdsmiljøet blandt socialrådgivere og kommunale sagsbehandlere i 12 kommuner fra hele landet. Datamaterialet belyser fem items, og består derfor af fem spørgsmål, som alle er besvaret ud fra fire svarkategorier. Tabel 1: Itembeskrivelse Spørgsmål: S71 S72 S73 S74 S75 Jeg har et godt Det er kun lønnen, arbejde der betyder noget Jeg ville stoppe, hvis jeg havde penge nok Jeg ville vælge noget mere interessant, hvis jeg havde mulighed for det Jeg er stolt over mit arbejde Tabel 2: Svarkategorier Svarkategorier: JA, passer i høj grad JA, passer i nogen grad NEJ, passer ikke NEJ, passer slet ikke Side 3 af 17
4 Ved spørgsmål S71 og S75 er der i datamaterialet foretaget to omkodninger (til variablene V71 og V75), da spørgsmålene har et positivt indhold modsat de resterende tre spørgsmål. Vægtningen af svarkategorierne skal afspejle at svarkategorien 1 er et udtryk for lavest grad af motivation, mens svarkategorien 4 er udtryk for højest grad af motivation. Udover belysning af de nævnte fem items, indeholder datamaterialet oplysninger om seks baggrundsvariable variable. Dette drejer sig om køn, alder (opdelt i 10-års intervaller), kommune (kodet anonymt fra 1-12), anciennitet (antal år på nuværende arbejdsplads), arbejdstid (ansættelse på heltid eller deltid) og overarbejde (hyppighed for overarbejde ved fire ordinale kategorier). Vi har indledningsvist konstrueret en variabel for motivationsskalaen, som er givet ved: Motivation = V71 + S72 + S73 + S74 + V75 Fordelingsbeskrivelse Vores datamateriale inkluderer data fra i alt 895 socialrådgivere og kommunale sagsbehandlere (størstedelen kvinder 84%), med en gennemsnitlig anciennitet på arbejdspladsen på 9,5 år (SD = 10). I nedenstående histogram (figur 2) ses den afhængige variabel, motivation. Det ses, at den marginale fordeling er tilnærmelsesvist normalfordelt, der dog er en anelse venstreskæv. I den videre analyse giver det ikke nogen mening at transformere denne variabel, for at opnå en bedre normalfordeling, når der ses en venstreskæv fordeling. Vi er opmærksomme på, at ti personer ikke har besvaret et eller flere af de fem spørgsmål, hvorfor der ikke er beregnet en samlet skalaværdi for disse. Figur 2: Fordeling af motivation I tabel 3 ses frekvensfordelingen af alle uafhængige variable, på nær anciennitet. Anciennitet er en kontinuert variabel og kan derfor med fordel beskrives ved et histogram (dette histogram findes som figur 3). Side 4 af 17
5 Tabel 3: Fordeling af baggrundsvariable Total N (valid%*) Total 895 (100) Alder 18 år 1 (0,1) år 89 (10) år 177 (19,8) år 265 (29,7) år 295 (33) 60 år 66 (7,4) Køn Mand 144 (16,1) Kvinde 749 (83,9) Kommune 1 34 (3,8) (16,2) (14,7) 4 22 (2,5) (11,6) 6 53 (5,9) 7 39 (4,4) 8 47 (5,3) 9 37 (4,1) (16,1) (7,9) (7,5) Arbejdstid Heltid 708 (79,6) Deltid 181 (20,4) Overarbejde Sjældent 215 (24,2) 2-3 gange pr. måned 288 (32,4) 2-3 gange pr. uge 277 (31,2) Næsten dagligt 109 (12,3) * Vi har pga. missing -værdier valgt den procentvise fordeling, som tager højde for dette, således at procenterne inden for hver variabel summerer til 100 %. Ud fra ovenstående fordelingstabel ses det, at antal cases i kategorierne inden for hver variabel fordeler sig acceptabelt med undtagelse af alder. Her ses det, at kun ét individ er 18 år. Af denne årsag slår vi de to yngste alderskategorier sammen ( 29 år, n=90). Det vurderes at være vanskeligt at påvise, at der er statistisk forskel variabelgrupperne imellem, hvis der er så få individer i en eller flere grupper. Risikoen højnes for type 2 fejl, når gruppernes størrelser er små. Side 5 af 17
6 Figur 3: Fordeling af anciennitet Vi ser ud fra ovenstående histogram, at den uafhængige variabel, anciennitet, ikke kan siges at være normalfordelt. Dette er dog ikke noget problem, da der ikke er noget krav om, at uafhængige variable i en generel lineær regressionsanalyse skal være normalfordelte. Vi ser at 25 % af personerne i datasættet har en anciennitet på 2 år eller mindre, mens 50 % af personerne har en anciennitet på 5 år eller mindre. Marginale analyser Den deskriptive sammenhæng mellem motivation og hhv. køn og arbejdstid kan beskrives ved brug af t- test, da disse to uafhængige variable er binære, og vi derfor ved brug af t-test kan sammenligne fordelingen af motivation indenfor hver af variablens to grupper. Dog er t-test en forsimpling af den ensidede variansanalyse (ANOVA), hvorfor denne lige så vel kan anvendes. Sammenhængen mellem de kategoriske variable, alder, kommune og overarbejde, og den afhængige variabel motivation undersøges vha. ensidet variansanalyse (ANOVA). Resultatet heraf ses i tabel 4. Tabel 4: Karakteristik af sammenhæng mellem baggrundsvariable og motivation Gennemsnitlig motivationsscore (SD) Test for varianshomogenitet* Test for middelværdiforskelle** Total 15,44 (2,68) Alder 0,827 0, år 15,26 (2,87) år 15,05 (2,76) år 15,46 (2,58) år 15,60 (2,68) 60 år 15,98 (2,58) Køn 0,700 0,002 Mand 14,81 (2,71) Kvinde 15,57 (2,67) Kommune 0,115 0, ,47 (2,77) 2 15,10 (2,68) 3 15,48 (2,60) 4 15,64 (2,42) Side 6 af 17
7 5 15,49 (2,28) 6 15,17 (2,91) 7 15,38 (3,38) 8 14,85 (2,47) 9 15,97 (2,24) 10 15,59 (2,73) 11 16,16 (3,17) 12 15,79 (2,42) Arbejdstid 0,830 0,113 Heltid 15,50 (2,67) Deltid 15,15 (2,71) Overarbejde 0,119 0,147 Sjældent 15,45 (2,76) 2-3 gange pr. 15,71 (2,47) måned 2-3 gange pr. uge 15,20 (2,73) Næsten dagligt 15,32 (2,97) * p-værdier fra Levenes test. ** p-værdi fra ANOVA test. Som følge af Levenes test konkluderes det, at alle variable i tabellen ovenfor har homogene varianser (nulhypotese om ens varianser godtages). Derudover ses det i tabellen, at hverken alder, kommune, arbejdstid eller overarbejde ved brug af ensidet variansanalyse (ANOVA) har en marginal sammenhæng med motivation. Som den eneste uafhængige variabel, viste køn en signifikant sammenhæng med motivation. Kvinder ses at have en signifikant højere motivation sammenlignet med mænd. Den uafhængige variabel, anciennitet, er kontinuert fordelt, og derfor undersøger vi anciennitetens betydning for motivation ved at se på variablen som den tegner sig i et såkaldt scatterplot. Dette plot kan afsløre, om der findes en tendens, som eventuelt er lineær, kvadratisk eller kubisk. Figur 4: Karakteristik af sammenhængen mellem anciennitet og motivation Vi ser en meget svag tendens til en lineær sammenhæng mellem anciennitet og motivation. Dvs. at jo længere anciennitet på arbejdspladsen des højere motivation. Dog er forklaringskraften ikke stor, da Side 7 af 17
8 hældningen på den fittede linje er meget lille grundet den store spredning. Vi testede desuden sammenhængen ved lineær regression og fandt, at anciennitet kunne tillægges signifikant betydning for motivation (p = 0,022) ved et signifikansniveau på 5 %. Side 8 af 17
9 Opgave 1. Differentiel item funktion (DIF) Undersøgelse af DIF er en metode til at foretage skalavalidering ved at afprøve skalaens begrebsvaliditet. DIF kan opfattes som et konfounderproblem og betyder, at besvarelsen af et spørgsmål (item), som skalaen indeholder, påvirkes af andre baggrundsvariable udover den latente variabel. Målingen af fx motivation vil derfor blive konfoundet af den uafhængige variabels direkte effekt på besvarelsen af det enkelte item, som det ses eksemplificeret i figur 5. Figur 5: DIF For at undgå, at målingen af den latente variabel konfoundes, er det nødvendigt at identificere og eventuelt fjerne items, som medfører DIF. En valid skala uden DIF opfylder: Dvs. at den indirekte sammenhæng mellem items og baggrundsvariable bør forsvinde, når der kontrolleres for den totale motivationsscore. Som følge af ovenstående ønsker vi at konstruere og afprøve en skala, der måler arbejdsmæssig motivation blandt socialrådgivere og kommunale sagsbehandlere, uden DIF i forhold til køn, alder, kommune, anciennitet, arbejdstid og overarbejde. Dette gør vi ved at foretage en logistisk regressionsanalyse for hvert af de fem items i motivationsskalaen, hvor hvert item optræder som afhængig variabel, mens den totale motivationsscore og samtlige seks baggrundsvariable indgår som uafhængige variable. Til disse analyser dikotomiseres de fem items, da logistiske regressionsmodeller kun kan håndtere binære afhængige variable. Vi slår derfor svarkategorierne 1 og 2 sammen til en samlet kategori JA, passer i høj grad/nogen grad, mens svarkategorierne 3 og 4 bliver til NEJ passer ikke/slet ikke. I analyserne kontrollerer vi for non-uniform DIF ved at inddrage et interaktionsled mellem motivationsskalaen og hver af de uafhængige variable. Non-uniform DIF optræder, når sammenhængen mellem en baggrundsvariabel, fx alder, og et item er forskellig alt efter hvor på den totale motivationsskala kan befinder sig. Dvs. at der findes en interaktion mellem motivationsscore og placering indenfor den uafhængige variabels undergrupper. Efter analyser for hvert af de fem items, hvor alle uafhængige variable, den totale motivationsscore og interaktionsled inddrages samtidig, finder vi ikke signifikant evidens for non-uniform DIF. Dette fordi ingen af analyserne viser tegn på interaktion mellem skala og de uafhængige variable. Som følge af baglæns manuel modelsøgning, hvor de insignifikante interaktionsled én efter én fjernes fra modellen, finder vi heller ingen tegn på uniform DIF for nogle af de uafhængige variable. Side 9 af 17
10 For at sikre os, at der ikke kan være tale om uniform DIF, foretager vi yderligere et antal logistiske regressionsanalyser, hvor hvert item igen indgår som afhængig variabel, mens baggrundsvariablene inddrages på skift. Dvs. at vi i alt foretager yderligere 5 x 6 analyser. Analysernes signifikante fund ses i tabel 5. Tabel 5: Tegn på uniform DIF i motivationsskalaen Item* DIF (p-værdi < 0,001) DIF (0,001 p-værdi < 0,01) DIF (0,01 p-værdi 0,05) v s s s Anciennitet (p-værdi = 0,026) v * Dikotome items er benyttet Det ses nu, at variablen anciennitet har svag signifikant direkte sammenhæng med det dikotome item S74. Jo kortede anciennitet på arbejdspladsen, jo større er tilbøjeligheden til at ville vælge noget mere interessant arbejde, hvis muligheden var der, efter at der er taget højde for den totale motivationsscore. På baggrund af det store antal gennemførte logistiske regressionsanalyser er det dog afgørende ikke at overvurdere det svagt signifikante testresultat. Ved meget analysearbejde er der risiko for falske resultater, fx i forbindelse med type 1 fejl. Af denne årsag vælger vi kun at bekymre os om p-værdier mindre end 1 %, og sådanne værdier afsløres ikke i analyserne. Vi vurderer på baggrund heraf, at motivationsskalaen fungerer bedst indeholdende alle fem items og derfor ikke bør reduceres. Side 10 af 17
11 Opgave 2. Generel lineær analyse Her er den overordnede problemstilling, hvilken betydning de uafhængige variable har for motivationsscoren, samt om effekten af de uafhængige variable interagerer. Underordnede problemstillinger består i, om forudsætningerne for generel lineær regressionsanalyse opfyldes. Indledningsvist foretager vi en generel lineær regressionsanalyse med motivation som afhængig variabel og variablene køn, alder, kommune, anciennitet, arbejdstid og overarbejde som uafhængige variable. Vi inddrager desuden samtlige to-vejsinteraktioner mellem de uafhængige variable. Da der herved er tale om et stort antal parametre i vores start-model vælger vi gennem analysen at benytte et signifikansniveau på 1 %. Nedenfor ses en tabel med de kategoriske variable i regressionsanalysen. Tabel 6: Kategoriske variable i den generelle lineære analyse Ydre/eksogen variabel Værdi Label N Alder* 1 29 år år år år år 62 Køn 1 Mand Kvinde 722 Kommune Arbejdstid 1 Heltid Deltid 173 Overarbejde 1 Sjældent gange pr. måned gange pr. uge Næsten dagligt 108 * To yngste alderskategorier slået sammen. Modelsøgning Første trin i den generelle lineære regression består af vores mættede startmodel, som inkluderer alle parametre, dvs. de uafhængige variable og deres interaktionsled (se tabel 7). Det bemærkes, at kommune (p = 0,003), overarbejde (p = 0,006) og kommune*overarbejde (p = 0,001) viser signifikant forklaringskraft i startmodellen. Resten af parametrene er insignifikante, og modellen kan derfor siges at være overparametriceret i forhold til data, hvilket nødvendiggør en baglæns modelsøgning for at eliminere de parametre, som ikke er troværdige udtryk for hverken interaktioner eller effekter. I Side 11 af 17
12 modelsøgningens trin udregnes F-teststørrelser og signifikansniveau for hver enkelt parameter, og den mindst signifikante parameter fjernes fra modellen. Denne procedure foretages i overensstemmelse med det hierarkiske princip, som benyttes ved inddragelsen af interaktionsled i modelsøgningen, og betyder at man ikke må fjerne en hovedvariabel førend alle interaktionsled, som er sammensat af denne er fjernet i modellen. Modelsøgningen fortsættes indtil det ikke længere er muligt at fjerne insignifikante parametre. Vores eksklusionsproces af parametre i modelsøgningen ses i tabel 8. I tabel 7 ses modelsøgningens start- og slutmodel fra vores generelle lineære regressionsanalyse. Sammenlignes slutmodellens signifikante p-værdier med tendenserne ved de marginale analyser ses det, at køn og anciennitet ikke længere har signifikant betydning for motivation. Til gengæld har det vist sig, at kommune, arbejdstid og overarbejde er signifikant associeret med motivation. Tovejsinteraktionsleddene alder*køn, køn*overarbejde og kommune*overarbejde har tillige signifikant forklaringskraft. Dog bemærkes det, at hverken alder eller køn har signifikant forklaringskraft alene. Tabel 7: Den mættede startmodel og slutmodellen Startmodel Slutmodel Variabel F-teststørrelse p-værdi* F-teststørrelse p-værdi* Alder 2,358 0,052 2,173 0,070 Køn 2,201 0,138 0,637 0,425 Kommune 2,561 0,003 2,611 0,003 Anciennitet 1,027 0, Arbejdstid 4,821 0,028 9,754 0,002 Overarbejde 4,127 0,006 4,328 0,005 Alder*Køn 2,087 0,081 3,986 0,003 Alder*Kommne 0,956 0, Alder*Anciennitet 0,586 0, Alder*Arbejdstid 0,659 0, Alder*Overarbejde 1,754 0, Køn*Kommune 1,544 0, Køn*Anciennitet 2,308 0, Køn*Arbejdstid 1,006 0, Køn*Overarbejde 2,481 0,060 4,609 0,003 Kommune*Anciennitet 0,605 0, Kommune*Arbejdstid 0,771 0, Kommune*Overarbejde 1,947 0,001 2,157 < 0,001 Anciennitet*Arbejdstid 0,186 0, Anciennitet*Overarbejde 2,395 0, Arbejdstid*Overarbejde 1,911 0, * p-værdi baseret på F-teststørrelsen fra ANOVA. Side 12 af 17
13 Tabel 8: Baglæns modelsøgning Trin Fjernet variabel p-værdi* 1 Kommune*Anciennitet 0,825 2 Anciennitet*Arbejdstid 0,688 3 Kommune*Arbejdstid 0,672 4 Alder*Arbejdstid 0,606 5 Alder*Anciennitet 0,507 6 Køn*Arbejdstid 0,531 7 Alder*Kommune 0,193 8 Køn*Kommune 0,107 9 Køn*Anciennitet 0, Alder*Overarbejde 0, Anciennitet*Overarbejde 0, Anciennitet 0, Arbejdstid*Overarbejde 0,084 * p-værdi baseret på F-teststørrelse fra ANOVA. Modelkontrol For at analyseresultaterne i vores slut-model er brugbare og tolkningsværdige, er det nødvendigt, at forudsætningerne for gennemførelsen af variansanalysen i rimeligt omfang er opfyldte. Modelkontrol af generelle lineære modeller består primært af residualanalyse, som er en analyse af de standardiserede residualer. Forudsætning om varianshomogenitet Modelforudsætningen om varianshomogenitet undersøges vha. Levenes homogenitetstest for slutmodellen og et grafisk scatterplot med de standardiserede residualer mod de prædikterede værdier af den afhængige variabel motivation. Ud fra Levenes homogenitetstest godtager vi nul-hypotesen om varianshomogenitet (p = 0,144). Nedenstående figur 6 viser desuden, at der i plottet ikke er en systematisk, men tilfældig, spredning mellem de standardiserede residualer og de prædikterede værdier af motivation, hvorfor forudsætningen om varianshomogenitet understøttes. Figur 6: Scatterplot af de standardiserede residualer mod de prædikterede værdier af motivation Side 13 af 17
14 Forudsætning om normalfordelte residualer Denne forudsætning undersøges ved et histogram over de standardiserede residualer for motivation med indtegning af en normalfordelingskurve, som det ses i figur 7. Det ses, at fordelingen af residualerne ikke afviger betydeligt fra normalfordelingskurven. Herudover undersøges den betingede normalfordeling af residualerne ved at sætte den kumulerede observerede fordeling af motivation mod den kumulerede forventede fordeling. Plottet viser som histogrammet, at residualerne er tilnærmelsesvist identisk normalfordelte, hvorfor residualerne må være uafhængige af alle baggrundsvariable i datamaterialet og kun afhænge af den afhængige variabel. Forudsætningen vurderes at være opfyldt. Figur 7: Fordeling af de standardiserede residualer for motivation Figur 8: P-P plot med de standardiserede residualer for motivation Forudsætning om linearitet Denne forudsætning er umiddelbart kun interessant i forhold til den uafhængige variabel, anciennitet, da denne er den eneste kontinuerte ydre variabel i vores datasæt. En enkelt måde at afprøve, hvorvidt effekten af den uafhængige variabel er lineær, er ved at inkludere et kvardratisk og/eller kubisk led af variablen i regressionsmodellen. Hvis effekten rent faktisk er lineær, må beta-værdien knyttet til det kvardratiske eller kubiske led ikke være signifikant forskelligt fra nul. Dette undersøgte vi allerede indledningsvist ved den marginale analyse af anciennitet, hvor vi i figur 4 så en svag lineær tendens, fordi observationerne fordelte sig nogenlunde pænt omkring en ret linje. Ved afprøvning af effekten af det kvardratiske og kubiske led, fandt vi ingen signifikante værdier, hvorfor disse led ikke kan tilskrives nogen forklaringskraft for motivation og derfor ikke blev bibeholdt i den lineære regressionsmodel. Tolkning af parameterestimater i slutmodellen Modelkontrollen afslørede ingen problemer med de tre forudsætninger for gennemførelsen af den generelle lineære analyse, og resultaterne i vores slutmodel vurderes på denne baggrund at være tolkningsværdige. Som beskrevet til slut i vores analyse, har de uafhængige variable kommune, arbejdstid og overarbejde signifikant forklaringskraft for motivation. To-vejsinteraktionsleddene alder*køn, køn*overarbejde og kommune*overarbejde har tillige en signifikant effekt. I det følgende redegøres for estimaterne af de signifikante parametre i slutmodellen. Parameterestimaterne (β) for samtlige signifikante hovedvariable og interaktioner er ikke vist her, da en Side 14 af 17
15 sådan tabel ville være meget lang. Vi viser kun parameterestimatet for hovedvariablen arbejdstid (se tabel 9), da denne er den eneste, som ikke også indgår i ét eller flere signifikante interaktionsled. Parameterestimaterne svarer til middelværdiforskelle. Parameterestimaterne for de signifikante hovedvariable kommune og overarbejde og de signifikante interaktioner er som nævnt udeladt i tabel 9, og effekterne af disse vil blive berørt separat, når vi redegør for effekten af interaktionerne. Tabel 9: Parameterestimater for den signifikante hovedvariabel arbejdstid Variabel β (95 % CI) p-værdi** Arbejdstid Heltid 0,715 (0,266 1,164) 0,002 Deltid 0* - * Referencegruppe. ** p-værdi ved t-test. Testet angiver, om der er forskel mellem de enkelte variabelgrupper og referencen. Af tabel 9 ser vi, at personer med fuldtidsarbejde gennemsnitlig har en motivation på 0,715 point højere end personer, som kun arbejder på deltid. Vores slutmodel kompliceres en hel del ved at indeholde flere signifikante interaktioner: mellem alder og køn, mellem køn og overarbejde samt mellem kommune og overarbejde. Interaktionerne betyder, at styrken af den ene uafhængige variabels effekt afhænger af værdien af den anden uafhængige variabel. En manglende interaktion vil omvendt sige, at en uafhængig variabel, har homogen effekt på den afhængige variabel, uanset værdierne de andre uafhængige variable. Interaktionen mellem alder og køn (p=0,003) betyder, at der opstår en synergieffekt, fordi variablene skaber lokale sammenhænge, hvor variablene effektmodificerer hinanden. Da køn udover at modificere effekten af alder, modificeres af overarbejde, mens overarbejde udover at modificere effekten af køn modificeres af kommune, er der tale om et kompliceret net af indbyrdes modificerende interaktioner. For at undersøge hvad en given interaktion har af betydning, er det nødvendigt at beregne den samlede effekt af variablene i interaktionen samt af de variable der modificerer effekten af interaktionens variable. Dette er forsøgt eksemplificeret i tabel 10, hvor den samlede effekt er beregnet ud fra slutmodellens parameterestimater. I tabellen vælger vi kun at indsætte beregninger på baggrund af kommune "1" matchet med overarbejde sjældent. Beregningerne bygger på følgende formel:,, ø ø ø ø Side 15 af 17
16 Tabel 10: Samlet effekt af kommune, overarbejde, køn og alder Kommune Sjældent* 2-3 gange pr. måned* 2-3 gange pr. uge* Næsten dagligt* Mand Kvinde Mand Kvinde Mand Kvinde Mand Kvinde Alder 29 år -1,961-3, år -5,203-3, år -4,238-3, år -5,224-2, år -5,146-2,519 0** * Hyppighed af overarbejde. ** Reference: Kommune = 1, overarbejde = næsten dagligt, køn = kvinde og alder 60 år. Side 16 af 17
17 På baggrund af ovenstående tabel 10 med udregnede samlede effekter ses det fx, at mænd under eller lig 29 år, som sjældent har overarbejde og hører til kommune 1 gennemsnitlig har 1,961 point lavere motivation sammenlignet med referencegruppen, som består af kvinder i alderen ældre eller lig 60 år, som næsten dagligt har overarbejde og tilhører kommune 12. Det ses samtidig i tabellen, at den gennemsnitlige motivation blandt mænd, som sjældent har overarbejde og tilhører kommune 1 falder med alderen. Den modsatte tendens ses blandt kvinderne, hvor den gennemsnitlige motivation stiger med alderen. For at afprøve, om disse teoretiske udregninger stemmer overens med de rå observationer fra datasættet, har vi i nedenstående figur 9 plottet den additive effekt af alder og køn mod motivation for personer, som sjældent har overarbejde og tilhører kommune 1. Figur 9: Samlet effekt af alder og køn hos personer, som sjældent har overarbejde og tilhører kommune "1" Vi er opmærksomme på, at der i data kun findes meget få personer (n = 7), som udover at tilhøre kommune 1 sjældent har overarbejde. Figuren kan derfor ikke benyttes til en gyldig tolkning af interaktionernes samlede effekt på motivationsscore. Vi ser dog, at linjerne i figuren tegner samme billede som tabel 10. Side 17 af 17
Synopsis til eksamen i Statistik
Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse
Læs mereEksamen i Statistik og skalavalidering
Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer
Læs mereEksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab
D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23
Læs mereSYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING
SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE
Læs mereSynopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab
Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende
Læs mereINDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4
Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal
Læs mereStatistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45
Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af
Læs mereEksamen i statistik 2009-studieordning
Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereLogistisk regression
Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereRegressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Læs mereSammenhængen mellem elevernes trivsel og elevernes nationale testresultater.
Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereOpsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller
Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereStatistik og skalavalidering. Opgave 1
Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs merea) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?
Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5
Læs mereMPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs mereEksamen Efterår 2013
Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs merePsykisk arbejdsmiljø og stress
Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker
Læs mereBaggrundsnotat: Søskendes uddannelsesvalg og indkomst
17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser
Læs mereModelkontrol i Faktor Modeller
Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereLars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.
Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt
Læs mereUdbrændthed og brancheskift
Morten Bue Rath Oktober 2009 Udbrændthed og brancheskift Hospitalsansatte sygeplejersker der viser tegn på at være udbrændte som konsekvens af deres arbejde, har en væsentligt forøget risiko for, at forlade
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereAppendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge
Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereUNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER
UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereSkriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00
Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereProgram. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereBenchmarking af kommunernes sagsbehandling antagelser, metode og resultater
Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereSkriftlig eksamen i samfundsfag
OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS
Læs mereDansk Erhvervs gymnasieanalyse Sådan gør vi
METODENOTAT Dansk Erhvervs gymnasieanalyse Sådan gør vi FORMÅL Formålet med analysen er at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereLUP læsevejledning til afdelingsrapporter
Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereEksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.
Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Denne opgavetype kan tage sig ud på forskellig vis, da det udleverede materiale enten kan være en tabel eller en figur. Nedenfor
Læs mereDansk Erhvervs gymnasieeffekt - sådan gør vi
Dansk Erhvervs gymnasieeffekt - sådan gør vi FORMÅL Formålet har været at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge blot ved at
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mereSchweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.
Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske
Læs mereLUP Fødende læsevejledning til afdelingsrapporter
Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...
Læs mereMultipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Læs mereStatistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik
Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereLineære normale modeller (4) udkast
E6 efterår 1999 Notat 21 Jørgen Larsen 2. december 1999 Lineære normale modeller (4) udkast 4.5 Regressionsanalyse 4.5.1 Præsentation 1 Regressionsanalyse handler om at undersøge hvordan én målt størrelse
Læs mereØkonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006
Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs mereVirksomhedspraktik til flygtninge
Virksomhedspraktik til flygtninge Af Lasse Vej Toft, LVT@kl.dk Formålet med dette analysenotat er, at give viden om hvad der har betydning for om flygtninge kommer i arbejde efter virksomhedspraktik Analysens
Læs mereRettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007
Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus
Læs mereEstimation og usikkerhed
Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode
Læs mereKapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Læs mereMatematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet
Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der
Læs mereDe variable, som er inkluderet i de forskellige modeller, er følgende:
DUL II. Undersøgelse af hvilke faktorer, der er væsentlige for at understøtte, at der er klare og veltilrettelagte mål tilstede i arbejdet med elevernes læring Følgende er en statistisk analyse af ovenstående
Læs mereKvantitative metoder 2
Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative
Læs mereTeoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger
Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereLUP læsevejledning til afdelingsrapporter
Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Læs mereModul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Læs mereStatistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Læs mereEksempel , opg. 2
Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme
Læs mereOpgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Læs merePersonlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereSandsynlighedsfordelinger for kontinuerte data på interval/ratioskala
3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter
Læs mere