Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Størrelse: px
Starte visningen fra side:

Download "Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab"

Transkript

1 Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer):

2 1. Indledning Deskriptiv statistik Indledende analyser Differential item funktion Analyse omkring baggrundsvariablenes sammenhæng med Motivation Modelsøgning og modelkontrol for Model 2 og Resultater Konklusion og diskussion

3 1. Indledning Datamaterialet i denne opgave stammer fra en undersøgelse af arbejdsmiljøet blandt socialrådgivere og kommunale sagsbehandlere i 12 anonymiserede kommuner fordelt over hele landet. Vores data beskriver studiepopulationen ved hhv. seks baggrundsvariable (Køn, Alder, Kommune, Overarbejde, Heltid/deltid og Anciennitet) og fem variable omhandlende motivation til arbejdet. De fem motivationsvariable bruges til at danne en sumskala til at afdække det latente begreb motivation. De fem motivationsvariable vil i opgaven fremover omtales som items. 2. Deskriptiv statistik Studiepopulationen består af 895 personer, hvoraf der er 144 mænd (16,1 %) og 749 kvinder (83,9 %). Alderssammensætningen er bestemt ved fem kategorier: 0,1 % er 18 år eller yngre, 10 % er år, 19,8 % er 30 til 39 år, 29,7 % er 40 til 49 år, 33 % er 50 til 59 år og 7,4 % er 60 eller ældre. På grund af den meget lille antal observationer i første aldersgruppe omkoder vi aldersvariablen, så de to første grupper lægges sammen. Vi overvejer at ekskludere den ene person på 18 eller færre år, da det ikke virker realistisk at vedkommende er færdiguddannet i den alder, men vælger alligevel at lade denne blive. Medarbejdernes anciennitet på arbejdspladsen er angivet som en kontinuert variabel, som går fra 0 til 45 år, hvor gennemsnittet er 9,48 år og modus er 1 år. 79,6 % har angivet, at de er ansat på heltid, mens 20,4 % er ansat på deltid. Overarbejde måles med en kategorisk variabel hvor 24, 2 % sjældent har overarbejde, 32,4 % har overarbejde 2 3 gange/måned, 31,2 % har 2 3 gange/uge og 12,3 % har næsten dagligt overarbejde. En sidste variabel angiver, hvilken kommune respondenterne arbejder i. Studiepopulationen er fordelt relativt jævnt over de tolv kommuner og således at hvert strata har minimum 2,5 % af studiepopulationen. Selvom det umiddelbart havde været gavnligt at lægge kommunen med 2,5 % sammen med en anden kommune, afholder vi os fra dette, da kommunerne er anonymiserede og vi derfor ikke har mulighed for at lave en kvalificeret sammenlægning. Items omkring arbejdsmotivation er kategoriske variable med fire ens svarmuligheder, hvilket muliggør summation til motivationsskalaen givet ved formlen: Motivation = v71 + s72 + 3

4 s73 + s74 + v75 5. Det er her vigtigt at bemærke at v71 og v75 er vendt om så værdien 1 fx er omkodet til 4. Svarfordelingen for hvert item ses i Tabel 1. Tabel 1. Svarfordeling over adskilte items 71 til 75 Ja, passer i høj Ja, passer i nogen Nej, passer Nej, passer slet grad grad ikke ikke s71: Jeg har et godt arbejde 19,2 % 63,8 % 14,5 % 2,5 % s72: Det er kun lønnen, der betyder noget 0,4 % 5,8 % 39,9 % 53,8 % s73: Jeg ville stoppe, hvis jeg havde penge nok 8,7 % 21,9 % 39,7 % 29,8 % s74: Jeg ville vælge noget mere interessant, hvis jeg havde mulighed for det 7,9 % 20,2 % 42,2 % 29,7 % s75: Jeg er stolt over mit arbejde 26 % 62,5 % 10,4 % 1,1 % Disse fem items udgør motivationsskalaen, som kan betragtes som en kontinuert variabel, der løber fra nul til 15, men kun kan antage hele værdier. Den gennemsnitlige score på skalaen ligger på 10,4 med en standardafvigelse på 2,69. Scoren er forholdsvist normalfordelt omkring gennemsnittet, men af Figur 1 kan man dog se en lille tendens til højreskævhed. Dette giver et hint om, at vi givetvis ikke vil få problemer med normalfordelingsantagelsen i variansanalysen, men dette kan ikke endeligt bekræftes før variablen er betinget med de øvrige (forklarende) variable. Figur 1. Histogram over fordelingen af samlet score på Motivationsskalaen 4

5 Ud fra fordelingen kan vi se, at skalaen generelt er sensitiv i hele spekteret hos netop denne studiepopulation, idet medarbejderne fordeler sig ud over et bredt range af de mulige scorer. 3. Indledende analyser For at gøre klart, hvilken kausal struktur vi antager, vil vi indledende præsentere et Directed Acyclic Graph (DAG), se Figur 2. Pilene fra motivationsskalaen til items beskriver en signifikant marginal sammenhæng mellem skalaen og hvert enkelt item (alle p< 0,000), men en vigtig antagelse er pilenes retning. Vi antager, i vores Item Response Model, at motivationsfaktoren kan ses som en iboende egenskab ved de kommunalt ansatte og anser deres tendens til at svare ja eller nej på items som en effekt af denne motivation (Faysers, 2007: 161). Vi ser altså motivationsskalaen som en refleksiv skala, og vi antager, at baggrundsvariable kan påvirke motivationen og ikke omvendt. Figur 2. DAG over hhv. statistisk testede sammenhænge og antagelser om kausale retninger V71 Alder S72 Anciennitet Kommune S73 Motivation S74 Overarbejde Køn V75 Heltid / deltid Vi antager desuden, at en evt. kausal sammenhæng med motivation og baggrundsvariablene imellem vil være ordnet inden for den kausale rækkefølge: Køn > Alder > Kommune > Anciennitet > Heltid/deltid > Overarbejde. Vi antager herefter at samtlige af disse variable kan påvirke motivationsgraden. Ud fra denne kausale struktur har vi indledningsvist testet sammenhængen mellem baggrundsvariable med hver af baggrundsvariablene som afhængig i en model med de baggrundsvariable der ligger forud i den kausale rækkefølge som de uafhængige. Disse mulige sammenhænge er testet vha. hhv. logistisk regression for binære variable (Overarbejde er dikotomiseret), lineær regression for Anciennitet og gammatest for Alder. Sammenhængen mellem Kommune og hhv. Køn og Alder testes marginalt med et χ 2 test. Sorte 5

6 pile i mellem baggrundsvariable i Figur 2 betegner herefter en signifikant (p<0,05) sammenhæng i den retning som afspejles af vores antagelser. De grønne pile i Figur 2 er ikke endnu testet, men det vil i løbet af opgave 2 blive af eller bekræftet om baggrundsvariablene har en effekt på arbejdsmotivation (i form motivationsskalaen). I det følgende undersøges de marginale sammenhænge mellem motivationsskalaen og baggrundsvariablene, se Tabel 2. Her benyttes t tests og ensidet variansanalyse (F test) til at undersøge, om der er identiske skala middelværdier blandt kategorierne i hhv. de binære og de kategoriske baggrundsvariable. Levene s test benyttes til at undersøge for varianshomogenitet, hvilket vi finder indenfor samtlige kategoriske baggrundsvariable. For den kontinuerte baggrundsvariabel Anciennitet benyttes lineær regression. Her undersøges varianshomogenitet vha. et scatterplot, hvor vi finder en ensartet spredning af de standardiserede residualer mod de prædikterede værdier 1. For alle variable viser Levenes test at der er homogene varianser i motivationsscore mellem kategorier i variablene. Vi fandt ikke forskel i motivationsscore middelværdier for baggrundsvariablene Kommune, Overarbejde, Heltid/deltid og Alder, og vi konkluderer ud fra et 0,05 % signifikansniveau, at der ikke er sammenhæng mellem disse og motivationsskalaen. Da den overordnede test ikke er signifikant præsenterer vi ikke p værdier for de parvise sammenhænge mellem kategorier i disse variable. Tabel 2. Marginale sammenhængsanalyser mellem motivationsskala og baggrundsvariable Variable Standardafvigelse Antal Middelværdi Levenes test for varianshomogenitet p værdi Test for forskellige middelværdier p værdi Kommune 0,115 (F=1,608) 0,091 Kommune ,47 2,766 Kommune ,11 2,685 Kommune ,49 2,600 Kommune ,64 2,421 Kommune ,49 2,279 Kommune ,17 2,914 1 Fremgangsmåden for modelkontrol vil blive gennemgået detaljeret i afsnit 6 6

7 Kommune ,39 3,384 Kommune ,85 2,467 Kommune ,97 2,236 Kommune ,59 2,726 Kommune ,16 3,165 Kommune ,79 2,422 Køn 0,700 (t= 3,095) 0,002 Mand 144 9,81 2,715 Kvinde ,57 2,666 Heltid/deltid 0,830 (t= 1,586) 0,113 Heltid ,50 2,672 Deltid ,15 2,715 Overarbejde 0,119 (F= 1,794) 0,147 Sjældent ,45 2, gange pr. måned ,71 2, gange pr. uge ,20 2,731 Næsten dagligt ,32 2,969 Alder 0,827 (F = 2,009) 0,091 < ,26 2, ,05 2, ,46 2, ,61 2, ,99 2,577 Anciennitet β= 0, ,022 Der er dog en højsignifikant marginal sammenhæng mellem Køn og skalaen (p=0,002) og en signifikant sammenhæng mellem Anciennitet og skalaen (p=0,022), hvilket betyder at kvinder gennemsnitligt har en motivationsscore som er 0,76 point højere end mændene og at motivationen stiger med 0,021 point for hvert ekstra år man er ansat. Vi vil ydermere undersøge, hvorledes de fem items er korrelerede marginalt. Da de fem items kan beskrives som ordinale variable, beskriver vi korrelationen ved gamma koefficienter og bruger gamma som teststørrelse. Som det ses i Tabel 3 er alle items stærkt (γ > 0,30) og signifikant korrelerede til samtlige øvrige items (p værdier for gamma testet). 2 Her angives ikke middelværdien, men i stedet middelværdiforskellen, da variablen er kontinuert. 7

8 Tabel 3. Korrelation mellem items beskrevet ved gamma koefficienter V71 S72 S73 S74 V75 V71 γ = 0,599 p = γ = 0,514 p = γ = 0,690 p = γ = 0,665 p = S72 γ = 0,620 p = γ = 0,608 p = γ = 0,475 p = S73 γ = 0,576 p = γ = 0,321 p = S74 γ = 0,500 p = Differential item funktion I dette afsnit vil vi undersøge motivationsskalaens begrebsvaliditet, men udelukkende have fokus på Differential Item Function (DIF) og lokal afhængighed. Vi vil ikke undersøge Item Response modellens antagelser om monoton sammenhæng mellem items og det latente træk (monotonicitet) eller antagelsen om, at det latente træk alene skal kunne forklare al variation i items, der ikke kan tillægges tilfældighed (unidimentionalitet) (Fayers & Machin, 2007:167). DIF implicerer, at et item ikke fungerer ens i forskellige sub grupper i befolkningen (Fayers & Machin, 2007: 176). Hvis der opstår DIF for nogle items, fx i forhold til køn, vil vi derfor få problemer med at sammenligne motivationsscoren mellem mænd og kvinder og man vil derfor forsøge at undgå items med DIF. Items undersøges for DIF ved at se om disse er korreleret med baggrundsvariablene, hvor denne sammenhæng ikke kan bortforklares af medarbejdernes latente motivation. Vi tester derfor for DIF ved at undersøge, om der findes nogle sammenhænge med hhv. hvert item og hver baggrundsvariabel, betinget vores motivationsskala (som proxy for den latente motivation). Analysen udføres som en logistisk regressionsanalyse, hvor hvert item figurerer som afhængig variabel, hvorfor disse må dikotomiseres. Vi indleder DIF analysen med at teste for non uniform DIF, som er et udtryk for at effekten af hver baggrundsvariabel på et item er signifikant forskellig inden for forskellige strata af motivationsskalaen (som i denne analyse opfattes som en kategoriseret variabel). Den nonuniforme DIF testes ved at tilføje et interaktionsled (Baggrundsvariabel * Motivationsskala) i modellen, hvor vi tester hvert item med hhv. hver baggrundsvariabel, motivationsskalaen samt interaktionsledet som uafhængige variable. Her ser vi, at samtlige Log likelihood p 8

9 værdier bliver højere end 0,530 og konkluderer at skalaens items derfor ikke lider under nonuniform DIF. Vi tester derefter for uniform DIF med hvert dikotomiseret item som afhængig i en model, hvor der betinges på alle baggrundsvariable (og skalaen) samtidigt. Log likelihood p værdier for disse tests kan ses i Tabel 4 herunder. Tabel 4. Skema over Log likelihood p værdier for DIF analyse med alle baggrundsvariable i analysen V71 S72 S73 S74 V75 Alder 0,989 0,258 0,208 0,434 0,182 Kommune 0,081 0,248 0,996 0,612 0,077 Køn 0,758 0,254 0,222 0,915 0,272 Anciennitet 0,522 0,949 0,585 0,057 0,341 Hel/deltid 0,427 0,776 0,304 0,390 0,528 Overarbejde 0,310 0,583 0,834 0,390 0,959 Her finder vi ingen uniform DIF (ikke engang på et 5 % kritisk niveau). For at være sikre på denne antagelser tester vi yderligere for uniform DIF med det dikotomiserede item mod hver baggrundsvariabel en af gangen, betinget for vores motivationsskala. Resultaterne for denne uniforme DIF analyse kan ses i Tabel 5 nedenfor, hvor p værdierne for det overordnede Wald test igen er angivet. Tabel 5. Skema over Log likelihood p værdier for DIF analyse med hver baggrundsvariabel V71 S72 S73 S74 V75 Kommune 0,982 0,369 0,203 0,379 0,191 Køn 0,083 0,682 0,888 0,544 0,055 Alder 0,612 0,344 0,065 0,591 0,580 Anciennitet 0,291 0,985 0,095 0,023 0,868 Hel/del tid 0,310 0,910 0,182 0,979 0,470 Overarbejde 0,241 0,678 0,915 0,241 0,806 I vores DIF analyse foretager vi multiple tests og for at mindske problemet med for mange type 1 fejl (at vi forkaster en sand nulhypotese), sætter vi det kritiske signifikans niveau ned til 1 %, dvs. 0,01 (Fayers & Machin, 2007: 186). Som det fremgår af Tabel 4 og 5 har skalaen derfor ikke problemer med uniform DIF, og vi lader alle items blive i vores konstruerede motivationsskala. Vi undersøger følgende om skalaen opfylder kravet om lokal uafhængighed mellem items, givet skalaen. Ifølge dette krav bør det være sådan, at items alle måler på det samme latente 9

10 træk, men items bør imidlertid ikke være korrelerede på en sådan måde, at det ikke kan forklares af skalaen. Vi tester derfor for lokal afhængighed mellem to items på følgende måde: Et item tages ud af motivationsskalaen og vi konstruerer nu en ny skala, hvori dette item ikke længere indgår. Herefter laver vi en logistisk regressionsanalyse, hvor itemet testes mod hvert af den nye skalas dikotomiserede items og betinger med den nye skala, som er inkluderet som en kategoriseret variabel. Resultaterne for test af lokal afhængighed mellem items er vist i Tabel 6 herunder, hvor vi igen vælger er kritisk signifikansniveau på 0,01. Tabel 6. Wald test p værdier for test af lokal afhængighed mellem items i motivationsskalaen. V71 S72 S73 S74 V75 V71 0,576 0,008 0,031 0,055 S72 0,967 0,202 0,623 0,880 S73 0,139 0,004 0,595 0,002 S74 0,024 0,524 0,060 0,588 V75 0,000 0,199 0,003 0,379 Som det fremgår af Tabel 6, kan der siges at være problemer med lokal afhængighed for fire af skalaens fem items. Det kan være svært helt at undgå, at items måler en forskellig grad af det samme, da skalaen er konstrueret med henblik på at måle forskellige aspekter ved samme latente faktor (her motivation), og da der ikke ville være meget skala tilbage, hvis vi tager fire items ud, lader vi de fire items blive i skalaen og går videre med opgavens andet spørgsmål. 5. Analyse omkring baggrundsvariablenes sammenhæng med Motivation Vi undersøger effekten af baggrundsvariablene ved at søge efter den statistiske model, der bedst beskriver eventuelle sammenhænge mellem baggrundsvariablene og Motivationsskalaen. Vi afgør hvilke variable, der bør være i modellen, ved hjælp af baglæns manuel modelsøgning i General Linear Models modulet og ekskluderer hovedvariable efter det hierarkiske princip. Vi starter med at betragte modellen som en lineær regression, men eftersom den eneste kontinuerte baggrundsvariabel, Anciennitet, ekskluderes fra modellen, bruger vi GLM modulet til at foretage en flersidet variansanalyse. Vi omkoder variablen Overarbejde, så katego 10

11 rien Overarbejde 2 3 gange per måned bliver reference, da denne gruppe indeholder flest observationer, men præsenterer fremover kategorierne i oprindelig rækkefølge. I Tabel 7 præsenteres samtlige elimineringstrin i modelsøgningen. Tabel 7. Eliminerede led ved modelsøgning Trin Variabel led p værdi for F test 1 Kommune * Anciennitet 0,825 2 Heltid * Anciennitet 0,688 3 Kommune * Heltid 0,672 4 Heltid *Alder 0,606 5 Alder* Anciennitet 0,570 6 Køn * Heltid 0,531 7 Kommune * Alder 0,193 8 Kommune * Køn 0,107 9 Køn * Anciennitet 0, Alder * Overarbejde 0, Anciennitet * Overarbejde 0, Anciennitet 0, Heltid * Overarbejde 0,084 Vi kunne have overvejet at stoppe modelsøgningen efter 10. trin, hvor det mest insignifikante led (Alder * Overarbejde) havde en F test p værdi på 0,054, men vi forholdt os konservativt til resultaterne og fastholder et kritisk signifikansniveau på 0,05. Den indledende modelsøgning ender derfor med en model med fem variable og tre interaktionsled, som vi kalder Model 1, se Tabel 8. Da modellen kan betragtes som en generel lineær model kontrollerer vi modellens forudsætninger og kan konkludere at både antagelsen om normalfordelt afhængig variabel givet de uafhængige variable og antagelsen om varianshomogenitet er opfyldt. 3 I Tabel 8 præsenteres F test værdier og tilhørende p værdier for alle led, mens beta parametre og de dertilhørende 95 % konfidensintervaller kun præsenteres for hovedvariable. Tabel 8. F teststørrelser, p værdier, β parametre og konfidensintervaller for model led i Model 1 F 95 % CI Hovedvariable teststørrelse p værdi β parameter Nedre Øvre Reference 12,498 Kommune 2,611 0,003 Kommune 1 7,214 13,084 1,344 Kommune 2 3,075 5,843 0,307 Kommune 3 1,682 4,576 1,212 Kommune 4 2,643 6,506 1,221 3 Modelkontrollen vil blive gennemgået nærmere senere i denne opgave. 11

12 Kommune 5 1,316 4,310 1,678 Kommune 6 1,368 4,486 1,749 Kommune 7 0,080 3,653 3,493 Kommune 8 5,653 9,548 1,758 Kommune 9 1,414 4,548 1,721 Kommune 10 2,051 4,764 0,661 Kommune 11 8,302 12,200 4,405 Kommune Køn 0,637 0,425 Mand 0,058 2,381 2,496 Kvinde 0.. Heltid/deltid 9,754 0,002 Heltid 0,715 0,266 1,164 Deltid 0.. Overarbejde 4,328 0,005 Sjældent 1,002 3,695 1, / måned 2,296 5,029 0, /uge 1,215 4,264 1,834 Næsten dagligt 0.. Alder 2,173 0,070 <30 år 1,180 2,095 0, år 1,108 1,929 0, år 0,681 1,464 0, år 0,349 1,141 0, år 0.. Køn * Alder 3,986 0,003 Kommune * Overarbejde 2,157 0,000 Køn * Overarbejde 4,609 0,003 På baggrund af denne model fremgår det, at der ses en selvstændig højsignifikant effekt af variablen Heltid/deltid, således at medarbejderne på heltid er prædikteret til at ligge 0,715 point højere på motivationsskalaen end dem på deltid. Resten af variablene indgår i mindst en tovejs interaktion og Køn og Alder har ikke en selvstændig signifikant effekt på motivationen men inddrages udelukkende pga. det hierarkiske princip. Dette betyder, at alder fx modificerer den effekt, som køn har på motivation. Effekten af køn er imidlertid også modificeret af overarbejdsstatus, som igen modificeres af, hvilken kommune man arbejder i, og det vil følgeligt blive meget uoverskueligt at præsentere disse kombinerede og komplekse effekter. Beta parametrene for alle andre variable end Heltid/deltid kan derfor kun tillægges betydning i de øvrige variables referencegrupper. På baggrund af denne problemstilling vælger vi at splitte datasættet i forhold til den binære variabel Køn, som indgår i to interaktioner. Vi så i Model 1, at modellens justerede R 2 værdi kun er 0,085 og håber derfor på at finde større forklaringskraft i baggrundsvariablene når vi 12

13 opdeler datasættet. Herefter vil vi introducere Model 2 på baggrund af den del af datasættet, som består af kvinder (N = 740) og Model 3, på baggrund af datasættet med mænd (N = 144). 6. Modelsøgning og modelkontrol for Model 2 og 3 Vi laver derfor en baglæns manuel modelsøgning i modulet General Linear Models for hhv. datasættet med kvinderne og datasættet med mændene. I begge tilfælde starter vi med en fuld model, der indeholder opgavens fem baggrundsvariable (foruden variablen Køn) og med alle to vejs interaktioner. Modelsøgningen foretages under hensynstagen til det hierarkiske princip således, at det er den mindst signifikante interaktion, der ryger først ud af modellen, og hovedvariablene får lov at blive i modellen, så længe de indgår i en interaktion. Tabel 9 (kvinder) og Tabel 10 (mænd) herunder viser, hvorledes de to modelsøgninger er forløbet og under hvilke trin i søgningen, at forskellige modelled ryger ud. I Tabel 10 for Model 3 ses, at alle interaktioner med Heltid/deltid elimineres i trin 1. Dette kunne skyldes, at især strata med mænd der arbejder på deltid er meget små. Tabel 9. Eliminerede led ved modelsøgning Model 2 (kvinder) Trin Modelled p værdi 1 Kommune* Anciennitet 0,773 2 Heltid* Anciennitet 0,754 3 Alder*Anciennitet 0,647 4 Heldtid*Alder 0,629 5 Kommune* Heltid 0,624 6 Heltid*Overarbejde 0,139 7 Alder*Overarbejde 0,066 8 Kommune*Alder 0,118 9 Alder 0, Overarbejde*Anciennitet 0,096 Tabel 10. Eliminerede led ved modelsøgning Model 3 (mænd) Trin Modelled p værdi 1 Heltid*Alder. Heltid*Anciennitet. Heltid*Kommune. Heltid*Overarbejde. 2 Overarbejde*Anciennitet 0,960 3 Kommune*Anciennitet 0,607 4 Kommune*Alder 0,553 5 Overarbejde*Aalder 0,746 6 Alder*Anciennitet 0,587 7 Anciennitet 0,142 Modelsøgningen fører til de to endelige modeller for hhv. kvinder og mænd Model 2 og Model 3. Model 2 med kvinder indeholder følgende variable samt en enkelt interaktion: Kommune, Heltid/deltid, Overarbejde, Anciennitet og Kommune * Overarbejde. Model 3 med mænd indeholder følgende model led samt en interaktion: Kommune, Overarbejde, Heltid/deltid, Alder og Kommune *Overarbejde. 13

14 Da vi betragter vores statistiske model som en general lineær model må vi teste modellens antagelser om henholdsvis (1) betinget normalfordelt afhængig variabel (2) homogene varianser og (3) lineær sammenhæng mellem de uafhængige intervalskalavariable og den afhængige variabel. Model 3 har ingen kontinuerte variable og linearitetsantagelsen modereres derfor til blot at være antagelsen om, at den betingede middelværdi af Motivation skal være en lineær funktion af værdierne i de uafhængige variable (Kreiner, 1999: 535). I det følgende gennemgås modelkontrollen for begge modeller parallelt. 1. Antagelse om betinget normalfordelt afhængig variabel Selvom GLM modeller generelt er mere robuste overfor afvigelser fra normalfordelingsantagelsen, vil vi her kontrollere antagelsen ved brug af modellens standardiserede residualer. Figur 3 viser et histogram over de standardiserede residualer for den afhængige variabel, motivationsskalaen. Residualerne for Model 2 ser ud til at være nogenlunde normalfordelte, hvilket bekræftes af P P plottet over de standardiserede residualer, se Figur 4. Normalfordelingsantagelsen støttes også op af Kolmogorov Smirnov testet (p = 0,083), der viser at vi kan acceptere testens nulhypotese om normalfordelte residualer. For Model 3, viser histogrammet i Figur 3 over modellens standardiserede residualer, at fordelingen er tilnærmelsesvis normal, dog med en høj top. P P plottet over de standardiserede residualer viste mindre afvigelser, men normalfordelingsantagelsen blev standardiserede residualer viste sig insignifikant (p=0,645). accepteret da Kolmogorov Smirnov testet for de Figur 3. Histogram med normalfordelingskurve over skalaens standardiserede residualer for Model 2 & 3. Model 2 (kvinder) Model 3 (mænd) 14

15 Figur 4. P P plot over de standardiserede residualer for Model 2 og 3 Model 2 (kvinder) Model 3 (mænd) 2. Antagelse om varianshomogenitet Herefter tester vi antagelsen om varianshomogenitet, og i den forbindelse laver vi først et scatterplot med skalaens standardiserede residualer mod de prædikterede værdier. Dette ses i Figur 5 herunder. Figur 5: Scatterplot over skalaens standardiserede residualer og prædikterede værdier for Model 2 & 3. Model 2 (kvinder) Model 3(mænd) Det ser ikke umiddelbart ud til, at punkterne spreder sig mere i den ene side end i den anden, og Levenes test bekræfter antagelsen om varianshomogenitet. Testet viser, at nulhypotesen om ens varianser kan accepteres for Model 2 (p = 0,112) og ligeledes for Model 3 (p=0,325). 15

16 For at teste den lineære variabel, Anciennitet, for ens varianser i Model 2, laver vi et scatterplot med skalaens standardiserede residualer og denne variabel (se Figur 6). Her skal punkterne gerne være spredt ligeligt i hver side af figuren, hvilket også ser ud til at være tilfældet trods færre punkter i højre side grundet færre observationer med lang anciennitet. Figur 6. Scatterplot med standardiserede residualer og Anciennitet for Model Antagelse om linearitet Samme figur kan også bruges til at teste modellens antagelse omkring linearitet. Da punkterne ser ud til at lægge sig symmetrisk omkring den vandrette linje, tyder det på, at vi kan godkende denne antagelse. Linearitetsantagelses bekræftes i scatterplots, Figur 7, hvor vi først plotter motivationsskalaen mod Anciennitet og herefter skalaens observerede værdier mod de prædikterede værdier. I Figur 7 indsættes hhv. lineære, kvadrerede og kubiske fitlines, og som det fremgår af de to scatterplots herunder, beskriver de kvadrerede og kubiske fitlines ikke punkternes fordeling bedre, og vi kan godkende antagelsen omkring linearitet for Model 2. 16

17 Figur 7. Scatterplots med Motivationsskalaen og hhv. Anciennitet og prædikterede værdier for Model 2 Som et ekstra tjek, har vi også indsat kvadratiske og kubiske led af Anciennitet i den endelige model, men leddene bliver insignifikante (p = 0,478 og p = 0,405), hvilket blot bekræfter antagelsen omkring linearitet. Det lineære fit har dog stadig en meget lav R 2 værdi og vi tvivler derfor på hvor brugbart det lineære fit er til prædiktion af motivation. I Figuren med prædikteret motivation er desuden indsat et 95 % prædiktions interval og da dette er relativt bredt, taler det yderligere for, at en prædiktion af motivationen vil være behæftet med en vis usikkerhed. 7. Resultater Modelsøgningerne fører til to forskellige statistiske modeller for kvinder og mænd. Forskellen ligger i at alder ser ud til at have en betydning for motivation hos mændene, men ikke hos kvinderne, hvor anciennitet til gengæld ser ud til at have en effekt på motivation. Se Tabel 11 (for kvinder) og 12 (for mænd) hvilke baggrundsvariable der korrelerer med motivationen. Tabel 11. F tests, p værdier, β parametre og konfidensintervaller for modelled i Model 2 (kvinder) F 95 % CI Hovedvariable teststørrelse p værdi β parameter Nedre Øvre Reference 9,426 8,267 10,584 Kommune 1,334 0,201 Kommune 1 0,246 1,876 2,369 Kommune 2 0,789 0,588 2,166 Kommune 3 0,229 1,156 1,614 Kommune 4 1,040 1,330 3,410 Kommune 5 0,018 1,374 1,337 Kommune 6 0,736 1,494 2,966 Kommune 7 0,075 2,048 2,198 Kommune 8 0,816 0,941 2,573 17

18 Kommune 9 2,006 0,116 4,128 Kommune 10 0,213 1,220 1,646 Kommune 11 1,641 0,026 3,309 Kommune Heltid/deltid 8,560 0,004 Heltid 0,711 0,234 1,188 Deltid 0.. Overarbejde 2,196 0,087 Sjældent 0,975 0,528 2, / måned gange/uge 0,186 2,045 2,417 Næsten dagligt 0,120 0,578 5,008 Anciennitet 10,454 0,001 0,033 0,013 0,052 Kommune * 1,520 0,034 Overarbejde Tabel 12. F test, p værdi, Beta parametre og konfidensintervaller for modelled i Model Model 3 (mænd) F 95 % CI Modelled Teststørrelse p værdi β parameter Reference 5,489 Kommune 2,957 0,002 Kommune 1 0,456 3,645 4,558 Kommune 2 2,166 1,322 5,653 Kommune 3 2,880 0,842 6,602 Kommune 4 8,511 2,097 14,926 Kommune 5 2,879 0,917 6,675 Kommune 6 2,218 1,914 6,351 Kommune 7 1,631 7,207 3,946 Kommune 8 2,116 1,867 6,098 Kommune 9 5,000,522 9,478 Kommune 10 1,369 4,207 6,946 Kommune 11 4,509 0,927 8,092 Kommune 12 0 Heltid/deltid 4,464 0,037 Heltid 2,339 0,141 4,538 Deltid 0 Overarbejde 4,764 0,004 Sjældent 2,839 0,979 6, / måned gange/uge 3,909 0,598 8,416 Næsten dagligt 7,140 11,990 2,290 Alder 3,313,014 <30 3,144 0,085 6, ,276 2,845 2, ,803 1,603 3, ,380 2,728 1, Kommune * 1,697 0,033 Overarbejde 18

19 Effekten af de variable der indgår er imidlertid også forskellige. Både hos kvinder og mænd ser det ud til, at det har en positiv effekt på motivationen at være ansat på heltid i forhold til at være ansat på deltid, hvis man holder alle andre effekter konstant. Hos kvinder er sammenhængen mere signifikant, men der kun en forskel på 0,711 i gennemsnit på motivationsskalaen, modsat mændene hvor forskellen er 2,339 på motivationsskalaen. Hos kvinderne ser vi en svag, men højsignifikant, sammenhæng mellem antal år medarbejderne har været ansat og motivation, idet motivationen gennemsnitligt stiger 0,033 point på skalaen for hvert år kvinderne er ansat. Hos mændene ser vi en sammenhæng mellem alder og motivation der viser, at medarbejdere under 30 år i gennemsnit scorer 3,144 point højere på motivationsskalaen end medarbejdere på 60 eller flere år. Hos de 30 til 59 årige ses en lidt tvetydig effekt, hvor de 40 til 49 årige er mest motiverede og de øvrige aldersgrupper ligger lidt under de ældste medarbejdere. Hos både mænd og kvinder ses der en interaktion mellem Kommune og Overarbejde og man kan derfor sige, at sammenhængen mellem overarbejde og motivation er forskellig alt efter hvilken kommune man arbejder i. Effekten af denne interaktion er præsenteret i Tabel 13 (for kvinder) og Tabel 14 (for mænd), hvor effekten i hver celle er beregnet som summen af β parametrene for hhv. de givne kategorier inden for hovedvariablene (Overarbejde og Kommune) og den givne interaktion (uden α værdien). Tabel 13. Interaktionseffekten af Kommune og Overarbejde for kvinder Overarbejde Kommune Sjældent 2 3/måned 2 3/uge Dagligt 1 0,246 0,246 0,081 a 2 1,129 0,789 0,673 1, ,695 0,229 0,682 0,27 4 1,07 1,04 0,03 0, ,015 0,018 0,529 0, ,4 0,736 0,189 0, ,667 0,075 0,939 2, ,096 0,816 0,659 2, ,777 2,006 0,319 0, ,291 0,213 0,428 0, ,216 1,641 1,235 6, , ,186 2,215 Tabel 14. Interaktionseffekten af Kommune og Overarbejde for mænd Overarbejde Kommune Sjældent 2 3/måned 2 3/uge Dagligt 1 1,001 0,456 0,826 1, ,508 2,166 0,513 2, ,987 2,88 1,699 4, ,511 0,29 5 0,552 2,879 0,825 5, ,571 2,218 0,245 5,96 7 1,631 3, ,972 2,116 0, , ,63 3, ,187 1,369 1,785 2, ,361 4,509 4, , ,909 7,14 a. I strata, hvor der ikke er observationer angiver vi ikke effekten, da dette tal vil have nogen reel mening 19

20 Ud fra disse tabeller kan der ikke siges noget generelt om sammenhængen mellem overarbejde og motivation, da alle kommuner viser forskellige tendenser, hvoraf disse tendenser sjældent er ens for kvinder og mænd. Det skal bemærkes, at referencegruppen blandt kvinderne dog er ca. 4 point højere end hos mændene og samtlige tal angivelser skal ses i forhold til de respektive referencegrupper (her medarbejdere i kommune 12, som arbejder over 2 3 gange om måneden). Den lineære effekt af baggrundsvariablene på motivationsscoren kan derfor beskrives ved formlerne: Model 2 for kvinder: E(Motivation Kommune, Heltid/deltid, Overarbejde, Anciennitet) = α + βkom1 xkom1 + βkom2 xkom2 + βkom3 xkom3 + βkom4 xkom4 + βkom5 xkom5 + βkom6 xkom6 + βkom7 xkom7 + βkom8 xkom8 + βkom9 xkom9 + βkom10 xkom10 + βkom11 xkom11 + βheltid xheltid + βoverarb1 xoverarb1 + βoverarb2 xoverarb + βoverarb3 xoverarb3 + Σ βancien xancien+ Σ βkom*overarb xkom*overarb Model 3 for mænd: E(Motivation Kommune, Heltid/deltid, Overarbejde, Alder) = α+ βkom1 xkom1 + βkom2 xkom2 + βkom3 xkom3 + βkom4 xkom4 + βkom5 xkom5 + βkom6 xkom6 + βkom7 xkom7 + βkom8 xkom8 + βkom9 xkom9 + βkom10 xkom10 + βkom11 xkom11 + βheltid xheltid + βoverarb1 xoverarb1 + βoverarb2 xoverarb + βoverarb3 xoverarb3 + βalder1 xalder1 + βalder2 xalder2 + βalder3 xalder3 + βalder4 xalder4 + Σ βkom*overarb xkom*overarb 8. Konklusion og diskussion I denne opgave har vi brugt 5 spørgsmål om kommunale socialrådgivere og sagsbehandleres opfattelser af deres arbejde til at danne en sumskala. Skalaen kaldes Motivation og vi antager at denne er et udtryk for det latente træk motivation. I opgaven har vi testet udvalgte dele af skalaens begrebsvaliditet. Vi fandt, at skalaen ikke havde hverken non uniform eller uniform DIF på nogle af items. Skalaen havde imidlertid problemer med betinget lokal afhængighed mellem items. Da kun et enkelt item var fri for lokal afhængighed valgte vi alligevel at beholde skalaen som den var. Vi undersøger hvilke baggrundsvariable der kan forklare graden af motivation hos de kommunalt ansatte og finder at der er en sammenhæng mellem hhv. ansættelseskommune og motivation, hvor ofte medarbejderne overarbejder og deres motivation, samt hvorvidt medarbejdere er ansat på hel eller deltid og deres motivation. Køn og Alder var ikke signifikant kor 20

21 releret med motivation, men effekten af overarbejde var modificeret af køn og desuden indgik køn og alder i en interaktion. Kommune og Overarbejde indgik ydermere i en interaktion og vi besluttede derfor at opdele datasættet i forhold til køn for at være i stand til at præsentere effekten af baggrundsvariablene. I de to datasæt for hhv. kvinder og mænd fandt vi, at både ansættelseskommune, overarbejdsstatus og ansættelse på hel eller deltid havde effekt på motivationen. Desuden havde anciennitet en betydning for kvindernes motivation, mens det for mænd havde en betydning hvilken alder man havde. For begge modeller var der en effektmodifikation mellem overarbejdsstatus og kommune. Ud fra de antagelser som vi har undersøgt om de to generelle lineære modeller, kan vi konkludere at modellerne fungerer fint. Det har imidlertid ikke forbedret baggrundsvariablenes forklaringsgrad bemærkelsesværdigt at opdele data i mænd og kvinder, hvilket viser sig i den justerede R 2 værdi på 0,042 for kvinder. R 2 værdien afspejler hvor stor en andel af variansen i motivationen der kan forklares af variansen i baggrundsvariablene og siger derfor noget om, hvorvidt variablene er med til at forklarer værdierne for motivation. Den justerede R 2 værdien for mændenes model ligger imidlertid meget højere, på 0,301, og vi må derfor konkludere at baggrundsvariablene bedre forklarer mændenes motivation til at gå på arbejde, selvom deres datasæt er betydeligt mindre. Dette er igen væsentlig bedre en forklaringsgraden i den første model hvor R 2 er 0,

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Statistik & Skalavalidering

Statistik & Skalavalidering å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k

Læs mere

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45 Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af

Læs mere

Eksamen i statistik 2009-studieordning

Eksamen i statistik 2009-studieordning Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Kausale modeller. Konstruktion og analyse

Kausale modeller. Konstruktion og analyse Kausale modeller Konstruktion og analyse 1 Kausale modeller = DAGs (Directed acyclic graphs) defineret ved Fuldstændig ordnet kausal struktur Definition af direkte kausal effekt Antagelser om fravær af

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008 Indholdsfortegnelse 1 INDLEDNING OG PROBLEMSTILLING... 2 1.1 OVERVÆGT SOM CASE... 2 2 ANALYSEFORBEREDELSER... 4 2.1 HEPRO-UNDERSØGELSEN... 4 2.2 DEN AFHÆNGIGE VARIABEL VIGTIGHED AF ÆNDRINGEN AF VÆGT...

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Eksamen Efterår 2013

Eksamen Efterår 2013 Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Løsninger til kapitel 14

Løsninger til kapitel 14 Opgave 14.1 a) Linjetilpasningsplottet bliver: Løsninger til kapitel 14 Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

LUP Fødende læsevejledning til afdelingsrapporter

LUP Fødende læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1 Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere

Læs mere

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006 Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere