Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Størrelse: px
Starte visningen fra side:

Download "Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45"

Transkript

1 Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: December 2010

2 Indholdsfortegnelse 1.0 Indledning Karakteristika af data... 3 Graf 1: Normalfordelingen af motivationsskalaen Opgave Tabel 1: p-værdier fra DIF-analysen... 4 Figur 1: Differentiel item funktion Delkonklusion Opgave Tabel 2: Signifikansniveau for den kausale relation... 6 Figur 2: DAG... 6 Tabel 3: Insignifikante interaktionsled og hovedeffekt... 7 Tabel 4: Slutmodel... 7 Tabel 5: Insignifikante interaktioner og hovedeffekt ved analyse for kvinder... 8 Tabel 6: Slutmodel for kvinder Modelkontrol... 9 Figur 5: Kontrol for linearitet Figur 6: Kontrol for varianshomogenitet af motivation Figur 7: Histogram over de standardiserede residualer Figur 8: PP-plot over de standardiserede residualer for kvinder Resultater Tabel 7: β-parametre for hovedeffekter og interaktioner Tabel 8: Samlet effekt af kommune og overarbejde Graf 2: De samlede effekter af kommune og overarbejde Diskussion og konklusion

3 1.0 Indledning Denne eksamensopgave tager udgangspunkt i resultaterne fra en undersøgelse af arbejdsmiljøet blandt socialrådgivere og kommunale sagsbehandlere i 12 anonymiserede kommuner fordelt over hele landet. På baggrund heraf er det, ud fra statistiske analyseredskaber, muligt at måle de ansattes motivation i forhold til deres arbejde. Dette er relevant for både de ansatte og deres chef, men også resten af samfundet, da resultaterne giver en fornemmelse af trivslen og arbejdet som kommunalansat socialrådgiver og sagsbehandler samt mulighed for forbedringer af arbejdsmiljøet. Der har i mange år været fokus på forskellige motivationsteorier, blandt andet for at fremme arbejdsmiljøet. En af de mest kendte er Abraham Marslows behovspyramide, der grafisk fremstiller de menneskelige behov i syv trin med de basale behov nederst 1. Disse behov er ligeledes et udtryk for motivationen idet jo flere behov individet har opfyldt, des mere motiveret er det. 1.1 Karakteristika af data For at klarlægge karakteristikken af populationen, er der foretaget en deskriptiv analyse. Populationen består af 895 socialrådgivere og sagsbehandlere, hvoraf 83,7 % er kvinder. Den største aldersgruppe er fra år med 33%. Fordelingen af populationen i de 12 kommuner er ikke lige fordelt, hvor spændvidden går fra 34 personer i den mindste kommune til 145 personer i den største. 79,1% arbejder på heltid, mens halvdelen af populationen, 51,6%, har været ansat 5 år eller derunder. Yderligere oplever 56,6% af de ansatte overarbejde 2-3 gange pr. måned eller sjældnere. Datasættet består af følgende uafhængige variable; køn, alder, kommune, ansættelsestid 2, overarbejde 3 og anciennitet. Desuden er der fem items (V71, S72, S73, S73 og V75), der sammenlagt danner en skala, som måler motivationen blandt de ansatte. Nedenstående histogram viser skalaens fordeling. Graf 1: Normalfordelingen af motivationsskalaen Som det ses, er motivationsskalaen en anelse højreforskudt, hvor variansen bliver lidt større med en venstre-hale. Vi vurderer, at den er normalfordelt, men skal være opmærksomme på loftseffekt 4. Det kan bemærkes, at personer, der mangler et svar på et eller flere spørgsmål ikke får beregnet en skalaværdi. Det drejer sig her om 10 personer (ca. 1 %). Den deskriptive statistik viste, at der kun er én person i aldersgruppen 18 år eller yngre. Denne person er ikke blevet lagt sammen med den næste aldersgruppe år, hvilket kan give et skævt estimat. 1 A. Huczynski & D. Buchanan, 2007, s Efterfølgende benævnt heltid. 3 Overarbejde er delt op i fire kategorier, fra næsten dagligt til sjældent. 4 S. Kreiner, 2007, s

4 Data for anciennitet så ikke helt normalfordelt ud, hvilket betyder at vi har taget logaritmen til anciennitet samt undersøgt anden og tredje grads polynomiet uden et forbedret resultat. Det betyder, at vi arbejder videre med anciennitet uden at ændre den (figurer ikke vist). 2.0 Opgave 1 Formålet i opgave 1 er at undersøge, om skalaen har problemer med differentiel item funktion (DIF) og om det i givet fald er muligt at konstruere en reduceret skala uden DIF. For statistisk at kunne vurdere om skalaens items er betinget uafhængige af de eksogene variable, er det yderst relevant at undersøge for DIF. Indeholder en skala DIF betyder det, at den ikke fungerer ens på alle af de undersøgte grupper. I så fald er der risiko for, at estimaterne bliver konfoundet. Det er derfor et krav, at den anvendte skala ikke indeholder DIF. Vi foretager logistisk regressionsanalyse for at undersøge dette. I den forbindelse har vi valgt at dikotomisere items, hvorved ja, passer i høj grad og ja, passer i nogen grad er lagt sammen til ja, og nej, passer ikke og nej, passer slet ikke er lagt sammen til nej. Det betyder, at vi eventuelt mister noget forklaringsgrad. Vi sætter vores items som de afhængige variable, og tester hvert af dem mod baggrundsvariable (køn, alder, kommune, anciennitet, heltid og overarbejde) og skalaen. Eftersom vi ikke fandt det nødvendigt at anvende anden og tredjes polynomium for anciennitet, er de heller ikke medtaget i DIF analysen. Derved testes eksempelvis om sandsynligheden for at det kun er lønnen, der har betydning 5, givet den samlede score, afhænger af de ovennævnte eksogene variable. Er dette tilfældet er itemet biased i forhold til den eksogene variabel, og informationen fra det item er ikke sufficient opsummeret i den samlede score. Vi vælger at teste på niveau 1%, da vi vurderer, at et test på niveau 5% giver øget risiko for type I fejl, når mange test foretages. Type I fejl forekommer, når en rigtig nulhypotese forkastes, mens type 2 fejl forekommer, når en forkert nulhypotese accepteres. Det kan derfor siges, at valget af kritisk niveau er en vurderingssag idet det handler om at finde den rette balance mellem risikoen for type I og type II fejl. Vi er klar over, at vi øger risikoen for type II fejl, mens risici for type I fejl mindskes 6. Tabel 1: p-værdier fra DIF-analysen Spørgsmål: V71 S72 S73 S74 V75 Sig. Sig. Sig. Sig. Sig. Kommune,989,609,253,463,311 Køn(1) 7,077,243,994,615,087 Alder,871,431,356,965,409 Anciennitet,519,949,584,061,346 Heltid(1),430,777,303,816,526 Overarbejde,314,603,833,384,959 Motivationsskala,000,000,000,000,000 Vi er endt ud med fem tabeller, svarende til de fem items (tabel 1), hvor sammenhængen mellem det afhængige item variabel og de eksogene variable (skalavariabel, køn, kommune m.v.) er undersøgt. Hver tabel er gennemgået for at se om der er DIF på niveau 1%, hvilket findes ved de signifikante værdier for de eksogene variable. Motivationsskalaen er signifikant ved test af alle 5 Item s72. 6 S. Kreiner, 2007, s (1) står for referencegruppen. 4

5 items eftersom det er skalaen. Der er dog ingen af de eksogene variable, der er signifikante, hvilket betyder, at der ikke er DIF. Vi har ligeledes testet item variable i forhold til skala og én uafhængig variabel af gangen. I den forbindelse fandt vi ligeledes ingen DIF. Et tænkt eksempel med DIF vil se ud som nedenstående figur 1, hvor kommune både påvirker et item direkte og indirekte igennem motivationsskalaen. Figur 1: Differentiel item funktion V71: Jeg har et godt arbejde DIF Kommune S72: Det er kun lønnen, der betyder noget S73: Jeg ville stoppe, hvis jeg havde penge nok Motivationsskala Køn Alder Anciennitet S74: Jeg ville vælge noget mere interessant arbejde, hvis jeg havde mulighed for det Heltid Overarbejde V75: Jeg er stolt over mit arbejde 2.1 Delkonklusion Hensigten med opgave 1 er at undersøge om skalaen indeholder DIF, og i den forbindelse er der ikke fundet DIF. Dette er et udtryk for, at der er betinget uafhængighed mellem de eksogene variable og items. Det er dog kun de variable tilhørende datasættet, der er taget højde for. Det vil sige, at skalaen kan være konfoundet af andre eksogene variable, som der ikke er taget højde for. Et eksempel herfor kan være civilstatus, altså om man er gift eller bor alene. De dikotomiserede items forårsager en datareduktion og de mange test, der foretages, medfører risiko for type II fejl, men da vi har anvendt logistisk regression har vi vurderet, at det har været en nødvendighed for at undgå type I fejl. DIF kunne være undersøgt ved for eksempel partielle gammakoefficienter, hvor datareduktionen kunne være undgået, men det ville have været mere omfattende. Vi finder, at det giver mest mening at fastholde den originale skala, da der ikke er forskel på, hvad man svarer på items i forhold til de eksogene variable. 5

6 3.0 Opgave 2 Der foretages, i opgave 2, en generel lineær analyse med motivationsskalaen som afhængig variabel, der kan fortælle om og i givet fald på hvilken måde graden af motivation afhænger af de øvrige variable. Det undersøges med en generel lineær model, hvorledes ligningen ser ud som følgende: Y= α + β 1 *X 1 + β 2 * X 2 + β 3 * X 1 * X 2 + ε, hvor α svarer til skæringen på y-aksen, β svarer til ligningens hældning og ε er N (0;σ 2 ). I sammenhæng med ovenstående har vi valgt at opstille en kausal relation mellem variablene: Køn alder kommune anciennitet heltid overarbejde motivationsskala Dette har vi valgt at gøre for at skabe sammenhæng mellem de forskellige variable og danne et directed acyclic graph (DAG). Det fremstilles for at vide hvilke variable, der skal medtages i den generelle lineære model. Derfor har vi testet signifikansniveauerne i forhold til om der er en kausal relation mellem variablene (tabel 2). Den kausale relation er valgt ud fra vores egen mening i forhold til, hvordan variablene hører sammen, og derfor er det en subjektiv vurdering, der eventuelt vil vurderes anderledes af andre personer. Tabel 2: Signifikansniveau for den kausale relation Afhængige variable Signifikansniveau (5%) Motivationsskala Køn (0,001), Heltid(0,006) Overarbejde Kommune (0,003) Heltid Alder (0,015), køn (0,000) Anciennitet Alder (0,000), køn (0,027) Kommune Køn (0,011) Alder Køn (0,000) Variablene er beregnet ud fra deres type, og der er anvendt generel lineær model med undtagelse af heltid, hvor vi har anvendt logistisk regression. Tabel 2 viser signifikante p-værdier, hvilket angiver, at der er en kausal relation. Det betyder, at vi får et DAG, der ser ud som nedenstående figur 2. Figur 2: DAG Vi kan se at kommune, overarbejde og anciennitet ikke har direkte indflydelse på skalaen. Idet vi ikke har det store kendskab til variablenes betydning for motivationen, har vi forsøgt at finde litteratur, der kan klarlægge dette. Det har dog ikke været muligt at finde litteratur om de pågældende variables indflydelse på motivation. Ligeledes mener vi, at det videre arbejde med dette DAG, vil ende ud med en overforsimplificeret model. Derfor vurderes det, at vi ikke har mulighed for at fremsætte om de nævnte variable skal undlades af analysen, og derfor vælger vi at anvende generelle lineære modeller med alle variable inkluderet. Vi er klar over, at det har betydning for analysens resultater, at vi inddrager alle variable. 6

7 Før vi kan gå i gang med den generelle lineære model, ser vi på den bivariate analyse, hvor vi har testet for varianshomogenitet ved hjælp af t-test og ensidet ANOVA test, hvor Levene s test påviser homogenitet eller ej. Den tester nulhypotesen (H 0 ), der siger, at varianserne er ens. Hvis p- værdien er under 0,05 kan dette afvises og betyder, at der er forskel over varianserne. For køn er der varianshomogenitet (p=0,700), men vi fandt dog, at der er forskel på mænd og kvinders gennemsnitlige motivation (p=0,002), hvilket et box-plot også viser (ikke vist). Levene s test for overarbejde viser varianshomogenitet (p=0,117), men der er en tendens til at graden af overarbejde har betydning for motivationen (p=0,044). Det betyder, at heltid, alder og kommune ikke udviser indflydelse på motivationen. Som skrevet tidligere er analysen lavet ved hjælp af generel lineær model, og i den forbindelse er det valgt at trække data med missing values ud af analysen, for at sikre et ens antal individer. Skalaen er sat som den afhængige, mens de eksogene variable er sat som uafhængige. Derfor indeholder startmodellen alle hovedeffekterne samt alle interaktionsled (ikke vist). Der er kun medtaget tovejsinteraktioner, da risikoen for en overparametriseret model øges. Tabel 3: Insignifikante interaktionsled og hovedeffekt Trin Interaktion Sig. (5%) 1: Kommune*anciennitet 0,823 2: Heltid*anciennitet 0,689 3: Kommune*heltid 0,681 4: Alder*heltid 0,606 5: Køn*heltid 0,550 6: Alder*anciennitet 0,490 7: Kommune*alder 0,195 8: Kommune*køn 0,110 9: Køn*anciennitet 0,102 10: Alder*overarbejde 0,057 11: Overarbejde*anciennitet 0,132 12: Overarbejde*heltid 0,059 13: Anciennitet 0,264 Med udgangspunkt i baglæns modelsøgning, og ud fra det hierarkiske princip 8, eliminerer vi de insignifikante variable. Dette princip er baseret på den højeste ordens-interaktion, hvilket første gang er interaktionen mellem kommune og anciennitet (p = 0,823). Herefter bliver modellen genestimeret. Således forsætter vi med at eliminere et led af gangen, indtil der ikke er flere insignifikante variable (tabel 3 og 4). De variable, der indgår i en interaktion kan ikke elimineres. Anciennitet tages ud, da den er høj insignifikant og ikke indgår i en interaktion (tabel 3). Vi vurderer ligeledes, at anciennitet korrelerer med alder og derfor godt kan udelades. Tabel 4: Slutmodel Tests of Between-Subjects Effects Dependent Variable:Motivationsskala Source Type III Sum of Squares df Mean Square F Sig. Corrected Model 926,453 a 61 15,188 2,289,000 Intercept 10912, , ,702,000 Kommune 184, ,733 2,522,004 Køn 5, ,135,774,379 8 S. Kreiner, 2007, s

8 Alder 64, ,803 1,930,087 Heltid 72, ,994 11,002,001 Overarbejde 87, ,030 4,375,005 Køn * Alder 88, ,123 3,334,010 Kommune * Overarbejde 465, ,110 2,127,000 Køn * Overarbejde 91, ,622 4,615,003 Error 5321, ,635 Total , Corrected Total 6247, a. R Squared =,148 (Adjusted R Squared =,084) Vi ender med en model, hvor der er interaktion mellem alder & køn, kommune & overarbejde og køn & overarbejde, hvor effekten af overarbejde og alder påvirkes af køn, og effekten af kommune og køn påvirkes af overarbejde (tabel 4). Derudover indeholder modellen de signifikante uafhængige variable samt de variable, der er forbundet i interaktioner. De variable, der indgår i interaktionerne, gør, at vi ikke kan udtale os om hovedeffekterne 9. Ligeledes kan R 2 ses i tabel 4. Vi har testet modelantagelserne, hvilke er opfyldte. De bliver ikke vist her, da vi går videre med analysen. Dette er også grunden til, at vi ikke tolker på den første analyses resultater. Det er derfor nødvendigt at lave en ny analyse, hvor vi deler køn op. Dette vælger vi at gøre, da køn indgår i to af interaktionerne. Idet vi foretager en ny analyse laver vi indledende bivariat analyse for kvinder. Der påvises varianshomogenitet og variablen heltid viser også en forskel i middelværdien (p=0,020). Vi tester desuden varianshomogeniteten for analysen med kvinder (p= 0,050) ved Levene s test og konstaterer, at der er varianshomogenitet. Analysen køres forfra med alle hovedeffekter og tovejsinteraktioner, men kun for kvinder (tabel 5). Det har vi valgt at gøre, da populationen for mænd er få (n = 144). Tabel 5: Insignifikante interaktioner og hovedeffekt ved analyse for kvinder Trin Interaktion Sig. (5%) 1: Kommune*anciennitet 0,773 2: Heltid*anciennitet 0,754 3: Alder*anciennitet 0,647 4: Alder*heltid 0,629 5: Kommune*heltid 0,624 6: Heltid*overarbejde 0,139 7: Alder*overarbejde 0,066 8: Kommune*alder 0,118 9: Overarbejde*anciennitet 0,073 10: Alder 0,331 Som nævnt tidligere korrelerer alder og anciennitet, og da alder er mere insignifikant end anciennitet i denne model, vælger vi at eliminere den. Det betyder også at sammenlægning af aldersgrupperne ikke har den store betydning, da den ikke er med i vores slutmodel. Vi ender derved op med nedenstående slutmodel (tabel 6). Tabel 6: Slutmodel for kvinder Tests of Between-Subjects Effects Dependent Variable:Motivationsskala Source Type III Sum of Squares df Mean Square F Sig. Corrected Model 545,421 a 48 11,363 1,660,004 Intercept 44017, , ,632,000 Kommune 100, ,131 1,334,201 9 T. Nielsen & S. Kreiner (2008), s

9 Heltid 58, ,613 8,560,004 Overarbejde 45, ,034 2,196,087 Kommune * Overarbejde 332, ,405 1,520,034 Ancien 71, ,580 10,454,001 Error 4608, ,847 Total , Corrected Total 5153, a. R Squared =,106 (Adjusted R Squared =,042) Slutmodellen indeholder signifikante hovedeffekter og interaktionen kommune,overarbejde, og på grund af dette, kan vi ikke udtale os om hovedeffekterne for kommune og overarbejde. Vi kunne i den sammenhæng have valgt at stratificere vores undersøgelse på kommune og overarbejde for at udtale os om hovedeffekterne. Dette ville dog være endt op med en meget stor analyse, hvilken vi ville have foretaget i et forskningsprojekt. Analysen for mænd er foretaget, men eftersom populationen er lille, vurderer vi, at der er for stor usikkerhed i estimaterne til at anvende i denne opgave. For at undersøge hvilken model der, for kvinder, forklarer variablenes indflydelse på motivationsskalaen bedst, anvender vi likelihood ratio testet, hvor nulhypotesen (H 0 ) er, at modellerne forklarer variablene på motivation lige godt. Dette skyldes, at vi ønsker en model, der med det samme udgangspunkt kan forklare variablene på motivationen lige godt, dog uden overflødig forklaring. Følgende formel bliver brugt til at udregne -2loglikelihood: AIC = n[log(2πrss/n +1)], hvor n er # data og RSS er residual sum of squares. Startmodel: 721[log(2π3858,727/721+1] = 1109,918 Slutmodel: 721[log(2π4608,070/721+1] = 1164,015 De beregnede værdier kan benyttes i en syntaksfil 10, hvor værdierne og frihedsgraderne 11 benyttes til at beregne p-værdien. Vi får en p-værdi på 0,99977, hvilket indikerer, at den beregnede p-værdi i log-likelihoodtestet er insignifikant. Det betyder, at vi accepterer vores nulhypotese. Vi mener hermed, at slutmodellen forklarer variablenes indflydelse på motivationen lige så godt som startmodellen. 3.1 Modelkontrol For at kunne forklare og tolke modellen meningsfuldt skal modelantagelserne om betinget varianshomogenitet og normalfordeling for motivation givet de uafhængige variable være opfyldt 12. Levene s Test viser en p-værdien på 0,112 og der er dermed varianshomogenitet. Ligeledes blev lineariteten (figur 5) og variansen undersøgt grafisk ved at plotte de standardiserede residualer mod de prædikterede værdier af motivationen (figur 6), hvorfra antagelsen om varianshomogenitet accepteres. Det kan ses, at data ikke fordeler sig helt systematisk mellem de standardiserede residualer og de prædikterede værdier for motivation, men med en tendens til en lidt mindre spredning for højere værdier af motivation. 10 Pchi.sps. 11 Aflæst i tabel. (df slutmodel = 673 & df startmodel = 578). 12 S. Kreiner, 2007 s

10 Figur 5: Kontrol for linearitet Figur 6: Kontrol for varianshomogenitet af motivation Normalfordelingsantagelsen blev accepteret, da Kolmogorov-Smirnov testet for de standardiserede residualer var insignifikant (p=0,086), og da histogram og PP-plot ligeledes for de standardiserede residualer begge viser normalfordeling (figur 7 og 8). Figur 7: Histogram over de standardiserede residualer Figur 8: PP-plot over de standardiserede residualer for kvinder 3.2 Resultater I dette afsnit vil analysens resultater blive præsenteret og gennemgået. Tabel 7 viser α, β- parametrene for hovedeffekter og interaktioner, t-testet samt 95%-konfidensintervallet. p- værdien er ikke angivet i tabel 7, da de 95%-konfidensinterval, der indeholder 1 er insignifikante. Der er en afvigelse fra dette med heltid (p =0,004). 10

11 Tabel 7: β-parametre for hovedeffekter og interaktioner β parameter (t-værdi) 95% CI Heltid 0,711 (2,926) (,234-1,188) Anciennitet 0,033 (3,233) (,013-,052) β -parameter for interaktionerne Kategorier Overarbejde -0,23 (-,326) 0,136 (,214) -0,078 (,048) (1,615-1,155) (-1,115-1,388) (-1,385-1,228) Kommune1-0,045 (-,036) 0-0,464 (-,295) 0,078 (,048) (-2,523-2,433) (-3,551-2,623) (-3,219-3,286) Kommune2 0,838 (1,115) -1,914 (-1,687) -1,939 (-1,971) -0,262 (-,0267) (-0,638-2,314) (-4,142-0,313) (-3,87-(-0,007) (-2,192-1,668) Kommune3 0,403 (,565) -0,195 (,-157) -1,513 (-1,615) -0,387 (-,405) (-0,997-1,804) (-2,636-2,246) (-3,52-,326) (-2,265-1,49) Kommune4 0,779 (,617) -1,053 (-,516) -1,177 (-,584) 0,048 (,028) (-1,7-3,258) (-5,057-2,951) (-5,133-2,779) (-3,326-3,422) Kommune5-0,307 (-,381) 1,153 (,888) 0,407 (,384) 0,075 (,074) (-1,889-1,276) (-1,395-3,701) (-1,673-2,487) (-1,923-2,073) Kommune6-0,691 (-,631) 0,473 (,293) 0,074 (,057) 1,214 (,784) (-2,844-1,461) (-2,494-2,643) (-2,494-2,643) (-1,828-4,256) Kommune7-0,959 (-1,108) 2,911 (1,761) 1,47 (1,199) 0,82 (,607) (-2,659-0,741) (-0,335-6,158) (-,937-3,878) (-1,835-3,475) Kommune8-2,387 (-2,045) -0,555 (-,247) 1,301 (,931) 2,991 (2,077) (-4,679-(-0,095) (-4,974-3,864) (-1,441-4,043) (,164-5,818) Kommune9 0,485 (,385) 0,321 (,178) -0,594 (-,375) 1,307 (,8) (-1,992-2,963) (-3,214-3,856) (-3,701-2,513) (-1,9-4,515) Kommune10 0,684 (,971) 1,47 (,933) -0,925 (,718) -0,897 (-,885) (-0,698-2,065) (-1,624-4,564) (-3,456-1,605) (-2,886-1,093) Kommune11-0,075 (-,084) -6,03 (-2,842) 0,882 (,768) 1,503 (1,263) (-1,824-1,674) (-10,197-(-1,864) (-1,374-3,138) (-,834-3,84) Kommune12 0 (ref.) 0 (ref.) 0 (ref.) 0 (ref.) α=14,717 95%-konfidensintervallerne er brede, og derfor skal tolkningerne vurderes forsigtigt. Heltid og anciennitet indgår i slutmodellen, og er derfor medtaget i tabel 7. Anciennitet angiver derfor en vurdering af hvor meget motivationen afhænger af denne. Når anciennitet stiger med 1 år stiger motivationen med 0,033 point. Det er et udtryk for, at jo længere tid man har været ansat des mere motiveret er man. Vi fandt i den deskriptive analyse, at 51,6% har været ansat under 5 år. Det kan derfor tyde på, at de personer, der har været ansat i kortere tid end 5 år er mindre motiverede end deres kollegaer, der har været ansat i mere end 5 år. Vi ser ligeledes at personer, der er ansat på heltid er 0,77 point mere motiverede end deres kollegaer, der er ansat på deltid. Som nævnt tidligere testede vi middelværdien for heltid, og der fandt vi forskel, hvilket et boxplot ligeledes angav (ikke vist). Det giver derfor mening, at der er forskel i motivationen om man arbejder heltid eller deltid. 11

12 I tilknytning til udregning af de samlede effekter, havde SPSS angivet en kommune med få personer og overarbejde dagligt som reference. Dette mente vi ikke var den bedste reference, eftersom de angivne referencer ikke indeholder mange personer. Det betyder, at vi har omkodet og fået nye referencer. Kommune 12 og overarbejde sjældent er referencerne. Den samlede effekt er beregnet ved at lægge hovedeffekt kommune, hovedeffekt overarbejde og interaktion kommune, overarbejde sammen 13. Resultaterne er vist i tabel 8. Dette er gjort, for at vi kan udtale os om den samlede effekt af de uafhængige variable, kommune og overarbejde, på motivationen (graf 2). Tabel 8: Samlet effekt af kommune og overarbejde Samlede effekter Kategorier af overarbejde Kommune 1-0, ,373-0,045-0,045 Kommune 2-1,306-0,965 0,498 0,838 Kommune 3-0,022-0,974-0,062 0,403 Kommune 4-0,504-0,262 0,749 0,779 Kommune 5 0,616 0,236-0,31-0,307 Kommune 6-0,448-0,481 0,445-0,691 Kommune 7 1,722 0,647-0,217-0,959 Kommune 8-3,172-0,95 0,526-2,387 Kommune 9 0,576 0,027 1,714 0,485 Kommune 10 1,924-0,105-0,291 0,684 Kommune 11-6,335 0,943 1,35-0,075 Kommune 12-0,23 0,136-0,078 0 Graf 2: De samlede effekter af kommune og overarbejde Næsten dagligt 2-3 gange pr. uge 2-3 gange pr. måned Sjældent Som det fremgår af graf 2, er de 12 kommuner angivet på x-aksen, overarbejde er opdelt i 4 kategorier angivet på z-aksen, og den samlede effekt ses på y-aksen. Tabel 8 og graf 2 viser hvorledes den samlede effekt har indflydelse på motivationen. Det er ikke muligt at udtale sig om 13 Se fodnote Eksempelregning af effektværdi: β kommune=1 +β overarbejde=1 +β kommune=1*overarbejde=1 =-0,045+(-0,23)+0=-0,

13 hovedeffekter, hvilket betyder, at vi må se, om der er generelle tendenser. Kommune 9 har medarbejdere, der er motiverede uanset hvor ofte de har overarbejde. Dette er i modsætning til kommune 1, der har medarbejdere, der er mindre motiverede uanset, hvor ofte de har overarbejde. Ligeledes er det påfaldende, at der i kommune 11 ses et stort udsving i forhold til motivationen ved næsten dagligt overarbejde. I analysen for kvinder fremkom der en determinationskoefficient, R 2, på 0,106, hvilket er et udtryk for hvor stor en andel af den afhængige variabels varians, der forklares af de uafhængige variable i modellen 15. Pearsons korrelationskoefficient kan beregnes ud fra R 2 ved at tage kvadratroden. Denne anfører hvor stærk sammenhængen mellem to variable er. Eftersom vi mener, at alder og anciennitet korrelerer, ville det være relevant at beregne Pearsons korrelationskoefficient, og derefter erstatte variablene med hinanden i modellen 16, men vi har valgt ikke at fokusere på det i denne opgave. R 2 viser, at af den totale variation er kun 10,6% forklaret af modellen. Havde vores R 2 været tæt på 1, havde den prædikteret perfekt. Vi kan derfor sige, at hvis vi ønsker at anvende modellen til at prædiktere med, er modellen ikke den bedste på grund af den lave R 2 værdi. Vi vælger alligevel at opstille en ligning for kvinder. Dette begrunder vi ligeledes med, at generelle lineære modeller kan præsenteres ved lineære sammenhænge, og som nævnt tidligere er den nedenstående formel den generelle for dette. Y= α + β 1 *X 1 + β 2 * X 2 + β 3 * X 1 * X 2 + ε Med baggrund i undersøgelsen opstilles følgende ligning for kvinder: E (motivation anciennitet, kommune, heltid, overarbejde, kommune * overarbejde) Y = α + β anciennitet * x anciennitet + β kommune * x kommune + β heltid * x heltid + β overarbejde * x overarbejde + β kommune,overarbejde * x kommune * x overarbejde Der sættes (sum) for de kategoriske variable med flere end to kategorier, og bliver for hver udregning multipliceret med værdien af dummy-variablen. Det betyder, at vi kan prædiktere motivationen for en kvinde, der har været ansat i et bestemt antal år, arbejder i en bestemt kommune, har overarbejde og arbejder på heltid eller deltid. β-parametrene fra tabel 7 anvendes såfremt der ønskes at se nærmere på en bestemt målgruppe. 4.0 Diskussion og konklusion Formålet med opgaven var at skabe en skala, der måler motivation blandt medarbejdere ansat i 12 kommuner uden at eksogene variable påvirker skalaen. Dette blev undersøgt ved logistisk regression, og der blev ikke fundet DIF. Det betyder, at skalaen kunne bruges til det næste formål i opgaven, hvilket var at undersøge om og i givet fald på hvilken måde graden af motivation afhænger af de øvrige variable. Den bivariate statistik blev først undersøgt, og i den forbindelse var det køn og overarbejde, der viste en sammenhæng. Sidenhen blev der foretaget analyse ved hjælp af generelle lineære modeller, hvor der blev fundet tre interaktioner, hvilket betød at 15 S. Kreiner, 2007, s S. Kreiner, 2007, s

14 analysen igen blev kørt, blot for mænd og kvinder (kun kvinder vist). Der kom én interaktion frem (kommune & overarbejde), hvilken også kom frem i den første analyse. Det kan være et udtryk for, at kommune og overarbejde sammen har betydning for motivationen. På grund af interaktionen blev den samlede effekt efterset. I den forbindelse blev det påvist, at det at være ansat i en kommune og have overarbejde har betydning for motivationen. Det kan derfor siges, at det at være kvinde, arbejde i en kommune og have overarbejde har betydning for motivation blandt de kvindelige offentlige ansatte. Heltid blev efterfølgende testet for kvinder, hvilket viste, at der er forskel på at arbejde heltid og deltid i forhold til motivationen. Grundene til dette kan være flere forskellige ting, som vi ikke kan tage højde for eftersom kommune og overarbejde kan være udtryk for mere og andet end det de er. Desuden er kommunerne anonymiserede, hvilket gør, at vi ikke kan forholde os til dem. Det kan tænkes, at det at arbejde i kommune 9 indebærer en god chef, et godt kollegialt samarbejde eller klienterne ikke volder problemer for de ansatte. Dette er også i relation til vores R 2, der kun forklarer 11% af variationen (tabel 6). Modelkontrollen viste, at modelantagelserne er opfyldte, men det vurderes dog, at de uafhængige variables forklaring af motivationen er lav. Som nævnt tidligere og i relation til Maslows motivationsteori mener vi, for eksempel at kommune kan være udtryk for flere ting. Det betyder, at det vil være en god ide at medtænke variabler, der uddyber påvirkningen på motivation bedre. Eksempel derpå er et godt kollegialt samvær og samarbejde. Det er ligeledes relevant at medarbejdere føler anerkendelse og påskønnelse, er god til sit job og får ros, for at føle sig motiveret. Dette kan vi dog ikke se med vores data. Vi kan derfor, på baggrund af resultaterne, konkludere at der er grundlag for at forbedre undersøgelsens målinger, og skal undersøgelsen gentages vil det være relevant at medtænke nye variable og items til måling af motivationen. Det er ligeledes relevant at sikre et forholdsvis jævnt fordelt data grundlag, for at kunne udtale sig om for eksempelvis kønsforskelle i forhold til motivation. På grund af, at der ikke har været en ligelig fordeling af mænd og kvinder, har vi valgt ikke at medtage mænd i den sidste del af analysen. Havde vi arbejdet videre med den kausale relation og DAG et, ville vi have fundet andre resultater, og derfor kan vi konkludere at vurderingen af hvilke variable, der har betydning og bør inddrages i en analyse, har stor betydning for resultatet. 14

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Eksamen i statistik 2009-studieordning

Eksamen i statistik 2009-studieordning Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE

Læs mere

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende

Læs mere

Statistik & Skalavalidering

Statistik & Skalavalidering å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Eksamen Efterår 2013

Eksamen Efterår 2013 Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345) Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ). Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Test nr. 6 af centrale elementer 02402

Test nr. 6 af centrale elementer 02402 QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2. C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b. 5.000 4.800 4.600 4.400 4.00 4.000 3.800 3.600 3.400 3.00 3.000 1.19% 14.9% 7.38% 40.48% 53.57% 66.67% 79.76% 9.86% 010 011

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen STATISTIK Skriftlig evaluering, 3. semester, mandag den 6. januar 004 kl. 9.00-13.00. Alle hjælpemidler er tilladt. Opgaveløsningen forsynes med navn og CPR-nr. OPGAVE 1 Et firma tuner biler. Antallet

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere