Eksamen i statistik 2009-studieordning

Størrelse: px
Starte visningen fra side:

Download "Eksamen i statistik 2009-studieordning"

Transkript

1 Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens nr. 28 og 36 I samarbejde med 35 og 46 1

2 Synopsis Motivation er en latent variabel der ikke kan måles direkte, da det er et multifacetteret begreb, hvorfor dette måles på en multi-item skala. Data til denne synopsis er hentet fra en undersøgelse omhandlende arbejdsmiljø for socialrådgivere og kommunale sagsbehandlere i 12 forskellige anonymiserede kommuner. Vi ønsker at undersøge, hvorvidt motivationsskalaen indeholder Differentiel Item Function (DIF), det vil sige, om nogle subgrupper af respondenter svarer anderledes på enkelte items end resten af respondenterne. Hvis ikke der er DIF, vil items være betinget uafhængig af baggrundsvariablerne, og dermed vil ét aspekt af begrebsvaliditet være opfyldt. Herefter ønsker vi ved hjælp af generelle lineære analyser, at undersøge hvilke af de målte variable der har betydning for motivation og efterfølgende estimere hvilken betydning disse variabler har. Deskriptiv statistik Vi udfører deskriptiv statistik på alle de variabler, som indgår i det udleverede datasæt. Der indgår 895 respondenter i undersøgelsen. Missings kodes i SPSS til 99. Vi er opmærksomme på, at der i flere kommuner er meget få respondenter, hvilket kan få betydning for senere analyseresultaters validitet. Yderligere er fordelingen af mænd og kvinder henholdsvis 16,1 % og 83,7 %, hvilket også kan få betydning for fortolkningen af resultaterne. I aldersgruppen 18 år eller yngre er der kun én respondent og denne kategori slår vi derfor sammen med år. Som forventet er der mange flere heltidsansatte (79,1 %) end deltidsansatte (20,2 %). Svarfordelingen i de fire kategorier indenfor hver af de fem items er skævt fordelt, med få personer i enkelte kategorier. Dette har dog ingen betydning, da vi kun benytter items til at danne motivationsskalaen og til DIF-analyser, hvor hvert item dikotomiseres til JA/NEJ- kategorier. I fortolkningsøjemed skal vi være opmærksomme på, at der er en stor overvægt af personer, der har været ansat 0-10 år og at denne variabel er ikke normalfordelt. Dette har dog ikke betydning for analysen, da det udelukkende er den afhængige variabel, der skal være normalfordelt for at opfylde antagelserne i generelle lineære modeller. I spørgsmålet om de forskellige variablers betydning for motivation, er det motivationsskalaen, der er den afhængige variabel. Fordelingen af den beregnede motivationsskala er som følger i figur 1: 2

3 Figur 1 Motivation ser umiddelbart ud til at være skævt fordelt mod venstre, hvilket kan tyde på, at data ikke er normalfordelt. Det er dog den betingede fordeling af y der skal være normalfordelt, hvilket vi ikke kan se ud fra ovenstående. Dette undersøges senere. Til yderligere beskrivelse af datamaterialet, har tester vi marginale sammenhænge mellem de forskellige baggrundsvariable. Her finder vi, at køn har højsignifikant betydning for, hvilken kommune man er ansat i (p = 0,008). Det er svært at sige hvordan sammenhængen er, da kommunerne er anonymiserede. Kvinder er 5,1 gange mere tilbøjelige til at være deltidsansat end mænd (p=0,000), hvilket ligeledes er højsignifikant. Der testes marginale sammenhænge mellem baggrundsvariablerne og motivationsskalaen. Køn og anciennitet har marginal sammenhæng med motivation og disse test er derfor de eneste der fremstilles her i tabel 1-4: Køn Descriptives Motivationsskala 95% Confidence Interval for Std. Std. Mean N Mean Deviation Error Lower Bound Upper Bound Minimum Maximum MAND ,81 2,715,226 14,37 15, KVINDE ,57 2,666,098 15,37 15, Total ,44 2,687,090 15,27 15, Tabel 1 3

4 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Sig. Interval of the (2- Mean Std. Error Difference F Sig. t df tailed) Difference Difference Lower Upper Motivationsskala Equal variances assumed,148,700-3, ,002 -,75372, , ,27574 Equal - 200,333,003 -,75372, , ,26756 variances 3,057 not Tabel 2 assumed Det ses af outputtet, at kvinders motivationsgennemsnit er 15,57 mens mænds er 14,81 og denne forskel er højsignifikant med en tilhørende p-værdi = 0,002. Dog skal man huske, at der er mange flere kvinder end mænd i undersøgelsen hvilket kan skævvride resultaterne. Anciennitet Coefficients a Model Unstandardized Standardized Coefficients Coefficients B Std. Error Beta t Sig. 1 (Constant) 15,233, ,713,000 Antal år på nuværende,021,009,078 2,294,022 arbejdsplads a. Dependent Variable: Motivationsskala Tabel 3 Det ses af tabel 3, at for hvert ekstra år medarbejderne har været ansat øges motivationen med 0,021 enheder. Sammenhængen er moderat signifikant (p = 0,022). Indenfor variablerne kommune, køn, alder, heltid/deltid og overarbejde finder vi ved Levene s test for homogenitet at der er varianshomogenitet, da alle p-værdier er > 0,05. 4

5 Differential Item Function DIF undersøger vi ved hjælp af logistisk regression. Først laver vi test for hver dikotomiseret item som afhængig variabel med motivationsskalaen og alle baggrundsvariablerne som uafhængige variabler. Dernæst foretages test for hvert item, med motivationsskalaen og hver af baggrundsvariablerne som uafhængige variabler. I alt foretager vi 35 test (5 + 6*5) og derfor vælger vi et signifikansniveau på 1 % som det kritiske niveau, for at minimere risikoen for type 2 fejl. Vi finder ingen items der udviser DIF på signifikansniveau 1 %. Ved item Jeg ville vælge noget mere interessant hvis jeg havde mulighed for det finder vi, at anciennitet er signifikant på niveau 5 % (p =0,026), men vi vurderer, at motivationsskalaen ikke indeholder DIF. Vi foretager derfor de efterfølgende analyser med en motivationsskala der indeholder alle fem items. Generelle lineære analyser Vi ønsker at undersøge hvilke variabler der har betydning for medarbejdernes motivation og til dette formål benytter vi baglæns modelsøgning. Motivation er en kontinuert skala og da vi både har kontinuerte og kategorisk uafhængige variabler, foretager vi modelsøgning ved hjælp af generel lineær regression (ANCOVA). For at bruge denne analyse skal der være lineær sammenhæng mellem den afhængige variabel og de kontinuerte uafhængige variabler. I dette datasæt er anciennitet den eneste kontinuerte afhængige variabel og vi laver et xy-plot, for at undersøge, om det er den lineære sammenhæng der bedst beskriver data: Figur 2 Det ser umiddelbart ud til at være den lineære sammenhæng der beskriver data bedst. Det underbygges af R 2 -værdierne som alle er 0,006, at det kvadratiske og kubiske led ikke bidrager med noget ekstra i forklaringen af variationen i y, og derfor medtages disse led ikke i den mættede model i modelsøgningen. 5

6 I fortolkningsøjemed finder vi det mest optimalt at have den yngste aldersgruppe som referencegruppe og derfor vender vi denne variabel. Det samme gør sig gældende for variablerne overarbejde og heltid/deltid, hvor vi vælger, at det er dem der sjældent har overarbejde og dem der er heltidsansatte der er referencegruppe. Vi foretager en baglæns modelsøgning, ud fra det hierarkiske princip, hvor alle hovedled og tovejsinteraktioner indgår i den mættede model. Leddene fjernes i følgende rækkefølge: Kommune*anciennitet, heltid*anciennitet, kommune*heltid, køn*heltid, alder*heltid, alder*anciennitet, heltid*overarbejde, kommune*overarbejde, alder*køn, overarbejde*køn, overarbejde*anciennitet, alder*overarbejde, overarbejde, alder*kommune, alder og vi ender ud med nedenstående: Dependent Variable:Motivation Tests of Between-Subjects Effects Source Type III Sum of Squares df Mean Square F Sig. Corrected Model 468,284 a 26 18,011 2,609,000 Intercept 37550, , ,423,000 Kommune 197, ,975 2,603,003 Køn 18, ,763 2,717,100 Heltid_vendt 45, ,751 6,626,010 Ancien 2, ,452,355,551 Køn * Ancien 60, ,098 8,704,003 Kommune * Køn 154, ,081 2,039,022 Error 5779, ,905 Total , Corrected Total 6247, a. R Squared =,075 (Adjusted R Squared =,046) Tabel 4 Modellen bliver dermed: Motivation = α + Kommune*β + Køn*β + Anciennitet*β + Heltid*β + Køn*Anciennitet*β + Kommune*Køn*β. 6

7 For denne model gælder, at der for den kategoriske variabel, kommune, indgår en β-værdi for hver dummyvariabel og en β- værdi for hver kombination af interaktionsleddene. Adjusted R 2 = 0,046 er et udtryk for at modellen kan forklare 4,6 % af variationen i motivationsskalaen, hvilket er en lav forklaringsgrad. Inden for folkesundhedsvidenskab er det dog sjældent at man ser meget høje R 2 - værdier. Vi undersøger ved likelihoodratio-test, om den model vi finder frem til, er sufficient, forstået på den måde, at vi har simplificeret modellen uden at eliminere for meget data. Først finder vi -2*likelihood for de to modeller, den mættede og den aktuelle. Da kravet for dette test er, at de to modeller skal indeholde lige mange respondenter, findes likelihoodratio ved at inddrage de samme personer i den aktuelle model, som indgår i den mættede. Dette er et ensidet test og testens hypoteser er følgende: H 0 : Ingen forskel i den mættede og den aktuelle models forklaring af motivation. H A : Den mættede model forklarer motivation bedre end den aktuelle model. -2*likelihood: n*[log(2π*rss/n)+1]. Vi aflæser i outputs: Den mættede model: 864*[log(2π*4808,700/864)+1] = Den aktuelle model: 864* [log(2π*5779,206/864)+1] = 1225,65 Frihedsgrader aflæses for de to modeller: Den mættede model: DF = 147 Den aktuelle model: DF = 26 Differencen for de to -2*likehood-værdier og de to frihedsgrader indsættes i en udleveret syntaksfil der beregner loglikelihoodratio, og der fås: Chi df p-værdi 118, ,54267 Tabel 5 Da testet er ensidet divideres p-værdien med to. Testet er insignifikant med (p= 0,271335) hvilket betyder, at vi ikke har elimineret for mange variabler i forklaringen af motivation i den aktuelle model. 7

8 Vi undersøger nu, om forudsætningerne for den fundne model er opfyldt. Udover det krav som ofte er gældende ved statistiske analyser, at data skal være uafhængigt indsamlet, gælder følgende forudsætninger for ANCOVA: Linearitet: y skal afhænge lineært af x Normalitet: y givet x skal være normalfordelt: residualerne skal være normalfordelt Varianshomogenitet: residualerne skal have samme varians for alle x Linearitet Vi så i xy-plottet for anciennitet og motivation i figur 2, at det var den lineære linje der beskrev sammenhængen bedst. Det xy-plot tager dog ikke højde for de andre variable i modellen, så vi er nødt til også at vurdere antagelsen om linearitet ud fra et residualplot, hvor de standardiserede residualer er tegnet op mod de forventede værdier: Figur 3 Det ser ud til at residualerne varierer tilfældigt om 0 og dermed er antagelsen om linearitet opfyldt. Normalfordeling Om residualerne er normalfordelt kan både vurderes ud fra ovenstående residualplot, ud fra et QQplot og ved hjælp af et Kolmogorov-Smirnov-test. I figur 3 ser der ud til at være en overvægt af antallet af punkter der ligger under -1,96 på y-aksen, i forhold til antallet af punkter der ligger over 1,96. Ved en normalfordeling vil 2,5 % af residualerne ligge over 1,96 på y-aksen og 2,5 % under - 8

9 1,96. Der ser umiddelbart ud til at være mange punkter i ekstremerne, hvilket indikerer manglende normalfordeling, hvilket vi også så i histogrammet figur 1. Vi tegner nu et QQ-plot med de standardiserede residualer tegnet op mod den teoretiske linje residualerne ville have, hvis der var normalfordeling: Figur 4 Der er i plottet en tendens til afvigelse fra den teoretiske normalfordeling i den ene ende, hvilket også stemmer overens med de forrige resultater. Endelig foretager vi et Kolmogorov-Smirnov-test, hvor det testes, om fordelingen af residualer afviger mere fra den teoretiske normalfordeling, end der kan forklares ved tilfældigheder: Tabel 6 Testet er ikke signifikant, (p= 0,192) og vi tror mere på testet end de grafiske fremstillinger, da testet er stærkere. Antagelsen om normalfordeling er derfor opfyldt i den fundne model. Varianshomogenitet Ved residualplottet kan varianshomogeniteten også undersøges.. Det ser ikke ud til, at residualerne varierer lige meget om 0 for alle x, da outliers er med til at antyde tragtform. Vi så i de indledende marginaltests, at der er varianshomogenitet inden for alle de uafhængige variabler. I forbindelse med den generelle lineære analyse foretog vi også Levene s test for varianshomogenitet mellem variablerne, som vises her: 9

10 Levene's Test of Equality of Error Variances a Dependent Variable:Motivation F df1 df2 Sig. 1, ,128 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept + Kommune + Køn + Heltid_vendt + Ancien + Køn * Ancien + Kommune * Køn Tabel 6 Da testet er insignifikant (p = 0,128), er der ens varians mellem variablerne i modellen. Således er også kravet om varianshomogenitet opfyldt, og vi kan derfor acceptere modellen til beskrivelse af hvorledes motivation afhænger af baggrundsvariable. Vi har dog ikke oplysninger nok om dataindsamlingen til at kunne vurdere, hvorvidt data er blevet indsamlet uafhængigt. Da antagelserne er opfyldt egner modellen sig til prædiktion. Effektestimering Vi har to interaktionsled, Køn*Anciennitet og Kommune*Køn. Der er kun 144 mænd i undersøgelsen og når disse fordeles på de 12 kommuner vil det give usikre estimaterne. Vi beslutter derfor, at stratificere på køn og kun fortolke estimaterne for kvinder, hvilket vi mener der kan argumenteres for at gøre, da kvinder også er hyppigst repræsenteret i de undersøgte job grupper. Vi får følgende regressionslinje for kvinder: Motivation: 15,738-0,490*β Kommune 1-0,452*β Kommune 2-0,578*β Kommune 3 + 0,071*β Kommune 4-0,375*β Kommune 5-0,646*β Kommune 6-0,286*β Kommune 7-1,060*β Kommune 8 + 0,370*β Kommune 9-0,328*β Kommune ,256*β Kommune 11-0,635*β deltid + 0,030*β anciennitet. Det er svært at sige noget om de enkelte kommunernes effekt på motivation, da de er anonymiseret. Vi ved f.eks. ikke, hvorvidt de eksempelvis er land- eller bykommuner, vi kan kun sige, at motivationen er højere i kommune 4, 9 og 11 end i referencekommunen 12. Vi så i den deskriptive statistik, at der var få respondenter i disse kommuner. I de resterende kommuner er motivationen højere end i referencekommunen 12. De deltidsansatte har 0,635 lavere motivationsscore end heltidsansatte. For hvert år ekstra kvinderne har været ansat, stiger motivationsscoren med 0,

11 Når vi stratificerer for køn får vi en ny R 2 -værdi for den del af modellen der kun er for kvinder. Den nye Adjusted R 2 værdi= 0,018, og det betyder at vi ud fra modellen kun kan forklare 1,8 % af variationen i motivationsskalaen. Denne R 2 -værdi forklarer mindre end den tidligere model, hvilket betyder at modellen får en mindre forklaringsgrad, når vi stratificerer. Årsagen til dette er at modelsøgningen er foretaget på baggrund af det samlede datasæt og en bedre R 2 -værdi kunne eventuelt opnås hvis vi foretog en modelsøgning som kun er baseret på de kvindelige respondenter. Hvis dette blev gjort kunne det ligeledes tænkes, at den endelige model ville indeholde andre hovedled og interaktionsled end den model vi har fundet frem til nu. Diskussion Vi fandt at motivationsskalaen ikke har problemer med DIF, hvilket betyder at alle items er betinget uafhængige af baggrundsvariablerne, hvorfor et af aspekterne af begrebsvaliditet er opfyldt. Dette siger imidlertid ikke noget om de andre aspekter af validitet og reliabilitet. I det vi arbejder med en latent variabel er kriterievaliditet særlig vigtigt. Dette undersøger vi ikke, da vi ikke har nogen golden standard at sammenligne med. Vi mener motivation er et multifacetteret begreb og det kan diskuteres hvorvidt de fem valgte items er dækkende for dette begreb. I studiet er spørgsmålene om motivation en del af en undersøgelse omhandlende arbejdsmiljø. Vi mener ikke, at disse fem items fuldt ud beskriver motivation da en motivationsskala målt i forhold til arbejdsmiljø for eksempel burde inddrage kollegiale forhold. Vi har valgt én ud af mange mulige modeller til at beskrive hvordan motivation afhænger af de øvrige variable. Vi har overvejet flere måder at konstruere modellen på. Som allerede beskrevet kunne vi have valgt at lave en modelsøgning kun for kvinder. Vi gjorde os fra starten overvejelser om hvorvidt vi ville inddrage variablen kommune i vores modelsøgning, idet datasættet er lille i forhold til at skulle inddeles i 12 subgrupper. Desuden er kommunerne anonymiserede, hvorfor vi ikke kan sige noget om de enkelte kommuners karakteristika i forhold til motivation. Vi valgte dog at bibeholde variablen kommune i modelsøgningen, da den i alle de afprøvende modelsøgninger viste sig at være signifikant. Vi kunne ligeledes have valgt at anlægge et mere epidemiologisk perspektiv på analysen, ved at konstruere et Directed Acyclic Graph (DAG), og ud fra dette beslutte hvilke variable der skulle inddrages i den mættede model. Årsagen til at vi ikke har konstrueret et DAG er, at analyserne til testningen af den opstillede kausale kæde ligger uden for pensum. 11

12 De mange muligheder for modelkonstruktion vidner om at det er problematisk at finde én god og sigende model. Den model vi har fundet frem til har en lav forklaringsgrad, der gør den til en dårlig model. De mange estimater bygger på forholdsvis få respondenter, hvilket ydermere betyder at modellen er usikker. 12

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45 Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af

Læs mere

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Statistik & Skalavalidering

Statistik & Skalavalidering å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Eksamen Efterår 2013

Eksamen Efterår 2013 Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer. Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Introduktion 1 Formelt Lærere: Esben Budtz-Jørgensen Jørgen Holm Petersen Øvelseslærere: Berivan+Kathrine, Amalie+Annabell Databehandling: SPSS

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere