Vejledende besvarelse af hjemmeopgave

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Vejledende besvarelse af hjemmeopgave"

Transkript

1 Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin D status i Europa, har man i fire europæiske lande (Danmark, Polen, Finland og Irland) foretaget målinger på en række personer, såvel mænd og kvinder som unge piger. Vi skal her beskæftige os med et udpluk af data vedrørende kvinderne og undersøge, hvor store forskelle, der er mellem de fire lande samt om disse forskelle helt eller delvis kan forklares udfra forskelligheder i andre variable, såsom body mass index, solvaner og vitamin D indtaget fra kosten. På hjemmesiden ligger diverse oplysninger på i alt 213 kvinder, nemlig registreringer af lbnr Et internt løbenummer, til brug ved sletning af en observation (se nedenfor) land: Landet, koderne er (1: Danmark, 2: Polen, 3: Finland, 4: Irland) dk: Indikator for, at kvinden er dansk (1: dansk, 0: ikke dansk) vitd: Vitamin D i en blodprøve, nmol/l bmi: Body mass index vitdintake: Indtag af vitamin D, bestemt ud fra kosten alder: Kvindens alder sol: Solvaner, koderne er (0: undgår sol, 1: indifferent eller soldyrker) Samtlige observationer er benyttet til denne besvarelse. 1

2 Spørgsmål: 1. Kan vitamin D niveauet antages at være ens i de fire lande? Foretag et test af identitet af alle fire middelværdier under et, samt parvise sammenligninger landene imellem, passende korrigeret for at undgå massesignifikans. Allerførst skal vi indlæse data og lave en tegning, f.eks. et boxplot af fordelingen af vitamin D i de 4 lande. For overskuelighedens skyld indføres en ny variabel country, der angiver landene, så de kan genkendes. Desuden laver vi ved samme lejlighed et par logaritmetransformationer, fordi vi kan få brug for dem senere. FILENAME navn URL "http://staff.pubhealth.ku.dk/~lts/ basal13_2/hjemmeopgave/hjemmeopgave1.txt"; data a1; infile navn firstobs=2; input lbnr land dk vitd bmi vitdintake alder sol; lvitd=log10(vitd); lvitdintake=log10(vitdintake); if land=1 then country= 1:DK ; if land=2 then country= 2:PL ; if land=3 then country= 3:SF ; if land=4 then country= 4:EI ; /* to alternativer til at tegne boxplot */ proc sgplot data=a1; vbox vitd / category=country; proc sort data=a1; by country; proc boxplot data=a1; plot vitd*country; 2

3 Vi ser her rimeligt ens værdier for Danmark, Finland og Irland, medens Polen synes at have noget lavere værdier (og samtidig noget lavere spredning). Vi foretager nu en ensidet variansanalyse ved hjælp af GLM, incl. Levenes test for varianshomogenitet, samt parvise sammenligninger (korrigeret for massesignifikans ved hjælp af Tukey korrektion). ods graphics on; proc glm plots=diagnostics data=a1; class country; model vitd=country; means country / hovtest=levene tukey cldiff; ods graphics off; Da vi bruger ods-systemet og tilføjer plots=diagnostics, får vi også nogle modelkontroltegninger, som kommenteres efterfølgende. Men selv outputtet bliver (let beskåret) The GLM Procedure Class Level Information Class Levels Values country 4 1:DK 2:PL 3:SF 4:EI 3

4 Number of Observations Read 213 Number of Observations Used 213 Dependent Variable: vitd Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE vitd Mean Source DF Type III SS Mean Square F Value Pr > F country <.0001 Levene s Test for Homogeneity of vitd Variance ANOVA of Squared Deviations from Group Means Sum of Mean Source DF Squares Square F Value Pr > F country Error Tukey s Studentized Range (HSD) Test for vitd NOTE: This test controls the Type I experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 209 Error Mean Square Critical Value of Studentized Range Comparisons significant at the 0.05 level are indicated by ***. Difference country Between Simultaneous 95% Comparison Means Confidence Limits 4:EI - 3:SF :EI - 1:DK :EI - 2:PL *** 3:SF - 4:EI :SF - 1:DK :SF - 2:PL *** 1:DK - 4:EI :DK - 3:SF :DK - 2:PL *** 2:PL - 4:EI *** 2:PL - 3:SF *** 2:PL - 1:DK *** Vi ser her en klar afvisning af hypotesen af ens middelværdier i de fire lande (F=10.06, P < ), men kan vi nu stole på det? Formentlig, men konfidensgrænser på de parvise sammenligninger er måske ikke helt gode, da vi fra Levenes test kan se, at der næppe er samme spredning i de fire grupper (P=0.0008) 4

5 Derfor gentages analysen med logaritmetransformeret outcome, når vi lige er færdig med at fortolke resultaterne fra outputtet ovenfor (fordi I jo ikke bliver bedt om at logaritmere). Angiv estimat og tilhørende 95% konfidensinterval for forskellen mellem Danmark og Polen. Estimatet for forskellen er , men hvad konfidensintervallet er, afhænger af, hvilken korrektion, man benytter til kontrol for massesignifikans. Vi har ovenfor benyttet Tukey, og så bliver konfidensintervallet (5.716, ), som altså viser, at der er signifikant forskel på de to lande, også efter at have taget højde for de mange (i alt 6) sammenligninger. Er det fornuftigt (eller måske ligefrem nødvendigt) at logaritmetransformere vitamin D målingerne? Svaret skal begrundes med baggrund i modelforudsætningerne, men man behøver ikke at foretage en sådan transformation. Programstumpen ovenfor producerede en modelkontroltegning som viser lidt trompetform i plottet af residualer mod predikterede værdier, samt en anelse hængekøjefacon på fraktildiagrammet. 5

6 Det med trompetfaconen hænger sammen med den manglende varianshomogenitet, idet Levenes test som allerede bemærket er signifikant, svarende til, at der ikke er ens spredninger i de 4 lande (P = ). Ser vi på simple summariske mål (gennemsnit og spredninger i de 4 lande), ser vi også at højt gennemsnit følges med stor spredning og vice versa (se nedenfor), hvilket også kunne understøtte en logaritmetransformation. proc means data=a1; class country; var vitd; The MEANS Procedure Analysis Variable : vitd N country Obs N Mean Std Dev Minimum Maximum :DK :PL :SF :EI I indlæsningsbidden havde vi allerede tilføjet en linie, hvor den logaritmetransformerede variabel lvitd blev defineret. Vi kan nu benytte denne i stedet for vitd i variansanalysen (samme kode i øvrigt) og finder så figuren samt outputtet 6

7 The GLM Procedure Class Level Information Class Levels Values country 4 1:DK 2:PL 3:SF 4:EI Number of Observations Read 213 Number of Observations Used 213 Dependent Variable: lvitd Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE lvitd Mean Source DF Type III SS Mean Square F Value Pr > F country <.0001 Levene s Test for Homogeneity of lvitd Variance ANOVA of Squared Deviations from Group Means Sum of Mean Source DF Squares Square F Value Pr > F country Error Tukey s Studentized Range (HSD) Test for lvitd NOTE: This test controls the Type I experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 209 Error Mean Square Critical Value of Studentized Range Comparisons significant at the 0.05 level are indicated by ***. Difference country Between Simultaneous 95% Comparison Means Confidence Limits 4:EI - 3:SF :EI - 1:DK :EI - 2:PL *** 3:SF - 4:EI :SF - 1:DK :SF - 2:PL *** 1:DK - 4:EI :DK - 3:SF :DK - 2:PL *** 2:PL - 4:EI *** 2:PL - 3:SF *** 2:PL - 1:DK *** 7

8 Vi ser nu, at Levenes test bliver godkendt (P=0.58), og at figuren med residualer mod predikterede værdier ser bedre ud. Til gengæld er fraktildiagrammet værre end før, idet det nu afviger den modsatte vej, altså svarende til en hale af små værdier. Vi har altså overtransformeret. På Boxplottet kan vi se, at specielt Polen, og tildels Finland har nogle personer med meget lave værdier af logaritmeret vitamin D. Estimatet for forskellen Danmark vs. Polen er , med konfidensinterval ( , ). Tilbagetransformeret til ratio er giver dette en faktor = 1.39, altså at Danmark ligger 39% højere end Polen, med konfidensgrænser ( , )=(1.09, 1.76), altså svarende til et sted mellem 9% og 76% højere. 2. Foretag nu sammenligningen af Danmark og Polen direkte, dvs. uden at inddrage de øvrige lande. Når der kun er to lande, bliver sammenligningen til et simpelt T-test (selv om man stadig ville kunne bruge GLM ligesom ovenfor). Vi udfører det først med den utransformerede variabel: proc ttest data=a1; where land in (1,2); class country; var vitd; 8

9 og får outputtet (igen let beskåret) The TTEST Procedure Variable: vitd country N Mean Std Dev Std Err Minimum Maximum 1:DK :PL Diff (1-2) country Method Mean 95% CL Mean Std Dev 1:DK :PL Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal <.0001 Satterthwaite Unequal <.0001 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F <.0001 Vi finder (selvfølgelig) igen samme estimerede forskel mellem Danmark og Polen ( ), men denne gang er konfidensintervallet udregnet på baggrund af spredningerne i disse to lande alene. Desuden korrigerer vi her ikke for massesignifikans, da vi kun foretager en enkelt sammenligning. Vi finder konfidensintervallet (7.6536, ), altså noget smallere end i spørgsmål 1. Vi konstaterer også igen den forskellige spredning i de to lande, og derfor er konfidensintervallet ovenfor baseret på satterth og ikke Pooled. Er resultatet nogenlunde det samme som ovenfor? Begrund evt. forskelle. Som anført ovenfor finder vi et noget smallere konfidensinterval, dels fordi spredningen i disse to lande er i den lave ende og dels fordi vi ikke har Tukey korrigeret (da vi jo kun laver en enkelt sammenligning). 9

10 Foretag også sammenligningen efter at have logaritmetransformeret vitamin D målingerne, og husk at give en forståelig præsentation af resultatet (dvs. tilbagetransformation af såvel estimat som konfidensinterval). Foretager vi det tilsvarende test på de logaritmerede værdier, finder vi: The TTEST Procedure Variable: lvitd country N Mean Std Dev Std Err Minimum Maximum 1:DK :PL Diff (1-2) country Method Mean 95% CL Mean Std Dev 1:DK :PL Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Estimatet for forskellen Danmark vs. Polen er stadig , nu med konfidensinterval (0.0592, ), som tilbagetransformeret til ratio er giver ( , )=(1.14,1.68), altså svarende til et sted mellem 14% og 68% højere. Det er noget snævrere end det, vi fandt i spørgsmål 1, af samme årsager som før. I det efterfølgende vil vi udelukkende se på kvinder fra Danmark og Polen. For at slippe for hele tiden at tilføje where land in (1,2); hver gang man kører en ny procedure, kan man eventuelt nu indføje en sætning if land in (3,4) then delete; oppe i indlæsningsbidden, eller i et nyt data step. 10

11 3. Er der forskel på body mass index hos kvinderne i Danmark og Polen? Kvantificer denne forskel og overvej (uden at lave statistisk analyse) om en sådan forskel kunne tænkes at forklare forskellen i vitamin D niveau i de to lande. Her er der igen lagt op til et T-test, men vi ser lige på en tegning først: Bortset fra en enkelt outlier (en ret kraftig Polsk kvinde), ser fordelingerne pæne ud, med ret ens spredninger. Vi finder sammenligningen (kode udeladt, da det blot er en ny variabel, vi ser på): The TTEST Procedure Variable: bmi country N Mean Std Dev Std Err Minimum Maximum 1:DK :PL Diff (1-2) country Method Mean 95% CL Mean Std Dev 1:DK :PL Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F

12 Vi ser en pæn varianshomogenitet, samt at polske kvinder har et noget højere body mass index end danske kvinder (28.9 mod 26.5, P=0.003, CI for forskel ). Da et højt body mass index sædvanligvis hænger sammen med et lavt vitamin D niveau (dette skal vi se på i det følgende), kunne denne forskel muligvis forklare de polske kvinders lave vitamin D niveau. 4. Se nu på de danske kvinder alene, og find en fornuftig beskrivelse af sammenhængen mellem body mass index og vitamin D niveau. Hvad er det forventede niveau af vitamin D for en dansk kvinde med BMI=25? Her skal vi se på en relation mellem to kvantitative variable, dvs. der lægges op til at foretage en lineær regression. Først skal vi dog se på et scatterplot, hvor der er indlagt en regressionslinie proc sgplot data=a1; where land=1; reg x=bmi y=vitd; Vi ser ikke rigtig nogen sammenhæng, men når man nu bliver bedt om at beskrive sammenhængen, er det naturligt at forsøge sig med en 12

13 lineær regressionsanalyse. Her bruger vi GLM, men kunne ligeså godt have valgt REG. Endvidere benytter vi igen ods-systemet til at få nem modelkontrol, og vi tilføjer en estimate-sætning for at kunne udtale os om en kvinde med bmi=25: ods graphics on; proc glm plots=diagnostics data=a1; where land=1; model vitd=bmi / solution clparm; estimate "bmi=25" intercept 1 bmi 25; ods graphics off; Herved fås det (let beskårede) output: The GLM Procedure Dependent Variable: vitd Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE vitd Mean Standard Parameter Estimate Error t Value Pr > t bmi= <.0001 Parameter 95% Confidence Limits bmi= Standard Parameter Estimate Error t Value Pr > t Intercept bmi Parameter 95% Confidence Limits Intercept bmi som viser en svag negativ, men insignifikant sammenhæng. Hældningsestimatet er -0.58, med konfidensinterval (-2.05, 0.90). 13

14 Ved hjælp af estimate-sætningen i koden ovenfor, finder vi den estimerede værdi af vitamin D for en dansk kvinde med et body mass index på 25 til at være (= ( )). Og hvad er normalområdet (referenceområdet) for sådanne kvinder? For at udregne normalområdet for sådanne kvinder, skal vi have fat i estimatet for spredningen omkring regressionslinien, som er (RootMSE), og vi udregner da ± = (2.31, 93.79) altså et meget bredt interval, som det også ses af figuren nedenfor. Vi må konkludere, at bmi ikke rigtig dur som prediktor for vitamin D status, og det højere bmi hos Polske kvinder kan altså næppe forklare deres lave vitamin D status. 5. Samme spørgsmål som ovenfor, bare for Polen? Vi foretager nu den samme analyse som ovenfor, blot for Polen (land=2) 14

15 Igen ser vi ikke nogen udpræget sammenhæng, men bemærker et par potentielt indflydelsesrige observationer. Vi foretager regressionsanalysen og finder outputtet The GLM Procedure Dependent Variable: vitd Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE vitd Mean Standard Parameter Estimate Error t Value Pr > t bmi= <.0001 Parameter 95% Confidence Limits bmi= Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 bmi Parameter 95% Confidence Limits Intercept bmi

16 og altså igen en svag negativ, men insignifikant sammenhæng. Hældningsestimatet er -0.65, med konfidensinterval (-1.38, 0.08). Ved hjælp af estimate-sætningen i koden ovenfor, finder vi den estimerede værdi af vitamin D for en polsk kvinde med et body mass index på 25 til at være 35.11, altså en del lavere end den tilsvarende danske kvinde, som vi fandt i sidste spørgsmål. Dette viser (som vi også allerede har konstateret pga den manglende sammenhæng mellem body mass og vitamin D), at den højere body mass index, som vi fandt i Polen, ikke kan forklare forskellen i vitamin D niveau. Og hvad er normalområdet (referenceområdet) for sådanne kvinder? For at udregne normalområdet for sådanne kvinder, skal vi have fat i estimatet for spredningen omkring regressionslinien, som er (RootMSE), og vi udregner da ± = (10.59, 59.63) altså et knap så bredt interval i forhold til det for danske kvinder, fordi spredningen blandt polske kvinder er en del mindre. 16

17 6. Giv et estimat (med 95% konfidensinterval) for forskellen i vitamin D niveau for de to kvinder (en dansk og en polsk), begge med BMI=25. Fra de to separate regressionsanalyser i spørgsmål 4 og 5 har vi allerede et estimat for denne forskel, nemlig = 12.94, men for at finde konfidensintervallet for denne forskel, er vi nødt til at analysere de to lande samlet, altså udføre en multipel regressionsanalyse. Hvis det skal svare helt til spørgsmål 4 og 5, skal denne analyse endvidere inkludere en interaktion (vekselvirkning) mellem bmi og land, idet der jo ovenfor var tale om to (lidt) forskellige hældninger. Derfor begynder vi med den model, og da interaktionen viser sig absolut ikke at være nær signifikans, fortsætter vi med den model, som I blev bedt om at udføre (den multiple regression med to kovariater, bmi og dk) ods graphics on; proc glm plots=diagnostics data=a1; where land in (1,2); class country; model vitd=country bmi country*bmi / solution clparm; estimate "dk vs. pl, bmi=25" country 1-1 country*bmi 25-25; ods graphics off; ods graphics on; proc glm plots=diagnostics data=a1; where land in (1,2); model vitd=dk bmi / solution clparm; estimate "dk vs. pl, bmi ens" dk 1; ods graphics off; Outputtet fra modellen med interaktion giver, som det ses nedenfor, en P-værdi P = 0.93 for test af ingen interaktion, dvs. test af ens hældninger for de to lande. Bemærk estimate-sætningen ovenfor, som er noget sværere end dem, I har set tidligere. De specielt interesserede må læse på SAS s hjemmesider for mere information, men I kan i hvert fald se, at vi får det samme resultat som den simple fratrækning af værdierne fra spørgsmål 4 og 5. 17

18 The GLM Procedure Class Level Information Class Levels Values country 2 1:DK 2:PL Number of Observations Read 118 Number of Observations Used 118 The GLM Procedure Dependent Variable: vitd Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE vitd Mean Source DF Type I SS Mean Square F Value Pr > F country <.0001 bmi bmi*country Source DF Type III SS Mean Square F Value Pr > F country bmi bmi*country Standard Parameter Estimate Error t Value Pr > t dk vs. pl, bmi= Parameter 95% Confidence Limits dk vs. pl, bmi= Standard Parameter Estimate Error t Value Pr > t Intercept B country 1:DK B country 2:PL B... bmi B bmi*country 1:DK B bmi*country 2:PL B... Parameter 95% Confidence Limits Intercept country 1:DK country 2:PL.. bmi bmi*country 1:DK bmi*country 2:PL.. NOTE: The X X matrix has been found to be singular, and a generalized inverse was used to solve the normal equations. Terms whose estimates are followed by the letter B are not uniquely estimable. 18

19 Figuren med de to ikke-parallelle linier (man kan ikke lige se det på øjemål, så ens er deres hældninger) er Hvordan passer denne forskel med den, vi fandt i spørgsmål 1 (eller 2)? Vink: Man kan her benytte en model med to kovariater, nemlig dk og bmi. Når vi kun har de to lande, Danmark og Polen, vil variablen dk blot angive forskellen mellem Danmark og Polen, for fastholdt bmi. Rigtig mange af jer har ladet jer narre af, at jeg beder om forskellen specifikt for bmi=25 og har prøvet at lave diverse fantasifulde estimate-sætninger, men det er altså slet ikke nødvendigt her, da den søgte forskel er den samme for alle værdier af bmi. Hvis man endelig vil have en estimate-sætning, skal den være som vist nedenfor, altså simpelthen 1 gange estimatet for variablen dk : ods graphics on; proc glm plots=diagnostics data=a1; where land in (1,2); model vitd=dk bmi / solution clparm; estimate "dk vs. pl, bmi ens" dk 1; ods graphics off; Vi finder så outputtet 19

20 The GLM Procedure Dependent Variable: vitd Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE vitd Mean Source DF Type I SS Mean Square F Value Pr > F dk <.0001 bmi Source DF Type III SS Mean Square F Value Pr > F dk bmi Standard Parameter Estimate Error t Value Pr > t dk vs. pl, bmi ens Parameter 95% Confidence Limits dk vs. pl, bmi ens Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 dk bmi Parameter 95% Confidence Limits Intercept dk bmi hvoraf det fremgår, at den søgte forskel estimeres til 13.13, med konfidensinterval (6.37, 19.88). Vi er altså ret sikre på, at danske kvinder ligger mindst 6 enheder højere end polske kvinder med samme bmi. Sammenligner vi med resultatet fra spørgsmål 2, ser vi at estimat og tilhørende konfidensinterval blot er rykket en anelse ned mod 0, men ikke noget, der rigtigt forslår noget. Den tilhørende tegning af fittet (de to parallelle linier) bliver 20

21 som næsten ikke er til at skelne fra figuren ovenfor af de to ikkeparallelle linier. 7. Lav en tabel til sammenligning af solvanerne i Danmark og Polen. Solvanerne er angivet som en binær (dikotom) variable, så vi skal her se på en 2 gange 2 tabel. Hvis vi følger det sædvanlige setup, skal landene være rækker, og vi skal udregne rækkeprocenter, χ 2 -test og odds ratio: proc freq data=a1; where land in (1,2); table country*sol / nopercent nocol chisq relrisk; med outputtet The FREQ Procedure Table of country by sol country sol Frequency Row Pct 0 1 Total :DK :PL Total

22 Statistics for Table of country by sol Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer s V Fisher s Exact Test Cell (1,1) Frequency (F) 14 Left-sided Pr <= F Right-sided Pr >= F Table Probability (P) Two-sided Pr <= P Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Confidence Limits Case-Control (Odds Ratio) Cohort (Col1 Risk) Cohort (Col2 Risk) Sample Size = 118 Er der signifikant forskel på solvanerne i de to lande? Nej, det er der ikke. χ 2 -testet giver P=0.12, samstemmende med Fishers eksakte test, der giver P=0.17. Angiv odds ratio (med 95% konfidensinterval) for at foretrække sol, for en dansk kvinde i forhold til en polsk. Den estimerede odds ratio ovenfor er for ikke at foretrække sol, så den skal inverteres. Dette kunne vi gøre enten på lommeregner, eller ved at bytte om på 0 og 1, f.eks. ved at definere skygge=1-sol; og så køre tabellen igen med denne nye variabel: 22

23 The FREQ Procedure Table of country by skygge country skygge Frequency Row Pct 0 1 Total :DK :PL Total Statistics for Table of country by skygge Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer s V Fisher s Exact Test Cell (1,1) Frequency (F) 39 Left-sided Pr <= F Right-sided Pr >= F Table Probability (P) Two-sided Pr <= P Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Confidence Limits Case-Control (Odds Ratio) Cohort (Col1 Risk) Cohort (Col2 Risk) Sample Size = 118 Vi finder så en odds ratio på 1.86, med konfidensinterval (0.85, 4.08). Da 1 ligger i dette konfidensinterval, er der ingen signifikant forskel på de to lande, men vi kan dog ikke udelukke, at odds for at kunne lide sol er helt op til 4 gange større for danske kvinder i sammenligning med polske. 23

24 Ser det ud som om solvaner kan forklare noget af forskellen i vitamin D niveau? (Her ønskes blot en vurdering baseret på sund fornuft, som ikke behøves at blive underbygget af statistiske analyser. I kan dog benytte modeller som skitseret ovenfor i spørgsmål 6, hvis I har overskud til det). Polske kvinder er ikke helt så solglade som danske kvinder, så umiddelbart kan det godt tænkes, at dette kunne forklare noget af deres lavere vitamin D status, også selv om forskellen ikke er signifikant. Vi prøver lige... ods graphics on; proc glm plots=diagnostics data=a1; where land in (1,2); class sol; model vitd=dk sol / solution clparm; ods graphics off; og finder outputtet The GLM Procedure Class Level Information Class Levels Values sol Number of Observations Read 118 Number of Observations Used 118 The GLM Procedure Dependent Variable: vitd Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE vitd Mean Source DF Type III SS Mean Square F Value Pr > F dk <.0001 sol

25 Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 dk <.0001 sol B sol B... Parameter 95% Confidence Limits Intercept dk sol sol 1.. NOTE: The X X matrix has been found to be singular, and a generalized inverse was used to solve the normal equations. Terms whose estimates are followed by the letter B are not uniquely estimable. Vi ser, at heller ikke de (lidt) forskellige solvaner kan forklare forskellen mellem landene. Estimatet for forskellen ændrer sig ikke meget i forhold til hverken spm. 2 eller spm Kan kostsammensætningen forklare noget af forskellen på Danmark og Polen? Er der forskel på vitamin D indtaget i de to lande? Her lægges der igen op til et T-test, men først en figur 25

26 Vi ser her ret skæve fordelinger, så når vi sammenligner niveauerne i de to lande, gør vi det på logaritmisk skala: T-testet giver The TTEST Procedure Variable: lvitdintake country N Mean Std Dev Std Err Minimum Maximum 1:DK :PL Diff (1-2) country Method Mean 95% CL Mean Std Dev 1:DK :PL Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F

27 og altså ingen signifikant forskel på Danmark og Polen (P=0.59). Har forskellen et fortegn, der kunne tyde på, at det forklarer noget af den fundne forskel i vitamin D indholdet i blodet? Da danske kvinder ses at indtage lidt større mængder af vitamin D, går forskellen den rigtige vej for at forklare forskellen i vitamin D indhold i blodet, men... Prøv evt. at tilføje vitamin D indtaget som ekstra kovariat i en af de tidligere modeller, og sammenlign igen de to kvinder med BMI=25, denne gang forudsat at de har samme vitamin D indtag. Konklusion? Her skal vi bestemme os for, hvordan vitamin D indtaget skal indgå i modellen. Ovenfor blev det logaritmetransformeret, forsi vi så, at fordelingen var ret skæv, men nu skal den fungere som kovariat, og så er der ikke noget krav om en bestemt fordeling. Hvis vi kører en model med vitd som outcome og vitdintake (og bmi) som forklarende variabel (altså begge utransformerede), får vi som en del af model checket nedenstående plot af residualer mod vitdintake 27

28 Da dette synes at vise en bue, vælges det at lade vitdintake logaritmetransformere. Det vil da være naturligt også at logaritmetransformere vitd, hvilket vi jo også tidligere har gjort. Efterfølgende modelkontrol må så vise, om denne model er OK. Da bmi har så lille effekt, kunne vi også se på plots af original observationer af vitd mod vitdintake som mildest taget heller ikke ser overbevisende lineært ud. Bedre ser det ud, når begge er logaritmeret: Vi kører derfor modellen 28

29 proc glm plots=(diagnostics residuals) data=a1; where land in (1,2); model vitd=dk bmi vitdintake / solution clparm; og får outputtet The GLM Procedure Dependent Variable: lvitd Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE lvitd Mean Source DF Type III SS Mean Square F Value Pr > F dk bmi lvitdintake <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 dk bmi lvitdintake <.0001 Parameter 95% Confidence Limits Intercept dk bmi lvitdintake der viser en overbevisende effekt af vitamin D indtaget (P < ), kvantificeret ved hældningen (0.244, 0.407). Da analysen er foretaget med beege disse variable logaritmetransformeret, svarer denne hældning til en potens, således at hvis man fordobler sit indtag, så vil vitamin D indholdet i blodet stige med en faktor = 1.25, altså en 25% forøgelse, med konfidensgrænser ( , ) = (1.18, 1.33) Nogle enkelte fik den ide at se på, om der skulle være en interaktion mellem vitdintake og land. Hvis man ignorere såvel bmi som sol og blot tegner en regressionslinie for hvert land for sig, finder man nedenstående plot, som kraftigt tyder i den retning: 29

30 Når vi skal sætte tal på disse højst forskellige linier, gør vi kovariaten dk til en class-variabel (det betyder ikke noget, så længe der kun er to værdier, men det letter overskueligheden af outputtet): proc glm plots=(diagnostics residuals) data=a1; where land in (1,2); class dk sol; model vitd=dk bmi sol vitdintake vitdintake*dk / solution clparm; og får outputtet The GLM Procedure Class Level Information Class Levels Values dk sol Number of Observations Read 118 Number of Observations Used 118 Dependent Variable: lvitd Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE lvitd Mean

31 Source DF Type III SS Mean Square F Value Pr > F dk bmi sol lvitdintake <.0001 lvitdintake*dk Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 dk B dk B... bmi sol B sol B... lvitdintake B <.0001 lvitdintake*dk B lvitdintake*dk B... Parameter 95% Confidence Limits Intercept dk dk 1.. bmi sol sol 1.. lvitdintake lvitdintake*dk lvitdintake*dk 1.. som viser, at der faktisk er signifikant forskel på hældningerne i de to lande, da Danmark har en hældning, der er større end Polen (P=0.012). Der er en begrundet mistanke om, at denne forskel i hældning skyldes en mere præcis registrering af vitamin D indtaget i Danmark. Det er nemlig sådan, at hvis der er fejl/støj på kovariat-værdierne, så vil sammenhængen tage sig svagere ud. Men alt i alt må man sige, at vi indtil videre ikke har fundet de vise sten til forklaring af forskellen på vitamin D niveauet i Danmark og Polen. Reference: Andersen R, et.al.: Teenage girls and elderly women living in northern Europe have low winter vitamin D status. Eur J Clin Nutr Apr;59(4):

Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november)

Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) Hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin D status i Europa, har man

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 Sammenligning af to grupper: T-test Dimensionering af undersøgelser

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE Økonomisk Kandidateksamen Teoretisk Statistik Eksamenstermin: Sommer 2004, dato: 3. juni 4 timers prøve med alle hjælpemidler, besvarelse på Dansk Opgave En simpel tilfældig stikprøve på 500 udtrukket

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2006. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 6 sider.

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Reeksamen i Statistik for biokemikere. Blok 3 2007.

Reeksamen i Statistik for biokemikere. Blok 3 2007. Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30.

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer. Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner

Læs mere

Restsaltmængdernes afhængighed af trafikken,

Restsaltmængdernes afhængighed af trafikken, Restsaltmængdernes afhængighed af trafikken, Thomas Glue, marts 2. Trafikintensitet...2 Indledende definitioner...2 Regressionsanalyser på trafikintensiteten...6 Justering af restsaltmængder i henhold

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017 Faculty of Health Sciences Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 26. september 2017 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Program. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression

Program. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression Program Indhold af kursus i overskrifter 1. overblik over kursus (opgaver fra sidst samt huspriser som eksempler). 2. p-værdi 3. uformel evaluering 1. sandsynlighedsregning sandsynlighedsfordelinger (normal,

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017 Faculty of Health Sciences Basal statistik Lille SAS Manual Lene Theil Skovgaard 31. januar 2017 1 / 42 Selve sproget Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual Faculty of Health Sciences Selve sproget Basal statistik Lille SAS Manual Lene Theil Skovgaard 5. september 2017 Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 24. oktober 2017 Biokemisk iltforbrug,

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren Faculty of Life Sciences Program Sammenligning af grupper Ensidet ANOVA Claus Ekstrøm E-mail: ekstrom@life.ku.dk Sammenligning af to grupper: tre eksempler Sammenligning af mere end to grupper: ensidet

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Den generelle lineære model mv. Lene Theil Skovgaard. 14. marts 2017

Faculty of Health Sciences. Basal statistik. Den generelle lineære model mv. Lene Theil Skovgaard. 14. marts 2017 Faculty of Health Sciences Basal statistik Den generelle lineære model mv. Lene Theil Skovgaard 14. marts 2017 1 / 96 Den generelle lineære model mv. Ikke-lineære sammenhænge Opbygning af modeller Sammenligning

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i

(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i Da er r i = e i ˆσ ei t(n 3) (tæt på N(0,1) hvis n ikke alt for lille). Program 1. lineær regression: opgave 3 og 13 (sukker-temperatur). 2. studentiserede residualer, multipel regression. Tommelfinger-regel:

Læs mere

2. januar 2015 Proj.nr. 2001474 Version 1 LRK/EHBR/EVO/CCM/MT. Rapport

2. januar 2015 Proj.nr. 2001474 Version 1 LRK/EHBR/EVO/CCM/MT. Rapport Rapport Projekt: Fedtkvalitet i moderne svineproduktion Betdning af jodtal for udbtter af kogeskinker Lars Kristensen, Eva Honnens de Lichtenberg Broge, Eli Vibeke Olsen, Chris Claudi- Magnussen 2. januar

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 4. oktober 2016 Parret sammenligning, målemetoder med

Læs mere

Træningsaktiviteter dag 3

Træningsaktiviteter dag 3 Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/?? Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere