Basal statistik. 30. september 2008

Størrelse: px
Starte visningen fra side:

Download "Basal statistik. 30. september 2008"

Transkript

1 Basal statistik 30. september 2008

2 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol

3 Peter Dalgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet Slides af Lene T. Skovgaard findes på

4 variansanalyse, september ANOVA (variansanalyse) i relation til t-test antal grupper, behandlinger, forskellige individer (units) samme individ (unit) situationer el.lign. 2 uparret t-test parret t-test 3 ensidet anova tosidet anova Tosidet variansanalyse forekommer dog oftest i anden sammenhæng: Personerne kan inddeles efter flere forskellige inddelingskriterier (f.eks. rygestatus og aktivitetsniveau)

5 variansanalyse, september Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium? Er der forskel på effektiviteten af diverse præparater til nedsættelse af blodtrykket? Afhænger lungefunktionen af rygestatus? Og af aktivitetsniveau? Datastruktur: Et antal personer (n) fordelt i et antal veldefinerede grupper (k) Analyseform er ensidet variansanalyse Personerne er inddelt efter flere forskellige inddelingskriterier (f.eks. rygestatus og aktivitetsniveau) Analyseform er tosidet (flersidet) variansanalyse

6 variansanalyse, september Sammenligning af mere end 2 grupper Eksempel: 22 ptt. bypass-operationer, randomiseret til 3 slags ventilering Outcome: Red cell foliate (noget med folinsyre) Gruppe I Gruppe II 50% N 2 O, 50% O 2 i 24 timer 50% N 2 O, 50% O 2 under op. Gruppe III 30 50% O 2 (ingen N 2 O) i 24 timer Gr.I Gr.II Gr.III n Mean SD Er der forskel på fordelingerne af responset i de enkelte grupper? Er der forskel på niveauerne i de enkelte grupper?

7 variansanalyse, september Pas på massesignifikans: sammenlign ikke alle grupper to og to! med mindre... (se senere)

8 variansanalyse, september Ensidet variansanalyse, ANOVA (one-way analysis of variance) ensidet: fordi der kun er et inddelingskriterium, f.eks. som her ventileringsmetode variansanalyse: fordi man sammenligner variansen mellem grupper med variansen indenfor grupper Antagelser: Alle observationer er uafhængige (personerne går ikke igen flere gange, er ikke tvillinger o.l.) Der er samme varians (samme spredning, dvs. biologisk variation) i alle grupper Inden for hver gruppe er observationerne normalfordelt

9 variansanalyse, september Model: Y gi = µ g + ε gi i te observation i gruppe nr. g individuel afvigelse middelværdi for gruppe nr. g Observationerne antages at følge en normalfordeling (inden for hver gruppe) med samme spredning σ. ε gi N(0, σ 2 ), Y gi N(µ g, σ 2 )

10 variansanalyse, september Ensidet variansanalyse går ud på at undersøge, om alle k grupper kan tænkes at have samme middelværdi, altså at teste hypotesen: H 0 : µ 1 = µ 2 = = µ k Fremgangsmåde ved ensidet variansanalyse: Variansestimater for hver gruppe pooles til et fælles estimat, s 2, som er et skøn over (den fælles) varians indenfor grupper. Hypotesen om ens middelværdier for alle grupper (H 0 : µ g = µ) testes ved et F-test på forholdet mellem variation mellem grupper og variation indenfor grupper.

11 variansanalyse, september Kvadratsummer Opspaltning af observationer: y gi ȳ = (y gi ȳ g ) + (ȳ g ȳ ) y gi ȳ g ȳ. i-te observation i g-te gruppe gennemsnit i g-te gruppe totalgennemsnit Opspaltning af variation (kvadratsum, sum of squares, SS): (y gi ȳ ) 2 = (y gi ȳ g ) 2 + (ȳ g ȳ ) 2 i,j i,j i,j }{{}}{{} indenfor grupper mellem grupper SS tot = SS w + SS b (n 1) = (n k) + (k 1)

12 variansanalyse, september Middelkvadratsummer (Mean Squares, MS): MS w = SS w /(N k): Poolet varians indenfor de 3 grupper MS b = SS b /(k 1): Varians mellem gruppegennemsnit Teststørrelse: F = MS b MS w Vi forkaster nulhypotesen hvis F er stor, dvs. hvis variationen mellem grupper er for stor i forhold til variationen indenfor grupper. Variansanalyseskema df SS MS F P Between Within Total

13 variansanalyse, september Ensidet ANOVA i SAS: OBS: Data sættes op i 2 kolonner, en med outcome (redcell) og en med klassifikationsvariablen (grp). I Analyst: Statistics ANOVA One-Way ANOVA... hvor redcell er Dependent og grp er Class : The ANOVA Procedure Class Level Information Class Levels Values grp Number of observations 22

14 variansanalyse, september Dependent Variable: redcell Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE redcell Mean Source DF Anova SS Mean Square F Value Pr > F grp

15 variansanalyse, september Hvis man også vil have estimater og konfidensgrænser...og det vil man vel som regel: Statistics ANOVA Linear Models, afkryds Parameter Estimates klik Statistics og Gå endvidere ud i koden og tilføje clparm i model-linien: model redcell=grp / solution clparm; hvorved man vil få Standard Parameter Estimate Error t Value Pr > t 95% Confidence Limits Intercept B < grp B grp B grp B.....

16 variansanalyse, september Normalfordelingsantagelsen Det er antaget, at observationerne følger en normalfordeling inden for hver gruppe. Dette bør checkes, f.eks.: ved at tegne histogrammer eller fraktildiagrammer for hver gruppe ved at tegne histogram eller fraktildiagram for residualerne r gi = Y gi ˆµ g = Y gi Ȳg ved at lave normalfordelingstest, enten for hver gruppe for sig, eller samlet for residualerne

17 variansanalyse, september Histogram af residualer, med overlejret normalfordeling: Flot er det jo ikke men hvad kan man forvente med kun 22 observationer...

18 variansanalyse, september Fraktildiagram: Tests for Normality Test --Statistic p Value Shapiro-Wilk W Pr < W Kolmogorov-Smirnov D Pr > D > Cramer-von Mises W-Sq Pr > W-Sq > Anderson-Darling A-Sq Pr > A-Sq > Her vurderes normalfordelingsantagelsen at være OK

19 variansanalyse, september Test for identiske varianser/spredninger i de 3 grupper (en af forudsætningerne for den ensidede variansanalyse) Dette testes ved at klikke Test og afkrydse i Levenes test : Levene s Test for Homogeneity of redcell Variance ANOVA of Squared Deviations from Group Means Sum of Mean Source DF Squares Square F Value Pr > F grp Error Ved sammenligning af de k = 3 variansestimater fås en teststørrelse på 4.14, som er F(2,19)-fordelt, svarende til P=0.03, og altså signifikans!

20 variansanalyse, september Antagelsen om varianshomogenitet kan også checkes grafisk med residualplot: Residualer tegnes op mod predikterede (=forventede=fittede) værdier Det giver dog ikke så meget ny information...

21 variansanalyse, september Multiple sammenligninger Problem: F-test viser, at der nok er forskel men hvor? Parvise t-test ikke godt pga. massesignifikans Der er m = k(k 1)/2 mulige test, reelt signifikansniveau: 1 (1 α) m, f.eks. for k=5: 0.40

22 variansanalyse, september Hvad gør man så i praksis? Der findes ikke nogen helt tilfredsstillende løsning, men 1. Prøv at undgå problemet (fokuser problemstillingen) 2. Udvælg et (lille) antal relevante sammenligninger på forhånd, dvs. skriv dem ind i protokollen! 3. Tegn gennemsnit ±2 SEM og brug øjemålet (!?), evt. suppleret med F-tests på delsæt af grupper. 4. Modificer t-test ved at gange P med antallet af tests, den såkaldte Bonferroni korrektion (konservativ) eller anden form for korrektion (Dunnett, Tukey).

23 variansanalyse, september Statistics ANOVA One-Way ANOVA... Tryk Plots og videre i Means Plot Her med Bars på 2 s.e., dvs. konfidensintervaller for middelværdierne I direkte programmering ændres i symbol-sætningen: symbol1 v=circle i=std1jt l=1 h=3 w=2;

24 variansanalyse, september Korrektion for multiple sammenligninger Bonferroni benytter signifikansniveau α m stærkt konservativ, dvs. for høje P-værdier (lav styrke) Sidak benytter signifikansniveau 1 (1 α) 1 m α m for små m lidt mindre konservativ, men stadig ret lav styrke Tukey baseres på fordeling af størst blandt mange giver større styrke Dunnett korrigerer kun for test mod referencegruppe (typisk en kontrolgruppe eller tid 0 )

25 variansanalyse, september Multiple sammenligninger i SAS Analyst: Vælg Statistics/Anova/Linear Models og herunder Means/LS Means, vælg grp og compute p s for pairwise differences samt Bonferroni eller Tukey som Adjustment Method: For også at få konfidensintervaller, skal man ud i koden og tilføje cl i lsmeans-sætningen: lsmeans grp / pdiff adjust=bonferroni cl; lsmeans grp / pdiff adjust=tukey cl;

26 variansanalyse, september Eksempel på SAS output for Bonferroni korrektionen: Adjustment for Multiple Comparisons: Bonferroni Least Squares Means for effect grp Pr > t for H0: LSMean(i)=LSMean(j) Dependent Variable: redcell i/j Adjustment for Multiple Comparisons: Bonferroni Difference Simultaneous 95% Between Confidence Limits for i j Means LSMean(i)-LSMean(j)

27 variansanalyse, september Eksempel på SAS output for Tukey korrektionen: Adjustment for Multiple Comparisons: Tukey-Kramer Least Squares Means for effect grp Pr > t for H0: LSMean(i)=LSMean(j) Dependent Variable: redcell i/j Adjustment for Multiple Comparisons: Tukey-Kramer Difference Simultaneous 95% Between Confidence Limits for i j Means LSMean(i)-LSMean(j)

28 variansanalyse, september Hvis antagelserne ikke holder: Transformation (ofte logaritmer) kan afhjælpe såvel variansinhomogenitet som dårlig normalfordelingstilpasning Man kan lave vægtet analyse (Welch s test), ligesom ved T-test Statistics ANOVA One-Way ANOVA... Klik Tests og afkryds Welch s variance-weighted test Welch s ANOVA for redcell Source DF F Value Pr > F grp Error Vi er altså ikke alt for sikre på den fundne forskel...

29 variansanalyse, september Analyse af logaritmerede data: Dependent Variable: logredcell Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE logredcell Mean Source DF Anova SS Mean Square F Value Pr > F grp Levene s Test for Homogeneity of logredcell Variance ANOVA of Squared Deviations from Group Means Sum of Mean Source DF Squares Square F Value Pr > F grp Error

30 variansanalyse, september Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 grp B grp B grp B... Parameter 95% Confidence Limits Intercept grp grp grp 3..

31 variansanalyse, september Fortolkning af logaritmeret analyse Eksempelvis forskel mellem gruppe 1 og gruppe 3: Estimatet var med konfidensgrænser ( , ) Det skal tilbagetransformeres: = med konfidensgrænser ( , ) = (0.933, 1.363) Det betyder, at gruppe 1 estimeres til at ligge 12.8% højere end gruppe 3, med 95% grænser fra 6.7% under til 36.3% over.

32 variansanalyse, september Non-parametrisk Kruskal-Wallis test: Statistics ANOVA Nonparametric One-Way ANOVA... hvor redcell sættes som Dependent og grp som Independent (dårlig betegnelse): Kruskal-Wallis Test Chi-Square DF 2 Asymptotic Pr > Chi-Square Exact Pr >= Chi-Square Bemærk: Man kan også få en eksakt vurdering af teststørrelsen, men pas på i tilfælde af store materialer!

33 variansanalyse, september Direkte programmering: /* indlæsning af data og dannelse af sasuser.redcell */ data sasuser.redcell; input grp redcell; datalines; ; run;

34 variansanalyse, september /* scatter plot, s. 4 */ proc gplot data=a1; plot redcell*grp / haxis=axis1 vaxis=axis2 frame; axis1 order=(1 to 3 by 1) offset=(8,8) label=(h=3 gruppe nr. ) value=(h=3) minor=none; axis2 offset=(1,1) value=(h=3) minor=none label=(a=90 R=0 H=3 red cell foliate ); symbol1 v=circle i=none l=1 h=3 w=2; run; /* analyse s ,16,25 */ proc anova data=sasuser.redcell; class grp; model redcell=grp; /* s. 10 */ means grp / hovtest=levene welch; /* s */ output out=ny p=predikt r=resid; run;

35 variansanalyse, september /* analyse s. 12,16,24 */ proc glm data=sasuser.redcell; class grp; model redcell=grp / solution clparm; /* s. 12 */ means grp / hovtest=levene; /* s. 16 */ lsmeans grp / pdiff adjust=tukey cl; /* s. 24 */ run; /* figurer s. 14,15 */ proc univariate normal data=ny; var resid; histogram / cfill=gray height=3 normal; /* s. 14 */ probplot / height=3 normal(mu=est sigma=est l=33); /* s. 15 */ inset mean std skewness / header= descriptive ; run; /* nonparametrisk sammenligning, s. 29 */ proc npar1way data=a1 anova wilcoxon; exact wilcoxon; class grp; var redcell; run;

36 variansanalyse, september ANOVA (variansanalyse) i relation til t-test antal grupper, behandlinger, forskellige individer (units) samme individ (unit) situationer el.lign. 2 uparret t-test parret t-test 3 ensidet anova tosidet anova Tosidet variansanalyse forekommer dog oftest i anden sammenhæng: Personerne kan inddeles efter flere forskellige inddelingskriterier (f.eks. rygestatus og aktivitetsniveau)

37 variansanalyse, september Korttidseffekt af enalaprilat på puls, gentagne målinger Tid Person mean mean Ved sammenligning af tidspunkter skal man eliminere variation mellem personer, ganske som i et parret t-test

38 variansanalyse, september Linieplot ( Spaghettiogram ) Puls vs. tid, observationer hørende til samme person forbundet. Ideelt er forløbene parallelle (additivitet).

39 variansanalyse, september Additiv model: Der er effekt af person (p) og tid (t): Y pt = µ + α p + β t + ε pt og disse virker additivt (de skal lægges sammen). (Nødvendigt med passende bånd på parametrene, i SAS f.eks. α 9 = β 4 = 0). ε pt uafhængige, middelværdi 0, samme spredning, normalfordelte, dvs. ε pt N(0, σ 2 ). Variationsopspaltning: SS tot = SS person + SS tid + SS res

40 variansanalyse, september Forsøg på grafisk illustration af modellen: Ideelt set parallelle forløb, overlejret med normalfordelt variation giver mere irregulære forløb. Person 1 Person 1 Person 2 Person 2 Time point Time point

41 variansanalyse, september Variansanalyseskema df SS MS F P Personer < Tid Resid Total Højsignifikant forskel på personer (forventeligt, men ikke så interessant) Signifikant tidsforskel, P=0.018, men vi mangler estimater!

42 variansanalyse, september Man kan igen med fordel anvende: Statistics/Anova/Linear Models med puls som Dependent og både person og tid som Class-variable. I Statistics vælges Parameter Estimates: Class Level Information Class Levels Values person tid Number of observations 36 Dependent Variable: puls Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE puls Mean

43 variansanalyse, september Source DF Type III SS Mean Square F Value Pr > F tid person <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 tid B tid B tid B tid B... person B person B person B <.0001 person B <.0001 person B <.0001 person B person B <.0001 person B <.0001 person B... Bemærk, at de sidste niveauer af hver faktor (Class-variabel) bliver sat til 0 De kaldes referenceniveauer

44 variansanalyse, september Forventede værdier for person=3, tid=30: ŷ pt = ˆµ + ˆα p + ˆβ t = = Residualer r pt = y pt ŷ pt = y pt ȳ p. ȳ.t + ȳ.. Altså f.eks. ŷ 32 = r 32 = = 0.84

45 variansanalyse, september Modelkontrol Se efter: Varianshomogenitet (systematik, trompet?) Normalfordelingstilpasning (tunge haler?, skæv fordeling?) Mangel på additivitet (vekselvirkning):. kan kun undersøges hvis der er flere observationer pr. celle Seriel korrelation? (Naboobservationer hænger tættere sammen)

46 variansanalyse, september Residualer vs. forventede værdier Der bør ikke ses nogen systematik.

47 variansanalyse, september Check af normalfordelingsantagelsen: Det ser rimeligt ud

48 variansanalyse, september Check af uafhængighed er rimeligt her, da der er flere observationer for hver person Vi har godt nok et personniveau, men der kunne være ekstra seriel korrelation, dvs. at naboresidualer kunne ligne hinanden Modeller, der inkluderer sådanne korrelationer, går under navnet Repeated measurements

49 variansanalyse, september Der ser ikke ud til at være seriel korrelation her

50 variansanalyse, september Direkte programmering af den tosidede variansanlyse: data sasuser.puls; infile puls.tal firstobs=2; input person tid0 tid30 tid60 tid120; /* udfoldning af data til 4 linier pr. person */ tid=0; puls=tid0; output; tid=30; puls=tid30; output; tid=60; puls=tid60; output; tid=120; puls=tid120; output; run; /* figur s. 35 */ proc gplot data=sasuser.puls; plot puls*tid=person / nolegend haxis=axis1 vaxis=axis2 frame; axis1 value=(h=3) minor=none label=(h=3); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3); symbol1 v=circle i=join c=black l=2 h=3 w=2 r=9; run;

51 variansanalyse, september /* analyse s */ proc glm data=sasuser.puls; class person tid; model puls=tid person / solution; output out=ny p=predikt r=resid; run; /* figur s. 43 */ proc gplot gout=plotud data=ny; plot resid*yhat / vref=0 lv=33 haxis=axis1 vaxis=axis2 frame; axis1 value=(h=3) minor=none label=(h=3 Expected ); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3 Residual ); symbol1 v=circle i=none c=black h=3 l=2 w=2 r=9; run; /* figurer s. 44 */ proc univariate normal data=ny gout=plotud; var resid; histogram / cfill=gray height=3 normal; probplot / height=3 normal(mu=est sigma=est l=33); inset mean std skewness / header= descriptive ; run;

52 variansanalyse, september data b1; set ny; lagresid=lag(resid); run; /* figur s. 46 */ proc gplot gout=plotud data=b1; where tid>0; plot resid*lagresid / href=0 lh=33 vref=0 lv=33 haxis=axis1 vaxis=axis2 frame; axis1 value=(h=3) minor=none label=(h=3 forrige residual ); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3 residual ); symbol1 v=circle i=none c=black h=3 l=2 w=2 r=9; run;

53 variansanalyse, september Eksempel på vekselvirkning (interaktion): To inddelingskriterier: køn og rygestatus Outcome: FEV 1 Effekten af rygning afhænger af køn Forskellen på kønnene afhænger af rygestatus

54 variansanalyse, september Mulige forklaringer: biologisk forskel på effekt af rygning holder vist ikke i praksis, men eksemplet er jo også blot tænkt måske ryger kvinderne ikke helt så meget antal pakkeår confounder for køn måske virker rygningen som en relativ (%-vis) nedsættelse af FEV 1 kunne undersøges ved en longitudinel undersøgelse

55 variansanalyse, september Eksempel: Rygnings effekt på fødselsvægt

56 variansanalyse, september Interaktion/vekselvirkning mellem mængden og varigheden af rygningen Der er effekt af mængden, men kun hvis man har røget længe. Der er effekt af varigheden, og denne effekt øges med mængden. Effekten af mængden afhænger af... og effekten af varigheden afhænger af...

57 variansanalyse, september Eksempel: Fibrinogen efter miltoperation 34 rotter randomiseres, på 2 måder 17 får fjernet milten (splenectomy=yes) 8/17 i hver gruppe opholder sig i stor højde (place=altitude) Outcome: Fibrinogen niveau i mg% ved dag 21

58 variansanalyse, september

59 variansanalyse, september Den sædvanlige additive model: Y spr = µ + α s + β p + ε spr splenectomy (s=yes/no) og place (p=altitude/control) virker additivt. Model med interaktion (vekselvirkning) Y spr = µ + α s + β p + γ sp + ε spr Her specificeres en interaktion mellem splenectomy og place, dvs. effekten af ophold i stor højde tænkes at afhænge af, hvorvidt man har fået fjernet milten eller ej. og omvendt...

60 variansanalyse, september Tosidet variansanalyse med vekselvirkning: Statistics ANOVA Linear Models hvor fibrinogen sættes som Dependent og såvel splenectomy som place som Class. For at få interaktionsleddet med, klikkes nu Model, hvorefter man udvælger begge variable og trykker Cross/Add: The GLM Procedure Class Level Information Class Levels Values splenectomy 2 no yes place 2 altitude control Number of observations 34

61 variansanalyse, september Dependent Variable: fibrinogen Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE fibrinogen Mean Source DF Type I SS Mean Square F Value Pr > F place splenectomy splenectomy*place Source DF Type III SS Mean Square F Value Pr > F place splenectomy splenectomy*place

62 variansanalyse, september Standard Parameter Estimate Error t Value Intercept B place altitude B place control B.. splenectomy no B splenectomy yes B.. splenectomy*place no altitude B splenectomy*place no control B.. splenectomy*place yes altitude B.. splenectomy*place yes control B.. Parameter Pr > t Intercept <.0001 place altitude place control. splenectomy no splenectomy yes. splenectomy*place no altitude splenectomy*place no control. splenectomy*place yes altitude. splenectomy*place yes control.

63 variansanalyse, september Estimater Referenceniveauerne er: place=control, splenectomy=yes (de sidste i den alfabetiske rækkefølge) Denne gruppe har et forventet fibrinogenniveau på intercept= For de andre niveauer skal der adderes et eller flere korrektionsled, således: place splenectomy control altitude yes = no = =

64 variansanalyse, september Vi kan godt få SAS til at udregne disse niveauer explicit: I Model under Linear Models fjernes hovedvirkningerne, og der afkrydses i No intercept Source DF Type III SS Mean Square F Value Pr > F splenectomy*place <.0001 Standard Parameter Estimate Error t Value splenectomy*place no altitude splenectomy*place no control splenectomy*place yes altitude splenectomy*place yes control Parameter Pr > t splenectomy*place no altitude <.0001 splenectomy*place no control <.0001 splenectomy*place yes altitude <.0001 splenectomy*place yes control <.0001 men så mister vi muligheden for at teste

65 variansanalyse, september Vekselvirkningen er ikke signifikant (P=0.77), så vi simplificerer til en tosidet variansanalyse uden vekselvirkning: The GLM Procedure Dependent Variable: fibrinogen Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE fibrinogen Mean Source DF Type III SS Mean Square F Value Pr > F place splenectomy

66 variansanalyse, september Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 place altitude B place control B... splenectomy no B splenectomy yes B... Parameter 95% Confidence Limits Intercept place altitude place control.. splenectomy no splenectomy yes..

67 variansanalyse, september Modelkontrolplots:

68 variansanalyse, september Test for normalitet: Goodness-of-Fit Tests for Normal Distribution Test ---Statistic p Value----- Kolmogorov-Smirnov D Pr > D >0.150 Cramer-von Mises W-Sq Pr > W-Sq Anderson-Darling A-Sq Pr > A-Sq 0.160

69 variansanalyse, september Direkte programmering af interaktion: data a1; input place $ splenectomy $ fibrinogen; datalines; a y 528 a y 444 a y 228 c n 388 c n 425 c n 344 c n 425 ; run;

70 variansanalyse, september data sasuser.fibrinogen; set a1; if place= a then place= altitude ; if place= c then place= control ; if splenectomy= y then splenectomy= yes ; if splenectomy= n then splenectomy= no ; if place= a and splenectomy= y then group= yes_altitude ; if place= c and splenectomy= y then group= yes_control ; if place= a and splenectomy= n then group= no_altitude ; if place= c and splenectomy= n then group= no_control ; run; /* figur s. 55 */ proc gplot data=sasuser.fibronogen; plot fibrinogen*group / nolegend haxis=axis1 vaxis=axis2 frame; axis1 offset=(3,3) value=(h=2) minor=none label=(h=3); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3); symbol1 v=circle i=none c=black h=3; run;

71 variansanalyse, september /* analyse s */ proc glm data=sasuser.fibronogen; class splenectomy place; model fibrinogen=place splenectomy place*splenectomy / solution; *output out=ny p=yhat r=resid; run; /* analyse s. 61 */ proc glm data=sasuser.fibronogen; class splenectomy place; model fibrinogen=place*splenectomy / noint solution; run; /* analyse s */ proc glm data=sasuser.fibronogen; class splenectomy place; model fibrinogen=place splenectomy / solution clparm; output out=ny p=yhat r=resid; run;

72 variansanalyse, september /* figur s. 64 */ proc gplot data=ny; plot resid*yhat / haxis=axis1 vaxis=axis2 frame; axis1 value=(h=3) minor=none label=(h=3 Expected ); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3 Residual ); symbol1 v=circle i=none c=black h=3 l=2 w=2 r=9; run; /* figur og test s. 64,65 */ proc univariate normal data=ny; var resid; probplot / height=3 normal(mu=est sigma=est l=33); histogram / cfill=gray height=3 normal; inset mean std skewness / header= descriptive ; run;

Basal statistik. 2. oktober Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol

Basal statistik. 2. oktober Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Basal statistik 2. oktober 2007 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Lene Theil Skovgaard, Biostatistisk Afdeling Institut

Læs mere

Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium?

Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium? variansanalyse 1 variansanalyse 2 Basal statistik 27. februar 2007 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Judith Jacobsen Statcon

Læs mere

Basal statistik 3. oktober Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium?

Basal statistik 3. oktober Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium? variansanalyse, oktober 2006 1 Basal statistik 3. oktober 2006 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Lene Theil Skovgaard

Læs mere

Basal Statistik Variansanalyse. 24 september 2013

Basal Statistik Variansanalyse. 24 september 2013 Basal Statistik Variansanalyse 24 september 2013 Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk Lene Theil Skovgaard biostat.ku.dk/~lts/basal/overheads/anova.pdf

Læs mere

Dagens Tekst. Sammenligning Flere Grupper F Basal Statistik Variansanalyse. Basal Statistik - Variansanalyse 1

Dagens Tekst. Sammenligning Flere Grupper F Basal Statistik Variansanalyse. Basal Statistik - Variansanalyse 1 Basal Statistik Variansanalyse Judith L. Jacobsen, PhD. Lene Theil Skovgaard http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk Dagens Tekst ANOVA Ikke-parametriske test Fordelingsantagelse En-sidet

Læs mere

Variansanalyse. Variansanalyse. Basal Statistik Variansanalyse

Variansanalyse. Variansanalyse. Basal Statistik Variansanalyse Basal Statistik Variansanalyse 4 september 013 Michael Gambor Institut for sydomsforebyelse Københavns Universitetshospital michael.orland.ambor@reionh.dk Lene Theil Skovaard biostat.ku.dk/~lts/basal/overheads/anova.pdf

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 Sammenligning af to grupper: T-test Dimensionering af undersøgelser

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 10. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 10. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 10. september 2018 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Basal statistik. 25. september 2007

Basal statistik. 25. september 2007 Basal statistik 25. september 2007 Korrelation og regression Simpel lineær regression Todimensionale normalfordelinger Korrelation vs. regression Modelkontrol Diagnostics Lene Theil Skovgaard, Biostatistisk

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot Program Residualanalyse Flersidet variansanalyse Helle Sørensen Modelkontrol (residualanalyse) i tosidet ANOVA med vekselvirkning. Test og konklusion i tosidet ANOVA (repetition) Tresidet ANOVA: the works

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til

Læs mere

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22. Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 11. februar 2019 med instruktioner til SPSS-analyse svarende til nogle

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Basal statistik. 16. september 2008

Basal statistik. 16. september 2008 Basal statistik 16. september 2008 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 12. februar 2018 1 / 88 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren Faculty of Life Sciences Program Sammenligning af grupper Ensidet ANOVA Claus Ekstrøm E-mail: ekstrom@life.ku.dk Sammenligning af to grupper: tre eksempler Sammenligning af mere end to grupper: ensidet

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Basal statistik. 18. september 2007

Basal statistik. 18. september 2007 Basal statistik 18. september 2007 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017 Faculty of Health Sciences Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 26. september 2017 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

Eksempel , opg. 2

Eksempel , opg. 2 Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 1 / 92 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion VARIANSANALYSE 2 Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: (Analysis of variance) med interaktion Problem: Hvordan håndterer vi forsøg, hvor effekten er forårsaget af to faktorer og en evt.

Læs mere

Basal statistik. 18. september 2007

Basal statistik. 18. september 2007 Basal statistik 18. september 2007 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Eksempel: To metoder, som forventes at skulle give samme resultat: MF: Transmitral volumetric flow, bestemt ved Doppler ekkokardiografi

Eksempel: To metoder, som forventes at skulle give samme resultat: MF: Transmitral volumetric flow, bestemt ved Doppler ekkokardiografi En- og to-stikprøve problemer 1 En- og to-stikprøve problemer 2 Basal statistik 13. februar 2007 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere