Basal Statistik Variansanalyse. 24 september 2013

Størrelse: px
Starte visningen fra side:

Download "Basal Statistik Variansanalyse. 24 september 2013"

Transkript

1 Basal Statistik Variansanalyse 24 september 2013

2 Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital Lene Theil Skovgaard biostat.ku.dk/~lts/basal/overheads/anova.pdf

3 Variansanalyse Fordelingsantagelse En-sidet To-sidet Interaktion Model kontrol ANOVA ANalysis Of VAriance E2013 Basal Statistik - Variansanalyse 3

4 Variansanalyse Typiske problemstillinger Hvordan afhænger behandlingen af sygdomstadium Er der forskel i effekten af diverse præperater til nedsættelse af blodtrykket Afhænger lungefunktionen af rygestatus? Og af fysiskaktivitet? Datastruktur Ensidet variansanalyse Et antal personer (N) opdelt i veldefinerede grupper (k) Tosidet variansanalyse Personerne er inddelt efter flere forskellige indelingskriterier, f. eks. Rygning og fysiskaktivitet E2013 Basal Statistik - Variansanalyse 4

5 Variansanalyse Én-sidet To-sidet Fler-sidet En faktor med mere end 2 grupper To faktorer Flere faktorer En-sidet variansanalyse med 2 grupper eller niveauer er præcis det samme som et t-test E2013 Basal Statistik - Variansanalyse 5

6 Variansanalyse Sammenligner varianser mellem grupper med varianser indenfor grupper Variansen inden for grupper er den biologiske variation. Hvis den biologiske variation er stor vil den tilfældige variation mellem grupperne også blive stor E2013 Basal Statistik - Variansanalyse 6

7 Én-sidet Variansanalyse Kvalitativ faktor & kvantitativ respons Eksempel: 22 ptt. bypass-operationer, 3 slags ventilation (randomiseret) Gruppe I 50% N2O, 50% O2 i 24 timer Gruppe II 50% N2O, 50% O2 under op. Gruppe III 30 50% O2 (ingen N2O) i 24 timer Er der forskel på fordelingen af responset (red cell foliate) i de tre grupper? Er der forskel på niveauerne i de tre grupper? E2013 Basal Statistik - Variansanalyse 7

8 Én-sidet Variansanalyse Kan vi ikke bare sammenligne grupperne parvis med t-test Problem: Massesignifikans (se senere) axis1 ORDER = (1 to 3 by 1) OFFSET=(8,8) LABEL=(H=2 'gruppe nr.') VALUE=(H=2) MINOR=none ; axis2 OFFSET=(1,1) LABEL=(a=90 R=0 H=2 'red cell foliate') VALUE=(H=2) MINOR=none ; symbol1 V=circle I=none H=2 C=black ; PROC GPLOT DATA=sasuser.redcell; PLOT redcell*grp/frame haxis=axis1 vaxis=axis2; RUN; E2013 Basal Statistik - Variansanalyse 8

9 Én-sidet Variansanalyse Én-sidet Der kun er et inddelingskriterium, f.eks. som her ventileringsmetode Variansanalyse: Fordi man sammenligner variansen mellem grupper med variansen indenfor grupper Antagelser: Alle observationer er uafhængige (personerne går ikke igen flere gange, ingen tvillinger o.l.) Inden for hver gruppe er observationerne normalfordelt Der er samme varians indenfor grupperne E2013 Basal Statistik - Variansanalyse 9

10 Én-sidet Variansanalyse Model Ygi = µ + g ε gi i te observation i gruppe nr. g middelværdi for gruppe nr. g individuel afvigelse Observationerne antages at følge en normalfordeling (inden for hver gruppe) med samme varians. ε gi ~ N(0, σ 2 ) Y gi ~ N( µ g, σ 2 ) E2013 Basal Statistik - Variansanalyse 10

11 Én-sidet Variansanalyse Vi undersøger om alle k grupper kan tænkes at have samme middelværdi H : µ = µ = L = µ k Variansestimaterne for hver gruppe pooles til et fælles estimat for variansen indenfor grupper H 0 testes ved at betragte forholdet mellem variationen mellem grupper og det fælles estimat for variansen indenfor grupper E2013 Basal Statistik - Variansanalyse 11

12 Kvadratsummer Opspaltning af observationer: y y gi y g i-te observation i g-te gruppe gennemsnit i g-te gruppe totalgennemsnit Opspaltning af variation (kvadratsum, sum of squares, SAK/SS): i, g y gi y = ( y y ) + ( y y ) gi 2 ( y.) = + gi y 2 ( ygi yg ) i, g indenfor grupper 2 ( yg y.) i, g mellem grupper E2013 Basal Statistik - Variansanalyse 12 g g

13 Kvadratsummer i, g 2 ( y ) = + gi y 2 ( ygi yg ) i, g indenfor grupper 2 ( yg y.) i, g mellem grupper SAK tot = SAK res +SAK grp SAK: Sum af Afvigelses Kvadrater SS tot = SS w + SS b SSD tot = SSD w + SSD b SS(D): Sum of Squares (of deviation) E2013 Basal Statistik - Variansanalyse 13

14 Kvadratsummer Opdeling af variansen Mellem grupper SAK grp (SS b ) Indenfor grupper SAK res (SS w ) Total variationen SAK tot (SS tot )opdeles i de to varians-komponenter SAK tot = SAK grp + SAK res E2013 Basal Statistik - Variansanalyse 14

15 Kvadratsummer Mellem grupper De forskelle der er mellem f.eks. Rygere og ikkeryger eller mellem social klasser Indenfor grupper De forskelle der er mellem f.eks. Individer Indenfor grupper-variansen kaldes også residual eller rest-variansen. E2013 Basal Statistik - Variansanalyse 15

16 F-Test Middelkvadratsummer (Mean Squares MS) MS w = SS w / (N-k): Poolet varians MS b = SS b / (k-1): Varians mellem gruppe gennemsnittene F = Teststørrelse: MS MS Vi forkaster hvis F er stor, altså hvis variationen mellem grupperne er stor i forhold til variationen indenfor grupper E2013 Basal Statistik - Variansanalyse 16 b w

17 Variansanalyseskema Varianstype SS df MS F = Mellem grp. SS k-1 SS/df MS/MS Indenf. grp SS N-k SS/df Total N-1 Varianstype SS df MS F = Mellem grp Indenf. grp Total E2013 Basal Statistik - Variansanalyse 17

18 Ensidet ANOVA i SAS Data sættes op i 2 variabler, en med outcome (redcell) og en med klassifikationsvariablen (grp) PROC GLM DATA=sasuser.redcell; CLASS grp; MODEL redcell=grp; RUN; Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE redcell Mean Source DF Anova SS Mean Square F Value Pr F grp E2013 Basal Statistik - Variansanalyse 18

19 Ensidet ANOVA i SAS Hvis man også vil have estimater og konfidensgrænser...og det vil man ALTID: PROC GLM DATA=sasuser.redcell; CLASS grp; MODEL redcell=grp / solution clparm; RUN; E2013 Basal Statistik - Variansanalyse 19

20 Normalfordelingsantagelsen Det er antaget, at observationerne følger en normalfordeling inden for hver gruppe Dette bør checkes, f.eks.: ved at tegne histogrammer eller fraktil-diagrammer for hver gruppe ved at tegne histogram eller fraktildiagram for residualerne r gi = Y ˆ µ gi g = Y gi _ Y g ved at lave normalfordelingstest, enten for hver gruppe for sig, eller samlet for residualerne E2013 Basal Statistik - Variansanalyse 20

21 Normalfordelingsantagelsen PROC GLM DATA=sasuser.redcell; CLASS grp; MODEL redcell=grp / solution clparm; OUTPUT OUT=ny P=predikt R=resid; RUN; QUIT; PROC UNIVARIATE normal DATA=ny; VAR resid; HISTOGRAM / normal cfill=gray height=3; PROBPLOT / normal(mu=est SIGMA=est L=33); RUN; E2013 Basal Statistik - Variansanalyse 21

22 Normalfordelingsantagelsen Histogram, med overlejret normalfordeling: Flot er det jo ikke men hvad kan man forvente med kun 22 observationer... E2013 Basal Statistik - Variansanalyse 22

23 Normalfordelingsantagelsen Probability plot: Normalfordelingstest: Tests for Normality Test Statistic p Value Shapiro-Wilk W Pr < W Kolmogorov-Smirnov D Pr > D > Cramer-von Mises W-Sq Pr >W-Sq > Anderson-Darling A-Sq Pr > A-Sq > Her er normalfordelingsantagelsen tilsyneladende OK E2013 Basal Statistik - Variansanalyse 23

24 Varianshomogenitet En af forudsætningerne for den ensidede variansanalyse er, at der er samme varians i alle grupper. PROC GLM DATA=sasuser.redcell; CLASS grp; MODEL redcell=grp / solution clparm; MEANS grp / HOVTEST=levene ; OUTPUT OUT=ny P=predikt R=resid; RUN; QUIT; axis3 OFFSET=(8,8) LABEL=(H=2 'predicted value') VALUE=(H=2) MINOR=none ; axis4 OFFSET=(1,1) LABEL=(a=90 R=0 H=2 'residual') VALUE=(H=2) MINOR=none ; symbol1 V=circle I=none H=2 W=2; PROC GPLOT DATA=ny; PLOT resid*predikt / frame haxis=axis3 vaxis=axis4; RUN; E2013 Basal Statistik - Variansanalyse 24

25 Varianshomogenitet Levenes test for varianshomogenitet: Level of redcell grp N Mean Std Dev Levene s Test for Homogeneity of redcell Variance ANOVA of Squared Deviations from Group Means Sum of Mean Source DF Squares Square F Value Pr > F grp Error Ved sammenligning af de k = 3 variansestimater fås teststørrelse på 4.14 F(2,19)-fordelt, svarende til P=0.03, og altså signifikans! E2013 Basal Statistik - Variansanalyse 25

26 Varianshomogenitet Grafisk check med residualplot: Residualer tegnes op mod predikterede (forventede, fittede) værdier E2013 Basal Statistik - Variansanalyse 26

27 Multiple sammenligninger Problem: F-test viser, at der nok er forskel men hvor? Parvise t-test ikke godt pga. massesignifikans Der er m = k(k 1)/2 mulige test, reelt signifikansniveau: 1 (1 α) m f.eks. for k=5: 0.40 E2013 Basal Statistik - Variansanalyse 27

28 Multiple sammenligninger Der findes ikke nogen helt tilfredsstillende løsning, men 1. Prøv at undgå problemet (fokuser problemstillingen) 2. Udvælg et (lille) antal relevante sammenligninger på forhånd, dvs. skriv dem ind i protokollen! 3. Tegn gennemsnit ±2 SEM og brug øjemål(!), evt. suppleret med F-tests på delsæt af grupper 4. Modificer t-test ved at gange P med antallet af tests såkaldt Bonferroni korrektion (konservativ) eller anden form for korrektion (Dunnett, Tukey). E2013 Basal Statistik - Variansanalyse 28

29 Multiple sammenligninger symbol1 V=circle I=std2mjt H=2 W=2; PROC GPLOT DATA=sasuser.redcell; PLOT redcell*grp / frame haxis=axis1 vaxis=axis2; RUN; Her med Bars på 2 s.e., dvs. konfidensintervaller for middelværdierne E2013 Basal Statistik - Variansanalyse 29

30 Multiple sammenligninger Bonferroni α α m signifikansniveau stærkt konservativ, dvs. for høje P-værdier lav styrke Sidak benytter signifikansniveau 1 1 ( 1 α ) m for små m m lidt mindre konservativ stadig ret lav styrke Tukey-Kramer baseres på fordeling af størst blandt mange giver større styrke Dunnett korrigerer kun for test mod referencegruppe (typisk en kontrolgruppe eller tid 0 ) E2013 Basal Statistik - Variansanalyse 30

31 Multiple sammenligninger i SAS PROC GLM DATA=sasuser.redcell; CLASS grp; MODEL redcell=grp / solution clparm; LSMEANS grp / pdiff adjust=bonferroni cl; LSMEANS grp / pdiff adjust=tukey cl; RUN; Adjustment for Multiple Comparisons: Bonferroni Least Squares Means for effect grp Pr > t for H0: LSMean(i)=LSMean(j) Dependent Variable: redcell i/j Adjustment for Multiple Comparisons: Tukey-Kramer Least Squares Means for effect grp Pr > t for H0: LSMean(i)=LSMean(j) Dependent Variable: redcell i/j E2013 Basal Statistik - Variansanalyse 31

32 Multiple sammenligninger i SAS Adjustment for Multiple Comparisons: Bonferroni Difference Simultaneous 95% Between Confidence Limits for i j Means LSMean(i)-LSMean(j) Adjustment for Multiple Comparisons: Tukey-Kramer Difference Simultaneous 95% Between Confidence Limits for i j Means LSMean(i)-LSMean(j) PROC GLM DATA=sasuser.redcell; CLASS grp; MODEL redcell=grp / solution clparm; LSMEANS grp / pdiff cl; RUN; Giver p værdier og konfidens grænser Uden justering for multipel testning E2013 Basal Statistik - Variansanalyse 32

33 Hvis antagelserne ikke holder Transformation (ofte logaritmer) kan afhjælpe såvel variansinhomogenitet som dårlig normalfordelingstilpasning Man kan lave vægtet analyse (Welch s test), ligesom ved T- test PROC GLM DATA=sasuser.redcell; CLASS grp; MODEL redcell=grp / solution clparm; MEANS grp / HOVTEST=levene WELCH ; RUN; Welch s variance-weighted test Welch s ANOVA for redcell Source DF F Value Pr > F grp Error Vi er altså ikke alt for sikre på den fundne forskel... E2013 Basal Statistik - Variansanalyse 33

34 Kruskal-Wallis Test The NPAR1WAY Procedure PROC NPAR1WAY DATA=sasuser.redcell wilcoxon; CLASS grp; VAR redcell; RUN; Bemærk: Man kan også få en eksakt vurdering af teststørrelsen, men pas på i tilfælde af store materialer! Analysis of Variance for Variable redcell Classified by Variable grp Wilcoxon Scores (Rank Sums) for Variable redcell Classified by Variable grp Sum of Expected Std Dev Mean grp N Scores Under H0 Under H0 Score Kruskal-Wallis Test Chi-Square DF 2 Asymptotic Pr > Chi-Square Exact Pr >= Chi-Square E2013 Basal Statistik - Variansanalyse 34 EXACT wilcoxon; Tilføjes før RUN;

35 Logaritmerede data Logaritme transformere udfaldet (her 10 tals logaritmen) logredcell=log10(redcell); E2013 Basal Statistik - Variansanalyse 35

36 Logaritmerede data E2013 Basal Statistik - Variansanalyse 36

37 Logaritmerede data Fortolkning: Eksempelvis forskel mellem gruppe 1 og gruppe 3: Estimatet: med CI: ( ; ) Tilbage transformeres til Estimat: = Med CI: 10 ;10 ( ) = ( 0.933;1.363 ) Dvs gruppe 1 ligger 12.8% højere end gruppe 3 med CI fra 6.7% under til 36.3% over E2013 Basal Statistik - Variansanalyse 37

38 ANOVA og t-test Tosidet variansanalyse forekommer dog oftest i anden sammenhæng (flere inddelingskriterier) E2013 Basal Statistik - Variansanalyse 38

39 To-sidet Variansanalyse Ved sammenligning af tidspunkter skal man eliminere variation mellem personer ganske som i et parret t-test E2013 Basal Statistik - Variansanalyse 39

40 Spaghetti Plot Puls vs. tid, observationer hørende til samme person forbundet. Ideelt er forløbene parallelle (additivitet) E2013 Basal Statistik - Variansanalyse 40

41 Spaghetti Plot DATA sasuser.puls; INFILE 'c:\puls.txt' firstobs=2; INPUT person tid0 tid30 tid60 tid120; tid=0; puls=tid0; output; tid=30; puls=tid30; output; tid=60; puls=tid60; output; tid=120; puls=tid120; output; RUN; axis5 LABEL=(H=2) VALUE=(H=2) MINOR=none ; axis6 LABEL=(A=90 R=0 H=2) VALUE=(H=2) MINOR=none ; symbol1 V=circle I=join C=black H=3 W=2 L=2 R=9; /*gentager symbolet 9 gange*/ PROC GPLOT DATA=sasuser.puls; PLOT puls*tid=person / nolegend frame haxis=axis5 vaxis=axis6; RUN; E2013 Basal Statistik - Variansanalyse 41

42 To-sidet Variansanalyse Der er effekt af person (p) og tid (t): Y pt = µ + α + β + ε og disse virker additivt. p (Nødvendigt med passende bånd på parametrene, i SAS f.eks. α t pt = β 9 4 = 0) ε pt uafhængige, middelværdi 0, samme varians, normalfordelte, ε pt ( 2 0, ) ~ N σ Variationsopspaltning: SS tot = SS person + SS tid + SS res E2013 Basal Statistik - Variansanalyse 42

43 To-sidet Variansanalyse Ideelt set parallelle forløb, overlejret med normalfordelt variation giver mere irregulære forløb. E2013 Basal Statistik - Variansanalyse 43

44 Variansanalyseskema df SS MS F P Personer < Tid Resid total Højsignifikant forskel på personer (forventeligt, men ikke så interessant) Signifikant tidsforskel, P=0.018 men vi mangler estimater! E2013 Basal Statistik - Variansanalyse 44

45 Estimater PROC GLM DATA=sasuser.puls; CLASS tid person; MODEL puls=tid person / solution clparm; OUTPUT OUT=ny P=predikt R=resid; RUN; QUIT; Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE puls Mean Source DF Type I SS Mean Square F Value Pr > F tid person <.0001 E2013 Basal Statistik - Variansanalyse 45

46 Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 tid B tid B tid B tid B... person B person B person B <.0001 person B <.0001 person B <.0001 person B person B <.0001 person B <.0001 person B... Bemærk, at de sidste niveauer af hver faktor (Class-variabel) bliver sat til 0 Forventede værdier for person = 3, tid = 30: Residualer Altså f.eks. De kaldes referenceniveauer E2013 Basal Statistik - Variansanalyse 46

47 Modelkontrol Varianshomgenitet? Normalfordelte residualer? Additivitet? (vekselvirkning, interaktion, effekt modifikation) Kan kun undersøges hvis der er flere observationer per celle Seriel korrelation? E2013 Basal Statistik - Variansanalyse 47

48 Modelkontrol Varianshomgenitet E2013 Basal Statistik - Variansanalyse 48

49 Modelkontrol Normalfordelte residualer E2013 Basal Statistik - Variansanalyse 49

50 Modelkontrol Seriel korrelation Der ser ikke ud til at være Seriel korrelation her Modeller, der inkludere sådanne korrelationer kaldes Repeated measurements E2013 Basal Statistik - Variansanalyse 50

51 Modelkontrol Data til seriel korrelation plottet: DATA ny2; SET ny; f_resid=lag(resid); IF tid=0 THEN f_resid=.; RUN; Seriel korrelation plottet: axis7 OFFSET=(8,8) LABEL=(H=2 'forrige residual') VALUE=(H=2) MINOR=none ; symbol1 V=circle I=none C=black H=2 W=2 L=2 ; PROC GPLOT DATA=ny2; PLOT resid*f_resid / vref=0 href=0 lvref=33 lhref=33 haxis=axis7 vaxis=axis4; RUN; E2013 Basal Statistik - Variansanalyse 51

52 Vekselvirkning Eller interaktion eller effekt modifikation Hvordan virker faktorerne ind på hinanden? Forskellen i respons mellem niveauerne af en faktor er ikke den samme ved alle niveauer af de andre faktorer Der kan være en synergistisk effekt (eller det modsatte) E2013 Basal Statistik - Variansanalyse 52

53 Faktor B Ao Fakt. A A Respons Ingen vekselvirkning A 1 A o Faktor B Med vekselvirkning 50 Respons Faktor B A o A 1 Fakt. A Faktor B A o A E2013 Basal Statistik - Variansanalyse 53

54 Vekselvirkning Eksempel på 2 inddelingskriterier: køn rygestatus Respons: FEV1 Mulige forklaringer: biologisk forskel på effekt af rygning måske ryger kvinderne ikke helt så meget måske virker rygningen som en relativ (%-vis) nedsættelse af FEV1 E2013 Basal Statistik - Variansanalyse 54

55 Eksempel E2013 Basal Statistik - Variansanalyse 55

56 Vekselvirkning Interaktion/vekselvirkning mellem mængden og varigheden af Rygningen Der er effekt af mængden, men kun hvis man har røget længe Der er effekt af varigheden, og denne effekt øges med mængden E2013 Basal Statistik - Variansanalyse 56

57 Vekselvirkning Fibrinogen efter miltoperation 34 rotter randomiseres, på 2 måder 17 får fjernet milten (splenectomy=yes) 8/17 i hver gruppe opholder sig i stor højde (place=altitude) Outcome: Fibrinogen niveau i mg% ved dag 21 E2013 Basal Statistik - Variansanalyse 57

58 Vekselvirkning Almindelig model: Yspr = µ + α + β + ε s p spr splenectomy (s=yes/no) og place (p=altitude/control) virker additivt. Model med interaktion (vekselvirkning): Yspr = µ + α + β + γ + ε Her specificeres en interaktion mellem splenectomy og place, dvs. effekten af ophold i stor højde tænkes at afhænge af, hvorvidt man har fået fjernet milten eller ej. og omvendt... s p sp spr E2013 Basal Statistik - Variansanalyse 58

59 Vekselvirkning i SAS PROC GLM DATA=sasuser.fibronogen; CLASS splenectomy place; MODEL fibrinogen = splenectomy place splenectomy*place / solution; RUN; Class Level Information Class Levels Values splenectomy 2 no yes place 2 altitude control Number of observations 34 Dependent Variable: fibrinogen The GLM Procedure Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected ^ Total ^ R-Square Coeff Var Root MSE fibrinogen Mean E2013 Basal Statistik - Variansanalyse 59

60 Vekselvirkning i SAS E2013 Basal Statistik - Variansanalyse 60

61 Vekselvirkning i SAS Referenceniveauerne er place=control, splenectomy=yes (de sidste i den alfabetiske rækkefølge) så disse har forventet fibrinogenniveau på intercept= For de andre niveauer skal der adderes et eller flere ekstra estimater, således: Splenectomy yes no place control Altitude = = = E2013 Basal Statistik - Variansanalyse 61

62 Vekselvirkning i SAS Vi kan godt få SAS til at udregne disse niveauer explicit: PROC GLM DATA=sasuser.fibronogen; CLASS splenectomy place; MODEL fibrinogen = splenectomy*place / solution noint; RUN; Bemærk at splenectomy place er slettet i model linien E2013 Basal Statistik - Variansanalyse 62

63 To-sidet variansanalyse Vekselvirkningen var ikke signifikant (p=0.77) Så modellen simplificeres til en tosidet variansanalyse uden vekselvirkning E2013 Basal Statistik - Variansanalyse 63

64 To-sidet variansanalyse E2013 Basal Statistik - Variansanalyse 64

65 Modelkontrol E2013 Basal Statistik - Variansanalyse 65

66 Modelkontrol E2013 Basal Statistik - Variansanalyse 66

Basal statistik. 30. september 2008

Basal statistik. 30. september 2008 Basal statistik 30. september 2008 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Peter Dalgaard, Biostatistisk Afdeling Institut for

Læs mere

Basal statistik. 2. oktober Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol

Basal statistik. 2. oktober Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Basal statistik 2. oktober 2007 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Lene Theil Skovgaard, Biostatistisk Afdeling Institut

Læs mere

Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium?

Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium? variansanalyse 1 variansanalyse 2 Basal statistik 27. februar 2007 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Judith Jacobsen Statcon

Læs mere

Basal statistik 3. oktober Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium?

Basal statistik 3. oktober Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium? variansanalyse, oktober 2006 1 Basal statistik 3. oktober 2006 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Lene Theil Skovgaard

Læs mere

Variansanalyse. Variansanalyse. Basal Statistik Variansanalyse

Variansanalyse. Variansanalyse. Basal Statistik Variansanalyse Basal Statistik Variansanalyse 4 september 013 Michael Gambor Institut for sydomsforebyelse Københavns Universitetshospital michael.orland.ambor@reionh.dk Lene Theil Skovaard biostat.ku.dk/~lts/basal/overheads/anova.pdf

Læs mere

Dagens Tekst. Sammenligning Flere Grupper F Basal Statistik Variansanalyse. Basal Statistik - Variansanalyse 1

Dagens Tekst. Sammenligning Flere Grupper F Basal Statistik Variansanalyse. Basal Statistik - Variansanalyse 1 Basal Statistik Variansanalyse Judith L. Jacobsen, PhD. Lene Theil Skovgaard http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk Dagens Tekst ANOVA Ikke-parametriske test Fordelingsantagelse En-sidet

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 Sammenligning af to grupper: T-test Dimensionering af undersøgelser

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 10. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 10. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 10. september 2018 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Basal statistik. 25. september 2007

Basal statistik. 25. september 2007 Basal statistik 25. september 2007 Korrelation og regression Simpel lineær regression Todimensionale normalfordelinger Korrelation vs. regression Modelkontrol Diagnostics Lene Theil Skovgaard, Biostatistisk

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot Program Residualanalyse Flersidet variansanalyse Helle Sørensen Modelkontrol (residualanalyse) i tosidet ANOVA med vekselvirkning. Test og konklusion i tosidet ANOVA (repetition) Tresidet ANOVA: the works

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion VARIANSANALYSE 2 Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: (Analysis of variance) med interaktion Problem: Hvordan håndterer vi forsøg, hvor effekten er forårsaget af to faktorer og en evt.

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

Basal statistik. 16. september 2008

Basal statistik. 16. september 2008 Basal statistik 16. september 2008 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Eksempel , opg. 2

Eksempel , opg. 2 Faktorer En faktor er en gruppering/inddeling af målinger/observationer pga. Tilsigtede variationer i en eller flere forsøgsparametre Nødvendige (potentielle) blok-effekter såsom gentagne målinger på samme

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Ensidet variansanalyse

Ensidet variansanalyse Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere