Variansanalyse. Variansanalyse. Basal Statistik Variansanalyse

Størrelse: px
Starte visningen fra side:

Download "Variansanalyse. Variansanalyse. Basal Statistik Variansanalyse"

Transkript

1 Basal Statistik Variansanalyse 4 september 013 Michael Gambor Institut for sydomsforebyelse Københavns Universitetshospital michael.orland.ambor@reionh.dk Lene Theil Skovaard biostat.ku.dk/~lts/basal/overheads/anova.pdf Variansanalyse Variansanalyse Fordelinsantaelse En-sidet To-sidet Interaktion Model kontrol ANOVA ANalysis Of VAriance Typiske problemstilliner Hvordan afhæner behandlinen af sydomstadium Er der forskel i effekten af diverse præperater til nedsættelse af blodtrykket Afhæner lunefunktionen af ryestatus? O af fysiskaktivitet? Datastruktur Ensidet variansanalyse Et antal personer (N) opdelt i veldefinerede rupper (k) Tosidet variansanalyse Personerne er inddelt efter flere forskellie indelinskriterier, f. eks. Rynin o fysiskaktivitet E013 Basal Statistik - Variansanalyse 3 E013 Basal Statistik - Variansanalyse 4

2 Én-sidet To-sidet Fler-sidet Variansanalyse En faktor med mere end rupper To faktorer Flere faktorer Variansanalyse Sammenliner varianser mellem rupper med varianser indenfor rupper Variansen inden for rupper er den bioloiske variation. En-sidet variansanalyse med rupper eller niveauer er præcis det samme som et t-test Hvis den bioloiske variation er stor vil den tilfældie variation mellem rupperne oså blive stor E013 Basal Statistik - Variansanalyse 5 E013 Basal Statistik - Variansanalyse 6 Én-sidet Variansanalyse Kvalitativ faktor & kvantitativ respons Eksempel: ptt. bypass-operationer, 3 slas ventilation (randomiseret) Gruppe I 50% NO, 50% O i 4 timer Gruppe II 50% NO, 50% O under op. Gruppe III 30 50% O (inen NO) i 4 timer Er der forskel på fordelinen af responset (red cell foliate) i de tre rupper? Er der forskel på niveauerne i de tre rupper? E013 Basal Statistik - Variansanalyse 7 Én-sidet Variansanalyse Kan vi ikke bare sammenline rupperne parvis med t-test Problem: Massesinifikans (se senere) axis1 ORDER = (1 to 3 by 1) OFFSET=(8,8) LABEL=(H= 'ruppe nr.') VALUE=(H=) MINOR=none ; axis OFFSET=(1,1) LABEL=(a=90 R=0 H= 'red cell foliate') VALUE=(H=) MINOR=none ; symbol1 V=circle I=none H= C=black ; PROC GPLOT DATA=sasuser.redcell; PLOT redcell*rp/frame haxis=axis1 vaxis=axis; E013 Basal Statistik - Variansanalyse 8

3 Én-sidet Variansanalyse Én-sidet Variansanalyse Én-sidet Der kun er et inddelinskriterium, f.eks. som her ventilerinsmetode Variansanalyse: Fordi man sammenliner variansen mellem rupper med variansen indenfor rupper Antaelser: Alle observationer er uafhænie (personerne år ikke ien flere ane, inen tvilliner o.l.) Inden for hver ruppe er observationerne normalfordelt Der er samme varians indenfor rupperne Model Yi i te observation i ruppe nr. = µ + ε middelværdi for ruppe nr. i individuel afvielse Observationerne antaes at føle en normalfordelin (inden for hver ruppe) med samme varians. ε i ~ N(0, σ ) Y i ~ N( µ, σ ) E013 Basal Statistik - Variansanalyse 9 E013 Basal Statistik - Variansanalyse 10 Én-sidet Variansanalyse Vi undersøer om alle k rupper kan tænkes at have samme middelværdi H 0 : µ 1 = µ = L = µ k Variansestimaterne for hver ruppe pooles til et fælles estimat for variansen indenfor rupper H 0 testes ved at betrate forholdet mellem variationen mellem rupper o det fælles estimat for variansen indenfor rupper E013 Basal Statistik - Variansanalyse 11 Kvadratsummer Opspaltnin af observationer: y y i y i-te observation i -te ruppe ennemsnit i -te ruppe totalennemsnit i, y i y = ( y y ) + ( y y ) i Opspaltnin af variation (kvadratsum, sum of squares, SAK/SS): ( yi y.) = ( yi y ) + ( y y.) i, i, indenfor rupper mellem rupper E013 Basal Statistik - Variansanalyse 1

4 i, Kvadratsummer ( yi y) = ( yi y ) + ( y y.) i, i, indenfor rupper SAK tot = SAK res +SAK rp SS tot = SS w + SS b SSD tot = SSD w + SSD b mellem rupper SAK: Sum af Afvielses Kvadrater SS(D): Sum of Squares (of deviation) Kvadratsummer Opdelin af variansen Mellem rupper SAK rp (SS b ) Indenfor rupper SAK res (SS w ) Total variationen SAK tot (SS tot )opdeles i de to varians-komponenter SAK tot = SAK rp + SAK res E013 Basal Statistik - Variansanalyse 13 E013 Basal Statistik - Variansanalyse 14 Mellem rupper De forskelle der er mellem f.eks. Ryere o ikkeryer eller mellem social klasser Indenfor rupper De forskelle der er mellem f.eks. Individer Indenfor rupper-variansen kaldes oså residual eller rest-variansen. Kvadratsummer E013 Basal Statistik - Variansanalyse 15 F-Test Middelkvadratsummer (Mean Squares MS) MS w = SS w / (N-k): Poolet varians MS b = SS b / (k-1): Varians mellem ruppe ennemsnittene MS Teststørrelse: F = MS Vi forkaster hvis F er stor, altså hvis variationen mellem rupperne er stor i forhold til variationen indenfor rupper E013 Basal Statistik - Variansanalyse 16 b w

5 Variansanalyseskema Varianstype SS df MS F = Mellem rp. SS k-1 SS/df MS/MS Indenf. rp SS N-k SS/df Total N-1 Varianstype SS df MS F = Mellem rp Indenf. rp Total E013 Basal Statistik - Variansanalyse 17 Ensidet ANOVA i SAS Data sættes op i variabler, en med outcome (redcell) o en med klassifikationsvariablen (rp) PROC GLM DATA=sasuser.redcell; CLASS rp; MODEL redcell=rp; Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE redcell Mean Source DF Anova SS Mean Square F Value Pr F rp E013 Basal Statistik - Variansanalyse 18 Ensidet ANOVA i SAS Hvis man oså vil have estimater o konfidensrænser...o det vil man ALTID: PROC GLM DATA=sasuser.redcell; CLASS rp; MODEL redcell=rp / solution clparm; Normalfordelinsantaelsen Det er antaet, at observationerne føler en normalfordelin inden for hver ruppe Dette bør checkes, f.eks.: ved at tene historammer eller fraktil-diarammer for hver ruppe ved at tene historam eller fraktildiaram for residualerne r i = Y ˆ µ = Y i i _ Y ved at lave normalfordelinstest, enten for hver ruppe for si, eller samlet for residualerne E013 Basal Statistik - Variansanalyse 19 E013 Basal Statistik - Variansanalyse 0

6 Normalfordelinsantaelsen Normalfordelinsantaelsen PROC GLM DATA=sasuser.redcell; CLASS rp; MODEL redcell=rp / solution clparm; OUTPUT OUT=ny P=predikt R=resid; QUIT; PROC UNIVARIATE normal DATA=ny; VAR resid; HISTOGRAM / normal cfill=ray heiht=3; PROBPLOT / normal(mu=est SIGMA=est L=33); E013 Basal Statistik - Variansanalyse 1 Historam, med overlejret normalfordelin: Flot er det jo ikke men hvad kan man forvente med kun observationer... E013 Basal Statistik - Variansanalyse Normalfordelinsantaelsen Probability plot: Normalfordelinstest: Tests for Normality Test Statistic p Value Shapiro-Wilk W Pr < W Kolmoorov-Smirnov D Pr > D > Cramer-von Mises W-Sq Pr >W-Sq >0.500 Anderson-Darlin A-Sq Pr > A-Sq >0.500 Her er normalfordelinsantaelsen tilsyneladende OK E013 Basal Statistik - Variansanalyse 3 Varianshomoenitet En af forudsætninerne for den ensidede variansanalyse er, at der er samme varians i alle rupper. PROC GLM DATA=sasuser.redcell; CLASS rp; MODEL redcell=rp / solution clparm; MEANS rp / HOVTEST=levene ; OUTPUT OUT=ny P=predikt R=resid; QUIT; axis3 OFFSET=(8,8) LABEL=(H= 'predicted value') VALUE=(H=) MINOR=none ; axis4 OFFSET=(1,1) LABEL=(a=90 R=0 H= 'residual') VALUE=(H=) MINOR=none ; symbol1 V=circle I=none H= W=; PROC GPLOT DATA=ny; PLOT resid*predikt / frame haxis=axis3 vaxis=axis4; E013 Basal Statistik - Variansanalyse 4

7 Varianshomoenitet Levenes test for varianshomoenitet: Level of redcell rp N Mean Std Dev Levene s Test for Homoeneity of redcell Variance ANOVA of Squared Deviations from Group Means Sum of Mean Source DF Squares Square F Value Pr > F rp Error Varianshomoenitet Grafisk check med residualplot: Residualer tenes op mod predikterede (forventede, fittede) værdier Ved sammenlinin af de k = 3 variansestimater fås teststørrelse på 4.14 F(,19)-fordelt, svarende til P=0.03, o altså sinifikans! E013 Basal Statistik - Variansanalyse 5 E013 Basal Statistik - Variansanalyse 6 Multiple sammenlininer Problem: F-test viser, at der nok er forskel men hvor? Parvise t-test ikke odt pa. massesinifikans Der er m = k(k 1)/ mulie test, reelt sinifikansniveau: 1 (1 α) m f.eks. for k=5: 0.40 Multiple sammenlininer Der findes ikke noen helt tilfredsstillende løsnin, men 1. Prøv at undå problemet (fokuser problemstillinen). Udvæl et (lille) antal relevante sammenlininer på forhånd, dvs. skriv dem ind i protokollen! 3. Ten ennemsnit ± SEM o bru øjemål(!), evt. suppleret med F-tests på delsæt af rupper 4. Modificer t-test ved at ane P med antallet af tests såkaldt Bonferroni korrektion (konservativ) eller anden form for korrektion (Dunnett, Tukey). E013 Basal Statistik - Variansanalyse 7 E013 Basal Statistik - Variansanalyse 8

8 Multiple sammenlininer Multiple sammenlininer symbol1 V=circle I=stdmjt H= W=; PROC GPLOT DATA=sasuser.redcell; PLOT redcell*rp / frame haxis=axis1 vaxis=axis; Her med Bars på s.e., dvs. konfidensintervaller for middelværdierne Bonferroni α sinifikansniveau m stærkt konservativ, dvs. for høje P-værdier lav styrke Sidak benytter sinifikansniveau α 1 1 ( 1 α ) m for små m m lidt mindre konservativ stadi ret lav styrke Tukey-Kramer baseres på fordelin af størst blandt mane iver større styrke Dunnett korrierer kun for test mod referenceruppe (typisk en kontrolruppe eller tid 0 ) E013 Basal Statistik - Variansanalyse 9 E013 Basal Statistik - Variansanalyse 30 Multiple sammenlininer i SAS PROC GLM DATA=sasuser.redcell; CLASS rp; MODEL redcell=rp / solution clparm; LSMEANS rp / pdiff adjust=bonferroni cl; LSMEANS rp / pdiff adjust=tukey cl; Adjustment for Multiple Comparisons: Bonferroni Least Squares Means for effect rp Pr > t for H0: LSMean(i)=LSMean(j) Dependent Variable: redcell i/j Adjustment for Multiple Comparisons: Tukey-Kramer Least Squares Means for effect rp Pr > t for H0: LSMean(i)=LSMean(j) Dependent Variable: redcell i/j E013 Basal Statistik - Variansanalyse 31 Multiple sammenlininer i SAS Adjustment for Multiple Comparisons: Bonferroni Difference Simultaneous 95% Between Confidence Limits for i j Means LSMean(i)-LSMean(j) PROC GLM DATA=sasuser.redcell; CLASS rp; MODEL redcell=rp / solution clparm; LSMEANS rp / pdiff cl; Adjustment for Multiple Comparisons: Tukey-Kramer Difference Simultaneous 95% Between Confidence Limits for i j Means LSMean(i)-LSMean(j) Giver p værdier o konfidens rænser Uden justerin for multipel testnin E013 Basal Statistik - Variansanalyse 3

9 Hvis antaelserne ikke holder Transformation (ofte loaritmer) kan afhjælpe såvel variansinhomoenitet som dårli normalfordelinstilpasnin Man kan lave vætet analyse (Welch s test), liesom ved T- test PROC GLM DATA=sasuser.redcell; CLASS rp; MODEL redcell=rp / solution clparm; MEANS rp / HOVTEST=levene WELCH ; Welch s variance-weihted test Welch s ANOVA for redcell Source DF F Value Pr > F rp Error Vi er altså ikke alt for sikre på den fundne forskel... E013 Basal Statistik - Variansanalyse 33 PROC NPAR1WAY DATA=sasuser.redcell wilcoxon; CLASS rp; VAR redcell; Bemærk: Man kan oså få en eksakt vurderin af teststørrelsen, men pas på i tilfælde af store materialer! Kruskal-Wallis Test The NPAR1WAY Procedure Analysis of Variance for Variable redcell Classified by Variable rp Wilcoxon Scores (Rank Sums) for Variable redcell Classified by Variable rp Sum of Expected Std Dev Mean rp N Scores Under H0 Under H0 Score Kruskal-Wallis Test Chi-Square EXACT wilcoxon; DF Tilføjes før Asymptotic Pr > Chi-Square Exact Pr >= Chi-Square E013 Basal Statistik - Variansanalyse 34 Loaritmerede data Loaritmerede data Loaritme transformere udfaldet (her 10 tals loaritmen) loredcell=lo10(redcell); E013 Basal Statistik - Variansanalyse 35 E013 Basal Statistik - Variansanalyse 36

10 Fortolknin: Loaritmerede data Eksempelvis forskel mellem ruppe 1 o ruppe 3: Estimatet: med CI: ( ; ) Tilbae transformeres til Estimat: = Med CI: 10 ;10 = 0.933;1.363 ( ) ( ) Dvs ruppe 1 lier 1.8% højere end ruppe 3 med CI fra 6.7% under til 36.3% over ANOVA o t-test Tosidet variansanalyse forekommer do oftest i anden sammenhæn (flere inddelinskriterier) E013 Basal Statistik - Variansanalyse 37 E013 Basal Statistik - Variansanalyse 38 To-sidet Variansanalyse Spahetti Plot Puls vs. tid, observationer hørende til samme person forbundet. Ideelt er forløbene parallelle (additivitet) Ved sammenlinin af tidspunkter skal man eliminere variation mellem personer anske som i et parret t-test E013 Basal Statistik - Variansanalyse 39 E013 Basal Statistik - Variansanalyse 40

11 Spahetti Plot To-sidet Variansanalyse DATA sasuser.puls; INFILE 'c:\puls.txt' firstobs=; INPUT person tid0 tid30 tid60 tid10; tid=0; puls=tid0; output; tid=30; puls=tid30; output; tid=60; puls=tid60; output; tid=10; puls=tid10; output; axis5 LABEL=(H=) VALUE=(H=) MINOR=none ; axis6 LABEL=(A=90 R=0 H=) VALUE=(H=) MINOR=none ; symbol1 V=circle I=join C=black H=3 W= L= R=9; /*entaer symbolet 9 ane*/ PROC GPLOT DATA=sasuser.puls; PLOT puls*tid=person / noleend frame haxis=axis5 vaxis=axis6; Der er effekt af person (p) o tid (t): Y pt = µ + α + β + ε o disse virker additivt. p (Nødvendit med passende bånd på parametrene, i SAS f.eks. α = β ε pt uafhænie, middelværdi 0, samme varians, normalfordelte, ε pt ( 0, ) ~ N σ Variationsopspaltnin: SS tot = SS person + SS tid + SS res t pt 9 4 = 0) E013 Basal Statistik - Variansanalyse 41 E013 Basal Statistik - Variansanalyse 4 To-sidet Variansanalyse Ideelt set parallelle forløb, overlejret med normalfordelt variation iver mere irreulære forløb. Variansanalyseskema df SS MS F P Personer < Tid Resid total Højsinifikant forskel på personer (forventelit, men ikke så interessant) Sinifikant tidsforskel, P=0.018 men vi manler estimater! E013 Basal Statistik - Variansanalyse 43 E013 Basal Statistik - Variansanalyse 44

12 PROC GLM DATA=sasuser.puls; CLASS tid person; MODEL puls=tid person / solution clparm; OUTPUT OUT=ny P=predikt R=resid; QUIT; Estimater Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE puls Mean Source DF Type I SS Mean Square F Value Pr > F tid person <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 tid 0 4. B tid B tid B tid B... person B person B person B <.0001 person B <.0001 person B <.0001 person B person B <.0001 person B <.0001 person B... Bemærk, at de sidste niveauer af hver faktor (Class-variabel) bliver sat til 0 Forventede værdier for person = 3, tid = 30: Residualer Altså f.eks. De kaldes referenceniveauer E013 Basal Statistik - Variansanalyse 45 E013 Basal Statistik - Variansanalyse 46 Varianshomenitet? Modelkontrol Normalfordelte residualer? Additivitet? (vekselvirknin, interaktion, effekt modifikation) Kan kun undersøes hvis der er flere observationer per celle Seriel korrelation? Varianshomenitet Modelkontrol E013 Basal Statistik - Variansanalyse 47 E013 Basal Statistik - Variansanalyse 48

13 Modelkontrol Normalfordelte residualer Seriel korrelation Modelkontrol Der ser ikke ud til at være Seriel korrelation her Modeller, der inkludere sådanne korrelationer kaldes Repeated measurements E013 Basal Statistik - Variansanalyse 49 E013 Basal Statistik - Variansanalyse 50 Modelkontrol Vekselvirknin Data til seriel korrelation plottet: DATA ny; SET ny; f_resid=la(resid); IF tid=0 THEN f_resid=.; Seriel korrelation plottet: axis7 OFFSET=(8,8) LABEL=(H= 'forrie residual') VALUE=(H=) MINOR=none ; symbol1 V=circle I=none C=black H= W= L= ; PROC GPLOT DATA=ny; PLOT resid*f_resid / vref=0 href=0 lvref=33 lhref=33 haxis=axis7 vaxis=axis4; Eller interaktion eller effekt modifikation Hvordan virker faktorerne ind på hinanden? Forskellen i respons mellem niveauerne af en faktor er ikke den samme ved alle niveauer af de andre faktorer Der kan være en syneristisk effekt (eller det modsatte) E013 Basal Statistik - Variansanalyse 51 E013 Basal Statistik - Variansanalyse 5

14 Faktor B Ao 0 30 Fakt. A A Respons Med vekselvirknin Faktor B A o A 1 Respons Inen vekselvirknin 60 A 1 40 A 0 o 0 Faktor B Faktor B A o 0 40 Fakt. A A Vekselvirknin Eksempel på inddelinskriterier: køn ryestatus Respons: FEV1 Mulie forklariner: bioloisk forskel på effekt af rynin måske ryer kvinderne ikke helt så meet måske virker ryninen som en relativ (%-vis) nedsættelse af FEV1 E013 Basal Statistik - Variansanalyse 53 E013 Basal Statistik - Variansanalyse 54 Eksempel Vekselvirknin Interaktion/vekselvirknin mellem mænden o variheden af Ryninen Der er effekt af mænden, men kun hvis man har røet læne Der er effekt af variheden, o denne effekt øes med mænden E013 Basal Statistik - Variansanalyse 55 E013 Basal Statistik - Variansanalyse 56

15 Fibrinoen efter miltoperation 34 rotter randomiseres, på måder 17 får fjernet milten (splenectomy=yes) 8/17 i hver ruppe opholder si i stor højde (place=altitude) Outcome: Fibrinoen niveau i m% ved da 1 Vekselvirknin Almindeli model: Yspr Vekselvirknin Yspr = µ + α + β + ε splenectomy (s=yes/no) o place (p=altitude/control) virker additivt. Model med interaktion (vekselvirknin): s s p p sp spr = µ + α + β + γ + ε Her specificeres en interaktion mellem splenectomy o place, dvs. effekten af ophold i stor højde tænkes at afhæne af, hvorvidt man har fået fjernet milten eller ej. o omvendt... spr E013 Basal Statistik - Variansanalyse 57 E013 Basal Statistik - Variansanalyse 58 Vekselvirknin i SAS PROC GLM DATA=sasuser.fibronoen; CLASS splenectomy place; MODEL fibrinoen = splenectomy place splenectomy*place / solution; Class Level Information Class Levels Values splenectomy no yes place altitude control Number of observations 34 Dependent Variable: fibrinoen The GLM Procedure Sum of Source DF Squares Mean Square F Value Pr > F Vekselvirknin i SAS Model Error Corrected ^ Total ^ R-Square Coeff Var Root MSE fibrinoen Mean E013 Basal Statistik - Variansanalyse 59 E013 Basal Statistik - Variansanalyse 60

16 Vekselvirknin i SAS Vekselvirknin i SAS Referenceniveauerne er place=control, splenectomy=yes (de sidste i den alfabetiske rækkeføle) så disse har forventet fibrinoenniveau på intercept=61.67 For de andre niveauer skal der adderes et eller flere ekstra estimater, således: Splenectomy yes no control place Altitude = = = Vi kan odt få SAS til at udrene disse niveauer explicit: PROC GLM DATA=sasuser.fibronoen; CLASS splenectomy place; MODEL fibrinoen = splenectomy*place / solution noint; Bemærk at splenectomy place er slettet i model linien E013 Basal Statistik - Variansanalyse 61 E013 Basal Statistik - Variansanalyse 6 To-sidet variansanalyse To-sidet variansanalyse Vekselvirkninen var ikke sinifikant (p=0.77) Så modellen simplificeres til en tosidet variansanalyse uden vekselvirknin E013 Basal Statistik - Variansanalyse 63 E013 Basal Statistik - Variansanalyse 64

17 Modelkontrol Modelkontrol E013 Basal Statistik - Variansanalyse 65 E013 Basal Statistik - Variansanalyse 66

Basal Statistik Variansanalyse. 24 september 2013

Basal Statistik Variansanalyse. 24 september 2013 Basal Statistik Variansanalyse 24 september 2013 Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk Lene Theil Skovgaard biostat.ku.dk/~lts/basal/overheads/anova.pdf

Læs mere

Basal statistik. 30. september 2008

Basal statistik. 30. september 2008 Basal statistik 30. september 2008 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Peter Dalgaard, Biostatistisk Afdeling Institut for

Læs mere

Basal statistik. 2. oktober Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol

Basal statistik. 2. oktober Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Basal statistik 2. oktober 2007 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Lene Theil Skovgaard, Biostatistisk Afdeling Institut

Læs mere

Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium?

Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium? variansanalyse 1 variansanalyse 2 Basal statistik 27. februar 2007 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Judith Jacobsen Statcon

Læs mere

Basal statistik 3. oktober Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium?

Basal statistik 3. oktober Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium? variansanalyse, oktober 2006 1 Basal statistik 3. oktober 2006 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Lene Theil Skovgaard

Læs mere

Dagens Tekst. Sammenligning Flere Grupper F Basal Statistik Variansanalyse. Basal Statistik - Variansanalyse 1

Dagens Tekst. Sammenligning Flere Grupper F Basal Statistik Variansanalyse. Basal Statistik - Variansanalyse 1 Basal Statistik Variansanalyse Judith L. Jacobsen, PhD. Lene Theil Skovgaard http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk Dagens Tekst ANOVA Ikke-parametriske test Fordelingsantagelse En-sidet

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 Sammenligning af to grupper: T-test Dimensionering af undersøgelser

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 10. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 10. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 10. september 2018 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Basal statistik. 25. september 2007

Basal statistik. 25. september 2007 Basal statistik 25. september 2007 Korrelation og regression Simpel lineær regression Todimensionale normalfordelinger Korrelation vs. regression Modelkontrol Diagnostics Lene Theil Skovgaard, Biostatistisk

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion VARIANSANALYSE 2 Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: (Analysis of variance) med interaktion Problem: Hvordan håndterer vi forsøg, hvor effekten er forårsaget af to faktorer og en evt.

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE Økonomisk Kandidateksamen Teoretisk Statistik Eksamenstermin: Sommer 2004, dato: 3. juni 4 timers prøve med alle hjælpemidler, besvarelse på Dansk Opgave En simpel tilfældig stikprøve på 500 udtrukket

Læs mere

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot Program Residualanalyse Flersidet variansanalyse Helle Sørensen Modelkontrol (residualanalyse) i tosidet ANOVA med vekselvirkning. Test og konklusion i tosidet ANOVA (repetition) Tresidet ANOVA: the works

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017 Faculty of Health Sciences Basal statistik Lille SAS Manual Lene Theil Skovgaard 31. januar 2017 1 / 42 Selve sproget Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual Faculty of Health Sciences Selve sproget Basal statistik Lille SAS Manual Lene Theil Skovgaard 5. september 2017 Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Modul 6: Regression og kalibrering

Modul 6: Regression og kalibrering Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere