Basal statistik 3. oktober Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium?

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Basal statistik 3. oktober Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium?"

Transkript

1 variansanalyse, oktober Basal statistik 3. oktober 2006 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Lene Theil Skovgaard Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet Typiske problemstillinger: Hvordan afhænger behandlingens effekt af sygdomsstadium? Er der forskel på effektiviteten af diverse præparater til nedsættelse af blodtrykket? Afhænger lungefunktionen af rygestatus? Og af aktivitetsniveau? Datastruktur: Et antal personer (n) fordelt i et antal veldefinerede grupper (k) Analyseform er ensidet variansanalyse Personerne er inddelt efter flere forskellige inddelingskriterier (f.eks. rygestatus og aktivitetsniveau) Analyseform er tosidet variansanalyse flersidet variansanalyse variansanalyse, oktober variansanalyse, oktober Sammenligning af mere end 2 grupper Problemstilling: Er der forskel på fordelingerne af responset i de enkelte grupper? Er der forskel på niveauerne i de enkelte grupper? Eksempel: 22 ptt. bypass-operationer, 3 slags ventilation (randomiseret) Gruppe I Gruppe II Gruppe III 50% N 2 O, 50% O 2 i 24 timer 50% N 2 O, 50% O 2 under op % O 2 (ingen N 2 O) i 24 timer Outcome: Red cell foliate Gr.I Gr.II Gr.III n Mean SD Pas på massesignifikans: sammenlign ikke alle grupper to og to! med mindre... (se senere)

2 variansanalyse, oktober variansanalyse, oktober Ensidet variansanalyse, ANOVA (one-way analysis of variance) Model: ensidet: fordi der kun er et inddelingskriterium, f.eks. som her ventileringsmetode variansanalyse: fordi man sammenligner variansen mellem grupper med variansen indenfor grupper i te observation i gruppe nr. g Y gi = µ g + ε gi individuel afvigelse middelværdi for gruppe nr. g Antagelser: Alle observationer er uafhængige (personerne går ikke igen flere gange, er ikke tvillinger o.l.) Inden for hver gruppe er observationerne normalfordelt Der er samme varians (biologisk variation) i alle grupper Observationerne antages at følge en normalfordeling (inden for hver gruppe) med samme varians. ε gi N(0, σ 2 ) Y gi N(µ g, σ 2 ) variansanalyse, oktober variansanalyse, oktober Ensidet variansanalyse går ud på at undersøge, om alle k grupper kan tænkes at have samme middelværdi, altså at teste hypotesen: Kvadratsummer Opspaltning af observationer: y gi ȳ = (y gi ȳ g ) + (ȳ g ȳ ) H 0 : µ 1 = µ 2 = = µ k y gi ȳ g ȳ. i-te observation i g-te gruppe gennemsnit i g-te gruppe totalgennemsnit Fremgangsmåde ved ensidet variansanalyse: Variansestimater for hver gruppe pooles til et fælles estimat, s 2, som er et skøn over variansen indenfor grupper. Hypotesen om ens middelværdier for alle grupper (H 0 : µ g = µ) testes ved et F-test på forholdet mellem variation mellem grupper og variation indenfor grupper. Opspaltning af variation (kvadratsum, sum of squares, SS): (y gi ȳ ) 2 = (y gi ȳ g ) 2 (ȳ g ȳ ) 2 i,j i,j }{{} indenfor grupper SS tot = SS w + SS b + i,j (n 1) = (n k) + (k 1) }{{} mellem grupper

3 variansanalyse, oktober variansanalyse, oktober F-testet Middelkvadratsummer (Mean Squares, MS): MS w = SS w /(N k): Poolet varians indenfor de 3 grupper MS b = SS b /(k 1): Varians mellem gruppegennemsnit Teststørrelse: F = MS b MS w Vi forkaster nulhypotesen hvis F er stor, dvs. hvis variationen mellem grupper er for stor i forhold til variationen indenfor grupper. Variansanalyseskema df SS MS F P Between Within Total Ensidet ANOVA i SAS: Data sættes op i 2 kolonner, en med outcome (redcell) og en med klassifikationsvariablen (grp). I Analyst: Statistics ANOVA One-Way ANOVA... hvor redcell er Dependent og grp er Class : The ANOVA Procedure Class Level Information Class Levels Values grp Number of observations 22 Dependent Variable: redcell Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE redcell Mean Source DF Anova SS Mean Square F Value Pr > F grp variansanalyse, oktober variansanalyse, oktober Hvis man også vil have estimater og konfidensgrænser...og det vil man vel som regel: Statistics ANOVA Linear Models klik Statistics og afkryds Parameter Estimates Gå endvidere ud i koden og tilføje clparm i model-linien: model redcell=grp / solution clparm; hvorved man vil få Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 grp B grp B grp B... Parameter 95% Confidence Limits Intercept grp grp grp 3.. Normalfordelingsantagelsen Det er antaget, at observationerne følger en normalfordeling inden for hver gruppe Dette bør checkes, f.eks.: ved at tegne histogrammer eller fraktildiagrammer for hver gruppe ved at tegne histogram eller fraktildiagram for residualerne r gi = Y gi ˆµ g = Y gi Ȳg ved at lave normalfordelingstest, enten for hver gruppe for sig, eller samlet for residualerne NOTE: The X X matrix has been found to be singular, and a generalized inverse was used to solve the normal equations. Terms whose estimates are followed by the letter B are not uniquely estimable.

4 variansanalyse, oktober variansanalyse, oktober Probability plot: Histogram, med overlejret normalfordeling: Tests for Normality Test --Statistic p Value Flot er det jo ikke men hvad kan man forvente med kun 22 observationer... Shapiro-Wilk W Pr < W Kolmogorov-Smirnov D Pr > D > Cramer-von Mises W-Sq Pr > W-Sq > Anderson-Darling A-Sq Pr > A-Sq > Her er normalfordelingsantagelsen tilsyneladende OK variansanalyse, oktober variansanalyse, oktober Test for identiske varianser En af forudsætningerne for den ensidede variansanalyse var, at der var samme varians i alle grupper. Dette testes ved at klikke Test og afkrydse i Levenes test : Antagelsen om varianshomogenitet kan også checkes grafisk med residualplot: Residualer tegnes op mod predikterede (=forventede=fittede) værdier Level of redcell grp N Mean Std Dev Levene s Test for Homogeneity of redcell Variance ANOVA of Squared Deviations from Group Means Sum of Mean Source DF Squares Square F Value Pr > F grp Error Ved sammenligning af de k = 3 variansestimater fås en teststørrelse på 4.14, som er F(2,19)-fordelt, svarende til P=0.03, og altså signifikans! Det giver dog ikke så meget ny information...

5 variansanalyse, oktober variansanalyse, oktober Multiple sammenligninger Problem: F-test viser, at der nok er forskel men hvor? Parvise t-test ikke godt pga. massesignifikans Der er m = k(k 1)/2 mulige test, reelt signifikansniveau: 1 (1 α) m, f.eks. for k=5: 0.40 Hvad gør man så i praksis? Der findes ikke nogen helt tilfredsstillende løsning, men 1. Prøv at undgå problemet (fokuser problemstillingen) 2. Udvælg et (lille) antal relevante sammenligninger på forhånd, dvs. skriv dem ind i protokollen! 3. Tegn gennemsnit ±2 SEM og brug øjemålet (!), evt. suppleret med F-tests på delsæt af grupper. 4. Modificer t-test ved at gange P med antallet af tests, den såkaldte Bonferroni korrektion (konservativ) eller anden form for korrektion (Dunnett, Tukey). variansanalyse, oktober variansanalyse, oktober Statistics ANOVA One-Way ANOVA... Tryk Plots og videre i Means Plot Her med Bars på 2 s.e., dvs. konfidensintervaller for middelværdierne I direkte programmering ændres i symbol-sætningen: symbol1 v=circle i=std1jt l=1 h=3 w=2; Korrektion for multiple comparisons Bonferroni benytter signifikansniveau α m stærkt konservativ, dsv. for høje P-værdier lav styrke Sidak benytter signifikansniveau 1 (1 α) 1 m α m for små m lidt mindre konservativ stadig ret lav styrke Tukey baseres på fordeling af størst blandt mange giver større styrke Dunnett korrigerer kun for test mod referencegruppe (typisk en kontrolgruppe eller tid 0 )

6 variansanalyse, oktober variansanalyse, oktober I SAS Analyst kan man med fordel anvende: Statistics/Anova/Linear Models og herunder Means/LS Means, vælg grp og compute p s for pairwise differences samt Bonferroni eller Tukey som Adjustment Method: Konfidensintervaller for forskelle: Her skal man ud i koden og tilføje cl i lsmeans-sætningen: lsmeans grp / pdiff adjust=bonferroni cl; lsmeans grp / pdiff adjust=tukey cl; Adjustment for Multiple Comparisons: Bonferroni Least Squares Means for effect grp Pr > t for H0: LSMean(i)=LSMean(j) Dependent Variable: redcell i/j Adjustment for Multiple Comparisons: Tukey-Kramer Least Squares Means for effect grp Pr > t for H0: LSMean(i)=LSMean(j) Dependent Variable: redcell i/j Adjustment for Multiple Comparisons: Bonferroni Difference Simultaneous 95% Between Confidence Limits for i j Means LSMean(i)-LSMean(j) Adjustment for Multiple Comparisons: Tukey-Kramer Difference Simultaneous 95% Between Confidence Limits for i j Means LSMean(i)-LSMean(j) variansanalyse, oktober variansanalyse, oktober Hvis antagelserne ikke holder: Transformation (ofte logaritmer) kan afhjælpe såvel variansinhomogenitet som dårlig normalfordelingstilpasning Man kan lave vægtet analyse (Welch s test), ligesom ved T-test Statistics ANOVA One-Way ANOVA... Klik Tests og afkryds Welch s variance-weighted test Welch s ANOVA for redcell Source DF F Value Pr > F grp Error Non-parametrisk Kruskal-Wallis test: Statistics ANOVA Nonparametric One-Way ANOVA... hvor redcell sættes som Dependent og grp som Independent (dårlig betegnelse): The NPAR1WAY Procedure Analysis of Variance for Variable redcell Classified by Variable grp Wilcoxon Scores (Rank Sums) for Variable redcell Classified by Variable grp Sum of Expected Std Dev Mean grp N Scores Under H0 Under H0 Score Kruskal-Wallis Test Chi-Square DF 2 Asymptotic Pr > Chi-Square Exact Pr >= Chi-Square Vi er altså ikke alt for sikre på den fundne forskel... Bemærk: Man kan også få en eksakt vurdering af teststørrelsen, men pas på i tilfælde af store materialer!

7 variansanalyse, oktober variansanalyse, oktober /* indlæsning af data og dannelse af sasuser.redcell */ data sasuser.redcell; input grp redcell; datalines; ; /* scatter plot, s. 3 */ proc gplot data=a1; plot redcell*grp / haxis=axis1 vaxis=axis2 frame; axis1 order=(1 to 3 by 1) offset=(8,8) label=(h=3 gruppe nr. ) value=(h=3) minor=none; axis2 offset=(1,1) value=(h=3) minor=none label=(a=90 R=0 H=3 red cell foliate ); symbol1 v=circle i=none l=1 h=3 w=2; /* analyse s */ proc anova data=sasuser.redcell; class grp; model redcell=grp; /* s. 9 */ means grp / hovtest=levene welch; /* s */ output out=ny p=predikt r=resid; /* analyse s */ proc glm data=sasuser.redcell; class grp; model redcell=grp / solution clparm; /* s. 10 */ means grp / hovtest=levene; /* s. 14 */ lsmeans grp / pdiff adjust=tukey cl; /* s */ /* figurer s */ proc univariate normal data=ny; var resid; histogram / cfill=gray height=3 normal; /* s. 12 */ probplot / height=3 normal(mu=est sigma=est l=33); /* s. 13 */ inset mean std skewness / header= descriptive ; /* nonparametrisk sammenligning, s. 23 */ proc npar1way data=a1 anova wilcoxon; exact wilcoxon; class grp; var redcell; variansanalyse, oktober variansanalyse, oktober ANOVA i relation til t-test antal forskellige samme grupper individer individ 2 uparret parret t-test t-test 3 ensidet tosidet variansanalyse variansanalyse Tosidet variansanalyse forekommer dog oftest i anden sammenhæng: Personerne kan inddeles efter flere forskellige inddelingskriterier (f.eks. rygestatus og aktivitetsniveau) Tosidet variansanalyse (two-way analysis of variance, ANOVA) To inddelingskriterier, A og B Data i tosidet skema (dog ikke, når der skal regnes på dem!): B A 1 2 c r Balanceret, hvis der er lige mange obs. i hver celle (evt. kun 1). Effekt på begge leder (dvs. af begge faktorer).

8 variansanalyse, oktober variansanalyse, oktober Linieplot ( Spaghettiogram ) Gentagne målinger Korttidseffekt af enalaprilat på puls Tid Person mean mean Ved sammenligning af tidspunkter skal man eliminere variation mellem personer, ganske som i et parret t-test Puls vs. tid, observationer hørende til samme person forbundet. Ideelt er forløbene parallelle (additivitet). variansanalyse, oktober variansanalyse, oktober Model: Der er effekt af person (p) og tid (t): Y pt = µ + α p + β t + ε pt Forsøg på grafisk illustration af modellen: Ideelt set parallelle forløb, overlejret med normalfordelt variation giver mere irregulære forløb. og disse virker additivt. (Nødvendigt med passende bånd på parametrene, i SAS f.eks. α 9 = β 4 = 0). ε pt uafhængige, middelværdi 0, samme varians, normalfordelte, dvs. ε pt N(0, σ 2 ). Variationsopspaltning: Person 1 Person 2 Person 1 Person 2 SS tot = SS person + SS tid + SS res Time point Time point

9 variansanalyse, oktober variansanalyse, oktober Man kan igen med fordel anvende: Variansanalyseskema df SS MS F P Personer < Tid Resid Total Statistics/Anova/Linear Models med puls som Dependent og såvel person som tid som Class-variable. I Statistics vælges Parameter Estimates: The GLM Procedure Class Level Information Class Levels Values person tid Number of observations 36 Højsignifikant forskel på personer (forventeligt, men ikke så interessant) Signifikant tidsforskel, P=0.018, men vi mangler estimater! Dependent Variable: puls Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE puls Mean Source DF Type I SS Mean Square F Value Pr > F tid person <.0001 variansanalyse, oktober variansanalyse, oktober Source DF Type III SS Mean Square F Value Pr > F tid person <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 tid B tid B tid B tid B... person B person B person B <.0001 person B <.0001 person B <.0001 person B person B <.0001 person B <.0001 person B... NOTE: The X X matrix has been found to be singular, and a generalized inverse was used to solve the normal equations. Terms whose estimates are followed by the letter B are not uniquely estimable. Bemærk, at de sidste niveauer af hver faktor (Class-variabel) bliver sat til 0 De kaldes referenceniveauer Forventede værdier for person=3, tid=30: Residualer ŷ pt = ˆµ + ˆα p + ˆβ t = = r pt = y pt ŷ pt = y pt ȳ p. ȳ.t + ȳ.. Altså f.eks. ŷ 32 = r 32 = = 0.84

10 variansanalyse, oktober variansanalyse, oktober Residualer vs. forventede værdier Modelkontrol Se efter: Varianshomogenitet (systematik, trompet?) Normalfordelingstilpasning (tunge haler?, skæv fordeling?) Mangel på additivitet (vekselvirkning):. kan kun undersøges hvis der er flere observationer pr. celle Seriel korrelation? (Naboobservationer hænger tættere sammen) Der bør ikke ses nogen systematik. variansanalyse, oktober variansanalyse, oktober Check af normalfordelingsantagelsen: Check af uafhængighed er rimeligt her, da der er flere observationer for hver person Vi har godt nok et personniveau, men der kunne være ekstra seriel korrelation, dvs. at naboresidualer kunne ligne hinanden Det ser rimeligt ud Der ser ikke ud til at være seriel korrelation her

11 variansanalyse, oktober variansanalyse, oktober Direkte programmering af den tosidede variansanlyse: data sasuser.puls; infile puls.tal firstobs=2; input person tid0 tid30 tid60 tid120; /* udfoldning af data til 4 linier pr. person */ tid=0; puls=tid0; output; tid=30; puls=tid30; output; tid=60; puls=tid60; output; tid=120; puls=tid120; output; /* figur s. 29 */ proc gplot data=sasuser.puls; plot puls*tid=person / nolegend haxis=axis1 vaxis=axis2 frame; axis1 value=(h=3) minor=none label=(h=3); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3); symbol1 v=circle i=join c=black l=2 h=3 w=2 r=9; /* analyse s */ proc glm data=sasuser.puls; class person tid; model puls=tid person / solution; output out=ny p=predikt r=resid; /* figur s. 37 */ proc gplot gout=plotud data=ny; plot resid*yhat / vref=0 lv=33 haxis=axis1 vaxis=axis2 frame; axis1 value=(h=3) minor=none label=(h=3 Expected ); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3 Residual ); symbol1 v=circle i=none c=black h=3 l=2 w=2 r=9; /* figurer s. 38 */ proc univariate normal data=ny gout=plotud; var resid; histogram / cfill=gray height=3 normal; probplot / height=3 normal(mu=est sigma=est l=33); inset mean std skewness / header= descriptive ; data b1; set ny; lagresid=lag(resid); /* figur s. 39 */ proc gplot gout=plotud data=b1; where tid>0; plot resid*lagresid / href=0 lh=33 vref=0 lv=33 haxis=axis1 vaxis=axis2 frame; axis1 value=(h=3) minor=none label=(h=3 forrige residual ); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3 residual ); symbol1 v=circle i=none c=black h=3 l=2 w=2 r=9; variansanalyse, oktober variansanalyse, oktober Vekselvirkning (interaktion) Eksempel på 2 inddelingskriterier: køn rygestatus Eksempel: Rygnings effekt på fødselsvægt Respons: FEV 1 Her er der vekselvirkning (interaktion). Mulige forklaringer: biologisk forskel på effekt af rygning måske ryger kvinderne ikke helt så meget måske virker rygningen som en relativ (%-vis) nedsættelse af FEV 1

12 variansanalyse, oktober variansanalyse, oktober Eksempel: Fibrinogen efter miltoperation 34 rotter randomiseres, på 2 måder 17 får fjernet milten (splenectomy=yes) 8/17 i hver gruppe opholder sig i stor højde (place=altitude) Interaktion/vekselvirkning mellem mængden og varigheden af rygningen Outcome: Fibrinogen niveau i mg% ved dag 21 Der er effekt af mængden, men kun hvis man har røget længe. Der er effekt af varigheden, og denne effekt øges med mængden Effekten af mængden afhænger af... og effekten af varigheden afhænger af... variansanalyse, oktober variansanalyse, oktober Tosidet variansanalyse med vekselvirkning: Den sædvanlige model: Y spr = µ + α s + β p + ε spr splenectomy (s=yes/no) og place (p=altitude/control) virker additivt. Statistics ANOVA Linear Models hvor fibrinogen sættes som Dependent og såvel splenectomy som place som Class. For at få interaktionsleddet med, klikkes nu Model, hvorefter man udvælger begge variable og trykker Cross/Add: Model med interaktion (vekselvirkning) Y spr = µ + α s + β p + γ sp + ε spr Her specificeres en interaktion mellem splenectomy og place, dvs. effekten af ophold i stor højde tænkes at afhænge af, hvorvidt man har fået fjernet milten eller ej. og omvendt... The GLM Procedure Class Level Information Class Levels Values splenectomy 2 no yes place 2 altitude control Number of observations 34 Dependent Variable: fibrinogen Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE fibrinogen Mean

13 variansanalyse, oktober variansanalyse, oktober Source DF Type I SS Mean Square F Value Pr > F place splenectomy splenectomy*place Source DF Type III SS Mean Square F Value Pr > F place splenectomy splenectomy*place Referenceniveauerne er place=control, splenectomy=yes (de sidste i den alfabetiske rækkefølge) så disse har forventet fibrinogenniveau på intercept= For de andre niveauer skal der adderes et eller flere ekstra estimater, således: Standard Parameter Estimate Error t Value Intercept B place altitude B place control B.. splenectomy no B splenectomy yes B.. splenectomy*place no altitude B splenectomy*place no control B.. splenectomy*place yes altitude B.. splenectomy*place yes control B.. Parameter Pr > t Intercept <.0001 place altitude place control. splenectomy no splenectomy yes. splenectomy*place no altitude splenectomy*place no control. splenectomy*place yes altitude. splenectomy*place yes control. place splenectomy control altitude yes = no = = variansanalyse, oktober variansanalyse, oktober Vi kan godt få SAS til at udregne disse niveauer explicit: I Model under Linear Models fjernes hovedvirkningerne, og der afkrydses i No intercept The GLM Procedure Dependent Variable: fibrinogen Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Uncorrected Total Vekselvirkningen er ikke signifikant (P=0.77), så vi simplificerer til en tosidet variansanalyse uden vekselvirkning: The GLM Procedure Dependent Variable: fibrinogen Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE fibrinogen Mean Source DF Type III SS Mean Square F Value Pr > F Source DF Type III SS Mean Square F Value Pr > F splenectomy*place <.0001 Standard Parameter Estimate Error t Value splenectomy*place no altitude splenectomy*place no control splenectomy*place yes altitude splenectomy*place yes control Parameter Pr > t splenectomy*place no altitude <.0001 splenectomy*place no control <.0001 splenectomy*place yes altitude <.0001 splenectomy*place yes control <.0001 men så mister vi muligheden for at teste place splenectomy Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 place altitude B place control B... splenectomy no B splenectomy yes B... Parameter 95% Confidence Limits Intercept place altitude place control.. splenectomy no splenectomy yes..

14 variansanalyse, oktober variansanalyse, oktober Modelkontrolplots Test for normalitet: Goodness-of-Fit Tests for Normal Distribution Test ---Statistic p Value----- Kolmogorov-Smirnov D Pr > D >0.150 Cramer-von Mises W-Sq Pr > W-Sq Anderson-Darling A-Sq Pr > A-Sq variansanalyse, oktober variansanalyse, oktober Direkte programmering af interaktion: data a1; input place $ splenectomy $ fibrinogen; datalines; a y 528 a y 444 a y 228 c n 388 c n 425 c n 344 c n 425 ; /* figur s. 45 */ proc gplot data=sasuser.fibronogen; plot fibrinogen*group / nolegend haxis=axis1 vaxis=axis2 frame; axis1 offset=(3,3) value=(h=2) minor=none label=(h=3); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3); symbol1 v=circle i=none c=black h=3; /* analyse s */ proc glm data=sasuser.fibronogen; class splenectomy place; model fibrinogen=place splenectomy place*splenectomy / solution; *output out=ny p=yhat r=resid; data sasuser.fibrinogen; set a1; if place= a then place= altitude ; if place= c then place= control ; if splenectomy= y then splenectomy= yes ; if splenectomy= n then splenectomy= no ; if place= a and splenectomy= y then group= yes_altitude ; if place= c and splenectomy= y then group= yes_control ; if place= a and splenectomy= n then group= no_altitude ; if place= c and splenectomy= n then group= no_control ; /* analyse s. 50 */ proc glm data=sasuser.fibronogen; class splenectomy place; model fibrinogen=place*splenectomy / noint solution; /* analyse s. 51 */ proc glm data=sasuser.fibronogen; class splenectomy place; model fibrinogen=place splenectomy / solution clparm; output out=ny p=yhat r=resid;

15 variansanalyse, oktober /* figur s. 52 */ proc gplot data=ny; plot resid*yhat / haxis=axis1 vaxis=axis2 frame; axis1 value=(h=3) minor=none label=(h=3 Expected ); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3 Residual ); symbol1 v=circle i=none c=black h=3 l=2 w=2 r=9; /* figur og test s ?? */ proc univariate normal data=ny; var resid; probplot / height=3 normal(mu=est sigma=est l=33); histogram / cfill=gray height=3 normal; inset mean std skewness / header= descriptive ;

Basal statistik. 2. oktober Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol

Basal statistik. 2. oktober Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Basal statistik 2. oktober 2007 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Lene Theil Skovgaard, Biostatistisk Afdeling Institut

Læs mere

Basal statistik. 30. september 2008

Basal statistik. 30. september 2008 Basal statistik 30. september 2008 Variansanalyse Sammenligning af flere grupper Ensidet variansanalyse Tosidet variansanalyse Interaktion Modelkontrol Peter Dalgaard, Biostatistisk Afdeling Institut for

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 Sammenligning af to grupper: T-test Dimensionering af undersøgelser

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE Økonomisk Kandidateksamen Teoretisk Statistik Eksamenstermin: Sommer 2004, dato: 3. juni 4 timers prøve med alle hjælpemidler, besvarelse på Dansk Opgave En simpel tilfældig stikprøve på 500 udtrukket

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Basal statistik. 16. september 2008

Basal statistik. 16. september 2008 Basal statistik 16. september 2008 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til

Læs mere

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22. Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende

Læs mere

Basal statistik 19. september Eksempel: To metoder, som forventes at skulle give samme resultat:

Basal statistik 19. september Eksempel: To metoder, som forventes at skulle give samme resultat: En- og to-stikprøve problemer, september 2006 1 Basal statistik 19. september 2006 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Forelæsning 11: Tovejs variansanalyse, ANOVA

Forelæsning 11: Tovejs variansanalyse, ANOVA Introduktion til Statistik Forelæsning 11: Tovejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren Faculty of Life Sciences Program Sammenligning af grupper Ensidet ANOVA Claus Ekstrøm E-mail: ekstrom@life.ku.dk Sammenligning af to grupper: tre eksempler Sammenligning af mere end to grupper: ensidet

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

Ensidet variansanalyse

Ensidet variansanalyse Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger

Læs mere

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017 Faculty of Health Sciences Basal statistik Lille SAS Manual Lene Theil Skovgaard 31. januar 2017 1 / 42 Selve sproget Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Basal statistik. 29. januar 2008

Basal statistik. 29. januar 2008 Basal statistik 29. januar 2008 Deskriptiv statistik Grafik Summary statistics Normalfordelingen Typer af data Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017 Faculty of Health Sciences Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 26. september 2017 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

Restsaltmængdernes afhængighed af trafikken,

Restsaltmængdernes afhængighed af trafikken, Restsaltmængdernes afhængighed af trafikken, Thomas Glue, marts 2. Trafikintensitet...2 Indledende definitioner...2 Regressionsanalyser på trafikintensiteten...6 Justering af restsaltmængder i henhold

Læs mere

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual Faculty of Health Sciences Selve sproget Basal statistik Lille SAS Manual Lene Theil Skovgaard 5. september 2017 Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al Program Tosidet variansanalyse og forsøgsplanlægning Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Ensidet ANOVA: repetition og Collinge eksempel. Additiv tosidet ANOVA (blokforsøg) Tosidet ANOVA

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Basal statistik. 23. september 2008

Basal statistik. 23. september 2008 Basal statistik 23. september 2008 Korrelation og regression Simpel lineær regression Todimensionale normalfordelinger Korrelation vs. regression Modelkontrol Diagnostics Thomas Scheike, Biostatistisk

Læs mere

Program. 1. Flersidet variansanalyse 1/11

Program. 1. Flersidet variansanalyse 1/11 Program 1. Flersidet variansanalyse 1/11 To-sidet variansanalyse Eksempel: (opgave 14.2 side 587) vitamin indhold i frossen juice målt for ialt 9 kombinationer af mærke (Rich food, Sealed-sweet, Minute

Læs mere

INTRODUKTION TIL dele af SAS

INTRODUKTION TIL dele af SAS INTRODUKTION TIL dele af SAS Der er flere forskellige angrebsvinkler ved statistiske analyser i SAS. Vi skal her kun beskæftige os med to af disse, nemlig Direkte programmering. Brug af SAS ANALYST Hvilken

Læs mere

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen Kursus 02402/02323 Introducerende Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Oversigt 1 Intro: Regneeksempel og TV-data fra B&O 2 Model og hypotese Per Bruun Brockhoff DTU Compute, Statistik

Læs mere