Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual"

Transkript

1 Faculty of Health Sciences Selve sproget Basal statistik Lille SAS Manual Lene Theil Skovgaard 5. september 2017 Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende værdier (14) Transformation (15) Sammensætning af datasæt (set og merge, 16-17) Opdeling af datasæt (by, where, 18) 1 / 42 2 / 42 Basale procedurer Grafik PROC MEANS (19): Summary statistics PROC UNIVARIATE (26,31): Summary statistics, grafik og tests PROC SORT (17): Sortering efter variable Siderne Scatter plot, plot med linier (21-23) Histogrammer (24) Box plot (25) Fraktildiagram, qqplot (26) Kaplan-Meier plot (27) Opdelte plots (panels) (28) Plots i forbindelse med statistiske analyser (29) 3 / 42 4 / 42

2 Statistiske analyser, I Statistiske analyser, II Se oversigten på s. 7 Parret sammenligning (31) Parret T-test Wilcoxon signed rank test Sammenligning af to grupper (32) Uparret T-test Mann-Whitney test Sammenligning af mere end to grupper (33) Variansanalyse (ANOVA) Kruskal-Wallis test Lineær regression (34) Multipel lineær regression (35-36) Se oversigten på s. 7 Tabeller/χ 2 -test (37-38) Logistisk regression (39) Proportional odds modeller (40) Overlevelsesdata (41) Kaplan-Meier kurver Log-rank test Cox regression Gentagne målinger, mixed models (42) Varianskomponentmodeller Gentagne målinger over tid 5 / 42 6 / 42 Notation Forklarende variable = Kovariater Outcome Dikotom Kategorisk Kvantitativ Kategoriske og kvantitative Dikotom 2*2-tabeller χ 2 -test Logistisk regression Kategorisk Tabeller/χ 2 -test Generaliseret logistisk regression Ordinale svært, f.eks. proportional odds modeller Kvantitativ Mann-Whitney Kruskal-Wallis Robust multipel Wilcoxon signed rank Friedman regression Normalfordelt T-test Variansanalyse Kovariansanalyse parret/uparret ensidet/tosidet Multipel regression Censureret Log-rank test Cox regression Korrelerede Varianskomponent- Modeller for normalfordelte modeller gentagne målinger På de følgende sider benyttes forskellige variabelnavne. Nogle af disse vil være let gennemskuelige, f.eks. alder, bmi, mens andre er mere generiske og forklares herunder: Y er et kvantitativt outcome (f.eks. blodtryk eller fødselsvægt) GRP er en gruppering af individer (f.eks. køn med to værdier, eller behandling med tre værdier) X1 og X2 er kvantitative kovariater (f.eks. alder og bmi) 7 / 42 8 / 42

3 Indlæsning fra nettet Indlæsning fra eget drev Hent tekst-filen fil.txt fra nettet DATA a1; INFILE " URL FIRSTOBS=2; INPUT grp$ y x1 x2; eller sådan her FILENAME navn URL " Hent tekst-filen fil.txt fra mappen "minfolder" DATA a1; INFILE "C:\minfolder\fil.txt" FIRSTOBS=2; INPUT grp$ y x1 x2; DATA a1; INFILE navn FIRSTOBS=2; INPUT grp$ y x1 x2; 9 / / 42 Hentning af allerede eksisterende SAS-data Indlæsning fra Excel Hent SAS-data "fil" fra mappen "minfolder" LIBNAME sas "C:\minfolder"; DATA a1; SET sas.fil; Hent SAS-data "fil" fra mappen "sasuser" DATA a1; SET sasuser.fil; Hent fil.xls ind fra mappen "minfolder" på eget drev PROC IMPORT OUT= WORK.a1 DATAFILE="C:\minfolder\fil.xls" DBMS=xls REPLACE; GETNAMES=YES; Se også Birthes mere udførlige vejledning på linket: Man kan altid erstatte navnet "a1" med "sasuser.a1", hvis man vil lave en permanent sasuser-fil 11 / / 42

4 Definition af nye variable skal skrives efter data a1; og inden det første run; dvs. i det, vi kalder et DATA step Eksempel: DATA vitamind; INFILE "C:\article2\vitaminD.txt" FIRSTOBS=2; INPUT country$ category$ vitd age height weight sunexp$ vitdintake; logvitd=log10(vitd); bmi=weight/(height/100)**2; IF bmi>25 THEN fat=1; IF bmi>0 AND bmi<=25 THEN fat=0; Bemærk: Det er vigtigt, at der kræves bmi>0 ved definition af fat=0, idet missing values ellers ville blive til fat=0, se s / 42 Missing values = manglende/uoplyste værdier Numeriske variable (tal, der kan regnes på): Benyt punktum, og aldrig -9, 999 etc. Karaktervariable (f.eks. mand, kvinde etc): Benyt NA (Not Available) eller punktum aldrig blanke Bemærk: Et punktum for en numerisk variabel anses for at være mindre end alle tal (dvs. minus uendelig), så man skal passe på med logiske sammenligninger, såsom definitionen af fat på s / 42 Transformation Sammensætning af data, I typisk (langt overvejende) logaritmetransformation: Her er i virkeligheden tale om definition af en ny variabel, idet man aldrig bør redefinere en allerede eksisterende variabel. Se derfor s. 13, hvor variablen vitd bliver logaritmetransformeret. Sammensæt to datasæt, et med kvinderne (female) og et med mændene (male): DATA alle_observationer; SET male female; Disse datasæt sættes under hinanden, så der altså kommer flere observationer i det fælles datasæt. 15 / / 42

5 Sammensætning af data, II Opdelte analyser Sammensæt to datasæt, et med alder, højde, vægt etc. (basalt) og et med blodprøvesvar (blod) for de samme individer (id): PROC SORT DATA=basalt; BY id; PROC SORT DATA=blod; BY id; DATA alle_variable; MERGE basalt blod; BY id; Disse datasæt sættes ved siden af hinanden, så der altså kommer flere variable i det fælles datasæt. Det kræver forudgående sortering af begge datasæt (PROC SORT). Foretag analyser på f.eks. mænd og kvinder hver for sig: PROC SORT DATA=a1, BY gender; PROC REG DATA=a1; BY gender; MODEL y=x1; Foretag kun analysen på f.eks. kvinderne: PROC REG DATA=a1; WHERE gender="female"; MODEL y=x1; 17 / / 42 Summary statistics Grafik såsom gennemsnit, median, spredning etc. Den skrabede kode: PROC MEANS DATA=a1; Koden med lidt mere selvbestemmelse: PROC MEANS N MEAN MEDIAN STDERR DATA=a1; CLASS gender; VAR x1 x2; Der er grundlæggende 3 metoder/systemer til grafik i SAS: 1. PROC GPLOT: Den gamle procedure, som kan nærmest alt, men som giver ret grimme plots, hvis ikke man tilføjer en del options. 2. PROC SGPLOT (og SGSCATTER, SGPANEL): De nyere procedurer, som meget let giver pæne tegninger, men som er svære at ændre på. 3. ODS-systemet i forbindelse med statistiske procedurer, som giver relevante tegninger af prediktioner, residualer mv. i en pæn udgave. 19 / / 42

6 PROC GPLOT SYMBOL-sætninger i GPLOT Vi vil tegne blodtryk (bp) op mod alderen (alder), med forskellige symboler for køn (variablen gender): Den skrabede kode: PROC GPLOT DATA=a1; PLOT bp*alder=gender; Koden til det pænere plot: 21 / 42 PROC GPLOT DATA=a1; PLOT bp*alder=gender / HAXIS=axis1 VAXISvaxis=axis2 frame; AXIS1 ORDER=(20 to 80 by 5) VALUE=(H=2) MINOR=none LABEL=(H=3); AXIS2 ORDER=(100 to 160 by 10) VALUE=(H=2) MINOR=none LABEL=(A=90 R=0 H=3); SYMBOL1 V=circle I=none C=red H=2; SYMBOL2 V=triangle I=none C=blue H=2; ; Plots med regressionslinier: I=rl for regressionslinie, L= for stipling, og W= for tykkelse: SYMBOL1 V=circle I=rl C=red H=2 L=1 W=2; SYMBOL2 V=triangle I=rl C=blue H=2 L=2 W=2; Regressionslinier med konfidens- eller prediktionsgrænser: I=rlclm95 hhv I=rlcli95 Udglattede kurver (for at afgøre linearitet): I=sm75s, hvor 75 blot skal være et tale mellem 1 og 99, idet stort tal svarer til meget udglatning 22 / 42 PROC SGPLOT Histogram Plottet fra s. 21 kan fremstilles således: PROC SGPLOT DATA=a1; SCATTER Y=bp X=alder / group=gender; og hvis man selv vil styre noget mere, kan man skrive: PROC SGPLOT DATA=a1; SCATTER Y=bp X=alder / GROUP=gender MARKERATTRS=(SYMBOL=circlefilled); med overlejret udglattet kurve: PROC SGPLOT DATA=a1; HISTOGRAM bp; DENSITY bp; og hvis vi skal opdele efter køn: PROC SGPANEL DATA=a1; PANELBY gender / ROWS=1; HISTOGRAM bp; DENSITY bp; Se også s. 26, hvor histogrammer laves vha UNIVARIATE-proceduren 23 / / 42

7 Box Plots bruges næsten altid kun med flere grupper, som f.eks opdelt efter køn: PROC SGPLOT DATA=a1; VBOX bp / CATEGORY=gender; eller med den direkte procedure: PROC SORT DATA=a1; BY gender; PROC BOXPLOT DATA=a1; PLOT bp*gender; Fraktildiagrammer kan enten laves ved hjælp af proceduren UNIVARIATE (se mere om denne s. 31) eller i forbindelse med modelkontrol, hvor der laves fraktildiagram af residualer, ved brug af ODS-systemet. PROC UNIVARIATE DATA=a1; QQPLOT x1; Her kan også laves histogrammer: PROC UNIVARIATE DATA=a1; HISTOGRAM x1; 25 / / 42 Kaplan-Meier overlevelseskurver Flere figurer samlet på en side Her betegner eventtime det tidspunkt, hvor der sker noget for personen. Det kan være enten et event (censur 0) eller en censurering (censur=0). Der opdeles i grupper, efter variablen grp. ODS GRAPHICS ON; PROC LIFETEST DATA=a1 PLOTS=(s); TIME eventtime*status(0); STRATA grp; ODS GRAPHICS OFF; kaldes PANELS: Ved brug af SGPANEL, f.eks. med 4 forskellige behandlinger (grp), hvor der i hvert plot tegnes tidsudviklinger af blodtrykket (bp) for hvert individ (id): PROC SGPANEL DATA=a1; PANELBY grp / rows=2 columns=2; SERIES Y=bp X=tid / GROUP=id; 27 / / 42

8 ODS-systemet Statistiske analyser Otput Delivery System giver plots af modellen (de predikterede værdier) relevante modelkontrol-tegninger i forbindelse med statistiske analyser. Hvilke plots, der produceres, afhænger helt af den anvendte procedure, men fælles er opsætningen ODS GRAPHICS ON / IMAGENAME="et_navn"; PROC et-eller-andet PLOTS=all DATA=a1;... ODS GRAPHICS OFF; På de følgende sider benyttes disse betegnelser: Y er et kvantitativt outcome (f.eks. blodtryk eller fødselsvægt) GRP er en gruppering af individer (f.eks. køn med to værdier, eller behandling med tre værdier) X1 og X2 er kvantitative kovariater (f.eks. alder og bmi) De nonparametriske metoder benyttes, hvis man ikke med nogenlunde rimelighed kan antage, at residualerne er normalfordelte. I stedet for PLOTS=all kan man skrive navnet på specifikke plots. 29 / / 42 Parret sammenligning Sammenligning af to grupper Her angiver y1 og y2 to målinger på samme unit (f.eks. målt i hvile kontra bevægelse, eller med to forskellige apparater): Parametrisk, dvs. parret T-test: PROC TTEST DATA=a1; PAIRED y1*y2; Nonparametrisk, dvs. et Wilcoxon signed rank test: DATA a2; SET a1; diff=y1-y2; PROC UNIVARIATE DATA=a1; VAR diff; Parametrisk, dvs. T-test: PROC TTEST DATA=a1; VAR y; Nonparametrisk, dvs. et Mann-Whitney test, også kaldet et Wilcoxon rank-sum test: PROC NPAR1WAY DATA=a1 WILCOXON; VAR y; *Exact; Bemærk, at linien EXACT; er udkommenteret, idet den ofte bevirker, at programmet går helt i stå (selv hvis data kun har moderat størrelse). 31 / / 42

9 Sammenligning af mere end to grupper Simpel lineær regression, I Parametrisk, dvs. en ensidet ANOVA: MODEL y=grp / SOLUTION; Ved brug af REG (simplest output): PROC REG DATA=a1; MODEL y=x1; Nonparametrisk, dvs. et Kruskal-Wallis test: PROC NPAR1WAY DATA=a1 WILCOXON; VAR y; Tosidet ANOVA: Se s. 36 Ved brug af GLM (generaliserer til andre typer analyser): MODEL y=x1 / SOLUTION; 33 / / 42 Multipel lineær regression, I Multipel lineær regression, II Fit to parallelle regressionslinier (kovariansanalyse) MODEL y = grp x1 / SOLUTION; Fit to ikke-parallelle regressionslinier (med interaktion=vekselvirkning= effektmodifikation) MODEL y = grp x1 grp*x1 / SOLUTION; Fit en tosidet ANOVA (to kategoriske kovariater) CLASS grp1 grp2; MODEL y = grp1 grp2 / SOLUTION; Fit en plan (to kvantitative kovariater) MODEL y = x1 x2 / SOLUTION; 35 / / 42

10 Tabeller, χ 2 -test Tabeller, Fishers eksakte test Nu betegner grp en gruppering af individer, f.eks. en behandling, og udfald betegner et dikotomt outcome (altså et, der kun kan antage to værdier, f.eks. 0/1 eller ja/nej. Vi tester om sandsynligheden for 1 (eller ja) er den samme i de to grupper: χ 2 -test for uafhængighed PROC FREQ DATA=a1; TABLES grp*udfald / NOCOL NOPERCENT RISKDIFF RELRISK; Bemærk: Rækkefølgen af variablene i TABLES-sætningen er vigtig, man skal have grupperingen stående først! Det er tilladt med mere end to værdier for såvel grp som udfald, men så kan RISKDIFF RELRISK ikke anvendes. Vigtigt: Se også s / 42 Hvis de forventede antale i tabellen er små, dvs. hvis de ikke opfylder Mindst 80% er over 5 Alle er mindst 1 så skal man anvende Fishers eksakte test i stedet for χ 2 -testet Fishers eksakte test for uafhængighed PROC FREQ DATA=a1; TABLES grp*udfald / NOCOL NOPERCENT RISKDIFF RELRISK EXACT; Bemærk: De forventede antal kan fås ved at benytte option EXPECTED 38 / 42 Logistisk regression Proportional odds modeller Her betegner udfald et dikotomt outcome (altså et, der kun kan antage to værdier, f.eks. 0/1. Vi undersøger sammenhængen mellem sandsynligheden for 1, i forhold til en eller flere kovariater, enten kategoriske (grp) eller kvantitative (x1 og x2): PROC GENMOD DESCENDING DATA=a1; MODEL UDFALD = grp x1 x2 / DIST=bin LINK=logit; PROC LOGISTIC DATA=a1; CLASS grp / PARAM=glm; MODEL UDFALD(EVENT="1") = grp x1 x2 / LACKFIT LINK=logit; Nu betegner udfald et ordinalt outcome (altså et, der kan antage mere end to værdier, på en ordinal skala, f.eks. smerte i 4 kategorier: ingen, let, moderat og svær). Vi undersøger sammenhængen mellem sandsynlighederne for de enkelte niveauer, i forhold til en eller flere kovariater, enten kategoriske (grp) eller kvantitative (x1 og x2): PROC LOGISTIC DATA=a1 DESCENDING; MODEL udfald = grp x1 x2; run; 39 / / 42

11 Overlevelsesdata Her betegner eventtime det tidspunkt, hvor der sker noget for personen. Det kan være enten et event (censur 0) eller en censurering (censur=0). Vi undersøger sammenhængen mellem hazard for den pågældende event, og en eller flere kovariater, enten kategoriske (grp) eller kvantitative (x1 og x2): Log-rank test (non-parametrisk): PROC PHREG DATA=a1; CLASS grp / PARAM=GLM; MODEL eventtime*censur(0) = grp / TIES=DISCRETE; Cox-regression (proportionale intensiteter): 41 / 42 PROC PHREG DATA=a1; MODEL eventtime*censur(0) = grp x1 x2 / RL; Korrelerede data typisk flere observationer for hvert individ (patient) over tid (tid). Patienterne tænkes inddelt i grupper, som skal sammenlignes (grp). Med en simpel kovarians/korrelations-struktur (CS): PROC MIXED DATA=a1; MODEL y = grp tid grp*tid / DDFM=kr SOLUTION CL; RANDOM INTERCEPT / SUBJECT=patient; Med en seriel kovarians/korrelations-struktur (AR1): 42 / 42 PROC MIXED DATA=a1; MODEL y = grp tid grp*tid / DDFM=kr SOLUTION CL; REPEATED tid / SUBJECT=patient TYPE=ar1;

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017 Faculty of Health Sciences Basal statistik Lille SAS Manual Lene Theil Skovgaard 31. januar 2017 1 / 42 Selve sproget Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Hvorfor SAS Kort intro til SAS

Hvorfor SAS Kort intro til SAS Hvorfor SAS Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til

Læs mere

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22. Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende

Læs mere

Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard

Kort intro til SAS. Efterår 2015. Janne Petersen Judith L Jacobsen Lene Theil Skovgaard Kort intro til SAS Efterår 2015 Janne Petersen Judith L Jacobsen Lene Theil Skovgaard 1 Hvorfor SAS Kan alt Alle ph.d. studerende har gratis adgang Fra universitetet eller hospitalerne Kode --- hjælp fra

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

INTRODUKTION TIL dele af SAS

INTRODUKTION TIL dele af SAS INTRODUKTION TIL dele af SAS Der er flere forskellige angrebsvinkler ved statistiske analyser i SAS. Vi skal her kun beskæftige os med to af disse, nemlig Direkte programmering. Brug af SAS ANALYST Hvilken

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable Faculty of Health Sciences Logistisk regression: Interaktion Kvantitative responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Introduktion til GLIMMIX

Introduktion til GLIMMIX Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik ... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 24. oktober 2017 Biokemisk iltforbrug,

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017 Faculty of Health Sciences Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 26. september 2017 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Praktisk håndtering af data. Vitamin D eksemplet. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Sammenligning af to grupper: T-test Dimensionering af undersøgelser Sammenligning af flere end

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 12. september / 116 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 1 / 116 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 15. januar 2018

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 15. januar 2018 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 15. januar 2018 1 / 91 Indhold Planlægning af undersøgelse, protokol Grafik, Basale begreber Parrede sammenligninger

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Basal Statistik. Indhold. Planlægning af undersøgelse. Ide, Problemstilling. Faculty of Health Sciences. Begreber. Parrede sammenligninger.

Basal Statistik. Indhold. Planlægning af undersøgelse. Ide, Problemstilling. Faculty of Health Sciences. Begreber. Parrede sammenligninger. Faculty of Health Sciences Indhold Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 15. januar 2018 Planlægning af undersøgelse, protokol Grafik, Basale begreber Parrede sammenligninger

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion . februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Øvelser til basalkursus, 2. uge

Øvelser til basalkursus, 2. uge Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

SAS systemet SAS. SAS vinduer. 2012 Janne Petersen

SAS systemet SAS. SAS vinduer. 2012 Janne Petersen SAS systemet SAS 2012 Janne Petersen February 7, 2012 Styrken i SAS er dets evne til at håndtere store datasæt. Det er hurtigt og har mange statistiske og ikke-statistiske muligheder. Kan "alt", så det

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Faculty of Health Sciences. Basal statistik. Den generelle lineære model mv. Lene Theil Skovgaard. 14. marts 2017

Faculty of Health Sciences. Basal statistik. Den generelle lineære model mv. Lene Theil Skovgaard. 14. marts 2017 Faculty of Health Sciences Basal statistik Den generelle lineære model mv. Lene Theil Skovgaard 14. marts 2017 1 / 96 Den generelle lineære model mv. Ikke-lineære sammenhænge Opbygning af modeller Sammenligning

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 4. oktober 2016 Parret sammenligning, målemetoder med

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Deskriptiv Statitik. Judith L. Jacobsen, PhD. http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk

Deskriptiv Statitik. Judith L. Jacobsen, PhD. http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk Deskriptiv Statitik Judith L. Jacobsen, PhD. http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk Kursus formål Planlægning af studier selve indsamlingen af data, opstilling af statistiske hypoteser

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 Sammenligning af to grupper: T-test Dimensionering af undersøgelser

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 87 Indhold Planlægning af undersøgelse, protokol Grafik Basale begreber Parrede

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Træningsaktiviteter dag 3

Træningsaktiviteter dag 3 Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk

Læs mere

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2 Jon K. Bjerregaard Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Hvorfor bøvle med MIXED

Hvorfor bøvle med MIXED Hvorfor bøvle med MIXED E. Jørgensen 1 1 Genetik og Bioteknologi Danmarks Jordbrgsforskning Forskergrppe for Statistik og besltningsteori Årslev 18/01/2006 MIXED vs. GLM Lidt baggrnd Generel Lineær Model

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Introduktion til SAS. Faculty of Health Sciences

Introduktion til SAS. Faculty of Health Sciences Faculty of Health Sciences Introduktion til SAS Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Eksempel: Blodtryk og fedme OBESE: vægt/idealvægt,

Læs mere

Basal statistik. 16. september 2008

Basal statistik. 16. september 2008 Basal statistik 16. september 2008 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

SAS systemet. Kort introduktion til SAS. SAS vinduer. Janne Petersen. Efterår 2013

SAS systemet. Kort introduktion til SAS. SAS vinduer. Janne Petersen. Efterår 2013 SAS systemet Kort introduktion til SAS Janne Petersen Efterår 2013 Styrken i SAS er dets evne til at håndtere store datasæt. Det er hurtigt og har mange statistiske og ikke-statistiske muligheder. Kan

Læs mere

Program. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression

Program. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression Program Indhold af kursus i overskrifter 1. overblik over kursus (opgaver fra sidst samt huspriser som eksempler). 2. p-værdi 3. uformel evaluering 1. sandsynlighedsregning sandsynlighedsfordelinger (normal,

Læs mere

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Hjemmesider:

Hjemmesider: Faculty of Health Sciences Korrelerede målinger Basal statistik Korrelerede målinger Lene Theil Skovgaard 4. april 2017 Tilfældige effekter Varianskomponentmodeller Modeller for longitudinelle målinger

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Repetition af variansanalyse Overlevelsesanalyse Bestemmelse af stikprøvestørrelse Matchning 30. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere