Statistik kommandoer i Stata opdateret 22/ Erik Parner

Relaterede dokumenter
Statistik kommandoer i Stata opdateret 16/ Erik Parner

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

MPH specialmodul Epidemiologi og Biostatistik

Morten Frydenberg 14. marts 2006

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Seniorkursus i Biostatistik og Stata, Dag 2

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Morten Frydenberg 26. april 2004

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Tema. Dagens tema: Indfør centrale statistiske begreber.

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Basal Statistik Kategoriske Data

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Produkt og marked - matematiske og statistiske metoder

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

1 Hb SS Hb Sβ Hb SC = , (s = )

En Introduktion til SAS. Kapitel 5.

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

Lineær og logistisk regression

Studieplan Biostatistik Semester 2

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Statistik i GeoGebra

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Opgaver til kapitel 3

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Morten Frydenberg Biostatistik version dato:

Løsning eksamen d. 15. december 2008

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Opgavebesvarelse, Basalkursus, uge 3

Ikke-parametriske tests

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Appendiks A Anvendte test statistikker

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Note om Monte Carlo metoden

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Postoperative komplikationer

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Basal Statistik - SPSS

Løsning til eksaminen d. 29. maj 2009

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Epidemiologi og Biostatistik

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Korrelation Pearson korrelationen

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Forelæsning 11: Kapitel 11: Regressionsanalyse

Uge 10 Teoretisk Statistik 1. marts 2004

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Kvantitative metoder 2

Transkript:

Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ Risiko og Risiko Differens... 2 Estimation af Rate Ratio og Rate Differens... 2 Estimation af Odds Ratio... 2 Stratificerede analyser... 2 Sammenligning af parrede proportioner (1-1 matched case-control studie)... 2 Test for ingen association i en rxc tabel... 3 Analyse af ventetidsdata... 3 Simple analyser af normalfordelt data... 3 Simple ikke parametriske test... 4 Styrkeberegning... 4 Indledning Dette dokument indeholder de Stata kommandoer, som er blevet brugt i MPH undervisningen i Biostatistik, samt et par supplerende kommandoer som kan være nyttige. Nogle kommando findes i en summary form, dvs. kommandoer, hvis man har tallene i hånden. F.eks. vil kommandoen give den estimerede proportion med et 95 % sikkerhedsinterval for en binomial fordeling med n=106 og antal observerede succeser lig 27. De fleste kommandoer har options. Alle options vil ikke blive gennemgået her. Der angives kun de mest naturlige valg. Man kan ved mange kommandoer indtaste data ind i tabel form ved at bruge ]. Simple beskrivelser Tabel over summary statistik Andre kommandoer! Data manipulation Generering af en krydsklassifikationsvariabel " 1

Generering af en grupperet variabel vha. cut ##$ "%% Estimation af proportioner ex Bemærk: Variablen skal være kodet 0/1. Summary form: ex Estimation af rater & Summary form: & ex %'(" Estimation af Relativ Risiko og Risiko Differens ) Bemærk* og ) skal være kodet 0/1 ex %" Estimation af Rate Ratio og Rate Differens )& Summary form: ++&+&+ ex "("((,"' Estimation af Odds Ratio ) ex "(', Stratificerede analyser Relativ Risiko ) Odds Ratio ) Odds Ratio ) Rate Ratio )& Sammenligning af parrede proportioner (1-1 matched case-control studie) +&&+& Bemærk: Een linie for hvert case-kontrol par. Både case_eksponering og kontrol_eksponering skal være kodet 0/1 ex,''", 2

Test for ingen association i en rxc tabel χ 2 -test for ingen association i en rxc tabel - - Summary for 2x2 tabel:.) - ex.%" - Summary for 3x2 tabel:.). - ex.(,. - Fishers eksakte test for ingen association i en rxc tabel: Syntaks som χ 2 -test for ingen association i en rxc tabel, blot vælges option. Analyse af ventetidsdata Opsætning af ventetidsdata ) +)- +)- +-) +-) Plot af Kaplan Meier kurve - (uden sikkerhedsintervaller) - ) (med sikkerhedsintervaller) -, (Opdelt i grupper) Sammenligning af ventetidsfordelinger vha. log-rang-testet Eksempel:, Beregning af rater fra ventetidsdata/person data (rater der 1000 enheder) (rate i undergrupper), Opsætning af data gruppe data &) ++/ Simple analyser af normalfordelt data T-test for en observationsrække - "%% - ""%%',,'"%% T-test for to uafhængige observationsrækker 3

Summary form: ) ),00,",,"0,0" T-test for parrede data QQ-plot til undersøgelse af normalitet 1 1 23% Histogram med normalfordelingskurve - 1-23% 1 Prædiktionsinterval 0%(0% 0%(0%) 0%(0%) Simple ikke parametriske test Mann-Whiney-Wilcoxon test til sammenligning af to uafhængige observationsrækker & &3% Wilcoxon signed rank test til sammenligning parrede data & &3% Styrkeberegning Nødvendig stikprøvestørrelse for sammenligning af to proportioner (binomial data) -45 hvor p1 og p2 er prævalensen i de to grupper, angiver signifikans niveauet (default 0.05), angiver den statistiske styrke (default 0.90) og r=n 2 /n 1 angiver ratio mellem antal af observationer i de to grupper (dafault 1). 00% -0%0(, Statistisk styrke for sammenligning af to proportioner (binomial data) -4 hvor n 1 og n 2 angiver antal observationer i gruppe 1 og gruppe 2. 4

00% " Nødvendig stikprøvestørrelse for sammenligning af to middelværdier (normalfordelte data) ))))-4/// 5 hvor angiver signifikans niveauet (default 0.05), angiver den statistiske styrke (default 0.90) og r=n 2 /n 1 angiver ratio mellem antal af observationer i de to grupper (dafault 1). "%"" 0'),), Statistisk styrke for sammenligning af to middelværdier (normalfordelte data) )))) hvor n 1 og n 2 angiver antal observationer i gruppe 1 og gruppe 2. "%"" ),)," 5