Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner



Relaterede dokumenter
Statistik kommandoer i Stata opdateret 22/ Erik Parner

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

MPH specialmodul Epidemiologi og Biostatistik

Morten Frydenberg 14. marts 2006

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff


Seniorkursus i Biostatistik og Stata, Dag 2

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

9. Chi-i-anden test, case-control data, logistisk regression.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Normalfordelingen. Statistik og Sandsynlighedsregning 2

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Morten Frydenberg 26. april 2004

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Morten Frydenberg Biostatistik version dato:

Studieplan Biostatistik Semester 3

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Produkt og marked - matematiske og statistiske metoder

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Epidemiologi og Biostatistik

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Basal Statistik Kategoriske Data

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

23. februar Epidemiologi og biostatistik. Uge 5, mandag 27. februar 2006 Michael Væth, Institut for Biostatistik.

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

OPLÆG TIL STUDIERETNINGSPROJEKTER I MATEMATIK-KEMI OM KVANTITATIV KEMISK ANALYSE OG STATISTISKE MODELLER

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Appendiks A Anvendte test statistikker

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Basal statistik. 30. januar 2007

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Korrelation Pearson korrelationen

Morten Frydenberg Biostatistik version dato:

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

02402 Løsning til testquiz02402f (Test VI)

Note til styrkefunktionen

Tillæg til studieordningen for bacheloruddannelsen i Sundhedsteknologi

Statistik i basketball

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Statistik i GeoGebra

Landsdækkende database for kræft i tykog endetarm (DCCG) Addendum til National a rsrapport januar december 2012

Løsning til øvelsesopgaver dag 4 spg 5-9

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Epidemiologi og Biostatistik

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Ikke-parametriske tests

SKRIFTLIG EKSAMEN I BIOSTATISTIK OG EPIDEMIOLOGI Cand.Scient.San, 2. semester 20. februar 2015 (3 timer)

Morten Frydenberg 25. april 2006

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Kapitel 2 Frekvensfordelinger

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Klasseøvelser dag 2 Opgave 1

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Maple 11 - Chi-i-anden test

Opgavebesvarelse, Basalkursus, uge 3

En intro til radiologisk statistik

Basal Statistik - SPSS

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

En Introduktion til SAS. Kapitel 5.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Tidsværdi for gods i Sverige

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Lineær og logistisk regression

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Opgavebesvarelse, Basalkursus, uge 3

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

ØVELSE 3A. I SAS kan man både bruge {}, [] og () som paranteser til index.

Undervisningsbeskrivelse

Hver anden vil benytte øget åbningstid i dagtilbud

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Opgavebesvarelse, Basalkursus, uge 3

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Transkript:

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ Risiko og Risiko Differens... 2 Estimation af Rate Ratio og Rate Differens... 2 Estimation af Odds Ratio... 2 Stratificerede analyser... 2 Sammenligning af parrede proportioner (1-1 matched case-control studie)... 3 Test for ingen association i en rxc tabel... 3 Analyse af ventetidsdata... 3 Simple analyser af normalfordelt data... 3 Simple ikke parametriske test... 4 Styrkeberegning... 4 Indledning Dette dokument indeholder de Stata kommandoer, som er blevet brugt i MPH undervisningen i Biostatistik, samt et par supplerende kommandoer som kan være nyttige. Nogle kommando findes i en summary form, dvs. kommandoer, hvis man har summary tal i hånden. F.eks. vil kommandoen give den estimerede proportion med et 95 % sikkerhedsinterval for en binomial fordeling med n=106 og antal observerede succeser lig 27. Kommandoerne får generelt et ekstra i på efter det engelske ord Immediate (direkte). De fleste kommandoer har options. Alle options vil ikke blive gennemgået her. Der angives kun de mest naturlige valg. Man kan ved mange kommandoer indtaste data ind i tabel form ved at bruge ]. Hukommelse I nogle tilfælde kan datasættet være så stort, at Stata s hukommelse i standard opsætningen er for lille. Hukommelsen kan øges til for eksempel 700M ved kommandoen Simple beskrivelser Tabel over summary statistik Andre kommandoer! 1

Data manipulation Generering af en krydsklassifikationsvariabel " Generering af en grupperet variabel vha. cut ##$ "%% Estimation af proportioner ex Bemærk: Variablen skal være kodet 0/1. Summary form: ex Estimation af rater & Summary form: & ex %'(" Estimation af Relativ Risiko og Risiko Differens ) Bemærk* og ) skal være kodet 0/1 ex %" Estimation af Rate Ratio og Rate Differens )& Summary form: ++&+&+ ex "("((,"' Estimation af Odds Ratio ) ex "(', Stratificerede analyser Relativ Risiko ) Odds Ratio ) Odds Ratio ) Rate Ratio )& 2

Sammenligning af parrede proportioner (1-1 matched case-control studie) +&&+& Bemærk: Een linie for hvert case-kontrol par. Både case_eksponering og kontrol_eksponering skal være kodet 0/1. ex,''", Test for ingen association i en rxc tabel χ 2 -test for ingen association i en rxc tabel - - Summary for 2x2 tabel:.) - ex.%" - Summary for 3x2 tabel:.). - ex.(,. - Fishers eksakte test for ingen association i en rxc tabel: Syntaks som χ 2 -test for ingen association i en rxc tabel, blot vælges option. Analyse af ventetidsdata Opsætning af ventetidsdata ) Ex: +)- +)- Plot af Kaplan Meier kurve - (uden sikkerhedsintervaller) - ) (med sikkerhedsintervaller) Ex: -, (Opdelt i grupper) Sammenligning af ventetidsfordelinger vha. log-rang-testet Eksempel:, Beregning af rater fra ventetidsdata/person data Ex:, Opsætning af data gruppe data &) ++/ Simple analyser af normalfordelt data T-test for en observationsrække - Ex: "%% (rater der 1000 enheder) (rate i undergrupper) 3

Summary form: Ex: )- ""%%',,'"%% T-test for to uafhængige observationsrækker Summary form: ) ),00,",,"0,0" T-test for parrede data QQ-plot til undersøgelse af normalitet 1 1 23% Histogram med normalfordelingskurve - 1-23% 1 Prædiktionsinterval 0%(0% 0%(0%) 0%(0%) Simple ikke parametriske test Mann-Whiney-Wilcoxon test til sammenligning af to uafhængige observationsrækker & &3% Wilcoxon signed rank test til sammenligning parrede data & &3% Styrkeberegning Nødvendig stikprøvestørrelse for sammenligning af to proportioner (binomial data) -45 hvor p1 og p2 er prævalensen i de to grupper, angiver signifikans niveauet (default 0.05), angiver den statistiske styrke (default 0.90) og r=n 2 /n 1 angiver ratio mellem antal af observationer i de to grupper (default 1). 4

00% -0%0(, Statistisk styrke for sammenligning af to proportioner (binomial data) -4 hvor n 1 og n 2 angiver antal observationer i gruppe 1 og gruppe 2. 00% " Nødvendig stikprøvestørrelse for sammenligning af to middelværdier (normalfordelte data) ))))-4/// 5 hvor angiver signifikans niveauet (default 0.05), angiver den statistiske styrke (default 0.90) og r=n 2 /n 1 angiver ratio mellem antal af observationer i de to grupper (default 1). Ex: "%"" 0'),), Statistisk styrke for sammenligning af to middelværdier (normalfordelte data) )))) hvor n 1 og n 2 angiver antal observationer i gruppe 1 og gruppe 2. Ex: "%"" ),)," 5