Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ Risiko og Risiko Differens... 2 Estimation af Rate Ratio og Rate Differens... 2 Estimation af Odds Ratio... 2 Stratificerede analyser... 2 Sammenligning af parrede proportioner (1-1 matched case-control studie)... 3 Test for ingen association i en rxc tabel... 3 Analyse af ventetidsdata... 3 Simple analyser af normalfordelt data... 3 Simple ikke parametriske test... 4 Styrkeberegning... 4 Indledning Dette dokument indeholder de Stata kommandoer, som er blevet brugt i MPH undervisningen i Biostatistik, samt et par supplerende kommandoer som kan være nyttige. Nogle kommando findes i en summary form, dvs. kommandoer, hvis man har summary tal i hånden. F.eks. vil kommandoen give den estimerede proportion med et 95 % sikkerhedsinterval for en binomial fordeling med n=106 og antal observerede succeser lig 27. Kommandoerne får generelt et ekstra i på efter det engelske ord Immediate (direkte). De fleste kommandoer har options. Alle options vil ikke blive gennemgået her. Der angives kun de mest naturlige valg. Man kan ved mange kommandoer indtaste data ind i tabel form ved at bruge ]. Hukommelse I nogle tilfælde kan datasættet være så stort, at Stata s hukommelse i standard opsætningen er for lille. Hukommelsen kan øges til for eksempel 700M ved kommandoen Simple beskrivelser Tabel over summary statistik Andre kommandoer! 1
Data manipulation Generering af en krydsklassifikationsvariabel " Generering af en grupperet variabel vha. cut ##$ "%% Estimation af proportioner ex Bemærk: Variablen skal være kodet 0/1. Summary form: ex Estimation af rater & Summary form: & ex %'(" Estimation af Relativ Risiko og Risiko Differens ) Bemærk* og ) skal være kodet 0/1 ex %" Estimation af Rate Ratio og Rate Differens )& Summary form: ++&+&+ ex "("((,"' Estimation af Odds Ratio ) ex "(', Stratificerede analyser Relativ Risiko ) Odds Ratio ) Odds Ratio ) Rate Ratio )& 2
Sammenligning af parrede proportioner (1-1 matched case-control studie) +&&+& Bemærk: Een linie for hvert case-kontrol par. Både case_eksponering og kontrol_eksponering skal være kodet 0/1. ex,''", Test for ingen association i en rxc tabel χ 2 -test for ingen association i en rxc tabel - - Summary for 2x2 tabel:.) - ex.%" - Summary for 3x2 tabel:.). - ex.(,. - Fishers eksakte test for ingen association i en rxc tabel: Syntaks som χ 2 -test for ingen association i en rxc tabel, blot vælges option. Analyse af ventetidsdata Opsætning af ventetidsdata ) Ex: +)- +)- Plot af Kaplan Meier kurve - (uden sikkerhedsintervaller) - ) (med sikkerhedsintervaller) Ex: -, (Opdelt i grupper) Sammenligning af ventetidsfordelinger vha. log-rang-testet Eksempel:, Beregning af rater fra ventetidsdata/person data Ex:, Opsætning af data gruppe data &) ++/ Simple analyser af normalfordelt data T-test for en observationsrække - Ex: "%% (rater der 1000 enheder) (rate i undergrupper) 3
Summary form: Ex: )- ""%%',,'"%% T-test for to uafhængige observationsrækker Summary form: ) ),00,",,"0,0" T-test for parrede data QQ-plot til undersøgelse af normalitet 1 1 23% Histogram med normalfordelingskurve - 1-23% 1 Prædiktionsinterval 0%(0% 0%(0%) 0%(0%) Simple ikke parametriske test Mann-Whiney-Wilcoxon test til sammenligning af to uafhængige observationsrækker & &3% Wilcoxon signed rank test til sammenligning parrede data & &3% Styrkeberegning Nødvendig stikprøvestørrelse for sammenligning af to proportioner (binomial data) -45 hvor p1 og p2 er prævalensen i de to grupper, angiver signifikans niveauet (default 0.05), angiver den statistiske styrke (default 0.90) og r=n 2 /n 1 angiver ratio mellem antal af observationer i de to grupper (default 1). 4
00% -0%0(, Statistisk styrke for sammenligning af to proportioner (binomial data) -4 hvor n 1 og n 2 angiver antal observationer i gruppe 1 og gruppe 2. 00% " Nødvendig stikprøvestørrelse for sammenligning af to middelværdier (normalfordelte data) ))))-4/// 5 hvor angiver signifikans niveauet (default 0.05), angiver den statistiske styrke (default 0.90) og r=n 2 /n 1 angiver ratio mellem antal af observationer i de to grupper (default 1). Ex: "%"" 0'),), Statistisk styrke for sammenligning af to middelværdier (normalfordelte data) )))) hvor n 1 og n 2 angiver antal observationer i gruppe 1 og gruppe 2. Ex: "%"" ),)," 5