Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner

Advertisement


Advertisement
Relaterede dokumenter
Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

MPH specialmodul Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Seniorkursus i Biostatistik og Stata, Dag 2

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Morten Frydenberg 26. april 2004

Morten Frydenberg Biostatistik version dato:

9. Chi-i-anden test, case-control data, logistisk regression.

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Produkt og marked - matematiske og statistiske metoder

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Epidemiologi og Biostatistik

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Appendiks A Anvendte test statistikker

Korrelation Pearson korrelationen

Morten Frydenberg 25. april 2006

Morten Frydenberg Biostatistik version dato:


Tillæg til studieordningen for bacheloruddannelsen i Sundhedsteknologi

Statistik i GeoGebra

Epidemiologi og Biostatistik

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

SKRIFTLIG EKSAMEN I BIOSTATISTIK OG EPIDEMIOLOGI Cand.Scient.San, 2. semester 20. februar 2015 (3 timer)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Ikke-parametriske tests

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Basal statistik. 30. januar 2007

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Landsdækkende database for kræft i tykog endetarm (DCCG) Addendum til National a rsrapport januar december 2012

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

En Introduktion til SAS. Kapitel 5.

ØVELSE 3A. I SAS kan man både bruge {}, [] og () som paranteser til index.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

OPLÆG TIL STUDIERETNINGSPROJEKTER I MATEMATIK-KEMI OM KVANTITATIV KEMISK ANALYSE OG STATISTISKE MODELLER

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Studieplan Biostatistik Semester 2

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Følgende tabel (fra Fisher) giver forøgelsen af sovetiden i timer fra et eksperiment med 10 patienter vedrørende 2 sovemidler A og B.

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

MPH Introduktionsmodul: Epidemiologi og Biostatistik

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Løsning til øvelsesopgaver dag 4 spg 5-9

Note til styrkefunktionen

Modelkontrol i Faktor Modeller

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

02402 Løsning til testquiz02402f (Test VI)

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Epidemiologiske associationsmål

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl

Undervisningsbeskrivelse

En intro til radiologisk statistik. Erik Morre Pedersen

Maple 11 - Chi-i-anden test

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik II 4. Lektion. Logistisk regression

Kvantitative metoder 2

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Analyse af binære responsvariable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Tidsværdi for gods i Sverige

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Sammenligning af to sæt observationer p-værdier og sikkerhedsgrænser

Institut for Matematiske Fag Sandsynlighedsregning og Statistik 2. R opgaver

En intro til radiologisk statistik

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Bilag 5: Økonometriske analyser af energispareindsatsens. (Cointegration) Energistyrelsen. Marts 2015

1 Start og afslutning. Help.

Kvantitative metoder 2

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Statistik i basketball

Nanostatistik: Opgaver

Tema. Dagens tema: Indfør centrale statistiske begreber.

Module 4: Ensidig variansanalyse

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable

Introduktion til GLIMMIX

Advertisement
Transkript:

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ Risiko og Risiko Differens... 2 Estimation af Rate Ratio og Rate Differens... 2 Estimation af Odds Ratio... 2 Stratificerede analyser... 2 Sammenligning af parrede proportioner (1-1 matched case-control studie)... 3 Test for ingen association i en rxc tabel... 3 Analyse af ventetidsdata... 3 Simple analyser af normalfordelt data... 3 Simple ikke parametriske test... 4 Styrkeberegning... 4 Indledning Dette dokument indeholder de Stata kommandoer, som er blevet brugt i MPH undervisningen i Biostatistik, samt et par supplerende kommandoer som kan være nyttige. Nogle kommando findes i en summary form, dvs. kommandoer, hvis man har summary tal i hånden. F.eks. vil kommandoen give den estimerede proportion med et 95 % sikkerhedsinterval for en binomial fordeling med n=106 og antal observerede succeser lig 27. Kommandoerne får generelt et ekstra i på efter det engelske ord Immediate (direkte). De fleste kommandoer har options. Alle options vil ikke blive gennemgået her. Der angives kun de mest naturlige valg. Man kan ved mange kommandoer indtaste data ind i tabel form ved at bruge ]. Hukommelse I nogle tilfælde kan datasættet være så stort, at Stata s hukommelse i standard opsætningen er for lille. Hukommelsen kan øges til for eksempel 700M ved kommandoen Simple beskrivelser Tabel over summary statistik Andre kommandoer! 1

Data manipulation Generering af en krydsklassifikationsvariabel " Generering af en grupperet variabel vha. cut ##$ "%% Estimation af proportioner ex Bemærk: Variablen skal være kodet 0/1. Summary form: ex Estimation af rater & Summary form: & ex %'(" Estimation af Relativ Risiko og Risiko Differens ) Bemærk* og ) skal være kodet 0/1 ex %" Estimation af Rate Ratio og Rate Differens )& Summary form: ++&+&+ ex "("((,"' Estimation af Odds Ratio ) ex "(', Stratificerede analyser Relativ Risiko ) Odds Ratio ) Odds Ratio ) Rate Ratio )& 2

Sammenligning af parrede proportioner (1-1 matched case-control studie) +&&+& Bemærk: Een linie for hvert case-kontrol par. Både case_eksponering og kontrol_eksponering skal være kodet 0/1. ex,''", Test for ingen association i en rxc tabel χ 2 -test for ingen association i en rxc tabel - - Summary for 2x2 tabel:.) - ex.%" - Summary for 3x2 tabel:.). - ex.(,. - Fishers eksakte test for ingen association i en rxc tabel: Syntaks som χ 2 -test for ingen association i en rxc tabel, blot vælges option. Analyse af ventetidsdata Opsætning af ventetidsdata ) Ex: +)- +)- Plot af Kaplan Meier kurve - (uden sikkerhedsintervaller) - ) (med sikkerhedsintervaller) Ex: -, (Opdelt i grupper) Sammenligning af ventetidsfordelinger vha. log-rang-testet Eksempel:, Beregning af rater fra ventetidsdata/person data Ex:, Opsætning af data gruppe data &) ++/ Simple analyser af normalfordelt data T-test for en observationsrække - Ex: "%% (rater der 1000 enheder) (rate i undergrupper) 3

Summary form: Ex: )- ""%%',,'"%% T-test for to uafhængige observationsrækker Summary form: ) ),00,",,"0,0" T-test for parrede data QQ-plot til undersøgelse af normalitet 1 1 23% Histogram med normalfordelingskurve - 1-23% 1 Prædiktionsinterval 0%(0% 0%(0%) 0%(0%) Simple ikke parametriske test Mann-Whiney-Wilcoxon test til sammenligning af to uafhængige observationsrækker & &3% Wilcoxon signed rank test til sammenligning parrede data & &3% Styrkeberegning Nødvendig stikprøvestørrelse for sammenligning af to proportioner (binomial data) -45 hvor p1 og p2 er prævalensen i de to grupper, angiver signifikans niveauet (default 0.05), angiver den statistiske styrke (default 0.90) og r=n 2 /n 1 angiver ratio mellem antal af observationer i de to grupper (default 1). 4

00% -0%0(, Statistisk styrke for sammenligning af to proportioner (binomial data) -4 hvor n 1 og n 2 angiver antal observationer i gruppe 1 og gruppe 2. 00% " Nødvendig stikprøvestørrelse for sammenligning af to middelværdier (normalfordelte data) ))))-4/// 5 hvor angiver signifikans niveauet (default 0.05), angiver den statistiske styrke (default 0.90) og r=n 2 /n 1 angiver ratio mellem antal af observationer i de to grupper (default 1). Ex: "%"" 0'),), Statistisk styrke for sammenligning af to middelværdier (normalfordelte data) )))) hvor n 1 og n 2 angiver antal observationer i gruppe 1 og gruppe 2. Ex: "%"" ),)," 5