Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Relaterede dokumenter
Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Opgavebesvarelse, Basalkursus, uge 3

Generelle lineære modeller

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Besvarelse af vitcap -opgaven

Historiske benzin- og dieselpriser 2011

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

3. SPSS Output. Descriptives. [DataSet1] C:\Users\Thomas\Desktop\Eservice_i_produktgruppen_Bekldning.sav

En Introduktion til SAS. Kapitel 5.

Kvant Eksamen December timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Klasseøvelser dag 2 Opgave 1

MPH specialmodul Epidemiologi og Biostatistik

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Seniorkursus i Biostatistik og Stata, Dag 2

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Eksamen i Statistik for Biokemikere, Blok januar 2009

Faxe, indbrud. Jan Feb Mar Apr Maj Jun Jul Aug Sep Okt Nov Dec. SSJÆ, indbrud. Jan Feb Mar Apr Maj Jun Jul Aug Sep Okt Nov Dec.

Ikke-parametriske tests

Vejledende besvarelse af hjemmeopgave

Løsning eksamen d. 15. december 2008

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Opgavebesvarelse, Basalkursus, uge 2

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Afdeling for Anvendt Matematik og Statistik December 2006

Opgavebesvarelse, Basalkursus, uge 3

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Postoperative komplikationer

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Den grønlandske varmestue Naapiffik Statistik

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Eksamen i Statistik for biokemikere. Blok

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Brug af testdata i børneforløbsundersøgelsen (BFU).

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

CBS Evaluering og Akkreditering

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Multipel Lineær Regression

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Vejledende besvarelse af hjemmeopgave, efterår 2018

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

1 Kalenderen. 1.1 Oversigt over de til årstallene hørende søjlenumre

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Eksamen i Statistik for biokemikere. Blok

Basal statistik. 30. januar 2007

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistik FSV 4. semester 2014 Holdundervisning Uge 1: 4. februar Introduktion til Stata

Besvarelse af opgave om Vital Capacity

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Epidemiologi og Biostatistik

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Tidsplan Allindelille Skee, 2015 Dato: 7. april 2015

Modtagere af integrationsydelse

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

- Hygiejeundersøgelse for Danske Fysioterapeuter

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

reducedcoping StrategyIndex

APPENDIX E.3 SHADOW FLICKER CALCULATUIONS. 70 m TOWERS & 56 m BLADES

Vejledende besvarelse af hjemmeopgave, efterår 2017

Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Sundby

Vejledende besvarelse af hjemmeopgave, forår 2015

Dansk Energi F:\Statistikdata\Uddata\Energipriser\Elpris-sammensætning-måned-4000kWh.xlsx/Elpris4000 Side 1 af 12

Uddannelseshjælp - antal borgere

Basal statistik. 16. september 2008

Kommentarer til øvelser i basalkursus, 2. uge

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Vejledende besvarelse af hjemmeopgave, forår 2017

ØVELSE 2B. Formål Det primære formål med denne øvelse er at prøve nogle vigtige procedurer til statistisk og grafisk analyse.

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Vejledende besvarelse af hjemmeopgave, efterår 2018

Phd-kursus i Basal Statistik, Opgaver til 1. uge

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

KA 4.2 Kvantitative Forskningsmetoder Forår 2010

For at få 8 linjer ud, skal dette specifiseres i kommandoen ved at sætte antal lig 8 n=8:

Statistik kommandoer i Stata opdateret 16/ Erik Parner

(studienummer) (underskrift) (bord nr)

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

9. Chi-i-anden test, case-control data, logistisk regression.

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Vejledende besvarelse af hjemmeopgave, forår 2018

Transkript:

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?. use "ebeltoftdata.dta", clear. tab2 random sex, row chi -> tabulation of random by sex +----------------+ ---------------- row percentage +----------------+ Køn Randomiseringsgruppe 1. Female 2. Male Total 1. Spørgeskema 104 136 240 43.33 56.67 100.00 2. Health-check 113 127 240 47.08 52.92 100.00 3. Helbredssamtale 119 121 240 49.58 50.42 100.00 46.67 53.33 100.00 Pearson chi2(2) = 1.9085 Pr = 0.385 2. Hvor stor en andel af mændene var rygere ved baseline? Hvor stor en andel af kvinderne?. recode tobak_0 (0=0)(1/max=1), generate(ryger_0). label variable ryger_0 "Ryger, baseline". label define nej_ja 0 "nej" 1 "ja". label values ryger_0 nej_ja. tab2 ryger_0 sex, col chi 1

-> tabulation of ryger_0 by sex ------------------- column percentage Ryger, Køn baseline 1. Female 2. Male Total nej 182 213 395 54.17 55.47 54.86 ja 154 171 325 45.83 44.53 45.14 100.00 100.00 100.00 Pearson chi2(1) = 0.1227 Pr = 0.726 3. Hvor stor en andel af mændene var storrygere ( 15 gram/dag) ved baseline? Hvor stor en andel af kvinderne? Var der signifikant forskel på andelen blandt mænd og kvinder?. recode tobak_0 (0/14=0)(15/max=1), generate(storryger_0). label variable storryger_0 "Ryger mindst 15 g/dag, baseline". label values storryger_0 nej_ja. tab2 storryger_0 sex, col chi -> tabulation of storryger_0 by sex ------------------- column percentage Ryger mindst 15 g/dag, Køn baseline 1. Female 2. Male Total nej 245 265 510 72.92 69.01 70.83 ja 91 119 210 27.08 30.99 29.17 100.00 100.00 100.00 Pearson chi2(1) = 1.3235 Pr = 0.250 4. Hvor stor en andel drak mere end Sundhedsstyrelsens genstandsgrænser (21/uge for mænd, 14/uge for kvinder) ved baseline?. gen storalk_0=0. replace storalk_0=1 if sex==1 & alko_0 > 14 & alko_0 <.. replace storalk_0=1 if sex==2 & alko_0 > 21 & alko_0 <. 2

. label variable storalk_0 "Alk>14/21, baseline". label values storalk_0 nej_ja. tab1 storalk_0 -> tabulation of storalk_0 Alk>14/21, baseline Freq. Percent Cum. ------------+----------------------------------- nej 624 86.67 86.67 ja 96 13.33 100.00 ------------+----------------------------------- Total 720 100.00 5. Lav et histogram der viser fordelingen af alkoholforbruget ved baseline.. histogram alko_0, frequency discrete 80 60 Frequency 40 20 0 0 50 100 150 200 Genstande pr. uge t0 6. Udskriv en liste med baseline-informationer for de deltagere der oplyste at drikke over 50 genstande pr. uge.. list id bdate-tobak_0 if alko_0>50 +--------------------------------------------------------------------+ id bdate sex date_0 alko_0 bmi_0 tobak_0 11. 11 15nov1945 1. Female 24jan1992 59 21.7 25 37. 37 15apr1943 2. Male 20may1992 70 31.6 5 65. 65 15dec1943 2. Male 08jun1992 58 26.8 0 170. 170 15sep1956 2. Male 06may1992 57 33.5 0 221. 221 15jan1960 2. Male 23may1992 88 23.2 15 223. 223 15sep1959 2. Male 24apr1992 172 20.5 27 243. 243 15jul1950 2. Male 08feb1992 60 26 30 393. 393 15may1954 2. Male 08jan1992 131 32.1 23 488. 488 15mar1956 2. Male 12feb1992 66 24 0 509. 509 15jul1942 2. Male 24jan1992 92 28.1 20 642. 642 15jan1957 2. Male 12jan1992 51 25.5 20 696. 696 15nov1949 1. Female 17feb1992 54 23 0 719. 719 15dec1958 2. Male 02apr1992 52 24.6 40 +--------------------------------------------------------------------+ 3

7. Er der forskel på mænds og kvinders BMI? Uden at tænke nærmere over det, kunne vi prøve med et t-test:. ttest bmi_0, by(sex) Two-sample t test with equal variances ------------------------------------------------------------------------------ Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] 1. Femal 336 23.20685.1950856 3.575979 22.8231 23.59059 2. Male 384 25.66771.1756461 3.441947 25.32236 26.01306 combined 720 24.51931.1383339 3.711888 24.24772 24.79089 diff -2.460863.2618388-2.974924-1.946802 ------------------------------------------------------------------------------ diff = mean(1. Femal) - mean(2. Male) t = -9.3984 Ho: diff = 0 degrees of freedom = 718 Ha: diff < 0 Ha: diff!= 0 Ha: diff > 0 Pr(T < t) = 0.0000 Pr( T > t ) = 0.0000 Pr(T > t) = 1.0000 Det er den midterste P-værdi (0.0000, dvs. P<0.0001) der gælder. Mændene er tungest med en forskel på 2.5 BMI-enheder. Imidlertid: Er BMI normalfordelt? Det er jo en betingelse for at resultaterne af t-testet er gyldigt!. histogram bmi_0.15.1 Density.05 0 15 20 25 30 35 40 Body Mass Index t0. qnorm bmi_0 4

40 Body Mass Index t0 35 30 25 20 15 15 20 25 30 35 Inverse Normal BMI er måske ikke helt normalfordelt og t-testet giver ikke nødvendigvis det rette svar; både p-værdier, gennemsnit, standard deviations, standard errors og konfidensintervaller kan være misvisende. Det bedste ville være at undersøge nærmere, hvilken fordeling BMI har, for at kunne give en bedre beskrivelse af forskellen mellem mænd og kvinder. I en snæver vending kan man imidlertid bruge det ikke-parametriske test Kruskall-Wallis, som dog kun giver en p- værdi:. kwallis bmi_0, by(sex) Test: Equality of populations (Kruskal-Wallis test) +-----------------------------+ sex Obs Rank Sum -----------+-----+----------- 1. Female 336 92657.50 2. Male 384 166902.50 +-----------------------------+ chi-squared = 104.560 with 1 d.f. probability = 0.0001 chi-squared with ties = probability = 0.0001 104.573 with 1 d.f. Gem til slut dine ændringer til datasættet, så du ikke behøver skrive den samme kode igen:. save "ebeltoftdata2.dta", replace 5