Formelsamlig til statistik-el af metoekursus, 4. semester, lægevieskab Versio 3 (6/9-011) Kære læser Dee formelsamlig er lavet me ugagspukt i Meical Statistics, seco eitio af Betty R. Kirkwoo og A. C. Stere og skulle meget gere ække e formler som ma ka få brug for uer eksame samt store ele af kurset i statistik. De ka og på ige måe erstatte læsig af læreboge og bør ses som et supplemet og ikke et alterativ. Selve formelsamlige er elt op i kapitler, svaree til em agivet i læseplae efteråret 011 og sieagivelser i form af footer vil lee ig he i læreboge, hvor u ka læse uybee om formele. Hvis u fier fejl, magler, uklarheer eller syes at e formel bør uybes, skal u være mere e velkomme til at skrive til mig på vlw43@alumi.ku.k Asger Mølgaar Arease Hol 408, Efteråret 011
Kapitel 3: Displayig the ata Meia i : 1 Nere kvartil ii : 1 observatiosummer som er meiae (me observatioer) observatiosummer som er ere kvartil 4 Øvre kvartil iii 3 1 : observatiosummer som er ere kvartil 4 Hvis meiae/ere/øvre kvartil giver et tal som ligger mellem to observatioer (f.eks. observatio r. 8,5) tages geemsittes mellem e to omkrigliggee observatioer (vs. sittet mellem observatio 8 og 9 i eksemplet). Rage iv = største væri laveste væri Iterquartile rage v = øvre kvartil ere kvartil vi k 1' e k ' ee percetil observatios væri (eksempel: hvis k=50 (vi øsker at fie 100 meiae) og =70, fås 35,5. Dvs. meiae er mellem obs. 35 og 36. Kap. 4: Meas, staar eviatios a staar errors Mielværi vii : x x Varias/spreig viii : s x x 1 Staar eviatio/spreig ix : s.. s s Sta error x : s se.. x x x x 1 1 Kap. 5: The Normal Distributio Ligig for staar ormal forelig xi me mielværie og s.. e : i S. ii S. 3 iii S. 3 iv S.4 v S. 4 vi S. 5 vii S. 33 viii S. 35 ix S. 36 x S. 39 xi S. 43
z exp y Hvor z kales Staar Normal Deviatio og givet ve: x z Øsker ma at fie hvor stor e proportio som ligger i ormalforeliges øvre ee, isættes e x-væri som øskes uersøgt for, i formele for z og z-værie aflæses i Tabel A1 (bag i boge). Eks.: Ma øsker at vie hvor mage mæ i e sample me 171,5cm, som er større e 180cm. Ma isætter 180 på x plas og får z=1,31. Dee væri aflæses i A1 til væree 0,0951. Dvs. 9,51% af mæee var større e 180cm. Fremgagsmåe for at fie proportio i ere hale af ormalforelig er aalog til proportio i øvre ee (blot skal x< ). For at fie proportio mellem to pukter, fies e procet som er uer ere pukt og over øvre pukt. Disse trækkes fra 1 og e samlee proportio fås. Eks.: Proportio af mæ mellem 165cm og 175cm = 1 proportio uer 165 proportio over 175cm= 1-0,1587-0,946=0,5467 eller 54,67% Referece iterval xii : x z ' s.. til x z ' s.. hvor z aflæses i Tabel A. For et 95% CI fås z =1,96. Formele ka også omformuleres til: x z ' s... De utrykker, hvor vi forveter at 95% af vores værier vil ligge. Kap. 6: Cofiece Iterval for a mea Kofies iterval (CI) for store samples (>5) xiii : x z ' s. e. til x z ' s. e. Kofies iterval (CI) for små samples (<5) xiv : x t ' s. e. til x t ' s. e. Hvor t slås op i tabel A3 me (-1) frihesgraer CI 95% giver os et iterval, hvor e sae mielværi me 95% sikkerhe ligger. Kap. 7: Compariso of two meas: cofiece itervals, hypothesis test a P-values Staar error for x1 x0 x1 x0 1 0 xv : s s 1 0 1 0 s. e. s. e. s. e. 1 0 1 0 Bemærk at er e sae spreig i populatioe, mes s er vores estimat på spreige bereget sample. Ofte keer vi og ikke og må øjes me s. Kofies iterval på ifferes mellem geemsit: '.. 1 0 '.. x x x1 x0 CI x 1 x 0 z s e til x 1 x 0 z s e z-test/approksimativ t-test (ku for large samples) xvi : xii S. 49 xiii S. 51 xiv S. 55 xv S. 60 xvi S: 6
x1 x0 z se.. x 1 x 0 Herefter opslag i Tabel A1 og ve sigifikat P-væri (husk at bruge e to-siee!) afvises ul-hypose (H 0 : at er ige statistisk ifferes er på geemsittee). t-test/upaire t-test bruges på små samples xvii : s t 1 1 s1 0 1 s0 x1 x0 x1 x0 1 0 se.. 1 1 s 1 0 Me atal frihesgraer (egrees of freeom):. f. 1 0 Opslag i Tabel A4 giver P-værie For parree observatioer uersøges ifferese. Dvs. vi omaer vores ata-par til e ekelt sample beståee af iffereser. CI for store samples xviii : x z ' s. e. til x z ' s. e. CI for små samples: x t ' s. e. til x t ' s. e. (husk -1 frihesgraer) Hypotese test for parree-ata uføres me ete e parret z-test eller e parret t-test: Parret z-test (store samples) xix : x x z se.. s Parret t-test (små samples): x x t,. f. 1 se.. s x er geemsittet af e parree iffereser og husk opslag i tabel A1 eller A4 Kap. 10: Lieær Regressio a correlatio (ku afsittee 10.1 og 10.) Lieær regressios forskrift xx : y x 0 1 Estimat på parametre xxi : x x y y x x og y x 1 0 1 Præcisioe måles me eres staar error xxii : xvii S. 66 xviii S. 68 xix S. 69 xx S. 88 xxi S. 90
x x x 1 x x 1 s s. e. s og s. e. x x x x s 0 1 Kofiesiterval for regressioskoefficiet (beævt 0/1 a formele gæler begge) xxiii : CI t ' s. e. til t ' s. e. 0/1 0/1 0/1 0/1 Atagelser for lieærregressio: For ehver væri af x, er y ormalforelt. Puktere er forelt me samme spreig omkrig liie over hele plottet. Hvorfor er isættes e spreigskoeffciet ( ) som er forskellig for hvert pukt, så forskrifte bliver: y x 0 1 Kap. 11: Multiple regressio E variabel som ku atager væriere 0 eller 1 kales e iicator variabel (f.eks. kø). Iterceptet ( 0 ) er værie af y hvis alle ekspoerigsvariable er 0. Geeral formel for multipel regressio me ekspoeriger xxiv : y x x x x 0 1 1 3 3... Kap. 14: Probability, risk a os (of isease) Prob er forkortelse for Probability, ligesom ssh er for sasylighe. Ssh for at båe A og B sker xxv : prob A a B prob A prob B Ssh for at ete A eller B sker: prob A or B or both prob A prob B prob both Os efieres ve ssh for at A sker, ivieret me ssh for at A ikke sker: p isease Os 1 p h healthy h os p 1 os Kap. 15: Proportios a the biomial istributio Proportio/risiko/ssh for sygom: atalsyge p total For e sample er risk=p. De sae (og ofte ukete) risiko i hele populatioe beæves. De geerelle formel for ssh for at få evets i e sample me iivier xxvi :! prob evets 1!! xxii S. 91 xxiii S. 91 xxiv S. 105 xxv S. 134 xxvi S. 141
Proportioer er også biomial forelt, hvorfor kofiesiterval og staar error også ka bereges for e proportio xxvii : CI p z ' s. e. til p z ' s. e. p 1 p se.. Me e z-test ka vi teste om vores estimat p på proportioe er mage til e bestemt væri (kalet. Gør at vi ka teste om p er lig me e sae (eller e væri vi tror, er sa)). p p z s.. e p 1 Efter opslag i tabel A1, får vi e P-væri. E sigifikat P-væri betyer at vi har evies for at p, mes at e usigifikat betyer at p ye sygomstilfæle i e give perioe risiko kumulativ icies atal raske ve perioes start atal sygomstilfæle til specifikt tispukt prævales total populatio Kap. 16: Comparig two proportios For at sammelige biære outcome variable mellem to ekspoerigsgrupper, ka et alti svare sig at bruge x-tabeller (=isease, h=healthy): Outcome Exposure Experiece evet: Di ot experiece Total D (isease) evet: H (healthy) Group 1 (expose) 1 h 1 1 Group 0 (uexpose) 0 h 0 0 Total h Vi husker at p samt at os h Differes mellem to proportioer xxviii : p p p iff 1 0 1 1 p p p p s. e. p p s. e. p s. e. p 1 1 0 0 1 0 1 0 1 0 '.. '.. CI p p z s e p p til p p z s e p p 1 0 1 0 1 0 1 0 Test for at to proportioer es (ulhypose (H 0 ): 1 0 xxix ): p1 p0 z 1 1 p1 p 1 0 0 1 Hvor p 0 1 Risk-ratio (RR), proportio mellem to risikoer xxx : xxvii S. 143 xxviii S. 151 xxix S. 153 xxx S. 153
RR p / p / 1 1 1 0 0 0 Kofiesiterval for RR xxxi : RR CI RR til RR EF EF EF error factor exp z ' s. e. log RR s. e. log RR 1 1 1 1 1 1 0 0 Test af ulhypose om at er ige forskel i risiko er i e to grupper xxxii. Dvs. at RR=1 og log(rr)=0: log RR z s. e. log RR Os ratio (OR): ratioe af os mellem e ekspoeree og e uekspoeree gruppe. (æste sie) xxxiii p / / os 1 p 1 / h / h Osratio OR OR isease os / h h os / h h 1 OR healthy gruppe1 1 1 1 0 gruppe0 0 0 0 1 For ureig af ratioalet for, at bruge OR, se s. 163. Kofies iterval for os: os CI til os EF EF EF exp z ' s. e. log os 1 1 s. e. logos h Kofies iterval for os ratio (OR): OR CI til OR EF EF EF exp z ' s. e. log OR s. e. log OR 1 1 1 1 h h 1 1 0 0 Test af ulhypose (H 0 : OR=1): log OR z s. e. log OR xxxi S. 156 xxxii S. 158 xxxiii S. 159
Kap. 17: Chi-square tests for x a larger cotigecy tables Chi-i-ae-test bruges til at uersøge om er er e associatio mellem række-variable og søjle-variable. Eller sagt på e ae måe: om forelige af iivier blat kategoriere af e variabel, er uafhægig af eres forelig blat kategoriere af e ae variabel. Bemærkiger om chi-i-ae-tests valiitet: s. 168. Chi-i-ae-tests ka ku bruges på reelle tal og ikke på proportioer. -testes bestaele: O = observe = atal observatioer/iivier i e celle E = expecte = ve beregig fier ma et forvetet atal af iivier i celle. r = atallet af rækker (rows) c = atallet af søjler (colums) totalsøjle totalrække E total alle O E E Me atal frihesgraer:. f. r 1 c 1 slås op i tabel A5 og P-væri fies. Hvis P-værie er lille (sigifikat: uer 0,05), a er er sammehæg mellem række- og søjlevariablee. Dvs. ata er ikke forelt efter ulhypotese om at ata er forelt uafhægigt af søjle- og række-variable. Kap. 19: Logistic regressio: comparig two or more exposure groups I ee moel multipliceres parametree (til forskel fra e multiple regressio som aerer em (kap. 11)). Hvis er er to ekspoeriger, fås følgee: Os = baselie x exposure(a) x exposure(b) (så hvis A forobler os og B øger os x3, fås at os er 6xbaselie) Logistisk regressio laves alti på logistisk skala (er af avet). Vigtigt at bemærke. Geerel formel: log os x x... x 0 1 1 outcome kales for regressios koefficieter. Trasformerig af ssh/risiko/ til log(os) kales logit fuktioe: log it log 1 Ssh vil alti ligge mellem 0 og 1. Os vil alti ligge mellem 0 og. Log(os) vil alti ligge mellem og. Kategoriske/biære ata ka også iføjes i logistiske regressioer. De vil blot blive sammeliget me hiae, sålees at f.eks. ygste alers gruppe er baselie eller at kvie er baselie (så får x=0 er kvie og x=1 er ma). Kap. 0: Logistic regressio: cotrollig for cofouig a other extesios Ige vigtige formler som ma umielbart ka rege på. Til ette kræves pc-kraft som ma ikke vil have til råighe/ti til uer eksame.