Formelsamling til statistik-del af metodekursus, 4. semester, lægevidenskab Version 3 (26/9-2011)



Relaterede dokumenter
Pårørende( involvering fakta og evidens

Hyldespjældet anno 2035 BILAG. En overordnet analyse af renoveringsbehovet i Hyldespjældet i relation til den energipolitiske milepæl for 2035.

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Motivation. En tegning

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

9. Binomialfordelingen

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Teoretisk Statistik, 9. februar Beskrivende statistik

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Kvalitetsmål til On-line algoritmer

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Sammenligning af to grupper

Estimation ved momentmetoden. Estimation af middelværdiparameter

for Søren Kierkegaards trykte og utrykte skrifter

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Løsning til eksamen d.27 Maj 2010

9. Chi-i-anden test, case-control data, logistisk regression.

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Appendiks - Speciale ITU 2002 Offline XML Datavarehus. Figuroversigt. Afsnit 1 Figur 1.1 Fiktiva s nuværende datastruktur

Valg til Folketinget mandater og stemmetal

Konfidens intervaller

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Stikprøvefordelinger og konfidensintervaller

Maja Tarp AARHUS UNIVERSITET

Vejledende opgavebesvarelser

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Den flerdimensionale normalfordeling

Løsninger til kapitel 7

2. Hverdagen på danske arbejdspladser

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Vejledende besvarelser til opgaver i kapitel 15

Lys og gitterligningen

Bornerim, Remser og Lege

Statistik Lektion 8. Test for ens varians

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Liste som omhandlet i aftalens artikel 3 DEL I RETSAKTER, SOM OMHANDLET I EØS-AFTALEN, DER ÆNDRES VED TILTRÆDELSESAKTEN AF 16.

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Bjarne Nielsen : Dansk Ornitologisk Forenings Tidsskrift (DOFT),

Giv eksempler på hvordan forskellige ligningstyper (lineære, eksponentielle eller potens) løses.

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Årsrapport om det nære sundhedsvæsen Ikast-Brande Kommune

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Renteformlen. Erik Vestergaard

Modul 14: Goodness-of-fit test og krydstabelanalyse

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Den lille prins af Antoiné de Saint-Exupéry

Transkript:

Formelsamlig til statistik-el af metoekursus, 4. semester, lægevieskab Versio 3 (6/9-011) Kære læser Dee formelsamlig er lavet me ugagspukt i Meical Statistics, seco eitio af Betty R. Kirkwoo og A. C. Stere og skulle meget gere ække e formler som ma ka få brug for uer eksame samt store ele af kurset i statistik. De ka og på ige måe erstatte læsig af læreboge og bør ses som et supplemet og ikke et alterativ. Selve formelsamlige er elt op i kapitler, svaree til em agivet i læseplae efteråret 011 og sieagivelser i form af footer vil lee ig he i læreboge, hvor u ka læse uybee om formele. Hvis u fier fejl, magler, uklarheer eller syes at e formel bør uybes, skal u være mere e velkomme til at skrive til mig på vlw43@alumi.ku.k Asger Mølgaar Arease Hol 408, Efteråret 011

Kapitel 3: Displayig the ata Meia i : 1 Nere kvartil ii : 1 observatiosummer som er meiae (me observatioer) observatiosummer som er ere kvartil 4 Øvre kvartil iii 3 1 : observatiosummer som er ere kvartil 4 Hvis meiae/ere/øvre kvartil giver et tal som ligger mellem to observatioer (f.eks. observatio r. 8,5) tages geemsittes mellem e to omkrigliggee observatioer (vs. sittet mellem observatio 8 og 9 i eksemplet). Rage iv = største væri laveste væri Iterquartile rage v = øvre kvartil ere kvartil vi k 1' e k ' ee percetil observatios væri (eksempel: hvis k=50 (vi øsker at fie 100 meiae) og =70, fås 35,5. Dvs. meiae er mellem obs. 35 og 36. Kap. 4: Meas, staar eviatios a staar errors Mielværi vii : x x Varias/spreig viii : s x x 1 Staar eviatio/spreig ix : s.. s s Sta error x : s se.. x x x x 1 1 Kap. 5: The Normal Distributio Ligig for staar ormal forelig xi me mielværie og s.. e : i S. ii S. 3 iii S. 3 iv S.4 v S. 4 vi S. 5 vii S. 33 viii S. 35 ix S. 36 x S. 39 xi S. 43

z exp y Hvor z kales Staar Normal Deviatio og givet ve: x z Øsker ma at fie hvor stor e proportio som ligger i ormalforeliges øvre ee, isættes e x-væri som øskes uersøgt for, i formele for z og z-værie aflæses i Tabel A1 (bag i boge). Eks.: Ma øsker at vie hvor mage mæ i e sample me 171,5cm, som er større e 180cm. Ma isætter 180 på x plas og får z=1,31. Dee væri aflæses i A1 til væree 0,0951. Dvs. 9,51% af mæee var større e 180cm. Fremgagsmåe for at fie proportio i ere hale af ormalforelig er aalog til proportio i øvre ee (blot skal x< ). For at fie proportio mellem to pukter, fies e procet som er uer ere pukt og over øvre pukt. Disse trækkes fra 1 og e samlee proportio fås. Eks.: Proportio af mæ mellem 165cm og 175cm = 1 proportio uer 165 proportio over 175cm= 1-0,1587-0,946=0,5467 eller 54,67% Referece iterval xii : x z ' s.. til x z ' s.. hvor z aflæses i Tabel A. For et 95% CI fås z =1,96. Formele ka også omformuleres til: x z ' s... De utrykker, hvor vi forveter at 95% af vores værier vil ligge. Kap. 6: Cofiece Iterval for a mea Kofies iterval (CI) for store samples (>5) xiii : x z ' s. e. til x z ' s. e. Kofies iterval (CI) for små samples (<5) xiv : x t ' s. e. til x t ' s. e. Hvor t slås op i tabel A3 me (-1) frihesgraer CI 95% giver os et iterval, hvor e sae mielværi me 95% sikkerhe ligger. Kap. 7: Compariso of two meas: cofiece itervals, hypothesis test a P-values Staar error for x1 x0 x1 x0 1 0 xv : s s 1 0 1 0 s. e. s. e. s. e. 1 0 1 0 Bemærk at er e sae spreig i populatioe, mes s er vores estimat på spreige bereget sample. Ofte keer vi og ikke og må øjes me s. Kofies iterval på ifferes mellem geemsit: '.. 1 0 '.. x x x1 x0 CI x 1 x 0 z s e til x 1 x 0 z s e z-test/approksimativ t-test (ku for large samples) xvi : xii S. 49 xiii S. 51 xiv S. 55 xv S. 60 xvi S: 6

x1 x0 z se.. x 1 x 0 Herefter opslag i Tabel A1 og ve sigifikat P-væri (husk at bruge e to-siee!) afvises ul-hypose (H 0 : at er ige statistisk ifferes er på geemsittee). t-test/upaire t-test bruges på små samples xvii : s t 1 1 s1 0 1 s0 x1 x0 x1 x0 1 0 se.. 1 1 s 1 0 Me atal frihesgraer (egrees of freeom):. f. 1 0 Opslag i Tabel A4 giver P-værie For parree observatioer uersøges ifferese. Dvs. vi omaer vores ata-par til e ekelt sample beståee af iffereser. CI for store samples xviii : x z ' s. e. til x z ' s. e. CI for små samples: x t ' s. e. til x t ' s. e. (husk -1 frihesgraer) Hypotese test for parree-ata uføres me ete e parret z-test eller e parret t-test: Parret z-test (store samples) xix : x x z se.. s Parret t-test (små samples): x x t,. f. 1 se.. s x er geemsittet af e parree iffereser og husk opslag i tabel A1 eller A4 Kap. 10: Lieær Regressio a correlatio (ku afsittee 10.1 og 10.) Lieær regressios forskrift xx : y x 0 1 Estimat på parametre xxi : x x y y x x og y x 1 0 1 Præcisioe måles me eres staar error xxii : xvii S. 66 xviii S. 68 xix S. 69 xx S. 88 xxi S. 90

x x x 1 x x 1 s s. e. s og s. e. x x x x s 0 1 Kofiesiterval for regressioskoefficiet (beævt 0/1 a formele gæler begge) xxiii : CI t ' s. e. til t ' s. e. 0/1 0/1 0/1 0/1 Atagelser for lieærregressio: For ehver væri af x, er y ormalforelt. Puktere er forelt me samme spreig omkrig liie over hele plottet. Hvorfor er isættes e spreigskoeffciet ( ) som er forskellig for hvert pukt, så forskrifte bliver: y x 0 1 Kap. 11: Multiple regressio E variabel som ku atager væriere 0 eller 1 kales e iicator variabel (f.eks. kø). Iterceptet ( 0 ) er værie af y hvis alle ekspoerigsvariable er 0. Geeral formel for multipel regressio me ekspoeriger xxiv : y x x x x 0 1 1 3 3... Kap. 14: Probability, risk a os (of isease) Prob er forkortelse for Probability, ligesom ssh er for sasylighe. Ssh for at båe A og B sker xxv : prob A a B prob A prob B Ssh for at ete A eller B sker: prob A or B or both prob A prob B prob both Os efieres ve ssh for at A sker, ivieret me ssh for at A ikke sker: p isease Os 1 p h healthy h os p 1 os Kap. 15: Proportios a the biomial istributio Proportio/risiko/ssh for sygom: atalsyge p total For e sample er risk=p. De sae (og ofte ukete) risiko i hele populatioe beæves. De geerelle formel for ssh for at få evets i e sample me iivier xxvi :! prob evets 1!! xxii S. 91 xxiii S. 91 xxiv S. 105 xxv S. 134 xxvi S. 141

Proportioer er også biomial forelt, hvorfor kofiesiterval og staar error også ka bereges for e proportio xxvii : CI p z ' s. e. til p z ' s. e. p 1 p se.. Me e z-test ka vi teste om vores estimat p på proportioe er mage til e bestemt væri (kalet. Gør at vi ka teste om p er lig me e sae (eller e væri vi tror, er sa)). p p z s.. e p 1 Efter opslag i tabel A1, får vi e P-væri. E sigifikat P-væri betyer at vi har evies for at p, mes at e usigifikat betyer at p ye sygomstilfæle i e give perioe risiko kumulativ icies atal raske ve perioes start atal sygomstilfæle til specifikt tispukt prævales total populatio Kap. 16: Comparig two proportios For at sammelige biære outcome variable mellem to ekspoerigsgrupper, ka et alti svare sig at bruge x-tabeller (=isease, h=healthy): Outcome Exposure Experiece evet: Di ot experiece Total D (isease) evet: H (healthy) Group 1 (expose) 1 h 1 1 Group 0 (uexpose) 0 h 0 0 Total h Vi husker at p samt at os h Differes mellem to proportioer xxviii : p p p iff 1 0 1 1 p p p p s. e. p p s. e. p s. e. p 1 1 0 0 1 0 1 0 1 0 '.. '.. CI p p z s e p p til p p z s e p p 1 0 1 0 1 0 1 0 Test for at to proportioer es (ulhypose (H 0 ): 1 0 xxix ): p1 p0 z 1 1 p1 p 1 0 0 1 Hvor p 0 1 Risk-ratio (RR), proportio mellem to risikoer xxx : xxvii S. 143 xxviii S. 151 xxix S. 153 xxx S. 153

RR p / p / 1 1 1 0 0 0 Kofiesiterval for RR xxxi : RR CI RR til RR EF EF EF error factor exp z ' s. e. log RR s. e. log RR 1 1 1 1 1 1 0 0 Test af ulhypose om at er ige forskel i risiko er i e to grupper xxxii. Dvs. at RR=1 og log(rr)=0: log RR z s. e. log RR Os ratio (OR): ratioe af os mellem e ekspoeree og e uekspoeree gruppe. (æste sie) xxxiii p / / os 1 p 1 / h / h Osratio OR OR isease os / h h os / h h 1 OR healthy gruppe1 1 1 1 0 gruppe0 0 0 0 1 For ureig af ratioalet for, at bruge OR, se s. 163. Kofies iterval for os: os CI til os EF EF EF exp z ' s. e. log os 1 1 s. e. logos h Kofies iterval for os ratio (OR): OR CI til OR EF EF EF exp z ' s. e. log OR s. e. log OR 1 1 1 1 h h 1 1 0 0 Test af ulhypose (H 0 : OR=1): log OR z s. e. log OR xxxi S. 156 xxxii S. 158 xxxiii S. 159

Kap. 17: Chi-square tests for x a larger cotigecy tables Chi-i-ae-test bruges til at uersøge om er er e associatio mellem række-variable og søjle-variable. Eller sagt på e ae måe: om forelige af iivier blat kategoriere af e variabel, er uafhægig af eres forelig blat kategoriere af e ae variabel. Bemærkiger om chi-i-ae-tests valiitet: s. 168. Chi-i-ae-tests ka ku bruges på reelle tal og ikke på proportioer. -testes bestaele: O = observe = atal observatioer/iivier i e celle E = expecte = ve beregig fier ma et forvetet atal af iivier i celle. r = atallet af rækker (rows) c = atallet af søjler (colums) totalsøjle totalrække E total alle O E E Me atal frihesgraer:. f. r 1 c 1 slås op i tabel A5 og P-væri fies. Hvis P-værie er lille (sigifikat: uer 0,05), a er er sammehæg mellem række- og søjlevariablee. Dvs. ata er ikke forelt efter ulhypotese om at ata er forelt uafhægigt af søjle- og række-variable. Kap. 19: Logistic regressio: comparig two or more exposure groups I ee moel multipliceres parametree (til forskel fra e multiple regressio som aerer em (kap. 11)). Hvis er er to ekspoeriger, fås følgee: Os = baselie x exposure(a) x exposure(b) (så hvis A forobler os og B øger os x3, fås at os er 6xbaselie) Logistisk regressio laves alti på logistisk skala (er af avet). Vigtigt at bemærke. Geerel formel: log os x x... x 0 1 1 outcome kales for regressios koefficieter. Trasformerig af ssh/risiko/ til log(os) kales logit fuktioe: log it log 1 Ssh vil alti ligge mellem 0 og 1. Os vil alti ligge mellem 0 og. Log(os) vil alti ligge mellem og. Kategoriske/biære ata ka også iføjes i logistiske regressioer. De vil blot blive sammeliget me hiae, sålees at f.eks. ygste alers gruppe er baselie eller at kvie er baselie (så får x=0 er kvie og x=1 er ma). Kap. 0: Logistic regressio: cotrollig for cofouig a other extesios Ige vigtige formler som ma umielbart ka rege på. Til ette kræves pc-kraft som ma ikke vil have til råighe/ti til uer eksame.