Basal Statistik for medicinske PhD-studerende Oktober 2007
|
|
- Finn Kristensen
- 5 år siden
- Visninger:
Transkript
1 Kategoriske data Basal Statistik for medicinske PhD-studerende Oktober 2007 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet Kategoriske vaiable Dikotom to kategorier: Respons: Ja / Nej Levende / Død Nominal flere kategorier: Selvstændig / Faglært / Ufaglært / Funktionær Blå / Brune / Grå / Grønne Ordinal flere ordnede kategorier: Ingen < Let < Moderat < Svær 0 10 < < < 51+ Oktober 2007: Kategoriske data 1 Data repræsentation Individer Person Kategori 1 a 2 f 3 c 4 b 5 b 6 d 7 d.. n b Tabel Kategori Antal a 8 b 14 c 4 d 9 e 12 f 3 n Oktober 2007: Kategoriske data 2
2 100 patienter behandles og respons registreres: ptt. udfald i x i Model for x i og x i nødvendig. { 65 = xi Respons 35 = 100 x i Intet respons Oktober 2007: Kategoriske data 3 Sandsynlighed for at en tilfældigt valgt person responderer: p{respons} = p p{intet respons} = 1 p Personer er ikke ens. Variationen kommer fra den tilfældige udvælgelse af patienter. p er ukendt - en parameter som karakteriserer populationen. Observationer: x responderer, n x responderer ikke. Oktober 2007: Kategoriske data 4 Binomialfordelingen: Sum af uafhængige Bernoulli-variable, med samme sandsynlighed, p: x = # 1-taller = x i binom(n, p) Punktsandsynlighed: p{x = x} = Middelværdi: E(X) = n p ( n x ) p x (1 p) n x Spredning: std(x) = var(x) = n p (1 p) Oktober 2007: Kategoriske data 5
3 N=5, p=0.1 N=5, p=0.2 N=5, p=0.3 N=5, p=0.5 N=5, p=0.8 N=5, p= N=10, p= N=10, p= N=10, p= N=10, p= N=10, p= N=10, p= N=20, p= N=20, p= N=20, p= N=20, p= N=20, p= N=20, p= N=50, p= N=50, p= N=50, p= N=50, p= N=50, p= N=50, p= Oktober 2007: Kategoriske data 6 Estimation i binomialfordelingen: Parameter: p = Pr{ positiv } Observation: x ud af n er positive (succes, død,... ). Estimat: ˆp = x n p(1 p) Spredning af estimat: s.e.(ˆp) = n Approximativt 95% konfidensinterval for p: ˆp(1 ˆp) ˆp ± n Oktober 2007: Kategoriske data kvinder fra almen praksis. 39 har astmatisk sygdom i familien. p = p{tilfældigt valgt kvinde har astma i familien} = prævalensen af familiær astma ˆp = = p(1 p) s.e.(ˆp) = = = n % c.i: ± = (0.130; 0.233) Dvs.: Data er foreneligt med prævalenser i populationen i området 13% 23%. Oktober 2007: Kategoriske data 8
4 Eksakt konfidensinterval: N=215, p= N=215, p= Oktober 2007: Kategoriske data 9 Eksakt konfidensinterval: 5 ud af N=20, p= N=20, p= % N=20, p= N=20, p= % ˆp = 5/20 = 0.25 Konfidensinterval: 0.25±1.96 = (0.06; 0.44) Oktober 2007: Kategoriske data 10 Eksakt konfidens interval for 0 ud af N Den nedre grænse er: p L = 0 Den øvre grænse, p U, skal vælges så ssh. for 0 er 2.5%: p 0 U (1 p U ) N = (1 p U ) N = p U = /N Eksempel: Observeres 0 ud af 7 bliver den øvre grænse for et eksakt 95% konfidensinterval: p U = /7 = Oktober 2007: Kategoriske data 11
5 Konfidensintervaller for p En god approximation til de eksakte konfidensintervaller er 1 : erf = exp ( 1.960/ np(1 p) ) og derefter udregne grænserne: p p + (1 p) erf 1 Denne formel er baseret på en normal-approximation til log-odds, ln(p/(1 p)). Oktober 2007: Kategoriske data 12 F.eks får vi for 5 ud af 20: p = 0.25, erf = exp ( 1.96/ ) = 2.75 dvs. et 95% c.i bliver: p = p + (1 p) erf = (10.8;47.8)% Traditonelt c.i: (6.0; 44.0)% Eksakt c.i: (8.7, 49.1)% Oktober 2007: Kategoriske data 13 Test H 0 : p = p 0 Hvis nulhypotesen er sand: ( x s.e.(ˆp) = s.e. = n) p0 (1 p 0 ) n z = x/n p 0 p0 (1 p 0 )/n N(0,1) N(0,1) er den standardiserede normalfordeling middelværdi 0 og varians 1. Oktober 2007: Kategoriske data 14
6 Ud af 215 havde 39 astma i familien. Er det foreneligt med en prævalens på 15%? z = 39/ /215 = 1.23 Opslag i tabel giver: p{ z > 1.23} = 21.87% Oktober 2007: Kategoriske data 15 Kontinuitetskorrektion Testsandsynligheden approximeres i normalfordelingen, ved at tage sandsynligheden fra x og udefter. Bedre at tage ssh. fra x (eller x 1 2 ). Det giver den korrigerede teststørrelse: z C = x/n p 0 1/2n p0 (1 p 0 )/n Oktober 2007: Kategoriske data 16 I eksemplet fra før med 39 ud af 215 og p 0 = 0.15: z C = 39/ /(2 215) /215 = 1.194, p = 23.26% Oktober 2007: Kategoriske data 17
7 Antagelser: Forudsætninger for at anvende binomialfordelingen: Observationerne er uafhængige, dvs: Viden om en persons status indeholder ikke information om andres. (Afhængighed kan forekomme hvis personer er i familier, og udfaldet er familiært associeret). Effekt af afhængige observationer: n bliver overvurderet. P-værdi for lille. Oktober 2007: Kategoriske data 18 Observationerne er repræsentative, dvs: Personerne skal repræsentere den population der skal generaliseres til. (Problemer hvis udvælgelsen afhænger af forhold som har med udfaldet at gøre). Effekt af manglende repræsentativitet: Afhænger af den konkrete situation. Oktober 2007: Kategoriske data 19 M Kalani, J Apelqvist, M Blombäck, K Brismar, B Eliasson, JW Eriksson, B Fagrell, A Hamsten, O Torffvit & G Jörneskog: Effect of Dalteparin on Healing of Chronic Foot Ulcers in Diabetic Patients With Peripheral Arterial Occlusive Disease. Diabetes Care 26: , 2003 Ulcer outcome in 85 diabetic patients with PAOD and chronic foot ulcers, randomly assigned to treatment. Dalteparin Placebo Healed 14 9 Improved Unchanged 7 9 Impaired 5 5 Amputation 2 8 Total Dalteparin Placebo Better Worse Total Oktober 2007: Kategoriske data 20
8 Sammenligning af 2 grupper Gruppe Resp. 1 2 Ja x 1 x 2 Nej n 1 x 1 n 2 x 2 n 1 n 2 ˆp 1 = x 1 /n 1 ˆp 2 = x 2 /n 2 p 1 (1 p 1 ) s.e.(ˆp 1 ˆp 2 ) = + p 2(1 p 2 ) n 1 n 2 Oktober 2007: Kategoriske data diabetes-patienter med fodsår: Dalteparin (Dal) Placebo (Pl) Gruppe Dalterapin Placebo Udfald: Bedre Værre ˆp Dal = = 67% ˆp Pl = = 47% Oktober 2007: Kategoriske data 22 Forskellen mellem sandsynlighederne er andelen af patienter der har glæde af behandlingen: p Dal p Pl ˆp Dal ˆp Pl = 20% p Dal (1 p Dal ) s.e.(ˆp Dal ˆp Pl ) = + p Pl(1 p Pl ) n Dal n Pl = %c.i. : 20% ± % = (0%;40%) Oktober 2007: Kategoriske data 23
9 data c ; proc freq data = a ; input resp $ grp $ ; table grp * resp / chisq measures nopercent nocol ; cards ; run ; B Dal B Dal B Dal... B Dal B Dal B Dal W Dal W Dal... data c ; W Dal input resp $ grp $ antal; W Dal cards ; B Pl B Dal 29 B Pl W Dal 14 B Pl B Pl 20 B Pl W Pl ; B Pl run ; W Pl W Pl proc freq data = c ; W Pl table grp * resp / chisq measures nopercent nocol ;... run ; W Pl W Pl W Pl ; run ; Oktober 2007: Kategoriske data 24 Eksempel i SAS Analyst: Indtast data i regnearket som: resp grp count B Dal 29 W Dal 14 B Pl 20 W Pl 22 Vælg Statistics Table Analysis. Put responsvariablen, her resp i column. I Tables vælges både row og col percents. Oktober 2007: Kategoriske data 25 Frequency Row Pct Col Pct B W Total Dal Pl Total Statistic Value ASE Somers D C R Somers D R C C R = Column response given Row ( = 19.82) R C = Row response given Column ( = 20.29) ASE = Asymtotic Standard Error Oktober 2007: Kategoriske data 26
10 Odds (for respons) i de to grupper er defineret som: odds 1 = p 1 1 p 1 odds 2 = p 2 1 p 2 Odds er forholdet mellem antal responser og non-responser i hver af grupperne. Odds-ratio, OR, er forholdet mellem odds i de to grupper: OR = p 1 1 p 1 / p2 1 p 2 Hvor mange gange større er forholdet mellem response og non-response i gruppe 1 i forhold til gruppe 2. Oktober 2007: Kategoriske data 27 Estimat for OR: ˆ OR = Resp. Gr. 1 Gr. 2 Ja a b Nej c d a + c b + d a/(a + c) c/(a + c) / b/(b + d) d/(b + d) = a / b c d = ad bc Spredning skal udregnes på den naturlige logaritme: s.e.[ln( OR)] ˆ 1 = a + 1 b + 1 c + 1 d Oktober 2007: Kategoriske data 28 Konfidensinterval skal udregnes for den naturlige logaritme og transformeres tilbage: ln( ˆ OR) ± 1.96 s.e.[ln( ˆ OR)] Test: OR ˆ } exp(1.96 {{ s.e.[ln( OR)]) ˆ } error factor ln( ˆ OR) s.e.[ln(or)] N(0,1) Oktober 2007: Kategoriske data 29
11 Relativ risiko. RR response = p 1 p 2 Estimat for RR: ˆ RR response = a / b a + c b + d Spredning skal udregnes på den naturlige logaritme: s.e.[ln( RR ˆ 1 response )] = a 1 a + c + 1 b 1 b + d Oktober 2007: Kategoriske data 30 OBS: RR er ikke symmetrisk: RR response 1 RR non-response OBS: OR er symmetrisk: OR response = 1 OR non-response Oktober 2007: Kategoriske data 31 OR og RR fra SAS output The FREQ Procedure Table of grp by resp grp resp Frequency Row Pct B W Total Dal Pl Total Oktober 2007: Kategoriske data 32
12 Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Conf. Limits Case-Control (Odds Ratio) Cohort (Col1 Risk) Cohort (Col2 Risk) Sample Size = 85 OR = = (29 22)/(20 14) RR B = = (29/43)/(20/42) RR W = = (14/43)/(22/42) 1/ = Oktober 2007: Kategoriske data 33 OR eller RR Mortalitet efter appendictomi Gruppe Udfald Hospital A Hospital B Død 2 3 Overlever / RR + = = 0.59 OR + = = 0.59 / RR = = 1.00 OR = = 1.71 Oktober 2007: Kategoriske data 34 OR eller RR 1-års mortalitet efter lungecancer: Gruppe Udfald Hospital A Hospital B Død Overlever / RR + = = 0.98 OR + = = 0.64 RR = 5 98/ 3 90 = 1.53 OR = = 1.56 Oktober 2007: Kategoriske data 35
13 Test: p 1 = p 2 Gruppe Respons 1 2 Ja x 1 x 2 Nej n 1 x 1 n 2 x 2 n 1 n 2 ˆp 1 = x 1 /n 1 ˆp 2 = x 2 /n 2 Under nulhypotesen, dvs. hvis p 1 = p 2 = p er sand: ˆp = x 1 + x 2 n 1 + n 2 Oktober 2007: Kategoriske data 36 dvs.: s.e.(ˆp 1 ˆp 2 ) = Teststørrelsen bliver derfor: ( p(1 p) p(1 p) 1 + = + 1 ) p(1 p) n 1 n 2 n 1 n 2 z = ˆp 1 ˆp 2 s.e.(ˆp 1 ˆp 2 ) N(0,1) Oktober 2007: Kategoriske data 37 Test: OR = 1 eller RR = 1 Samme hypotese som p 1 = p 2! Observeret, O Gruppe 1 2 Forventet, E Gruppe 1 2 (a+b)(a+c) (a+b)(b+d) J a b a + b N N (c+d)(a+c) N c d c + d N a + c b + d N a + c b + d χ 2 P = (O E) 2 = z 2 E (c+d)(b+d) N Oktober 2007: Kategoriske data 38
14 SAS output fra Proc Freq Statistics for Table of grp by resp Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer s V Oktober 2007: Kategoriske data 39 Oversigt over 2 2-tabellen Gruppe Respons 1 2 Ja a b a + b Nej c d c + d a + c b + d N Model: ˆp 1 = a/(a + c) ˆp 2 = b/(b + d) a bin(a + c,p 1 ) b bin(b + d, p 2 ) Oktober 2007: Kategoriske data 40 Tre forskelige mål for afhængighed: p1 (1 p 1 ) p 1 p 2 s.e.(p 1 p 2 ) = a + c OR = p 1/(1 p 1 p 2 /(1 p 2 ) RR = p 1 p 2 s.e.(ln[rr]) = Én nulhypotese H 0 : s.e.(ln[or]) = + p 2(1 p 2 ) b + d 1 a + 1 b + 1 c + 1 d 1 a 1 a + c + 1 b 1 b + d p 1 = p 2 p 1 p 2 = 0 OR = 1 RR = 1 Forudsætning: Alle forventede tal > 5. Oktober 2007: Kategoriske data 41
15 Oversigt over 2 2-tabellen Proc Freq Statistics for Table of grp by resp Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Statistic Value ASE Somers D C R Somers D R C Oktober 2007: Kategoriske data 42 Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Conf. Limits Case-Control (Odds Ratio) Cohort (Col1 Risk) Cohort (Col2 Risk) Sample Size = 85 Oktober 2007: Kategoriske data 43 Tynde tabeller Hvis nogen forventede tal er mindre end 5, f.eks. (DGA, tabel 10.14): Obs. (O) Exp. (E) Delinquent Delinquent Spectactles Yes No Total Yes No Yes No Total Oktober 2007: Kategoriske data 44
16 Fisher s eksakte test: Fasthold marginalerne. P-værdien er sandsynligheden for: den observerede tabel samt mere ekstreme tabeller: Ensidet test: Tabeller med mere skæv fordeling mellem grupperne end den observerede, i samme retning væk fra uafhængighed. Tosidet test: Alle tabeller med mindre sandsynlighed end den observerede. Oktober 2007: Kategoriske data 45 Spectactle Juvenile Non- cum. wearers delinquents delinquents Total ssh. ssh. Yes No Yes No Yes No Yes No Yes No Yes No Yes No Total Oktober 2007: Kategoriske data 46 Eksempel The FREQ Procedure Table of spect by del spect del Frequency Row Pct Col Pct J N Total N Y Total Oktober 2007: Kategoriske data 47
17 Statistics for Table of spect by del Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square WARNING: 75% of the cells have expected counts less than 5. Chi-Square may not be a valid test. Fisher s Exact Test Cell (1,1) Frequency (F) 8 Left-sided Pr <= F Right-sided Pr >= F Table Probability (P) Two-sided Pr <= P Oktober 2007: Kategoriske data 48 R C-tabeller Caffeine consumption (mg/day) >300 Total Married Divorced Single Oktober 2007: Kategoriske data 49 Er fordelingen af koffein-konsumption den samme i de forskellige civilstandsgrupper? Er civilstandsfordelingen den samme for de forskellige niveauer af koffein-konsumption? Det er det samme spørgsmål, og det samme som: Er der uafhængighed i tabellen? Er inddelingen af de 3888 kvinder efter de to kriterier uafhængige? Oktober 2007: Kategoriske data 50
18 R C-tabeller: udregninger χ 2 -test ved sammenligning af O, observerede, og E, forventede v.h.a. Pearsons s χ 2 : χ 2 P = (O E) 2 E χ 2 ((r 1) (c 1)) Oktober 2007: Kategoriske data 51 R C-tabeller: udregninger i SAS data cm ; input civ $ kaf $ antal ; cards ; Married DivWid 0 36 Single Married DivWid Single Married DivWid Single Married > DivWid > Single > ; run ; Oktober 2007: Kategoriske data 52 proc freq data = cm ; weight antal ; table kaf * civ / chisq expected norow nocol nopercent ; table kaf * civ / nopercent ; run ; Oktober 2007: Kategoriske data 53
19 Table of civ by kaf civ kaf Frequency Expected >300 Total DivWid Married Single Total Oktober 2007: Kategoriske data 54 Statistics for Table of kaf by civ Statistic DF Value Prob Chi-Square <.0001 Likelihood Ratio Chi-Square <.0001 Mantel-Haenszel Chi-Square <.0001 Phi Coefficient Contingency Coefficient Cramer s V Sample Size = 3888 Oktober 2007: Kategoriske data 55 Uafhængighedstest hvad kan de bruges til? Man får en P-værdi. Signifikant test: Beskriv den observerede afhængighed teststørrelsen siger ikke noget om hvordan afhængigheden ser ud. Beskriv tabellen med procenter etc. Ikke signifikant test: Teststørrelsen siger ikke nødvendigvis at uafhængigheden er fuldstændig. Beskriv tabellen med procenter etc. Oktober 2007: Kategoriske data 56
20 Table of civ by kaf civ kaf Frequency Row Pct Col Pct >300 Total DivWid Married Single Total Oktober 2007: Kategoriske data 57 Antal fra tabeller Married DivWid Single > Married DivWid Single >300 Oktober 2007: Kategoriske data 58 Procenter fra tabeller Married DivWid Single > Married DivWid Single >300 Oktober 2007: Kategoriske data 59
21 Procenter fra tabeller med SAS goptions hsize=10cm vsize=10cm ; proc gchart data=cm; vbar civ / sumvar=antal subgroup=kaf ; run; Oktober 2007: Kategoriske data 60 proc freq data=cm ; weight antal ; table civ * kaf / out = ud outpct ; run ; proc print data= ud ; run ; civ kaf... PCT_ROW PCT_COL DivWid DivWid DivWid DivWid > Married Married Married Married > Single Single Single Single > proc gchart data=ud; vbar civ / sumvar=pct_row subgroup=kaf; label pct_row="%" ; run; Oktober 2007: Kategoriske data 61 2 k-tabel med ordnede kategorier Skonummer CS < Ialt Ja Nej Ialt χ 2 test for uafhængighed: 9.28 med 5 frihedsgrader; P = Konklusion: Ingen sammenhæng! Oktober 2007: Kategoriske data 62
22 Table of sko by cs sko cs Frequency N Y Total Total Statistic DF Value Prob Chi-Square Oktober 2007: Kategoriske data 63 Kejsersnit som funktion af skonummer. P(kejsersnit) Skonummer Oktober 2007: Kategoriske data 64 Trend test Regression af p i = P {CS} på skonummer, s i : p i = α + βs i Estimer α og β (afskæring og hældning). Test om hældningen er 0. Kejsersnitseksempel: χ 2 trend = P = Oktober 2007: Kategoriske data 65
23 Trend test SAS proc freq data = a ; table sko * cs / nopercent nocol trend ; run ; Table of sko by cs sko cs Frequency Row Pct N Y Total Oktober 2007: Kategoriske data Total Statistics for Table of sko by cs Cochran-Armitage Trend Test Statistic (Z) One-sided Pr > Z Two-sided Pr > Z Sample Size = 351 Bemærk at = Dette er χ 2 -testet med 1 d.f. Oktober 2007: Kategoriske data 67 Trend test forudsætninger Forudsætningen er at data faktisk er velbeskrevet ved en ret linje. Opdeling af χ 2 -testet i test for linearitet og test for trend: χ 2 total (5) = χ2 lin (4) + χ2 trend (1) χ 2 : 9.29 = f: 5 = p: Det samlede test skjuler en signifikant trend. Oktober 2007: Kategoriske data 68
24 Testet for linearitet bidrager med lidt til teststørrelsen, men med mange frihedsgrader. Husk altid at udregne test for linearitet. Det er jo blot simpel subtraktion. Oktober 2007: Kategoriske data 69 Vigtig forudsætning: Observationerne skal være uafhængige. Hvis der er flere observationer på samme objekt er de enkelte observationer ikke uafhængige. Et ofte forekommende tilfælde af dette er: Parrede data: Samme prøve set af to (eller flere) observatører. Samme prøve målt med to forskellige metoder. To personer fra samme matchede sæt. Oktober 2007: Kategoriske data 70 Parrede data To læger skal stille en pos. / neg. diagnose på de samme patienter: Læge 1 Læge 2 Antal ptt. + + a + b + c d Er der overensstemmelse mellem lægernes diagnose? Er sandsynligheden for en positiv diagnose den samme? Oktober 2007: Kategoriske data 71
25 Opsummering af data Tabel over antal par af resultater (her patienter): Læge 1 + Læge 2 Andel positive diagnoser: a + c N a + b N + a b c d differens: b c N Oktober 2007: Kategoriske data 72 McNemar s test Læge 2 Læge a b c d Hvis de to læger har samme sandsynlighed for positiv diagnose må c b. McNemar s test sammenligner b og c: (b c) 2 b + c χ 2 (1) Oktober 2007: Kategoriske data 73 McNemar s test med kontinuitetskorrektion: OBS: ( b c 1) 2 χ 2 (1) b + c Afhænger kun af b og c. (Diskordante observationer, dvs. observationer hvor lægerne er uenige). Test for ens diagnose-sandsynligheder: P 1 {+} = P 2 {+} ikke test for overensstemmelse. Oktober 2007: Kategoriske data 74
26 Estimation af differens Læge 1 + Læge 2 + a b a + b c d c + d a + c b + d N ˆp 1 = a + c N ˆp 2 = a + b N Oktober 2007: Kategoriske data 75 Differens mellem sandsynligheder for pos. diagnose: ˆp 2 ˆp 1 = a + b N s.e.( ˆp 2 ˆp 1 ) = 1 N a + c N b + c = b c N (b c)2 N Bruges til at konstruerere approximative konfidensintervaller for p 1 p 2. Men det har ikke noget med sammenligning af de to læger at gøre! Oktober 2007: Kategoriske data 76 Odds-ratio for pos. diagnose mellem lægerne Læge 2 Læge a b a + b c d c + d a + c b + d N Odds-ratio (OR) mellem læge 1 og 2: OR = p 1/(1 p 1 ) p 2 /(1 p 2 ) = p 1(1 p 2 ) (1 p 1 )p 2 Oktober 2007: Kategoriske data 77
27 P {+, } = p 1 (1 p 2 ) c/n P {,+} = (1 p 1 )p 2 b/n OR = P {+, }/P {,+} = c/n b/n = c b s.e.[ln(or)] = 1 b + 1 c Bruges til at konstruerere konfidensintervaller for OR. Oktober 2007: Kategoriske data 78 Eksakte grænser Læge 2 Læge a b a + b c d c + d a + c b + d N Betinget af uenighed [dvs. enten (+, ) eller (,+)] er c binom(c + b, θ) Det giver muligheder for eksakte grænser for θ. Oktober 2007: Kategoriske data 79 Differens i antal diskordanser (c b): N(p 1 p 2 ) = (c + b) (θ (1 θ)) p 1 p 2 = c + b (2θ 1) N Forhold mellem antal diskordanser (c/b): OR = p 1(1 p 2 ) (1 p 1 )p 2 = θ 1 θ Eksakte grænser for θ kan umiddelbart oversættes til eksakte grænser for p 1 p 2 hhv. OR. Oktober 2007: Kategoriske data 80
28 Eksempel: Dyrkning af tuberkelbaciller. Spytprøver fra 50 tuberkulosepatienter dyrkes i substrat A hhv. B. En positiv prøve vil sige at man får vækst af tuberkelbaciller: A B Antal ptt Er substraterne lige effektive, dvs. har de samme sporingssandsynlighed? Oktober 2007: Kategoriske data 81 Tuberkelbaciller (fortsat) Substrat A + Substrat B Oktober 2007: Kategoriske data 82 Sporingssandsynlighed for A: p A = = 64% % c.i.: 0.64 ± = (0.507; 0.773) Sporingssandsynlighed for B: p B = = 44% % c.i.: 0.44 ± = (0.304; 0.576) Oktober 2007: Kategoriske data 83
29 Differens mellem sporingssandsynligheder: 95% c.i.: 0.20 ± p A p B = 20% (2 12)2 50 = (0.064; 0.336) McNemar s test: χ 2 (1) = (2 12) = 100 = 7.14, p = Oktober 2007: Kategoriske data 84 McNemar s test med kontinuitets-korrektion: χ 2 (1) = ( ) = 81 = 5.78, p = Oktober 2007: Kategoriske data 85 McNemars s test i SAS data g ; input A $ B $ antal ; cards ; ; run ; proc freq data = g ; weight antal ; table A * b / nopercent agree ; run ; Table of A by B A B Frequency Oktober 2007: Kategoriske data 86
30 Row Pct Col Pct + - Total Total Statistics for Table of A by B McNemar s Test Statistic (S) <-- Ingen kontinuitetskorrektion! DF 1 Pr > S Sample Size = 50 Oktober 2007: Kategoriske data 87
Basal Statistik Kategoriske Data
Basal Statistik Kategoriske Data 8 oktober 2013 E 2013 Basal Statistik - Kategoriske data Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk
Læs mereKategoriske data. Basal Statistik for medicinske PhD-studerende October 2008
Kategoriske data Basal Statistik for medicinske PhD-studerende October 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc
Læs merePostoperative komplikationer
Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.
Læs mereAfdeling for Anvendt Matematik og Statistik December 2006
Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 i SAS (Zar kapitel 23) PROC FREQ PROC CATMOD
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereMPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme
MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereLogistisk regression. Basal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereMPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme
MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes
Læs mereIntroduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher
Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereIntroduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher
Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår
Læs mereVejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013
Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.
Læs mereBasal Statistik. Kategorisk outcome. Sandsynligheder. Bestemmelse af sandsynligheder. Faculty of Health Sciences
Faculty of Health Sciences Kategorisk outcome Basal Statistik Kategorisk outcome. Tabeller. Lene Theil Skovgaard 14. februar 2017 1 / 89 Sandsynligheder og odds Binomialfordelingen 2 2 tabeller, relativ
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereMantel-Haenszel analyser. Stratificerede epidemiologiske analyser
Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereFaculty of Health Sciences. Basal Statistik. Kategorisk outcome. Tabeller. Lene Theil Skovgaard. 19. september 2017
Faculty of Health Sciences Basal Statistik Kategorisk outcome. Tabeller. Lene Theil Skovgaard 19. september 2017 1 / 93 Kategorisk outcome Sandsynligheder og odds Binomialfordelingen 2 2 tabeller, relativ
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereBasal Statistik. Kategorisk outcome. Sandsynligheder. Bestemmelse af sandsynligheder. Faculty of Health Sciences
Faculty of Health Sciences Kategorisk outcome Basal Statistik Kategorisk outcome. Tabeller. Lene Theil Skovgaard 17. september 2018 1 / 93 Sandsynligheder og odds Binomialfordelingen 2 2 tabeller, relativ
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev
Læs mereForsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mål for sammenhæng mellem to variable Estimation Stikprøve Data Population Teori relativ hyppighed parameter estimat sandsynlighed parameter
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs mereStatistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004
Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod
Læs mereChi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles
Læs mereBasal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mere9. Chi-i-anden test, case-control data, logistisk regression.
Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/
Læs mereOpgavebesvarelse, logistisk regression
Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med
Læs mereHypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Læs mereProgram. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereKursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereIkke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Læs mereResumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se
Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller
Læs mereTema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Læs mereLøsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereVejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014
Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke
Læs mereForelæsning 9: Inferens for andele (kapitel 10)
Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereOpgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)
Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereØvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse
Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mereReeksamen i Statistik for biokemikere. Blok 3 2007.
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet
Læs mereVi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.
Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereForsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 8. november 2011 Videnskabelig hypotese Planlægning af et studie Endpoints Forsøgsplanlægning Stikprøvestørrelse 1 51 Instrumentelle/eksponerings variable Variationskilder
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereFaculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018
Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereFaculty of Health Sciences. Basal Statistik. Kategorisk outcome. Tabeller. Lene Theil Skovgaard. 20. september 2016
Faculty of Health Sciences Basal Statistik Kategorisk outcome. Tabeller. Lene Theil Skovgaard 20. september 2016 1 / 89 Kategorisk outcome Sandsynligheder og odds Binomialfordelingen 2 2 tabeller, relativ
Læs mereVejledende besvarelse af hjemmeopgave
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin
Læs mereLogistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereEksamen i Statistik for biokemikere. Blok
Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2006. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 6 sider.
Læs mereVejledende besvarelse af eksamen i Statistik for biokemikere, blok
Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder
Læs mereDag 6: Interaktion. Overlevelsesanalyse
Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25
Læs mereOR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model
Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske
Læs mereØvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse
Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.
Læs mereProgram: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Læs mereReeksamen i Statistik for biokemikere. Blok
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er
Læs mereFaculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereAfsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse
Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereIkke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereEpidemiologi og Biostatistik
Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereAgenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereProgram. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Læs mere