Kategoriske data. Basal Statistik for medicinske PhD-studerende October 2008

Størrelse: px
Starte visningen fra side:

Download "Kategoriske data. Basal Statistik for medicinske PhD-studerende October 2008"

Transkript

1 Kategoriske data Basal Statistik for medicinske PhD-studerende October 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet

2 Kategoriske vaiable Dikotom to kategorier: Respons: Ja / Nej Levende / Død Nominal flere kategorier: Selvstændig / Faglært / Ufaglært / Funktionær Blå / Brune / Grå / Grønne Ordinal flere ordnede kategorier: Ingen < Let < Moderat < Svær 0 10 < < < 51+ October 2008: Kategoriske data 1

3 Data repræsentation Individer Person Kategori 1 a 2 f 3 c 4 b 5 b 6 d 7 d.. n b Tabel Kategori Antal a 8 b 14 c 4 d 9 e 12 f 3 n October 2008: Kategoriske data 2

4 100 patienter behandles og respons registreres: ptt. udfald i x i Model for x i og x i nødvendig. { 65 = xi Respons 35 = 100 x i Intet respons October 2008: Kategoriske data 3

5 Sandsynlighed for at en tilfældigt valgt person responderer: p{respons} = p p{intet respons} = 1 p Personer er ikke ens. Variationen kommer fra den tilfældige udvælgelse af patienter. p er ukendt - en parameter som karakteriserer populationen. Observationer: x responderer, n x responderer ikke. October 2008: Kategoriske data 4

6 Binomialfordelingen: Sum af uafhængige Bernoulli-variable, med samme sandsynlighed, p: x = # 1-taller = x i binom(n, p) ( ) n Punktsandsynlighed: p{x = x} = p x (1 p) n x x Middelværdi: E(X) = n p Spredning: std(x) = var(x) = n p (1 p) October 2008: Kategoriske data 5

7 N=5, p=0.1 N=5, p=0.2 N=5, p=0.3 N=5, p=0.5 N=5, p=0.8 N=5, p= N=10, p= N=10, p= N=10, p= N=10, p= N=10, p= N=10, p= N=20, p= N=20, p= N=20, p= N=20, p= N=20, p= N=20, p= N=50, p= N=50, p= N=50, p= N=50, p= N=50, p= N=50, p= October 2008: Kategoriske data 6

8 Estimation i binomialfordelingen: Parameter: p = Pr{ positiv } Observation: x ud af n er positive (succes, død,... ). Estimat: ˆp = x n p(1 p) Spredning af estimat: s.e.(ˆp) = n Approximativt 95% konfidensinterval for p: ˆp ± ˆp(1 ˆp) n October 2008: Kategoriske data 7

9 215 kvinder fra almen praksis. 39 har astmatisk sygdom i familien. p = p{tilfældigt valgt kvinde har astma i familien} = prævalensen af familiær astma ˆp = = p(1 p) s.e.(ˆp) = = = n % c.i: ± = (0.130; 0.233) Dvs.: Data er foreneligt med prævalenser i populationen i området 13% 23%. October 2008: Kategoriske data 8

10 Eksakt konfidensinterval: N=215, p= N=215, p= October 2008: Kategoriske data 9

11 Eksakt konfidensinterval: 5 ud af N=20, p= N=20, p= % N=20, p= N=20, p= % ˆp = 5/20 = 0.25 Konfidensinterval: 0.25±1.96 = (0.06; 0.44) October 2008: Kategoriske data 10

12 Eksakt konfidens interval for 0 ud af N Den nedre grænse er: p L = 0 Den øvre grænse, p U, skal vælges så ssh. for 0 er 2.5%: p 0 U (1 p U ) N = (1 p U ) N = p U = /N Eksempel: Observeres 0 ud af 7 bliver den øvre grænse for et eksakt 95% konfidensinterval: p U = /7 = October 2008: Kategoriske data 11

13 Konfidensintervaller for p En god approximation til de eksakte konfidensintervaller er 1 : erf = exp ( 1.960/ np(1 p) ) og derefter udregne grænserne: p p + (1 p) erf 1 Denne formel er baseret på en normal-approximation til log-odds, ln(p/(1 p)). October 2008: Kategoriske data 12

14 F.eks får vi for 5 ud af 20: p = 0.25, erf = exp ( 1.96/ ) = 2.75 dvs. et 95% c.i bliver: p = p + (1 p) erf = (10.8; 47.8)% Traditonelt c.i: (6.0; 44.0)% Eksakt c.i: (8.7, 49.1)% October 2008: Kategoriske data 13

15 Test H 0 : p = p 0 Hvis nulhypotesen er sand: s.e.(ˆp) = s.e. ( x n) = p0 (1 p 0 ) n z = x/n p 0 p0 (1 p 0 )/n N (0, 1) N (0, 1) er den standardiserede normalfordeling middelværdi 0 og varians 1. October 2008: Kategoriske data 14

16 Ud af 215 havde 39 astma i familien. Er det foreneligt med en prævalens på 15%? z = 39/ /215 = 1.23 Opslag i tabel giver: p{ z > 1.23} = 21.87% October 2008: Kategoriske data 15

17 Kontinuitetskorrektion Testsandsynligheden approximeres i normalfordelingen, ved at tage sandsynligheden fra x og udefter. Bedre at tage ssh. fra x (eller x 1 2 ). Det giver den korrigerede teststørrelse: z C = x/n p 0 1/2n p0 (1 p 0 )/n October 2008: Kategoriske data 16

18 I eksemplet fra før med 39 ud af 215 og p 0 = 0.15: z C = 39/ /(2 215) /215 = 1.194, p = 23.26% October 2008: Kategoriske data 17

19 Antagelser: Forudsætninger for at anvende binomialfordelingen: Observationerne er uafhængige, dvs: Viden om en persons status indeholder ikke information om andres. (Afhængighed kan forekomme hvis personer er i familier, og udfaldet er familiært associeret). Effekt af afhængige observationer: n bliver overvurderet. P-værdi for lille. October 2008: Kategoriske data 18

20 Observationerne er repræsentative, dvs: Personerne skal repræsentere den population der skal generaliseres til. (Problemer hvis udvælgelsen afhænger af forhold som har med udfaldet at gøre). Effekt af manglende repræsentativitet: Afhænger af den konkrete situation. October 2008: Kategoriske data 19

21 M Kalani, J Apelqvist, M Blombäck, K Brismar, B Eliasson, JW Eriksson, B Fagrell, A Hamsten, O Torffvit & G Jörneskog: Effect of Dalteparin on Healing of Chronic Foot Ulcers in Diabetic Patients With Peripheral Arterial Occlusive Disease. Diabetes Care 26: , 2003 Ulcer outcome in 85 diabetic patients with PAOD and chronic foot ulcers, randomly assigned to treatment. Dalteparin Placebo Healed 14 9 Improved Unchanged 7 9 Impaired 5 5 Amputation 2 8 Total Dalteparin Placebo Better Worse Total October 2008: Kategoriske data 20

22 Sammenligning af 2 grupper Gruppe Resp. 1 2 Ja x 1 x 2 Nej n 1 x 1 n 2 x 2 n 1 n 2 ˆp 1 = x 1 /n 1 ˆp 2 = x 2 /n 2 p 1 (1 p 1 ) s.e.(ˆp 1 ˆp 2 ) = + p 2(1 p 2 ) n 1 n 2 October 2008: Kategoriske data 21

23 85 diabetes-patienter med fodsår: Dalteparin (Dal) Placebo (Pl) Gruppe Dalterapin Placebo Udfald: Bedre Værre ˆp Dal = = 67% ˆp Pl = = 47% October 2008: Kategoriske data 22

24 Forskellen mellem sandsynlighederne er andelen af patienter der har glæde af behandlingen: p Dal p Pl ˆp Dal ˆp Pl = 20% s.e.(ˆp Dal ˆp Pl ) = p Dal (1 p Dal ) n Dal + p Pl(1 p Pl ) n Pl = %c.i. : 20% ± % = (0%; 40%) October 2008: Kategoriske data 23

25 data c ; proc freq data = a ; input resp $ grp $ ; table grp * resp / chisq measures nopercent nocol ; cards ; run ; B Dal B Dal B Dal... B Dal B Dal B Dal W Dal W Dal... data c ; W Dal input resp $ grp $ antal; W Dal cards ; B Pl B Dal 29 B Pl W Dal 14 B Pl B Pl 20 B Pl W Pl ; B Pl run ; W Pl W Pl proc freq data = c ; W Pl table grp * resp / chisq measures nopercent nocol ;... run ; W Pl W Pl W Pl ; run ; October 2008: Kategoriske data 24

26 Eksempel i SAS Analyst: Indtast data i regnearket som: resp grp count B Dal 29 W Dal 14 B Pl 20 W Pl 22 Vælg Statistics Table Analysis. Put responsvariablen, her resp i column. I Tables vælges både row og col percents. October 2008: Kategoriske data 25

27 Frequency Row Pct Col Pct B W Total Dal Pl Total Statistic Value ASE Somers D C R Somers D R C C R = Column response given Row ( = 19.82) R C = Row response given Column ( = 20.29) ASE = Asymtotic Standard Error October 2008: Kategoriske data 26

28 Odds (for respons) i de to grupper er defineret som: odds 1 = p 1 1 p 1 odds 2 = p 2 1 p 2 Odds er forholdet mellem antal responser og non-responser i hver af grupperne. Odds-ratio, OR, er forholdet mellem odds i de to grupper: OR = p 1 1 p 1 / p2 1 p 2 Hvor mange gange større er forholdet mellem response og non-response i gruppe 1 i forhold til gruppe 2. October 2008: Kategoriske data 27

29 Estimat for OR: ˆ OR = Resp. Gr. 1 Gr. 2 Ja a b Nej c d a + c b + d / a/(a + c) b/(b + d) c/(a + c) d/(b + d) = a / b c d = ad bc Spredning skal udregnes på den naturlige logaritme: s.e.[ln( ˆ OR)] = 1 a + 1 b + 1 c + 1 d October 2008: Kategoriske data 28

30 Konfidensinterval skal udregnes for den naturlige logaritme og transformeres tilbage: ln( ˆ OR) ± 1.96 s.e.[ln( ˆ OR)] OR ˆ exp(1.96 } {{ s.e.[ln( OR)]) ˆ } error factor Test: ln( ˆ OR) s.e.[ln(or)] N (0, 1) October 2008: Kategoriske data 29

31 Relativ risiko. RR response = p 1 p 2 Estimat for RR: ˆ RR response = a / b a + c b + d Spredning skal udregnes på den naturlige logaritme: s.e.[ln( ˆ RR response )] = 1 a 1 a + c + 1 b 1 b + d October 2008: Kategoriske data 30

32 OBS: RR er ikke symmetrisk: RR response 1 RR non-response OBS: OR er symmetrisk: OR response = 1 OR non-response October 2008: Kategoriske data 31

33 OR og RR fra SAS output The FREQ Procedure Table of grp by resp grp resp Frequency Row Pct B W Total Dal Pl Total October 2008: Kategoriske data 32

34 Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Conf. Limits Case-Control (Odds Ratio) Cohort (Col1 Risk) Cohort (Col2 Risk) Sample Size = 85 OR = = (29 22)/(20 14) RR B = = (29/43)/(20/42) RR W = = (14/43)/(22/42) 1/ = October 2008: Kategoriske data 33

35 OR eller RR Mortalitet efter appendictomi Gruppe Udfald Hospital A Hospital B Død 2 3 Overlever / RR + = = 0.59 OR + = = 0.59 / RR = = 1.00 OR = = 1.71 October 2008: Kategoriske data 34

36 OR eller RR 1-års mortalitet efter lungecancer: Gruppe Udfald Hospital A Hospital B Død Overlever / RR + = = 0.98 OR + = = 0.64 RR = 5 98/ 3 90 = 1.53 OR = = 1.56 October 2008: Kategoriske data 35

37 Test: p 1 = p 2 Gruppe Respons 1 2 Ja x 1 x 2 Nej n 1 x 1 n 2 x 2 n 1 n 2 ˆp 1 = x 1 /n 1 ˆp 2 = x 2 /n 2 Under nulhypotesen, dvs. hvis p 1 = p 2 = p er sand: ˆp = x 1 + x 2 n 1 + n 2 October 2008: Kategoriske data 36

38 dvs.: s.e.(ˆp 1 ˆp 2 ) = p(1 p) n 1 + p(1 p) n 2 = ( 1 n n 2 ) p(1 p) Teststørrelsen bliver derfor: z = ˆp 1 ˆp 2 s.e.(ˆp 1 ˆp 2 ) N (0, 1) October 2008: Kategoriske data 37

39 Test: OR = 1 eller RR = 1 Samme hypotese som p 1 = p 2! Observeret, O Gruppe 1 2 J a b a + b N c d c + d Forventet, E Gruppe 1 2 (a+b)(a+c) N (c+d)(a+c) N (a+b)(b+d) N (c+d)(b+d) N a + c b + d N a + c b + d χ 2 P = (O E) 2 E = z 2 October 2008: Kategoriske data 38

40 SAS output fra Proc Freq Statistics for Table of grp by resp Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer s V October 2008: Kategoriske data 39

41 Oversigt over 2 2-tabellen Gruppe Respons 1 2 Ja a b a + b Nej c d c + d a + c b + d N Model: ˆp 1 = a/(a + c) ˆp 2 = b/(b + d) a bin(a + c, p 1 ) b bin(b + d, p 2 ) October 2008: Kategoriske data 40

42 Tre forskelige mål for afhængighed: p 1 p 2 s.e.(p 1 p 2 ) = p1 (1 p 1 ) a + c + p 2(1 p 2 ) b + d OR = p 1/(1 p 1 p 2 /(1 p 2 ) RR = p 1 p 2 s.e.(ln[rr]) = Én nulhypotese H 0 : s.e.(ln[or]) = 1 a + 1 b + 1 c + 1 d 1 a 1 a + c + 1 b 1 b + d p 1 = p 2 p 1 p 2 = 0 OR = 1 RR = 1 Forudsætning: Alle forventede tal > 5. October 2008: Kategoriske data 41

43 Oversigt over 2 2-tabellen Proc Freq Statistics for Table of grp by resp Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Statistic Value ASE Somers D C R Somers D R C October 2008: Kategoriske data 42

44 Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Conf. Limits Case-Control (Odds Ratio) Cohort (Col1 Risk) Cohort (Col2 Risk) Sample Size = 85 October 2008: Kategoriske data 43

45 Tynde tabeller Hvis nogen forventede tal er mindre end 5, f.eks. (DGA, tabel 10.14): Obs. (O) Exp. (E) Delinquent Delinquent Spectactles Yes No Total Yes No Yes No Total October 2008: Kategoriske data 44

46 Fisher s eksakte test: Fasthold marginalerne. P-værdien er sandsynligheden for: den observerede tabel samt mere ekstreme tabeller: Ensidet test: Tabeller med mere skæv fordeling mellem grupperne end den observerede, i samme retning væk fra uafhængighed. Tosidet test: Alle tabeller med mindre sandsynlighed end den observerede. October 2008: Kategoriske data 45

47 Spectactle Juvenile Non- cum. wearers delinquents delinquents Total ssh. ssh. Yes No Yes No Yes No Yes No Yes No Yes No Yes No Total October 2008: Kategoriske data 46

48 Eksempel The FREQ Procedure Table of spect by del spect del Frequency Row Pct Col Pct J N Total N Y Total October 2008: Kategoriske data 47

49 Statistics for Table of spect by del Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square WARNING: 75% of the cells have expected counts less than 5. Chi-Square may not be a valid test. Fisher s Exact Test Cell (1,1) Frequency (F) 8 Left-sided Pr <= F Right-sided Pr >= F Table Probability (P) Two-sided Pr <= P October 2008: Kategoriske data 48

50 R C-tabeller Caffeine consumption (mg/day) >300 Total Married Divorced Single October 2008: Kategoriske data 49

51 Er fordelingen af koffein-konsumption den samme i de forskellige civilstandsgrupper? Er civilstandsfordelingen den samme for de forskellige niveauer af koffein-konsumption? Det er det samme spørgsmål, og det samme som: Er der uafhængighed i tabellen? Er inddelingen af de 3888 kvinder efter de to kriterier uafhængige? October 2008: Kategoriske data 50

52 R C-tabeller: udregninger χ 2 -test ved sammenligning af O, observerede, og E, forventede v.h.a. Pearsons s χ 2 : χ 2 P = (O E) 2 E χ 2 ((r 1) (c 1)) October 2008: Kategoriske data 51

53 R C-tabeller: udregninger i SAS data cm ; input civ $ kaf $ antal ; cards ; Married DivWid 0 36 Single Married DivWid Single Married DivWid Single Married > DivWid > Single > ; run ; October 2008: Kategoriske data 52

54 proc freq data = cm ; weight antal ; table kaf * civ / chisq expected norow nocol nopercent ; table kaf * civ / nopercent ; run ; October 2008: Kategoriske data 53

55 Table of civ by kaf civ kaf Frequency Expected >300 Total DivWid Married Single Total October 2008: Kategoriske data 54

56 Statistics for Table of kaf by civ Statistic DF Value Prob Chi-Square <.0001 Likelihood Ratio Chi-Square <.0001 Mantel-Haenszel Chi-Square <.0001 Phi Coefficient Contingency Coefficient Cramer s V Sample Size = 3888 October 2008: Kategoriske data 55

57 Uafhængighedstest hvad kan de bruges til? Man får en P-værdi. Signifikant test: Beskriv den observerede afhængighed teststørrelsen siger ikke noget om hvordan afhængigheden ser ud. Beskriv tabellen med procenter etc. Ikke signifikant test: Teststørrelsen siger ikke nødvendigvis at uafhængigheden er fuldstændig. Beskriv tabellen med procenter etc. October 2008: Kategoriske data 56

58 Table of civ by kaf civ kaf Frequency Row Pct Col Pct >300 Total DivWid Married Single Total October 2008: Kategoriske data 57

59 Antal fra tabeller Married DivWid Single > Married DivWid Single >300 October 2008: Kategoriske data 58

60 Procenter fra tabeller Married DivWid Single > Married DivWid Single >300 October 2008: Kategoriske data 59

61 Procenter fra tabeller med SAS goptions hsize=10cm vsize=10cm ; proc gchart data=cm; vbar civ / sumvar=antal subgroup=kaf ; run; October 2008: Kategoriske data 60

62 proc freq data=cm ; weight antal ; table civ * kaf / out = ud outpct ; run ; proc print data= ud ; run ; civ kaf... PCT_ROW PCT_COL DivWid DivWid DivWid DivWid > Married Married Married Married > Single Single Single Single > proc gchart data=ud; vbar civ / sumvar=pct_row subgroup=kaf; label pct_row="%" ; run; October 2008: Kategoriske data 61

63 2 k-tabel med ordnede kategorier Skonummer CS < Ialt Ja Nej Ialt χ 2 test for uafhængighed: 9.28 med 5 frihedsgrader; P = Konklusion: Ingen sammenhæng! October 2008: Kategoriske data 62

64 Table of sko by cs sko cs Frequency N Y Total Total Statistic DF Value Prob Chi-Square October 2008: Kategoriske data 63

65 Kejsersnit som funktion af skonummer. P(kejsersnit) Skonummer October 2008: Kategoriske data 64

66 Trend test Regression af p i = P {CS} på skonummer, s i : p i = α + βs i Estimer α og β (afskæring og hældning). Test om hældningen er 0. Kejsersnitseksempel: χ 2 trend = P = October 2008: Kategoriske data 65

67 Trend test SAS proc freq data = a ; table sko * cs / nopercent nocol trend ; run ; Table of sko by cs sko cs Frequency Row Pct N Y Total October 2008: Kategoriske data 66

68 Total Statistics for Table of sko by cs Cochran-Armitage Trend Test Statistic (Z) One-sided Pr > Z Two-sided Pr > Z Sample Size = 351 Bemærk at = Dette er χ 2 -testet med 1 d.f. October 2008: Kategoriske data 67

69 Trend test forudsætninger Forudsætningen er at data faktisk er velbeskrevet ved en ret linje. Opdeling af χ 2 -testet i test for linearitet og test for trend: χ 2 total (5) = χ2 lin (4) + χ2 trend (1) χ 2 : 9.29 = f: 5 = p: Det samlede test skjuler en signifikant trend. October 2008: Kategoriske data 68

70 Testet for linearitet bidrager med lidt til teststørrelsen, men med mange frihedsgrader. Husk altid at udregne test for linearitet. Det er jo blot simpel subtraktion. October 2008: Kategoriske data 69

71 Vigtig forudsætning: Observationerne skal være uafhængige. Hvis der er flere observationer på samme objekt er de enkelte observationer ikke uafhængige. Et ofte forekommende tilfælde af dette er: Parrede data: Samme prøve set af to (eller flere) observatører. Samme prøve målt med to forskellige metoder. To personer fra samme matchede sæt. October 2008: Kategoriske data 70

72 Parrede data To læger skal stille en pos. / neg. diagnose på de samme patienter: Læge 1 Læge 2 Antal ptt. + + a + b + c d Er der overensstemmelse mellem lægernes diagnose? Er sandsynligheden for en positiv diagnose den samme? October 2008: Kategoriske data 71

73 Opsummering af data Tabel over antal par af resultater (her patienter): Læge 1 + Læge 2 Andel positive diagnoser: a + c N a + b N + a b c d differens: b c N October 2008: Kategoriske data 72

74 McNemar s test Læge 2 Læge a b c d Hvis de to læger har samme sandsynlighed for positiv diagnose må c b. McNemar s test sammenligner b og c: (b c) 2 b + c χ 2 (1) October 2008: Kategoriske data 73

75 McNemar s test med kontinuitetskorrektion: OBS: ( b c 1) 2 b + c χ 2 (1) Afhænger kun af b og c. (Diskordante observationer, dvs. observationer hvor lægerne er uenige). Test for ens diagnose-sandsynligheder: P 1 {+} = P 2 {+} ikke test for overensstemmelse. October 2008: Kategoriske data 74

76 Estimation af differens Læge 1 + Læge 2 + a b a + b c d c + d a + c b + d N ˆp 1 = a + c N ˆp 2 = a + b N October 2008: Kategoriske data 75

77 Differens mellem sandsynligheder for pos. diagnose: ˆp 2 ˆp 1 = a + b N a + c N s.e.( ˆp 2 ˆp 1 ) = 1 b + c N = b c N (b c)2 N Bruges til at konstruerere approximative konfidensintervaller for p 1 p 2. Men det har ikke noget med sammenligning af de to læger at gøre! October 2008: Kategoriske data 76

78 Odds-ratio for pos. diagnose mellem lægerne Læge 2 Læge a b a + b c d c + d a + c b + d N Odds-ratio (OR) mellem læge 1 og 2: OR = p 1/(1 p 1 ) p 2 /(1 p 2 ) = p 1(1 p 2 ) (1 p 1 )p 2 October 2008: Kategoriske data 77

79 P {+, } = p 1 (1 p 2 ) c/n P {, +} = (1 p 1 )p 2 b/n OR = P {+, } /P {, +} = c/n b/n = c b s.e.[ln(or)] = 1 b + 1 c Bruges til at konstruerere konfidensintervaller for OR. October 2008: Kategoriske data 78

80 Eksakte grænser Læge 2 Læge a b a + b c d c + d a + c b + d N Betinget af uenighed [dvs. enten (+, ) eller (, +)] er c binom(c + b, θ) Det giver muligheder for eksakte grænser for θ. October 2008: Kategoriske data 79

81 Differens i antal diskordanser (c b): N(p 1 p 2 ) = (c + b) (θ (1 θ)) p 1 p 2 = c + b (2θ 1) N Forhold mellem antal diskordanser (c/b): OR = p 1(1 p 2 ) (1 p 1 )p 2 = θ 1 θ Eksakte grænser for θ kan umiddelbart oversættes til eksakte grænser for p 1 p 2 hhv. OR. October 2008: Kategoriske data 80

82 Eksempel: Dyrkning af tuberkelbaciller. Spytprøver fra 50 tuberkulosepatienter dyrkes i substrat A hhv. B. En positiv prøve vil sige at man får vækst af tuberkelbaciller: A B Antal ptt Er substraterne lige effektive, dvs. har de samme sporingssandsynlighed? October 2008: Kategoriske data 81

83 Tuberkelbaciller (fortsat) Substrat A + Substrat B October 2008: Kategoriske data 82

84 Sporingssandsynlighed for A: p A = = 64% % c.i.: 0.64 ± = (0.507; 0.773) Sporingssandsynlighed for B: p B = = 44% % c.i.: 0.44 ± = (0.304; 0.576) October 2008: Kategoriske data 83

85 Differens mellem sporingssandsynligheder: p A p B = 20% 95% c.i.: 0.20 ± (2 12)2 50 = (0.064; 0.336) McNemar s test: χ 2 (1) = (2 12) = = 7.14, p = October 2008: Kategoriske data 84

86 McNemar s test med kontinuitets-korrektion: χ 2 (1) = ( ) = = 5.78, p = October 2008: Kategoriske data 85

87 McNemars s test i SAS data g ; input A $ B $ antal ; cards ; ; run ; proc freq data = g ; weight antal ; table A * b / nopercent agree ; run ; Table of A by B A B Frequency October 2008: Kategoriske data 86

88 Row Pct Col Pct + - Total Total Statistics for Table of A by B McNemar s Test Statistic (S) <-- Ingen kontinuitetskorrektion! DF 1 Pr > S Sample Size = 50 October 2008: Kategoriske data 87

Basal Statistik for medicinske PhD-studerende Oktober 2007

Basal Statistik for medicinske PhD-studerende Oktober 2007 Kategoriske data Basal Statistik for medicinske PhD-studerende Oktober 2007 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Basal Statistik Kategoriske Data

Basal Statistik Kategoriske Data Basal Statistik Kategoriske Data 8 oktober 2013 E 2013 Basal Statistik - Kategoriske data Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Afdeling for Anvendt Matematik og Statistik December 2006

Afdeling for Anvendt Matematik og Statistik December 2006 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 i SAS (Zar kapitel 23) PROC FREQ PROC CATMOD

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Modul 5: Test for én stikprøve

Modul 5: Test for én stikprøve Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................

Læs mere

Konfidensinterval for µ (σ kendt)

Konfidensinterval for µ (σ kendt) Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)

Læs mere

9. Chi-i-anden test, case-control data, logistisk regression.

9. Chi-i-anden test, case-control data, logistisk regression. Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Basal Statistik for medicinske PhD-studerende November 2008

Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra

Læs mere

Introduktion til SAS. Faculty of Health Sciences

Introduktion til SAS. Faculty of Health Sciences Faculty of Health Sciences Introduktion til SAS Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Eksempel: Blodtryk og fedme OBESE: vægt/idealvægt,

Læs mere

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mål for sammenhæng mellem to variable Estimation Stikprøve Data Population Teori relativ hyppighed parameter estimat sandsynlighed parameter

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Faculty of Health Sciences. Basal Statistik. Kategorisk outcome. Tabeller. Lene Theil Skovgaard. 20. september 2016

Faculty of Health Sciences. Basal Statistik. Kategorisk outcome. Tabeller. Lene Theil Skovgaard. 20. september 2016 Faculty of Health Sciences Basal Statistik Kategorisk outcome. Tabeller. Lene Theil Skovgaard 20. september 2016 1 / 89 Kategorisk outcome Sandsynligheder og odds Binomialfordelingen 2 2 tabeller, relativ

Læs mere

Basal Statistik. Kategorisk outcome. Sandsynligheder. Bestemmelse af sandsynligheder. Faculty of Health Sciences

Basal Statistik. Kategorisk outcome. Sandsynligheder. Bestemmelse af sandsynligheder. Faculty of Health Sciences Faculty of Health Sciences Kategorisk outcome Basal Statistik Kategorisk outcome. Tabeller. Lene Theil Skovgaard 14. februar 2017 1 / 89 Sandsynligheder og odds Binomialfordelingen 2 2 tabeller, relativ

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Faculty of Health Sciences. Basal Statistik. Kategorisk outcome. Tabeller. Lene Theil Skovgaard. 19. september 2017

Faculty of Health Sciences. Basal Statistik. Kategorisk outcome. Tabeller. Lene Theil Skovgaard. 19. september 2017 Faculty of Health Sciences Basal Statistik Kategorisk outcome. Tabeller. Lene Theil Skovgaard 19. september 2017 1 / 93 Kategorisk outcome Sandsynligheder og odds Binomialfordelingen 2 2 tabeller, relativ

Læs mere

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Ensidet variansanalyse

Ensidet variansanalyse Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger

Læs mere

Basal Statistik. Kategorisk outcome. Sandsynligheder. Bestemmelse af sandsynligheder. Faculty of Health Sciences

Basal Statistik. Kategorisk outcome. Sandsynligheder. Bestemmelse af sandsynligheder. Faculty of Health Sciences Faculty of Health Sciences Kategorisk outcome Basal Statistik Kategorisk outcome. Tabeller. Lene Theil Skovgaard 17. september 2018 1 / 93 Sandsynligheder og odds Binomialfordelingen 2 2 tabeller, relativ

Læs mere

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:

Læs mere

En Introduktion til SAS. Kapitel 6.

En Introduktion til SAS. Kapitel 6. En Introduktion til SAS. Kapitel 6. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 6 Regressionsanalyse i SAS 6.1 Indledning Dette kapitel

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Simpel og multipel logistisk regression

Simpel og multipel logistisk regression Faculty of Health Sciences Logistisk regression Simpel og multipel logistisk regression 16. Maj 2012 Analyse af en binær responsvariabel. syg/rask, død/levende, ja/nej... Ud fra en eller flere forklarende

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Besvarelse af opgavesættet ved Reeksamen forår 2008

Besvarelse af opgavesættet ved Reeksamen forår 2008 Besvarelse af opgavesættet ved Reeksamen forår 2008 10. marts 2008 1. Angiv formål med undersøgelsen. Beskriv kort hvordan cases og kontroller er udvalgt. Vurder om kontrolgruppen i det aktuelle studie

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Reeksamen i Statistik for biokemikere. Blok 3 2007.

Reeksamen i Statistik for biokemikere. Blok 3 2007. Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts Århus 27. februar 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts Epibasic er nu opdateret til version 2.02 (obs. der er ikke ændret ved arket C-risk) Start med

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.

Læs mere

Estimation og konfidensintervaller

Estimation og konfidensintervaller Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25.

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (24.-25. marts) En stikprøve bestående af 65 mænd og 65 kvinder

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning Intro til statistik Rasmus F. Brøndum, Institut 17 (Matematik) Hjemmeside: people.math.aau.dk/~froberg 22 forelæsninger (hvor af jeg afholder de første 13) + det samme antal øvelsesgange. Hjælpelærer:

Læs mere

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1 Mikro-kursus i statistik 2. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er hypotesetestning? I sundhedsvidenskab:! Hypotesetestning = Test af nulhypotesen Hypotese-testning anvendes til at vurdere,

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Modul 3: Kontinuerte stokastiske variable

Modul 3: Kontinuerte stokastiske variable Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 3: Kontinuerte stokastiske variable 3.1 Kontinuerte stokastiske variable........................... 1 3.1.1 Tæthedsfunktion...............................

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

2 Logaritme- og eksponentialfunktion 6

2 Logaritme- og eksponentialfunktion 6 Indhold 1 Kontingenstabeller 2 1.1 Krydstabeller....................................... 2 1.2 Forventede under nulhypotesen............................. 4 1.3 Ki-kvadrat test......................................

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 8. november 2011 Videnskabelig hypotese Planlægning af et studie Endpoints Forsøgsplanlægning Stikprøvestørrelse 1 51 Instrumentelle/eksponerings variable Variationskilder

Læs mere

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable

Læs mere

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A) Økonometri 1 Forår 2003 Ugeseddel 13 Program for øvelserne: Gruppearbejde Opsamling af gruppearbejdet og introduktion af SAS SAS-øvelser i computerkælderen Øvelsesopgave 6: Hvem består første årsprøve

Læs mere

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation

Læs mere