Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1

Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand afprøves Der 3 muligheder: 1. Præparatet M har en positiv effekt folk foretrækker M for T (traditionel) 2. Præparatet har en negativ effekt folk foretrækker T for M 3. Præparatet M har ingen/ringe effekt folk er ligeglade med hvad de får 2

Undersøgelsesdesign: Randomiseret, dobbeltblind cross-over trial, hvor 8 patienter får M og T i 2 perioder Randomiseret Hvis alle patienter fik præparaterne i samme rækkefølge, f.eks. T efterfulgt af M, kunne man forveksle evt. forskelle med f.eks. årstidsvariation, spontan bedring mv Blindet Fordi patientens egen forventning har en indvirkning på udfaldet (placeboeffekt) og fordi lægens viden eller forventning kan smitte til patienten. Hvilken størrelse skal observeres? Studieresultat: X: Antal (af de 8), der foretrækker M for T 3

Vi skal nu lave sådanne undersøgelser Man går sammen i grupper: to og to Hver gruppe skal lave deres eget lille studie: får en pose - ikke kigge ned i posen! posen indeholder røde og blå kugler 8 kugler trækkes med tilbagelægning. En blå kugle repræsenterer at det nye præparat foretrækkes antal blå kugler er jeres studieresultat Diskuter med din makker hvad jeres bedste bud på andelen af blå kugler der er i posen: baser jeres bud på kun jeres eget resultat 4

Påstand: Der er lige mange røde og blå kugler i posen! Diskuter med din makker hvad I mener om den påstand baseret på jeres eget studie-resultat Diskuter hvor mange blå kugler (ud af de 8) der skal til for at I ville afvise påstanden 5

Antallet af blå kugler råbes ned til Jørgen 6

Statistisk Model X: Antal (af de 8), der foretrækker M for T X er binomialfordelt med antalsparameter N=8 og (ukendt) sandsynlighedsparameter (p) der er sandsynligheden for at en tilfældigt udvalgt patient foretrækker M for T: X Bin(N = 8,p) Resultat af observationen: N = 8 : x = 7(der foretrak M (blå bolde)) Estimation: Vores bedste gæt på p (estimatet) er andelen af patienter, der foretrækker M, altså ˆp = x n = 7 8 Det ser ud til, at M har en positiv effekt! Hvorfor? Fordi, hvis M ikke virkede, ville vi næppe finde så mange, der foretrak M for T. 7

Men: det er jo små tal (N=8 og x=7), så kunne det ikke blot være sket ved en tilfældighed? Vi opstiller (nul)hypotesen: H 0 : p = 1 2 (M virker ikke) mod alternativet: H A : p > 1 2 (M virker positivt) Hvis vi kan afkræfte hypotesen H 0, har vi sandsynliggjort, at medicinen har en effekt. 8

Fremgangsmåde: H 0 : p = 1 2 (M virker ikke) Vi forestiller os, at H 0 er sand og ser om det fører til noget, der ligner en modstrid (dvs. noget som er meget usandsynligt). Hvis H 0 er sand, hvilke X er vil vi da forvente at observere? Formentlig nogle omkring 4 (= 8 2 ). Vi kender fordelingen af X under H 0 : X Bin(n = 8,p = 0.5) 9

Vi kender fordelingen af X under H 0 : X Bin(N = 8,p = 0.5) 0.30 0.2734 0.25 0.2187 0.2187 0.20 0.15 0.10 0.1094 0.1094 0.05 0.0312 0.0312 0.00 0.0039 0.0039 0 1 2 3 4 5 6 7 8 Vi har observeret x=7 Er det meget usandsynligt under H 0? P(X 7 H 0 ) = 0.035 10

Hvis H 0 er sand, har vi observeret noget langt ude i halen, som man kun tilfældigvis vil observere i 3.5% af tilfældene. Dette tyder på,at H 0 ikke er sand (og at H A altså er mere rimelig). Vi kalder P(X 7 H 0 ) for halesandsynligheden eller P-værdien, og skriver P=0.035 eller P=3.5%. Når denne er tilstrækkelig lille, forkaster vi H 0. Men hvad betyder tilstrækkelig lille?? P<5%? P<1%? Man vælger et signifikansniveau, betegnet α, og forkaster så H 0, når P< α. 11

Signifikansniveauet α er ofte 0.05 = 5% Signifikansniveauet angiver den risiko, vi er villige til at løbe for at forkaste en sand nulhypotese Den betegnes også Fejl af type I accept forkast H 0 sand 1-α α Fejl af type I H 0 falsk 12

Vi prøver en gang til med boldene Samme grupper: får en pose - ikke kigge ned i posen! posen indeholder røde og blå kugler 8 kugler trækkes med tilbagelægning. En blå kugle repræsenterer at det nye præparat foretrækkes antal blå kugler er jeres studieresultat Diskuter med din makker hvad jeres bedste bud på hvor mange blå kugler der er i posen Påstand: Der er lige mange røde og blå kugler i posen! Diskuter med din makker hvad I mener om den påstand baseret på jeres eget studie-resultat 13

Antallet af blå kugler råbes ned til Jørgen 14

Vi kender fordelingen af X under H A : p 0.5 X Bin(N = 8,p = 6/8) 0.35 0.3115 0.30 0.267 0.25 0.20 0.2076 0.15 0.10 0.0865 0.1001 0.05 0.00 0 4e 04 0.0038 0.0231 0 1 2 3 4 5 6 7 8 Vi har observeret x=7 eller x=8 en del gange Er det sandsynligt under H A? P(X 7 H A ) = 0.267+0.100 = 0.367 15

accept forkast H 0 sand 1-α α fejl af type I H 0 falsk β 1-β fejl af type II 1-β kaldes styrken der er sandsynligheden for at forkaste en falsk hypotese 16

Ensidigt vs. tosidigt test I det foregående har vi lavet et ensidigt test, idet H A : p >0.5 Hvis H A :p 0.5 ville observationerne x=0 og x=1 være ligeså ekstreme, så P-værdien ville blive fordoblet til 7% og dermed lede til et accept af hypotesen. Acceptområde: Alle de observationer, der ville lede til accept af hypotesen. Her: (0,1,2,3,4,5,6) for det ensidige test (1,2,3,4,5,6,7) for det tosidige test Kritisk område eller Forkastelsesområde: Alle de værdier, der ville lede til forkastelse af hypotesen. Her: (7,8) for det ensidige test (0,8) for det tosidige test Hvis α sænkes, bliver acceptområdet større og det kritiske område mindre. 17

Vi prøver en sidste gang med boldene Samme grupper: hver får en pose - ikke kigge ned i posen! der er nu to slags poser med kugler hver pose indeholder røde og blå kugler En blå kugle repræsenterer at det nye præparat foretrækkes 8 kugler trækkes med tilbagelægning. antal blå kugler er jeres studieresultat Diskuter med din makker hvad jeres bedste bud på andelen af blå kugler i jeres pose: basér jeres bud på kun jeres eget resultat Påstand: Der er lige mange blå kugler i de to slags poser! Diskuter med en gruppe med en anden slags pose hvad I mener om den påstand baseret på de to gruppers studie-resultater. Hvad skal der til for at man vil afvise, at andelen af blå kugler i de to poser er den samme? 18

Statistisk model Lad X 1 være antal (af de 8) i gruppe 1, der foretrækker M for T (antal blå bolde) Lad X 2 være antal (af de 8) i gruppe 3, der foretrækker M for T (antal blå bolde) Vi kender ikke den præcise fordeling af X 1 eller X 2, men X 1 Bin(N = 8,p 1 ) og X 2 Bin(N = 8,p 2 ) Nulhypotesen (lige stor andel i de to grupper foretrækker M) H 0 : p 1 = p 2 19