Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Relaterede dokumenter
Basal statistik. 6. februar 2007

Basal statistik. 6. februar 2007

Basal statistik. 11.september Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke

Basal statistik. 11.september 2007

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Note til styrkefunktionen

Tema. Dagens tema: Indfør centrale statistiske begreber.

J E T T E V E S T E R G A A R D

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Estimation og konfidensintervaller

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Susanne Ditlevsen Institut for Matematiske Fag susanne

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

StatDataN: Test af hypotese

Om hypoteseprøvning (1)

Hypotesetests, fejltyper og p-værdier

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Forelæsning 9: Inferens for andele (kapitel 10)

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

En intro til radiologisk statistik. Erik Morre Pedersen

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Nanostatistik: Test af hypotese

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Vejledende besvarelser til opgaver i kapitel 14

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Konfidensinterval for µ (σ kendt)

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Dagens program. Praktisk information:

En intro til radiologisk statistik

Kvantitative Metoder 1 - Efterår Dagens program

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Personlig stemmeafgivning

Dagens program. Praktisk information: Husk evalueringer af kurset

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Kvantitative Metoder 1 - Forår Dagens program

Løsning til eksaminen d. 14. december 2009

Kapitel 7 Forskelle mellem centraltendenser

Forsøgsplanlægning Stikprøvestørrelse

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

02402 Løsning til testquiz02402f (Test VI)

Konfidensintervaller og Hypotesetest

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Statistik i basketball

Løsning eksamen d. 15. december 2008

Maple 11 - Chi-i-anden test

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Statistik viden eller tilfældighed

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Statistik II 1. Lektion. Analyse af kontingenstabeller

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Nanostatistik: Opgavebesvarelser

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Test nr. 6 af centrale elementer 02402

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Løsning til eksaminen d. 29. maj 2009

Statistiske principper

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

1 Hb SS Hb Sβ Hb SC = , (s = )

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Besvarelser til øvelsesopgaver i uge 6

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Oversigt over nyttige fordelinger

Løsninger til kapitel 9

Confounding. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Vejledende løsninger kapitel 8 opgaver

Note om Monte Carlo metoden

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

ca. 5 min. STATISTISKE TEGN

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Transkript:

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Indledende om Signifikanstest Boldøvelser 1

Påstand: Et nyt præparat M virker mod migræne. Inden præparatet kan markedsføres, skal denne påstand afprøves Der 3 muligheder: 1. Præparatet M har en positiv effekt folk foretrækker M for T (traditionel) 2. Præparatet har en negativ effekt folk foretrækker T for M 3. Præparatet M har ingen/ringe effekt folk er ligeglade med hvad de får 2

Undersøgelsesdesign: Randomiseret, dobbeltblind cross-over trial, hvor 8 patienter får M og T i 2 perioder Randomiseret Hvis alle patienter fik præparaterne i samme rækkefølge, f.eks. T efterfulgt af M, kunne man forveksle evt. forskelle med f.eks. årstidsvariation, spontan bedring mv Blindet Fordi patientens egen forventning har en indvirkning på udfaldet (placeboeffekt) og fordi lægens viden eller forventning kan smitte til patienten. Hvilken størrelse skal observeres? Studieresultat: X: Antal (af de 8), der foretrækker M for T 3

Vi skal nu lave sådanne undersøgelser Man går sammen i grupper: to og to Hver gruppe skal lave deres eget lille studie: får en pose - ikke kigge ned i posen! posen indeholder røde og blå kugler 8 kugler trækkes med tilbagelægning. En blå kugle repræsenterer at det nye præparat foretrækkes antal blå kugler er jeres studieresultat Diskuter med din makker hvad jeres bedste bud på andelen af blå kugler der er i posen: baser jeres bud på kun jeres eget resultat 4

Påstand: Der er lige mange røde og blå kugler i posen! Diskuter med din makker hvad I mener om den påstand baseret på jeres eget studie-resultat Diskuter hvor mange blå kugler (ud af de 8) der skal til for at I ville afvise påstanden 5

Antallet af blå kugler råbes ned til Jørgen 6

Statistisk Model X: Antal (af de 8), der foretrækker M for T X er binomialfordelt med antalsparameter N=8 og (ukendt) sandsynlighedsparameter (p) der er sandsynligheden for at en tilfældigt udvalgt patient foretrækker M for T: X Bin(N = 8,p) Resultat af observationen: N = 8 : x = 7(der foretrak M (blå bolde)) Estimation: Vores bedste gæt på p (estimatet) er andelen af patienter, der foretrækker M, altså ˆp = x n = 7 8 Det ser ud til, at M har en positiv effekt! Hvorfor? Fordi, hvis M ikke virkede, ville vi næppe finde så mange, der foretrak M for T. 7

Men: det er jo små tal (N=8 og x=7), så kunne det ikke blot være sket ved en tilfældighed? Vi opstiller (nul)hypotesen: H 0 : p = 1 2 (M virker ikke) mod alternativet: H A : p > 1 2 (M virker positivt) Hvis vi kan afkræfte hypotesen H 0, har vi sandsynliggjort, at medicinen har en effekt. 8

Fremgangsmåde: H 0 : p = 1 2 (M virker ikke) Vi forestiller os, at H 0 er sand og ser om det fører til noget, der ligner en modstrid (dvs. noget som er meget usandsynligt). Hvis H 0 er sand, hvilke X er vil vi da forvente at observere? Formentlig nogle omkring 4 (= 8 2 ). Vi kender fordelingen af X under H 0 : X Bin(n = 8,p = 0.5) 9

Vi kender fordelingen af X under H 0 : X Bin(N = 8,p = 0.5) 0.30 0.2734 0.25 0.2187 0.2187 0.20 0.15 0.10 0.1094 0.1094 0.05 0.0312 0.0312 0.00 0.0039 0.0039 0 1 2 3 4 5 6 7 8 Vi har observeret x=7 Er det meget usandsynligt under H 0? P(X 7 H 0 ) = 0.035 10

Hvis H 0 er sand, har vi observeret noget langt ude i halen, som man kun tilfældigvis vil observere i 3.5% af tilfældene. Dette tyder på,at H 0 ikke er sand (og at H A altså er mere rimelig). Vi kalder P(X 7 H 0 ) for halesandsynligheden eller P-værdien, og skriver P=0.035 eller P=3.5%. Når denne er tilstrækkelig lille, forkaster vi H 0. Men hvad betyder tilstrækkelig lille?? P<5%? P<1%? Man vælger et signifikansniveau, betegnet α, og forkaster så H 0, når P< α. 11

Signifikansniveauet α er ofte 0.05 = 5% Signifikansniveauet angiver den risiko, vi er villige til at løbe for at forkaste en sand nulhypotese Den betegnes også Fejl af type I accept forkast H 0 sand 1-α α Fejl af type I H 0 falsk 12

Vi prøver en gang til med boldene Samme grupper: får en pose - ikke kigge ned i posen! posen indeholder røde og blå kugler 8 kugler trækkes med tilbagelægning. En blå kugle repræsenterer at det nye præparat foretrækkes antal blå kugler er jeres studieresultat Diskuter med din makker hvad jeres bedste bud på hvor mange blå kugler der er i posen Påstand: Der er lige mange røde og blå kugler i posen! Diskuter med din makker hvad I mener om den påstand baseret på jeres eget studie-resultat 13

Antallet af blå kugler råbes ned til Jørgen 14

Vi kender fordelingen af X under H A : p 0.5 X Bin(N = 8,p = 6/8) 0.35 0.3115 0.30 0.267 0.25 0.20 0.2076 0.15 0.10 0.0865 0.1001 0.05 0.00 0 4e 04 0.0038 0.0231 0 1 2 3 4 5 6 7 8 Vi har observeret x=7 eller x=8 en del gange Er det sandsynligt under H A? P(X 7 H A ) = 0.267+0.100 = 0.367 15

accept forkast H 0 sand 1-α α fejl af type I H 0 falsk β 1-β fejl af type II 1-β kaldes styrken der er sandsynligheden for at forkaste en falsk hypotese 16

Ensidigt vs. tosidigt test I det foregående har vi lavet et ensidigt test, idet H A : p >0.5 Hvis H A :p 0.5 ville observationerne x=0 og x=1 være ligeså ekstreme, så P-værdien ville blive fordoblet til 7% og dermed lede til et accept af hypotesen. Acceptområde: Alle de observationer, der ville lede til accept af hypotesen. Her: (0,1,2,3,4,5,6) for det ensidige test (1,2,3,4,5,6,7) for det tosidige test Kritisk område eller Forkastelsesområde: Alle de værdier, der ville lede til forkastelse af hypotesen. Her: (7,8) for det ensidige test (0,8) for det tosidige test Hvis α sænkes, bliver acceptområdet større og det kritiske område mindre. 17

Vi prøver en sidste gang med boldene Samme grupper: hver får en pose - ikke kigge ned i posen! der er nu to slags poser med kugler hver pose indeholder røde og blå kugler En blå kugle repræsenterer at det nye præparat foretrækkes 8 kugler trækkes med tilbagelægning. antal blå kugler er jeres studieresultat Diskuter med din makker hvad jeres bedste bud på andelen af blå kugler i jeres pose: basér jeres bud på kun jeres eget resultat Påstand: Der er lige mange blå kugler i de to slags poser! Diskuter med en gruppe med en anden slags pose hvad I mener om den påstand baseret på de to gruppers studie-resultater. Hvad skal der til for at man vil afvise, at andelen af blå kugler i de to poser er den samme? 18

Statistisk model Lad X 1 være antal (af de 8) i gruppe 1, der foretrækker M for T (antal blå bolde) Lad X 2 være antal (af de 8) i gruppe 3, der foretrækker M for T (antal blå bolde) Vi kender ikke den præcise fordeling af X 1 eller X 2, men X 1 Bin(N = 8,p 1 ) og X 2 Bin(N = 8,p 2 ) Nulhypotesen (lige stor andel i de to grupper foretrækker M) H 0 : p 1 = p 2 19