Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau



Relaterede dokumenter
Konfidensinterval for µ (σ kendt)

Konfidensintervaller og Hypotesetest

Modul 5: Test for én stikprøve

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Forelæsning 8: Inferens for varianser (kap 9)

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Note til styrkefunktionen

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Signifikanstestet. usædvanlig godt godt

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Konfidens intervaller

Vejledende besvarelser til opgaver i kapitel 14

Module 12: Mere om variansanalyse

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Trivsel og fravær i folkeskolen

Kvantitative Metoder 1 - Forår 2007

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Kapitel 3 Centraltendens og spredning

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Oversigt: De næste forelæsninger

Module 2: Beskrivende Statistik

Statistik og Sandsynlighedsregning 2

En intro til radiologisk statistik

Ensidet variansanalyse

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Funktionalligninger - løsningsstrategier og opgaver

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Ligninger med reelle løsninger

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

SENIORKURSUS STATA OG BIOSTATISTIK

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Tema. Dagens tema: Indfør centrale statistiske begreber.

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

02402 Løsning til testquiz02402f (Test VI)

Forelæsning 9: Inferens for andele (kapitel 10)

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

c) For, er, hvorefter. Forklar.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Nanostatistik: Middelværdi og varians

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

TALTEORI Wilsons sætning og Euler-Fermats sætning.

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

Kvantitative Metoder 1 - Forår Dagens program

Variabel- sammenhænge

To-sidet varians analyse

Grafteori, Kirsten Rosenkilde, september Grafteori

Statistik og Sandsynlighedsregning 2

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Læsevejledning til resultater på regionsplan

Statistik i basketball

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Valgkampens og valgets matematik

Normalfordelingen og Stikprøvefordelinger

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

En Introduktion til SAS. Kapitel 6.

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Maple 11 - Chi-i-anden test


Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Løsning eksamen d. 15. december 2008

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Kapitel 7 Forskelle mellem centraltendenser

Nanostatistik: Opgavebesvarelser

LUP læsevejledning til regionsrapporter

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Løsning til eksaminen d. 14. december 2009

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

TALTEORI Wilsons sætning og Euler-Fermats sætning.

Susanne Ditlevsen Institut for Matematiske Fag susanne

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Produkt og marked - matematiske og statistiske metoder

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (

Finde invers funktion til en 2-gradsfunktion - ved parallelforskydning. John V Petersen

Danmarks Radio. 24. mar 2015

En intro til radiologisk statistik. Erik Morre Pedersen

Matematisk modellering og numeriske metoder. Lektion 18

Arealer under grafer

TALTEORI Primfaktoropløsning og divisorer.

Statistikkompendium. Statistik

Modul 12: Exercises Sukkersygepatienters vægt

Transkript:

ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau

Konfidens intervaller Et konfidens interval er et interval, der estimerer værdien af en ukendt populations parameter. Kaldes også et interval estimat. Sammen med intervallet gives et mål for, hvor sikker man er på, at den sande populations parameter ligger i intervallet. Dette mål kaldes for konfidens niveauet. Et punkt estimat estimerer værdien af en ukendt populations parameter ved en enkelt værdi. For eksempel, gennemsnitsløn for A X=6. Et punkt estimat indeholder ikke meget information om den faktiske værdi af µ. Et interval estimat indeholder flere informationer, for eksempel: Vi er 95% sikre på, at intervallet [55,65] indeholde den sande middelværdi µ. Eller vi er 9% sikre på, at intervallet [599,61] indeholder den sande middelværdi µ.

Repetition fra sidst (1-α)1% konfidens interval for: Populations middelværdi µ, når X er normal fordelt (eller stikprøven er stor) og σ er kendt: σ x ± z n α Populations middelværdi µ, når X er normal fordelt og σ er ukendt: For populations andelen p: x ± t α s n pˆ ± z α pq ˆ ˆ n 3

(1-α)1% konfidens interval for: Populations variansen σ²: Beregning af stikprøve størrelse: ( n ) s 1, ( n 1 ) s χ χ α α 1 Mindste stikprøve størrelse, når µ estimeres : z α σ n = B hvor B er den maksimale grænse for, hvor langt estimatet må ligge fra den sande middelværdi (med konfidens niveau α). For populations andelen er den givet ved: z α pq n = B vis p ukendt bruges p =.5, da det giver den største stikprøve størrelse (og er altså et konservativt gæt). 4

ypoteser og hypotesetest. En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable, for eksempel: Er middelværdien af de A studerendes vægt lig med 7 kilo? I en hypotesetest testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 68 kilo. Er det (signifikant) forskellig fra 7? Det er forskellig fra 7, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhængig af eksempelvis stikprøvestørrelsen? En hypotesetest består af 5 elementer: antagelser, hypoteser, test størrelse, p- værdi og beslutning/konklusion. 5

Antagelser Type af data: Se på om det er diskrete eller kontinuerte data Populations fordeling: Se på hvilken fordeling populationen har. Stikprøve: vilken metode er brugt til at indsamle data. Skal være en simpel stikprøve i de test vi bruger. Stikprøve størrelse: vor stor er den stikprøve vi har til at beregne test størrelsen? 6

ypoteser Nul hypotesen Er sand indtil vi statistisk har bevist, at den er falsk. Den alternative hypotese : En påstand om en parameter. situationer, der ikke er dækket af. 1 : En påstand om alle Nul hypotesen er sand indtil det modsatte er bevist. : µ = 5 1 : µ 5 : µ 5 1 : µ < 5 : µ 5 1 : µ > 5 : 1 : : p.5 1 : p =.5 p.5 : p <.5 : p.5 1 p >.5 7

O.J. Simpson en analogi fra den virkelige verden O. J. Simpson er anklaget for mordet sin eks og dennes kæreste. Nul hypotesen: an er uskyldig Alternativ hypotese: an er skyldig For at O. J. skal kunne dømmes skyldig, skal anklagerne bevise, at han er skyldig beyond any reasonable doubt O. J. skal ikke bevise, at han er uskyldig. Vi kan forkaste nul hypotesen, hvis han findes skyldig, men hvis nul hypotesen ikke forkastes, har vi ikke bevist, at han er uskyldig blot, at der ikke er beviser nok til at finde ham skyldig. (Note: an blev erklæret ikke skyldig!!) 8

Test størrelsen Test størrelsen beregnes fra stikprøve data og bruges til at vurdere nul hypotesen. Den indeholder typisk et punkt estimat for den parameter, der indgår i nul hypotesen for eksempel gennemsnittet som punkt estimat for middelværdien. Selve fremgangsmåden for hypotese test er ens fra test til test, uanset data type, fordelings type og stikprøve størrelse. Men formlen for test størrelsen varierer afhængigt af disse ting. 9

P-værdi P-værdien af en test, er sandsynligheden for at observere en teststørrelse mindst så ekstrem som den beregnede/observerede værdi, når nul hypotesen er sand. Der gælder følgende for p-værdier: 1. Når p-værdien <.1 er resultatet meget signifikant.. Når p-værdien er mellem.1 og.5 er resultatet signifikant. 3. Nå p-værdien er mellem.5 og.1 er resultatet marginalt signifikant. 4. Når p-værdien er større end.1, er resultatet ikke signifikant. 1

P-værdi, fortsat Det vil altså sige når nul hypotesen er falsk, er p-værdien meget lille og når nul hypotesen er sand, vil p-værdien være stor (større end for eksempel.5). Vi accepterer/beviser aldrig, at nul hypotesen er sand. vis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. vis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand. 11

Konklusion/beslutnings regel En beslutningsregel for en hypotese test, er en regel for under hvilke betingelse nul hypotesen kan forkastes. Betragt : µ=1. Beslutnings reglen kan her være at forkaste, når stikprøve gennemsnittet er udenfor intervallet [95, 15]. Typisk bruges dog p-værdien for testen. Så en beslutningsregel er for eksempel at forkaste, når p-værdien er mindre end.5. vor lille man vælger p-værdien, afhænger af hvilke konsekvenser beslutningen om at forkaste har. vis det er et spørgsmål om liv eller død, for eksempel i medicinske forsøg, vælges p-værdien meget lille. Men hvis det bare er at teste om et folketingsparti er større end et andet, kan man godt vælge p-værdien større. 1

Test af middelværdi Antagelse: Test af µ, X kvantitativ variabel og n>3. ypoteser: 1 : µ = µ : µ µ Stikprøve fordeling af X når er sand er approksimativ normal med middelværdi µ og standard afvigelse σ n.8.7.6.5.4.3..1. µ x Teststørrelse: Z = X µ σ n 13

Beregning af p-værdi Når er sand, er fordelingen af Z approksimativt standard normal fordelt (dvs. normal fordelt med middelværdi og standard afvigelse 1). P-værdien er sandsynligheden for at observere en test størrelse mindst så ekstrem som den observerede, givet at er sand. I formler: p( Z > beregnet z værdi). I praksis: I tabellen for standard normalfordelingen aflæses sandsynligheden ud fra værdien af z-værdien og ganges med, da det er i begge sider af fordelingen. Dvs. skal ganges med, da vi både ser på værdier der er mindre end og større end middelværdien opgivet i. Meget nemmere at se ved hjælp af et eksempel: 14

Eksempel : µ = 3 1: µm 3 Stikprøve: n = 5 x = 31.5 σ = 5 P-værdi: p = p( z >,1) = p( z >,1) =.17 =.34 Lille p-værdi, så forkastes. Fordeling: Test størrelse: Z = 31.5 3 5 5 =,1.8.7.6.5.4.3..1..17.17 µ =3 x=8.5 x=31.5 15

Sandsynligheden for Z-værdien. 8. 7. 6. 5. 4. 3..17.17. 1. Z=-,1 Z=,1 16

Summe opgave : µ = 3 1: µm 3 : µ = 3 1: µm 3 Stikprøve: n = x = 31.5 σ = 5 Stikprøve: n = 1 x = 31.5 σ = 5 Beregn værdien af test størrelsen og p-værdien. Beregn værdien af test størrelsen og p-værdien 17

Relation til konfidens intervaller σ x± 1.96 = 31.5 ± 1.96 n 5 5 Middelværdi under 95% konfidens interval omkring observeret middelværdi µ = 3 3.88 3.11 x = 31.5 18

vorfor = i nul hypotesen : µ µ : µ = µ 1 : µ > µ skrives i det følgende som : 1 : µ > µ Grunden til dette er, at man på denne måde "lader tvivlen komme til gode". Desuden er vi kun interesseret i, om µ er større ( eller mindre, hvis < ) end en givet værdi, ikke hvor meget den evt. er mindre. 19

øjresidet test Antagelse: Test af µ, X kvantitativ variabel og n>3. ypoteser: 1 : µ = µ : µ > µ Stikprøve fordeling af X når er sand er approksimativ normal med middelværdi µ og standard afvigelse σ n Teststørrelse: X µ Z = σ n P-værdien: p( Z > beregnet z værdi)

Eksempel højresidet test : µ = 3 1: µ > 3 Stikprøve: n = 5 x = 31.5 σ = 5 P-værdi: p = p( z >,1) =.17 Lille p-værdi, så forkastes..8.7.6.5.4.3..1. Z=,1.17 Test størrelse: Fordeling: Z = 31.5 3 5 5 =,1.8.7.6.5.4.3..1. µ =3 x=31.5.17 1

Venstresidet test Antagelse: Test af µ, X kvantitativ variabel og n>3. ypoteser: 1 : µ = µ : µ < µ Stikprøve fordeling af X når er sand er approksimativ normal med middelværdi µ og standard afvigelse σ n Teststørrelse: Z = X µ σ n P-værdien: p( Z < beregnet z værdi)

Eksempel venstresidet test : µ = 3 1: µ < 3 Stikprøve: n = 5 x = 31.5 σ = 5 Test størrelse: P-værdi: p = p( z <,1) = 1.17 Stor p-værdi, så forkastes ikke..8.7 1-.17.6.5.4.3..1. Fordeling: Z=,1 Z = 31.5 3 5 5 =,1.8.7.6 1-.17.5.4.3..1. µ =3 x=31.5 3

Test af middelværdi for ukendt varians Antagelse: Test af µ, X normalfordelt variabel og σ² ukendt (estimeret ved s²). ypoteser: 1 : µ = µ : µ µ Teststørrelse t er t-fordelt med (n-1) frihedsgrader: X s µ t = n P-værdien: p( t > beregnet t værdi) kan ikke beregnes ved tabel opslag. Venstre og højre sidet test efter samme princip som før. 4

Eksempel : µ = 3 1: µm 3 Stikprøve: n = 5 x = 31.5 s = 5 Test størrelse: 31.5 3 = =,1 5 5 Svært at slå op i tabel. Ligger mellem.5 og.1. P-værdi: p = p( t >,1) = p( t >,1) =. =.4 Lille p-værdi, så forkastes. Fordeling:.8 t.7.6.5.4.3..1... x=8.5 µ =3 x=31.5 5

Test af en andel Antagelse: Test af populations andel p, når np>5 og n(1-p)>5. ypoteser: pˆ 1 : p = p : p p Stikprøve fordeling af når er sand er approksimativ normal med middelværdi og standard afvigelse p 1 p ) / n Teststørrelse: p Z = ) / n P-værdien: p( Z > beregnet z værdi) p pˆ (1 p p ( øjresidet og venstresidet test efter samme princip som før. 6

Test af variansen Antagelse: Test af populations variansen σ², X normal fordelt. ypoteser: 1 : σ : σ = σ σ Teststørrelse: ( n 1) s χ = σ ( χ fordelt med (n -1) frihedsgrader) P-værdi: p( Χ² > beregnet Χ² værdi) kan ikke beregnes ved tabel opslag. øjresidet og venstresidet test efter samme princip som før. 7

Signifikans niveau Signifikans niveauet α er et tal, således at forkastes, hvis p-værdien er mindre end α. Konklusion Er normalvis.5 eller.1. Vælges før analysen foretages. P-værdi 1 vis man tester på signifikans niveau.5, svarer det til en z-værdi på 1.96 i en to-sidet test (hvorfor?) og 1.645 i en højresidet test (hvorfor?). P<.5 Forkast Accepter Normal ses dog på p-værdien i stedet, da de i de fleste tilfælde ikke er smart at have en standard procedure for om man forkaster eller ej. P>.5 Forkast ikke Accepter ikke 8

Eksempel - igen : µ = 3 1: µm 3 Stikprøve: n = 5 x = 31.5 s = 5 I stedet for p-værdi, vælges signifikans niveau α, for eksempel α=,5. Slå op i t-tabellen med 49 frihedsgrader under,5, da det er en -sidet test. Test størrelse: 31.5 3 t = =,1 5 5 Svært at slå op i tabel. Ligger mellem.5 og.1. t-værdien er cirka lig med.1. Da,1 er større end,1, forkastes. vis t=-,1 skulle vi have sagt, da -,1 er mindre end -.1, forkastes. 9

Eksempel højresidet test : µ = 3 1: µ > 3 Stikprøve: n = 5 x = 31.5 σ = 5 Test størrelse: I stedet for p-værdi, vælges signifikans niveau α, for eksempel α=,5. Slå op i z-tabellen under,5 da det er en 1-sidet test. z-værdien er cirka lig med 1,645. Da,1 er større end 1.645, forkastes. Z = 31.5 3 5 5 =,1 3

Test af varians - eksempel 31

Type 1 og type fejl Type 1 fejl: forkastes, når den er sand. Type fejl: forkastes ikke, selvom den er falsk. Signifikans niveauet α er sandsynligheden for at begå en type 1 fejl. Sandsynligheden for at begå en type fejl betegnes β Sandsynligheden for type 1 og type fejl er inverst relaterede, dvs. når den ene stiger, så falder den anden, så man kan ikke vælge begge to så lavt som muligt. Typisk vælger med at fastsætte sandsynligheden for type 1 fejl, så man ikke begår store fejl. For eksempel hvis er, at en eller anden medicin er skadelig, er det bedre at være sikker på, at man ikke forkaster selvom den er sand, end at være sikker på, at man ikke forkaster den, selvom den er falsk. I O.J. Simpson sagen er der nok sket en type fejl ;-) Beslutning Forkast Forkast ikke Sand tilstand af sand Type 1 fejl Korrekt beslutning falsk Korrekt beslutning Type fejl 3

vordan α og β afhænger af hinanden For forskellige n og et bestemt µ 33

Beregning af β (for en venstre sidet test) Se på følgende hypoteser: : µ 1 1 : µ < 1 Lad σ = 5, α = 5%, og n = 1. Vi vil beregne β når µ = µ 1 = 998. Se næste slide Figuren viser fordelingen af x-streg når µ = µ = 1, og når µ = µ 1 = 998. Bemærk at vil blive forkastet, når x- streg er mindre end den kritiske værdi givet ved (x-streg) crit = µ -z α σ/ n = 1 1.645 5/ 1 = 999.18. Omvendt, vil ikke blive forkastet, når x-steg er større end (x-streg) crit. 34

Beregning af β 35

Beregning af β Når µ = µ 1 = 998, så er β sandsynligheden for ikke at forkaste, så den er P{(x-streg > (x-streg) crit }. Når µ = µ 1, så vil x-streg følge en normal fordeling med middelværdi µ 1 og standard afvigelse = σ/ n, så: X 1 = P Z > crit µ β = P( Z > 1.18/.5) = P( Z σ / n =.91 >.36) Power af en test, er sandsynligheden for at den falske nul hypotese bliver opdaget af testen. Power af testen = 1 β= 1.91 =.999. 36

Opgaver Kapitel 6: 41, 47, 53, 55, 59, 61, 63. Kapitel 7: 1, 3, 7, 17, 37, 43. 37