Dagens program. Praktisk information: Husk evalueringer af kurset

Relaterede dokumenter
Dagens program. Praktisk information:

Kvantitative Metoder 1 - Efterår Dagens program

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Kvantitative Metoder 1 - Forår Dagens program

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Vejledende besvarelser til opgaver i kapitel 14

Forelæsning 9: Inferens for andele (kapitel 10)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Personlig stemmeafgivning

Konfidensintervaller og Hypotesetest

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Om hypoteseprøvning (1)

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Kapitel 7 Forskelle mellem centraltendenser

Kvantitative Metoder 1 - Forår 2007

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Estimation og konfidensintervaller

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Bayesiansk statistik. Tom Engsted. DSS Aarhus, 28 november 2017

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Kvantitative Metoder 1 - Forår 2007

Susanne Ditlevsen Institut for Matematiske Fag susanne

Tema. Dagens tema: Indfør centrale statistiske begreber.

Kvantitative Metoder 1 - Forår Dagens program

Note til styrkefunktionen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Kvantitative Metoder 1 - Forår Dagens program

Kønsproportion og familiemønstre.

Test for strukturelle ændringer i investeringsadfærden

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Vejledende løsninger kapitel 8 opgaver

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Kapitel 12 Variansanalyse

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Schweynoch, Se eventuelt

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

StatDataN: Test af hypotese

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

02402 Løsning til testquiz02402f (Test VI)

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Forelæsning 8: Inferens for varianser (kap 9)

Kapitel 12 Variansanalyse

Nanostatistik: Test af hypotese

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

J E T T E V E S T E R G A A R D

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Løsning til eksaminen d. 14. december 2009

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Statistik i basketball

Stikprøver og acceptgrænser

Multiple choice opgaver

Kvantitative Metoder 1 - Efterår Dagens program

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Module 4: Ensidig variansanalyse

To-sidet varians analyse

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Modul 12: Regression og korrelation

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Maple 11 - Chi-i-anden test

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Flemmings Maplekursus 1. Løsning af ligninger

c) For, er, hvorefter. Forklar.

Løsninger til kapitel 5

Kvantitative Metoder 1 - Forår 2007

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Hypotesetests, fejltyper og p-værdier

At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle.

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Test nr. 4 af centrale elementer 02402

Transkript:

Dagens program Praktisk information: Husk evalueringer af kurset Hypoteseprøvning kap. 11.1-11.3 Fokastelsesområdet kap. 11.1 Type I og Type II fejl kap. 11.1 Styrkefunktionen kap. 11.2 Stikprøvens størrelse kap. 11.3 1

Konklusioner på baggrund af hypoteseprøvning Ofte vil man gerne drage en konklusion på bagrund af hypoteseprøvning. Ideen er her, at man på forhånd bestemmer sig for nogle "regler"for, hvorledes man vil basere sine konklusioner vedr. nulhypotesen på basis af teststørrelsen. Her bestemmer man sig for, at hvis sandsynligheden for at forkaste en sand nulhypotese er mindre end et vist niveau (kaldet signi kansniveauet), vil man forkaste nulhypotesen. 2

Forkastelsesområdet Kvantitative Metoder 1 - Efterår 2006 I denne afsnit drejer det sig om at lave en "regel"for, hvornår man kan forkaste nulhyposen, og hvornår man accepterer nulhypotesen. Som i kapitel 10 er teststørrelsen en central størrelse, fordi den bør indeholde den relevante information fra stikprøven til at kunne skelne mellem nulhypotesen og alternativhypotesen. Teststørrelsen bruges til at lave en "regel"for, hvornår vi vil forkaste nulhypotesen. Baseret på værdierne for teststørrelsen de neres et område "Forkastelsesområde"eller et kritisk område. De nition: Forkastelsesområdet R for et test af H 0 mod et alternativ H A er værdier af teststørrelsen, hvor man vil forkaste H 0 : Det betyder, at hvis teststørrelsen for en given stikprøve falder i området R; vil man forkaste nulhypotesen H 0 :Hvis teststørrelsen ikke falder i området R, dvs teststørrelsen ligger i R C ; vil man sige, at man ikke kan forkaste H 0 ; eller man accepterer H 0 : R C kaldes acceptområdet. 3

Type I og Type II fejl Kvantitative Metoder 1 - Efterår 2006 I det foregående afsnit så vi, at det var muligt (med mindre at stikprøven er hele populationen) at komme til at drage forkerte slutninger på baggrund af en given stikprøve. En nulhypotese kan forkastes på baggrund af et forkastelsesområde og teststørrelsen. Da teststørrelsen er en stokastisk variabel, vil det være muligt, at teststørrelsen kan falde i enten forkastelsesområdet eller acceptområdet, uanset om nulhypotesen eller alternativhypotesen er sand. Det betyder at der er to måder man kan tage fejl: Man kan afvise H 0 ; når H 0 er sand. Dette kaldes Type I fejl Man kan acceptere H 0 ; når H A er sand. Dette kaldes Type II fejl. Når vi opstiller en "regel"(eller et forkastelsesområde) for, hvornår nulhypotesen skal forkastes, er vi interesseret i at vide, hvor ofte vi tager fejl, hvis nu nulhypotesen er sand, og hvis alternativhypotesen er sand. Vi er interesseret i at beregne sandsynlighederne for at lave fejl givet H 0 og givet H A : 4

For et givent test og en given stikprøvestørrelse kan man ikke samtidig reducere sandsynligheden for at begå Type I og Type II fejl. Man vælger ofte at ville kontrollere sandsynligheden for at begå Type I fejl til f.eks. 0.05. Dette vil typisk fastlægge forkastelsesområdet. Om man kan nde sandsynlighederne for fejl, når enten givet nulhypotesen eller alternativhypotesen afhænger af, hvordan hypoteserne er de neret. Hvis nulhypotesen er givet således, at fordelingen af teststørrelsen er fuldstændig speci ceret, kan man nde sandsynligheden for type I fejl (sandsynligheden for at forkaste H 0 ; når H 0 er sand). 5

Bemærk: nulhypotesen behøver ikke nødvendigvis fuldstændigt at speci cere populationsfordelingen. Det er nok at teststørrelsens fordeling er speci ceret. For et test med forkastelsesområdet R er sandsynligheden for Type I fejl givet ved = P (forkast H 0 jh 0 ) = P (RjH 0 ): kaldes for signi kansniveauet for testet (eller størrelsen af Type I fejl). Ofte vælger man at teste på et 5% signi kansniveau. Det betyder, at man vælger R således, at signi kansniveauet er 0,05, dvs = 0; 05: 6

Man kan beregne sandsynligheden for Type II fejl, hvis alternativhypotesen er speci- ceret således, at teststørrelsens fordeling, (når alternativhypotesen er sand), er fuldstændig speci ceret. Ofte er alternativhypotesen formuleret således, at parameteren kan antage mange forskellige værdier. I dette tilfælde kan man udregne sandsynligheden for Type II fejl for en given værdi af parameteren : For et test med forkastelsesområdet R er sandsynligheden for Type II fejl for en given værdi af parameteren givet ved = P (accept H 0 j) = P (R C j): kaldes for størrelsen af Type II fejl. 1 kaldes styrken af testet mod alternativet. 7

Nedenstående tabel giver en oversigt over Type I og Type II fejl. H 0 er sand H A er sand teststørrelsen 2 R c 1 (); Type II fejl teststørrelsen 2 R ;Type I fejl 1 (). Af tabellen ses, at for et givent test og en given stikprøvestørrelse vil man ikke mindske og samtidigt. Hvis man har R 1 R 2 ; vil det medføre, at 1 2 ; men samtidig gælder der at R C 1 R C 2 : Det betyder at 2 1 : 8

Relationen mellem P-værdi og signi kansniveau Der ndes en tæt relation mellem P-værdien og signi kansniveauet. Begge størrelser vedrører sandsynligheden for ekstreme hændelser af teststørrelsen, når nulhypotesen er sand. Hvis man benytter et forkastelsesområde, som er baseret på et bestemt signi kansniveau f.eks. 5%, vil det være det samme som at forkaste nulhypotesen, hvis og kun hvis P-værdien er mindre end eller lig med (P-værdien ): 9

Eksempel (beståelse af 1. årsprøve) Antag at vi ønsker at undersøge, om der er 50%, som består 1. årsprøve blandt politstuderende efter det første år. Vi antager, at sandsynligheden for at bestå er p: Til det benyttes en stikprøve betående af 231 økonomistuderende optaget i 1999. Af tabellen fremgår det, hvor mange som bestod (data stammer fra Karsten Albæks artikel "Hvem består politstudiet"). bestået ikke bestået ialt 134 97 231 Test for hypotesen H 0 : p = 0; 5 mod alternativhypotesen H A : p > 0; 5 på et 5% signi kansniveau. Teststørrelsen er givet ved Z = ^p 0; 5 q 0;50;5 231 Da vi har mange observationer, antages at Z N(0; 1); når H 0 er sand. 10

Man skal nu nde det kristiske område, således at = P (Rjp = 0; 5) = P (Z 2 Rjp = 0; 5) = 0; 05: Vælges R = [1; 65; 1) ; gælder der at = 0; 05: I den givne stikprøve beregnes teststørrelsen til Z = 0; 58 0; 5 0;5 p 231 = 2; 43: Da Z falder i forkastelsesområdet, forkastes H 0 : Testsandsynligheden kan så udregnes som P = 1 (2; 43) = ( 2; 43) = 0; 0075 Da testsandsynligheden er mindre end 0,05 forkastes H 0. 11

Styrkefunktionen Kvantitative Metoder 1 - Efterår 2006 Sandsynligheden for at forkaste H 0 ; når H A er sand (1 ()); afhænger typisk af en parameter :Styrkefunktionen er en funktion af parameteren ; som angiver sandsynligheden for at forkaste H 0 som funktion af : Denne funktion er de neret for alle 2 H 0 og 2 H A : () = P (forkast H 0 j) = P (Rj) Der gælder, at hvis H 0 : = 0 ; så er styrkefunktionen ( 0 ) = Styrkefunktionen angiver sandsynligheden for at forkaste H 0 : Vi ønsker derfor Lav styrke (dvs. lave værdier af ()); når 2 H 0 Høj styrke(dvs høje værdier af ()); når 2 H A 12

Eksempel (beståelse af 1. årsprøve) fortsat Antag at vi undersøger nulhypotesen Vi vil benytte forkastelsesområdet Styrkefunktionen er så de neret som H 0 : p = 0; 5 R = [1; 65; 1) (p) = P (Rjp) p 2 [0; 5; 1] = P (Z 2 [1; 65; 1)jp) = P (Z 1; 65jp) ^p 0; 5 = P ( 1; 65jp) q 0;5(1 0;5) 231 r 0; 5 0; 5 = P (^p 0; 5 + 1; 65 jp) r 231 0; 5 0; 5 = 1 P (^p < 0; 5 + 1; 65 jp) 231 13

p(1 p) ) ifølge den centrale grænseværdisætning. Så styrkefunk- 231 Der gælder, at ^p N(p; tionen er givet ved (p) = : 1 p! 0; 5 p 0; 5 231p + 1; 65p p (1 p) p (1 p) Styrkefunktionen kan afbildes som 14

styrkefunktionen 1,2 1 0,8 0,6 0,4 0,2 0 styrkefunktio nen 0,5 0,58 0,66 0,74 0,82 0,9 0,98 p 15

Stikprøvens størrelse Kvantitative Metoder 1 - Efterår 2006 Når man bestemmer stikprøvens størrelse, er det ofte en afvejning mellem, hvor troværdige konklusioner man kan få og omkostningerne ved at indsamle data. Styrkefunktionen kan bruges til at vurdere sandsynligheden for at begå fejl for en given stikprøve. Ved at fastlægge størrelsen for Type I og Type II fejl kan man nde den mindste stikprøve, som behøves. Antag at man er interesseret i at teste følgende nulhypotese H 0 : = 0 på et 5% signi kansniveau (sandsynligheden for Type I fejl). Men samtidig vil man have, at sandsynligheden for Type II fejl for parameteren = 1 højst skal være 10%. Dvs at man har at ( 0 ) = 0; 05; ( 1 ) = 1 0; 1 = 0; 9: Disse to betingelser vil fastlægge betingelser for forkastelsesområdet og stikprøvestørrelsen. 16

Eksempel (beståelse af 1. årsprøve) fortsat Antag at man ønsker at (0; 05) = 0; 05; (0; 60) = 1 0; 1 = 0; 9: Antagelse om signi kansniveauet fastlægger forkastelsesområdet til R = [1; 65; 1): Stikprøvens størrelse kan bestemmes til (0; 6) = : 1 p! 0; 5 0; 6 0; 5 np + 1; 65p = 0; 9 0; 6 (1 0; 6) 0; 6 (1 0; 6) dvs. p 0; 5 0; 6 0; 5 n p + 1; 65p = 1; 28 0; 6 (1 0; 6) 0; 6 (1 0; 6) p n = 1; 28 1; 65 0; 5 p 0; 6 (1 0; 6)! p 0; 6 (1 0; 6) 0; 1 Løses ligningen mht.n fås at n 211: 17

styrkefunktionen 1,2 1 0,8 0,6 0,4 0,2 0 styrkefunktion (n=231) styrkefunktion (n=100) styrkefunktion (n=211) 0,5 0,56 0,62 0,68 0,74 0,8 0,86 0,92 0,98 p 18

Opsummering Forkastelsesområde Type I og Type II fejl Styrkefunktionen Stikprøvens størrelse 19

Næste gang Torsdag d. 7/12: Likelihood kvotients test kap. 11.8 Sammenligning af populationer kap. 12.1 og 12.2 20