Dagens program. Praktisk information: Husk evalueringer af kurset

Dagens program Praktisk information: Husk evalueringer af kurset Hypoteseprøvning kap. 11.1-11.3 Fokastelsesområdet kap. 11.1 Type I og Type II fejl kap. 11.1 Styrkefunktionen kap. 11.2 Stikprøvens størrelse kap. 11.3 1

Konklusioner på baggrund af hypoteseprøvning Ofte vil man gerne drage en konklusion på bagrund af hypoteseprøvning. Ideen er her, at man på forhånd bestemmer sig for nogle "regler"for, hvorledes man vil basere sine konklusioner vedr. nulhypotesen på basis af teststørrelsen. Her bestemmer man sig for, at hvis sandsynligheden for at forkaste en sand nulhypotese er mindre end et vist niveau (kaldet signi kansniveauet), vil man forkaste nulhypotesen. 2

Forkastelsesområdet Kvantitative Metoder 1 - Efterår 2006 I denne afsnit drejer det sig om at lave en "regel"for, hvornår man kan forkaste nulhyposen, og hvornår man accepterer nulhypotesen. Som i kapitel 10 er teststørrelsen en central størrelse, fordi den bør indeholde den relevante information fra stikprøven til at kunne skelne mellem nulhypotesen og alternativhypotesen. Teststørrelsen bruges til at lave en "regel"for, hvornår vi vil forkaste nulhypotesen. Baseret på værdierne for teststørrelsen de neres et område "Forkastelsesområde"eller et kritisk område. De nition: Forkastelsesområdet R for et test af H 0 mod et alternativ H A er værdier af teststørrelsen, hvor man vil forkaste H 0 : Det betyder, at hvis teststørrelsen for en given stikprøve falder i området R; vil man forkaste nulhypotesen H 0 :Hvis teststørrelsen ikke falder i området R, dvs teststørrelsen ligger i R C ; vil man sige, at man ikke kan forkaste H 0 ; eller man accepterer H 0 : R C kaldes acceptområdet. 3

Type I og Type II fejl Kvantitative Metoder 1 - Efterår 2006 I det foregående afsnit så vi, at det var muligt (med mindre at stikprøven er hele populationen) at komme til at drage forkerte slutninger på baggrund af en given stikprøve. En nulhypotese kan forkastes på baggrund af et forkastelsesområde og teststørrelsen. Da teststørrelsen er en stokastisk variabel, vil det være muligt, at teststørrelsen kan falde i enten forkastelsesområdet eller acceptområdet, uanset om nulhypotesen eller alternativhypotesen er sand. Det betyder at der er to måder man kan tage fejl: Man kan afvise H 0 ; når H 0 er sand. Dette kaldes Type I fejl Man kan acceptere H 0 ; når H A er sand. Dette kaldes Type II fejl. Når vi opstiller en "regel"(eller et forkastelsesområde) for, hvornår nulhypotesen skal forkastes, er vi interesseret i at vide, hvor ofte vi tager fejl, hvis nu nulhypotesen er sand, og hvis alternativhypotesen er sand. Vi er interesseret i at beregne sandsynlighederne for at lave fejl givet H 0 og givet H A : 4

For et givent test og en given stikprøvestørrelse kan man ikke samtidig reducere sandsynligheden for at begå Type I og Type II fejl. Man vælger ofte at ville kontrollere sandsynligheden for at begå Type I fejl til f.eks. 0.05. Dette vil typisk fastlægge forkastelsesområdet. Om man kan nde sandsynlighederne for fejl, når enten givet nulhypotesen eller alternativhypotesen afhænger af, hvordan hypoteserne er de neret. Hvis nulhypotesen er givet således, at fordelingen af teststørrelsen er fuldstændig speci ceret, kan man nde sandsynligheden for type I fejl (sandsynligheden for at forkaste H 0 ; når H 0 er sand). 5

Bemærk: nulhypotesen behøver ikke nødvendigvis fuldstændigt at speci cere populationsfordelingen. Det er nok at teststørrelsens fordeling er speci ceret. For et test med forkastelsesområdet R er sandsynligheden for Type I fejl givet ved = P (forkast H 0 jh 0 ) = P (RjH 0 ): kaldes for signi kansniveauet for testet (eller størrelsen af Type I fejl). Ofte vælger man at teste på et 5% signi kansniveau. Det betyder, at man vælger R således, at signi kansniveauet er 0,05, dvs = 0; 05: 6

Man kan beregne sandsynligheden for Type II fejl, hvis alternativhypotesen er speci- ceret således, at teststørrelsens fordeling, (når alternativhypotesen er sand), er fuldstændig speci ceret. Ofte er alternativhypotesen formuleret således, at parameteren kan antage mange forskellige værdier. I dette tilfælde kan man udregne sandsynligheden for Type II fejl for en given værdi af parameteren : For et test med forkastelsesområdet R er sandsynligheden for Type II fejl for en given værdi af parameteren givet ved = P (accept H 0 j) = P (R C j): kaldes for størrelsen af Type II fejl. 1 kaldes styrken af testet mod alternativet. 7

Nedenstående tabel giver en oversigt over Type I og Type II fejl. H 0 er sand H A er sand teststørrelsen 2 R c 1 (); Type II fejl teststørrelsen 2 R ;Type I fejl 1 (). Af tabellen ses, at for et givent test og en given stikprøvestørrelse vil man ikke mindske og samtidigt. Hvis man har R 1 R 2 ; vil det medføre, at 1 2 ; men samtidig gælder der at R C 1 R C 2 : Det betyder at 2 1 : 8

Relationen mellem P-værdi og signi kansniveau Der ndes en tæt relation mellem P-værdien og signi kansniveauet. Begge størrelser vedrører sandsynligheden for ekstreme hændelser af teststørrelsen, når nulhypotesen er sand. Hvis man benytter et forkastelsesområde, som er baseret på et bestemt signi kansniveau f.eks. 5%, vil det være det samme som at forkaste nulhypotesen, hvis og kun hvis P-værdien er mindre end eller lig med (P-værdien ): 9

Eksempel (beståelse af 1. årsprøve) Antag at vi ønsker at undersøge, om der er 50%, som består 1. årsprøve blandt politstuderende efter det første år. Vi antager, at sandsynligheden for at bestå er p: Til det benyttes en stikprøve betående af 231 økonomistuderende optaget i 1999. Af tabellen fremgår det, hvor mange som bestod (data stammer fra Karsten Albæks artikel "Hvem består politstudiet"). bestået ikke bestået ialt 134 97 231 Test for hypotesen H 0 : p = 0; 5 mod alternativhypotesen H A : p > 0; 5 på et 5% signi kansniveau. Teststørrelsen er givet ved Z = ^p 0; 5 q 0;50;5 231 Da vi har mange observationer, antages at Z N(0; 1); når H 0 er sand. 10

Man skal nu nde det kristiske område, således at = P (Rjp = 0; 5) = P (Z 2 Rjp = 0; 5) = 0; 05: Vælges R = [1; 65; 1) ; gælder der at = 0; 05: I den givne stikprøve beregnes teststørrelsen til Z = 0; 58 0; 5 0;5 p 231 = 2; 43: Da Z falder i forkastelsesområdet, forkastes H 0 : Testsandsynligheden kan så udregnes som P = 1 (2; 43) = ( 2; 43) = 0; 0075 Da testsandsynligheden er mindre end 0,05 forkastes H 0. 11

Styrkefunktionen Kvantitative Metoder 1 - Efterår 2006 Sandsynligheden for at forkaste H 0 ; når H A er sand (1 ()); afhænger typisk af en parameter :Styrkefunktionen er en funktion af parameteren ; som angiver sandsynligheden for at forkaste H 0 som funktion af : Denne funktion er de neret for alle 2 H 0 og 2 H A : () = P (forkast H 0 j) = P (Rj) Der gælder, at hvis H 0 : = 0 ; så er styrkefunktionen ( 0 ) = Styrkefunktionen angiver sandsynligheden for at forkaste H 0 : Vi ønsker derfor Lav styrke (dvs. lave værdier af ()); når 2 H 0 Høj styrke(dvs høje værdier af ()); når 2 H A 12

Eksempel (beståelse af 1. årsprøve) fortsat Antag at vi undersøger nulhypotesen Vi vil benytte forkastelsesområdet Styrkefunktionen er så de neret som H 0 : p = 0; 5 R = [1; 65; 1) (p) = P (Rjp) p 2 [0; 5; 1] = P (Z 2 [1; 65; 1)jp) = P (Z 1; 65jp) ^p 0; 5 = P ( 1; 65jp) q 0;5(1 0;5) 231 r 0; 5 0; 5 = P (^p 0; 5 + 1; 65 jp) r 231 0; 5 0; 5 = 1 P (^p < 0; 5 + 1; 65 jp) 231 13

p(1 p) ) ifølge den centrale grænseværdisætning. Så styrkefunk- 231 Der gælder, at ^p N(p; tionen er givet ved (p) = : 1 p! 0; 5 p 0; 5 231p + 1; 65p p (1 p) p (1 p) Styrkefunktionen kan afbildes som 14

styrkefunktionen 1,2 1 0,8 0,6 0,4 0,2 0 styrkefunktio nen 0,5 0,58 0,66 0,74 0,82 0,9 0,98 p 15

Stikprøvens størrelse Kvantitative Metoder 1 - Efterår 2006 Når man bestemmer stikprøvens størrelse, er det ofte en afvejning mellem, hvor troværdige konklusioner man kan få og omkostningerne ved at indsamle data. Styrkefunktionen kan bruges til at vurdere sandsynligheden for at begå fejl for en given stikprøve. Ved at fastlægge størrelsen for Type I og Type II fejl kan man nde den mindste stikprøve, som behøves. Antag at man er interesseret i at teste følgende nulhypotese H 0 : = 0 på et 5% signi kansniveau (sandsynligheden for Type I fejl). Men samtidig vil man have, at sandsynligheden for Type II fejl for parameteren = 1 højst skal være 10%. Dvs at man har at ( 0 ) = 0; 05; ( 1 ) = 1 0; 1 = 0; 9: Disse to betingelser vil fastlægge betingelser for forkastelsesområdet og stikprøvestørrelsen. 16

Eksempel (beståelse af 1. årsprøve) fortsat Antag at man ønsker at (0; 05) = 0; 05; (0; 60) = 1 0; 1 = 0; 9: Antagelse om signi kansniveauet fastlægger forkastelsesområdet til R = [1; 65; 1): Stikprøvens størrelse kan bestemmes til (0; 6) = : 1 p! 0; 5 0; 6 0; 5 np + 1; 65p = 0; 9 0; 6 (1 0; 6) 0; 6 (1 0; 6) dvs. p 0; 5 0; 6 0; 5 n p + 1; 65p = 1; 28 0; 6 (1 0; 6) 0; 6 (1 0; 6) p n = 1; 28 1; 65 0; 5 p 0; 6 (1 0; 6)! p 0; 6 (1 0; 6) 0; 1 Løses ligningen mht.n fås at n 211: 17

styrkefunktionen 1,2 1 0,8 0,6 0,4 0,2 0 styrkefunktion (n=231) styrkefunktion (n=100) styrkefunktion (n=211) 0,5 0,56 0,62 0,68 0,74 0,8 0,86 0,92 0,98 p 18

Opsummering Forkastelsesområde Type I og Type II fejl Styrkefunktionen Stikprøvens størrelse 19

Næste gang Torsdag d. 7/12: Likelihood kvotients test kap. 11.8 Sammenligning af populationer kap. 12.1 og 12.2 20