Note til styrkefunktionen



Relaterede dokumenter
Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Konfidensinterval for µ (σ kendt)

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Kvantitative Metoder 1 - Forår Dagens program

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Vejledende besvarelser til opgaver i kapitel 14

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Konfidensintervaller og Hypotesetest

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Kapitel 7 Forskelle mellem centraltendenser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Normalfordelingen. Statistik og Sandsynlighedsregning 2

02402 Løsning til testquiz02402f (Test VI)

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Modul 5: Test for én stikprøve

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Hvad skal vi lave i dag?

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Maple 11 - Chi-i-anden test

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Kvantitative Metoder 1 - Efterår Dagens program

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Statistik viden eller tilfældighed

En intro til radiologisk statistik

Statistik i basketball

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Tema. Dagens tema: Indfør centrale statistiske begreber.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Stastistik og Databehandling på en TI-83

Løsning til eksaminen d. 29. maj 2009

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Løsning eksamen d. 15. december 2008

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Kapitel 12 Variansanalyse

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

c) For, er, hvorefter. Forklar.

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Forelæsning 9: Inferens for andele (kapitel 10)

Kapitel 12 Variansanalyse

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Løsning til eksaminen d. 14. december 2009

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Modelkontrol i Faktor Modeller

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Kvantitative Metoder 1 - Forår 2007

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Statistiske modeller

J E T T E V E S T E R G A A R D

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 2)

1 Hb SS Hb Sβ Hb SC = , (s = )

Note om Monte Carlo eksperimenter

Opgave 6. Opgave 7. Opgave 8. Peter Harremoës Mat A delprøve med hjælpemidler 15 december 2015

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Rygtespredning: Et logistisk eksperiment

Transkript:

Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H 0 når den egentlig var sand, og dermed skulle have været accepteret. Sandsynligheden for at begå denne fejl er direkte forbundet med testets signifikansniveau. Hvis man (sædvanligvis) tester på 95% niveau, så er risikoen for at begå en type fejl, alt andet lige større end hvis man tester på eks. 99% niveau. Hvis man derfor kun er bekymret over type fejl, så kan man sige, at så bør man blot sætte signifikansniveauet meget lavt, eks. 0,005 da man så kun gennemsnitligt i ud af hver 00 tests vil komme til at begå en type fejl altså at forkaste en sand H 0, men her kommer type fejl ind i billedet. Type fejl: At undlade at forkaste H 0 når den egentlig var falsk altså at acceptere H 0 på trods af at H var sand. er er et grundlæggende trade-off mellem de to typer af fejl. Hvis man vælger at reducere sandsynligheden for at begå type fejl, fx ved at teste på 99% niveau i stedet for fx 95% niveau, så vil man da samtidig automatisk øge sandsynligheden for at begå en type fejl, altså vil man være mere tilbøjelig til at lade tvivl tale til fordel for nulhypotesen, da man tester på 99% niveau, og dermed mere ofte komme til at opretholde nulhypotesen til trods for at alternativhypotesen faktisk var sand. Sandsynligheden for at begå en type fejl er lig med testets signifikansniveau α. Sandsynligheden for at begå en type fejl hænger sammen med temaet for denne note testets styrkefunktion. Hvad er styrkefunktionen? Styrkefunktionen angiver sandsynligheden for at forkaste H 0 givet at denne rent faktisk er falsk, dvs. givet at H (alternativhypotesen) er den rigtige. en hypotese vi tester er følgende: H 0 : θ θ 0 overfor et givet alternativ (kan både være mindre end større end eller forskellig fra θ 0 ). et vi ønsker er at få en vurdering af, er sandsynligheden for at - -

Teoretisk Statistik. årsprøve parameteren rent faktisk er θ og ikke θ 0 som H 0 angiver. enne størrelse, der netop er testets styrke, må naturligvis afhænge af værdien af θ. Vi skriver derfor testets styrkefunktion som η(θ ). Testets styrke må alt andet lige være svagere, når man vælger en θ tæt på θ 0 end når man vælger en θ længere væk fra θ 0. Hvis et tests styrke over for et givet alternativ (i form af parameteren θ ) er en høj værdi (tæt på ), så vil det med andre ord sige, at sandsynligheden for at forkaste H 0 givet at den rent faktisk bør forkastes er stor, og dermed at sandsynligheden for at begå type fejl er relativt lille. Sandsynligheden for at begå en type fejl er givet som: η(θ ) erfor er et test (over for et givet alternativ) et bedre test hvis det har en høj styrke end et test der har en lav styrke. Med andre ord et stærkere test deraf navnet styrkefunktionen. Beregninger på styrkefunktionen Man beregner et test styrke over for et givet alternativ ved at udregne sandsynligheden for at havne i forkastelsesområdet R, givet at θ er den sande værdi af θ. vs. η(θ ) P(X R θ θ ) Eksempel (binomialfordelingen) : Antag at vi har en binomialfordelt stokastisk variabel X med antalsparameteren 33 og en sandsynlighedsparameter θ. Altså X ~ bin(n33, θ) Vi har observeret en værdi af X til 88. Spørgsmålet er om den sandsynlighedsparameteren kan tænkes at være 0,65? Altså ønsker vi at teste: H 0 : θ 0,65 H : θ 0,65 Signifikanssandsynligheden for dette test er p min{p(x 88), P(X 88)} min{0,478 ; 0,643} 0,8556 (eksakt beregning) ette eksempel er hentet fra Eksamensopgaven sommer 000 Opgave spørgsmål 3 jf. lærebogens side 38. - -

Vha. normalfordelingsapproksimationen fås: Note til styrkefunktionen Teoretisk Statistik. årsprøve 88 33 0,65 88 min ; + p Φ Φ p min 33 0,65 33 0,65 ( 0,65) 33 0,65 ( 0,65) { Φ( 0,909) ; Φ( 0,377) } min{ 0,443 ; 0,6453} 0, 8486 ermed må hypotesen om at parameteren θ er lig med 0,65 altså klart accepteres. Vi skal nu beregne dette tests styrke i forhold til et alternativ om at θ 0,50. Vi skal altså beregne sandsynligheden for at havne i forkastelsesområdet givet at θ 0,50. Vi beregner derfor først acceptområdet (konfidensintervallet) for hypotesen H 0 (på signifikansniveau 0,05). er er tale om et approksimativt konfidensinterval i normalfordelingen: ( ) 33 0,65 ±,96 33 0,65 0,35 [ 75,67 ; 97,3] n p ± u α / n p p Nu skal vi da finde sandsynligheden for at X ikke ligger i dette interval givet at den sande θ 0,50 først beregnes den vha. normalfordelingsapproksimationen 3 : η ( 0,50) P( X [ 75,67 ; 97,3] θ 0,50) Φ 75,67 33 0,50 97,3 33 0,50 Φ 33 0,5 0,5 + Φ 33 0,5 0,5 (,59) + Φ( 5,33) Φ(,59) + Φ( 5,33) 0,944+ 0,0000 0, 944 Og dernæst eksakt i binomialfordelingen: η P ( 0,50) P( X [ 75,67 ; 97,3] θ 0,50) P( X 75,67) + P( X 97,3) ( X 75) + P( X 97) 0, 9409 (, idet X ~ bin(n 33, θ 0,50)) Altså har testet en styrke på 94,%. Ergo er sandsynligheden for at begå en fejl af type, altså at acceptere en hypotese om at θ 0,65, hvis den sande værdi rent faktisk er 0,50 altså omkring 5,9%. 3 Bemærk, at der her i approksimationen ikke er tillagt/fratrukket ½ som vi ellers plejer at gøre når vi skal approksimere en diskret fordeling i U-fordelingen. Grunden til dette er at de grænser der indsættes ikke er heltallige observationer fra den diskrete fordeling, men i stedet approksimativt udregnede værdier i normalfordelingen. - 3 -

Teoretisk Statistik. årsprøve Sandsynligheden for at begå en fejl af type er altså ikke særlig stor i dette tilfælde, hvilket hænger sammen med at der er relativ stor forskel på de to opstille parameterværdier 0,65 og 0,50. Hvis man i stedet beregner styrken for et alternativ om at θ 0,60, så fås følgende: η P ( 0,60) P( X [ 75,67 ; 97,3] θ 0,60) P( X 75,67) + P( X 97,3) ( X 75) + P( X 97) 0, 33 Altså får vi et svagere test med en ret stor risiko for at begå en type fejl over for det givne alternativ, at θ 0,60. Tilsvarende kan man for alle θ [0;] beregne testets styrke. ette er vist i figuren nedenfor:, Styrkefunktionen for test i binomialfordelingen 0,8 Styrken 0,6 0,4 0, 0 0 0, 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Theta Eksempel (sammenligning af to normalfordelinger) 4 ette eksempel viser hvordan man beregner styrken for et test der sammenligner middelværdierne i to normalfordelinger. 4 ette eksempel bygger på Eksamensopgaven 00 sommer opgave. - 4 -

Vi har givet to normalfordelinger: Note til styrkefunktionen Teoretisk Statistik. årsprøve Gruppe Gennemsnit Empirisk varians (n 50 obs.) 37,89,33 (m 83 obs.) 8,6 4,078 For at kunne udføre testet for om middelværdierne er ens, må vi først undersøge om varianserne er ens, dette testes ved følgende V-test: H 0 : σ σ vs. H : σ σ max V min v * 4,078,33 p P V { s, s } { s, s } ~ F,3 ~ F * ( > v ) 0, 89 ( obsantal, obsantal ) tæller ( 83, 50 ) nævner Ergo kan varianserne antages at være ens, og dermed kan vi udregne den poolede varians: s pooled ( n ) s + ( m ) s n + m 3,4 Nu kan vi bruge t-testet for at teste om middelværdierne er ens: H 0 : μ μ vs. H : μ μ T s X 37,89 8,6 t 3,4 + pooled p P T X 50 n + m 83 ~ T ( n + m ) 3,86 ~ t ( 50 + 83 ) ( > t ) 0,000 < α 0, 05 I opgaveteksten tester man ensidet med alternativet H : μ > μ, og da bliver signifikanssandsynligheden lig med ( > t) 0,000< 0, 05 p P T α Ergo er middelværdierne ikke ens middelværdien for gruppe er signifikant større end middelværdien for gruppe. - 5 -

Teoretisk Statistik. årsprøve Vi skal nu beregne testets styrke over for et alternativ om, at forskellen i middelværdier er lig med, hvor vi før testede om forskellen i middelværdien var lig med 0 altså at de to middelværdier var ens. Vi starter med at antage at de i de foregående beregninger indgående varianser kan betragtes som kendte med deres estimater som værdier 5. Vi konstruerer nu en stokastisk variabel X som differensen mellem X og X. Husk at fordelingen af gennemsnittene 6 er givet ved: X i σ i ~ Nf µ i,. ermed må der også gælde: ni σ σ ( ) X X X Nf ~ µ µ µ, σ + n m Idet variansen kan betragtes som kendt, udregnes denne: σ σ n σ + m,33 50 4,078 + 83,40 vs. at under hypotesen om at middelværdierne er ens, dvs. H 0 : μ 0 gælder, at X ~ Nf ( 0 ;,40 ) Et 95% konfidensinterval (acceptområdet) for μ under det ensidede alternativ, at μ > 0, findes ved at finde 95% fraktilen i den til σu + µ,40,645 + 0 X ; 0,95 0,95 ermed bliver 95% konfidensintervallet: µ ] ; 3,95] X hørende normalfordeling: 3,95 Nu skal vi beregne styrken for dette ensidede test under en alternativ hypotese om at μ : η ( ) P ( X ] ; 3,95] µ ) P( X [ 3,95 ; [ µ ) P( X 3,95 µ ) 3,95 Φ Φ,40 ( 3,35) 0,0004 0, 9996 5 ette er en normal antagelse at gøre, da vi ellers ikke længere kan beregne styrken i U-fordelingen. 6 Jf. Sætning 6. i lærebogen. - 6 -

Teoretisk Statistik. årsprøve ette test har således en relativ høj styrke, og risikoen for at begå en type fejl, altså risikoen for at acceptere hypotesen om ens middelværdier på trods af at den sande værdi af μ, dvs. forskellen mellem middelværdierne i de to normalfordelinger, rent faktisk er, er således så lav som 0,0004. Styrken for det ensidede test kan beregnes for alle (positive) værdier af μ og dette er illustreret i figuren nedenfor:, Styrkefunktionen for normalfordeling (ensidet test) 0,8 Styrke 0,6 0,4 0, 0 0 4 6 8 0 middelværdi Hvis i stedet man laver testet to-sidet, så skal man naturligvis blot slå ½% og 97½% fraktilerne op i X s normalfordeling, og intervallet mellem disse to grænser er acceptområdet. ermed bliver sandsynligheden for at havne i forkastelsesområdet en toleddet størrelse. 95% konfidensintervallet for μ bliver i dette tilfælde [-4,7 ; 4,7]. ermed bliver styrken over for alternativet at μ i dette tilfælde: ( ) P ( X [ 4,7; 4,7] µ ) P( X ] ; 4,7] [ 4,7; [ µ ) η!,75 0 + 0,9988 0,9988 ermed bliver styrken for det dobbeltsidede test altså en smule svagere end for det enkeltsidede test. - 7 -

Teoretisk Statistik. årsprøve Tilsvarende kan styrken også beregnes for alle værdier i det dobbeltsidede tilfælde, hvilket er vist i figuren nedenfor. Styrkefunktionen for normalfordeling (tosidet), 0,8 Styrke 0,6 0,4 0, 0 - -6 0 6 Middelværdi Eksempel (poissonfordelingen): Vi betragter nu en poissonproces, hvor X angiver antallet af patienter der ankommer til en skadestue i døgnet. I forbindelse med en undersøgelse som skadestuen tidligere har gennemført har man estimeret at der gennemsnitligt ankommer 80 patienter i døgnet. Ledelsen af sygehuset har hørt i krogene, af der ikke længere er den samme mængde patienter på skadestuen, og udfører derfor en enkelt dag en stikprøve, hvor det viser sig at der ankommer 67 patienter til skadestuen. Ledelsen mener hermed at have konkluderet at besøgsmængden på skadestuen er faldet og at der derfor skal skæres i personalet. Skadestuens personale er oprørte og har nu bedt de seje politstuderende om at vurdere om der rent faktisk er sket en signifikant reduktion i antallet af besøgene eller om det blot kan tænkes at være udslag af tilfældigheder. ette gøres ved at teste en hypotese om at den sande λ er 80. vs. - 8 -

H 0 : λ 80 vs. H : λ < 80 7 Note til styrkefunktionen Teoretisk Statistik. årsprøve X ~ Ps(λ 80) Signifikanssandsynligheden for dette test er: p P(X 67) 0,078 > α 0,05 Altså må vi glæde personalet på skadestuen med, at vi på 5% niveau ikke kan afvise at det faktum at der den pågældende dag blot var 67 patienter, alene skyldes tilfældige udsving fra et gennemsnitligt antal patienter på 80 pr. dag. ette meddeler personalet på skadestuen til sygehusledelsen, der dog straks bemærker at der i den opstillede testprocedure jo er en risiko for at man kommer til at acceptere H 0 selv om den rent faktisk er falsk. ette tygger de ansatte i skadestuen så lidt på og beder så atter en gang de politstuderende om hjælp 8. En af de kvikke studerende finder hurtigt ud af, at det der spørges til reelt er styrken af det test der tidligere blev udført. Man beslutter sig derfor for at beregne styrken af testet over for et alternativ om at λ 67. enne er givet som sandsynligheden for at X tilhører forkastelsesområdet for H 0 : λ 80, givet at λ 67 er den sande værdi. erfor beregner vi først konfidensintervallet for det tidligere udførte test. Idet vi er i en diskret fordeling kan vi ikke præcis ramme et 95% konfidensinterval. et tætteste på vi kommer er et 95,% konfidensinterval, der er intervallet λ [66; [. Styrken η er derfor givet ved: η(67) P(X [66; [ λ 67) P(X ] 0 ; 65] λ 67) 0,435 vs. at sandsynligheden for at acceptere nulhypotesen om at λ 80 givet at en alternativ værdi λ 67 faktisk er den sande værdi af λ ret beset er ganske stor, nemlig η(67) 0,5649. erfor må man trods alt give sygehusledelsen ret i at der er en ganske stor risiko for at komme til at acceptere en hypotese om at λ 80 selvom den sande værdi faktisk er λ 67. 7 a man kun er interesseret i at forkaste den pågældende hypotese, såfremt man da påviser at ankomstraten er større end 60. - 9 -

Teoretisk Statistik. årsprøve Styrkefunktion for poissonfordeling (ensidet), 0,8 Styrke 0,6 0,4 0, 0 0 0 0 30 40 50 60 70 80 Parameter 8 Hvad skulle vi dog gøre uden dem! - 0 -