Om hypoteseprøvning (1)

Relaterede dokumenter
Tema. Dagens tema: Indfør centrale statistiske begreber.

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Nanostatistik: Opgavebesvarelser

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Note til styrkefunktionen

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Note om Monte Carlo metoden

Definition. Definitioner

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Eksamen 2014/2015 Mål- og integralteori

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Dagens program. Praktisk information: Husk evalueringer af kurset

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Løsninger til kapitel 6

4 Oversigt over kapitel 4

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Elementær sandsynlighedsregning

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Vejledende besvarelser til opgaver i kapitel 14

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Kvantitative Metoder 1 - Forår 2007

Elementær sandsynlighedsregning

Produkt og marked - matematiske og statistiske metoder

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Konfidensintervaller og Hypotesetest

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kapitel 7 Forskelle mellem centraltendenser

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvantitative Metoder 1 - Forår 2007

Besvarelser til øvelsesopgaver i uge 6

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Løsning eksamen d. 15. december 2008

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Kvantitative Metoder 1 - Efterår Dagens program

Opgaver til kapitel 3

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Kapitel 12 Variansanalyse

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Statistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Nanostatistik: Test af hypotese

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Normalfordelingen og Stikprøvefordelinger

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Dagens program. Praktisk information:

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

Kapitel 12 Variansanalyse

Sandsynlighedsregning

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

StatDataN: Test af hypotese

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Reeksamen 2014/2015 Mål- og integralteori

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Forelæsning 2: Kapitel 4, Diskrete fordelinger

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Nanostatistik: Opgaver

Lidt om fordelinger, afledt af normalfordelingen

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Statistik viden eller tilfældighed

Statistik II 1. Lektion. Analyse af kontingenstabeller

Transkript:

E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω; på baggrund af en observation x skal man undersøge om man kan tillade sig at mene at θ tilhører delmængden Ω 0 af Ω. Dette formuleres kort på den måde at man ønsker at teste den statistiske hypotese H 0 : θ Ω 0. EKSEMPEL 1 SAMMENLIGNING AF BINOMIALFORDELINGER) Lad X 1, X 2,..., X k være uafhængige binomialfordelte stokastiske variable således at X j har kendt) antalsparameter n j og ukendt) sandsynlighedsparameter p j [0, 1]. Her er θ = p 1, p 2,..., p k ) et punkt i Ω = [0, 1] k. Man kunne være interesseret i at undersøge om der er signifikant forskel på p-erne. Det gør man ved at teste den statistiske hypotese om at p-erne er ens; sædvanligvis vil man formulere denne hypotese sådan her: H 0 : p 1 = p 2 =... = p k, men i den generelle formulering skriver vi hypotesen som H 0 : θ Ω 0 hvor Ω 0 = {p 1, p 2,..., p k ) Ω : p 1 = p 2 =... = p k }. EKSEMPEL 2 ENSTIKPRØVEPROBLEMET I NORMALFORDELINGEN) Lad X 1, X 2,..., X n være uafhængige identisk normalfordelte stokastiske variable med middelværdi µ og varians σ 2. Her er θ = µ,σ 2 ) et punkt i Ω = R ]0, + [. Man kunne være interesseret i at undersøge om middelværdien afviger signifikant fra den på forhånd oplyste værdi µ 0. Det gør man ved at teste den statistiske hypotese om at µ er lig med µ 0 ; normalt formulerer man denne hypotese sådan her: H 0 : µ = µ 0, men i den generelle formulering må vi skrive hypotesen som H 0 : θ Ω 0 hvor Ω 0 = {µ 0 } ]0, + [. Der findes forskellige måder at angribe hypoteseprøvningsproblemet på. 1. Man kan anskue det som et beslutningsproblem decisionsproblem) hvor man skal afgøre om man skal agere som som om nulhypotesen H 0 : θ Ω 0 er sand, eller om man skal agere som om den alternative hypotese H 1 : θ Ω 1 er sand, hvor Ω 1 = Ω \ Ω 0. Man taler om at man henholdsvis accepterer H 0 og forkaster H 0. Afgørelsen skal være optimal i en eller anden forstand som nærmere skal præciseres. 2. Man kan anskue det som et led i en modellerings- eller erkendelses- eller forskningsproces hvor man ønsker at konfrontere observationen x med modelforslaget H 0 : θ Ω 0 ; hvis H 0 ikke beskriver x tilstrækkeligt godt, vender man tilbage til grundmodellen θ Ω. Det svar der kommer ud af det, er enten at H 0 forkastes, eller at H 0 ikke kan forkastes på det foreliggende grundlag.

Om hypoteseprøvning 1) Side 2 af 5 I det følgende omtales først den ene, så den anden tilgang. 1 Tests og beslutninger Testteori som handlende om at træffe optimale beslutninger er en disciplin der blev grundlagt i begyndelsen af 1930-erne; to prominente hovedpersoner er Jerzy Neyman og Egon Pearson. Situationen er som følger. Vi har en statistisk model for den stokastiske variabel X; modellen er parametriseret ved parameteren θ; vi ønsker at finde en testprocedure δ som kan bruges for at teste hypotesen H 0 : θ Ω 0 mod alternativet H 1 : θ Ω 1, hvor Ω 1 = Ω \ Ω 0. En testprocedure er en opskrift på hvordan man for en given observation x skal afgøre om H 0 skal accepteres eller forkastes. Da δ kun kan afhænge af x og ikke af den ukendte parameter θ), vil man somme tider komme til at træffe en forkert beslutning, man taler om to typer af fejl: Fejl af type 1 er at forkaste H 0 når den er rigtig. Fejl af type 2 er at acceptere H 0 når den er forkert. Testproceduren skal vælges sådan at såvel sandsynligheden for Type 1 fejl som sandsynligheden for Type 2 fejl er lille. Sagen kompliceres af at disse sandsynligheder typisk afhænger af den sande værdi af θ. For at kunne tale mere præcist om tingene indføres forskellige begreber vedrørende et test eller en testprocedure): 1. Hvis testet er indrettet sådan at der findes en delmængde C af udfaldsrummet S således at H 0 forkastes hvis og kun hvis x C, så kaldes C for det kritiske område eng.: critical region) for testet. 2. I nogle tilfælde se også punkt 5) vil man gerne kunne operere med et såkaldt randomiseret test; derfor indføres en kritisk funktion φx) hvis værdi er sandsynligheden for at testproceduren forkaster H 0 når man har observeret x. For et ikke-randomiseret test er φ lig indikatorfunktionen for det kritiske område. Et randomiseret test fungerer typisk på den måde at for visse x forkastes H 0 uden videre, for andre x accepteres H 0 uden videre, og for atter andre x skal man aktivere en tilfældighedsmekanisme der leverer svarene»forkast«og»acceptér«med sandsynlighederne p og 1 p, hvor p er et tal der kan bestemmes ud fra de krav der stilles til testet.) En standardreference til denne form for testteori men ikke til historien om den) er E.L. Lehmann 1959): Testing Statistical Hypotheses, Wiley. Indikatorfunktionen for en delmængde C af S er funktionen 1 C : S R som har værdien 1 på C og værdien 0 på S \ C.

Om hypoteseprøvning 1) Side 3 af 5 3. Styrkefunktionen eng.: power function) πθ) for et test angiver sandsynligheden for at forkaste H 0, udregnet under forudsætning af at θ er den rigtige parameterværdi. For et ikke-randomiseret test med kritisk område C er πθ) = P θ X C). For et generelt test med kritisk funktion φ er πθ) = E θ φx). 4. Den maksimale sandsynlighed under H 0 ) for fejl af type 1 kaldes testets størrelse eng.: size) og betegnes α: α = sup{πθ) : θ Ω 0 }. 5. Styrkefunktionen skal helst være lille på Ω 0 og stor på Ω 1. Derfor kan man være interesseret i at søge efter et stærkeste test, dvs. et test der maksimalisere styrkefunktionen på Ω 1 samtidig med at størrelsen α ikke må overskride en på forhånd fastsat grænse α 0, det såkaldte signifikansniveau eng.: level of significance). Der er tradition for at man som α 0 tit bruger 5% eller 1%. Hvis man gerne vil have at testets størrelse skal være lig med det valgte signifikansniveau, må man undertiden især i diskrete modeller) benytte randomiserede tests se f.eks. Opgave 1.2). 6. Hvis Ω 0 er en etpunktsmængde, Ω 0 = {θ 0 }, taler man om en simpel hypotese. Hvis Ω 1 er en etpunktsmængde, Ω 1 = {θ 1 }, taler man tilsvarende om et simpelt alternativ. Det modsatte af en simpel hypotese er en sammensat hypotese. 1.1 Simpel hypotese vs. simpelt alternativ Når man skal udvikle og/eller præsentere testteorien, er det en fordel at begynde med det i øvrigt ikke særlig realistiske tilfælde hvor man tester en simpel hypotese H 0 : θ = θ 0 mod et simpelt alternativ H 1 : θ = θ 1. Da er størrelsen af testet blot α = πθ 0 ), og det der skal maksimaliseres, er πθ 1 ) under bibetingelsen πθ 0 ) α 0 dvs. man ønsker at minimalisere sandsynligheden 1 πθ 1 ) for fejl af type 2, samtidig med at sandsynligheden for fejl af type 1 ikke må overskride α 0 ). Lad os sige at sandsynlighedstætheds)funktionen for X under H 0 hhv. H 1 er f 0 x) hhv. f 1 x). Det virker umiddelbart som en fornuftig ting at bruge en testprocedure der accepterer H 0 hvis kvotienten f 0 x)/ f 1 x) er stor, og forkaster H 0 hvis samme kvotient er lille, dvs. den kritiske funktion er af formen 0 hvis f 0 x)/ f 1 x) > k φ x) = γ hvis f 0 x)/ f 1 x) = k 1) 1 hvis f 0 x)/ f 1 x) < k for passende valg af k ]0, + [ og γ [0, 1]. Det fundamentale Neyman-Pearson lemma fortæller at φ faktisk er det stærkeste test på niveau α i den forstand at det maksimaliserer styrkefunktionen i θ 1 under den bibetingelse at størrelsen er α:

Om hypoteseprøvning 1) Side 4 af 5 SÆTNING 1.1 I den ovenfor beskrevne situation gælder: 1. Til et givet α [0, 1] findes konstanter k og γ således at det test δ hvis kritiske funktion er givet ved 1), er et test med størrelse α. Lad δ være et andet test for H 0 mod H 1. Lad π og π betegne styrkefunktionerne for δ og δ. 2. Hvis størrelsen af δ er højst α, så er δ stærkere end δ, dvs. π θ 1 ) πθ 1 ). BEVIS Notation: Vi skriver P 0 og E 0 hhv. P 1 og E 1 for sandsynligheder og middelværdier udregnet under hhv. H 0 og H 1. Den kritiske funktion for δ er φ. Ad 1. Størrelsen af testet δ er E 0 φ X) = P 0 f0 X)/ f 1 X) < k ) + γ P 0 f0 X)/ f 1 X) = k ). 2) Det følger af de almindelige egenskaber ved sandsynligheder at funktionen Gk) = P 0 f0 X)/ f 1 X) < k ) er voksende og venstrekontinuert og har grænseværdierne 0 og 1 i hhv. 0 og + ; desuden er størrelsen af et eventuelt spring lim Gk + k) Gk) = P 0 f0 X)/ f 1 X) = k ). Heraf følger alt i alt at k 0 højresiden af 2) kan bringes til at antage enhver værdi mellem 0 og 1. Ad 2. Først skriver vi op hvad man kan slutte om visse størrelser ud fra kendskabet til om φ er 0 eller 1 eller indimellem: φ x) = 0 k f 1 x) f 0 x) < 0, φ x) φx) 0 φ x) ]0, 1[ k f 1 x) f 0 x) = 0 φ x) = 1 k f 1 x) f 0 x) > 0, φ x) φx) 0 Heraf ses at der for alle x gælder at φ x) φx) ) k f 1 x) f 0 x) ) 0 eller k φ x) φx) ) f 1 x) φ x) φx) ) f 0 x). Ved at integrere/summere på begge sider af det sidste ulighedstegn fås k E 1 φ X) E 1 φx) ) E 0 φ X) E 0 φx) = α E 0 φx) 0, og da k > 0, følger heraf at E 1 φ X) E 1 φx), dvs. π θ 1 ) πθ 1 ). Hvis ovennævnte ulighedstegn faktisk er lighedstegn, dvs. hvis de to tests er lige stærke, så kan man ved at regne baglæns indsé at φx) = φ x) for næsten alle x for hvilke φ x) ikke er 0 eller 1. Det stærkeste test er altså stort set entydigt bestemt.)

Om hypoteseprøvning 1) Side 5 af 5 1.2 Opgaver Opgaver fra DeGroot: 8.1.3. OPGAVE 1.1 VARIANT AF DEGROOT S OPGAVE 8.2.4) Man har observeret x 1, x 2,..., x n fra en normalfordeling med middelværdi µ og varians 1. Man ønsker at teste hypotesen H 0 : µ = 3.5 mod alternativet H 1 : µ = 5. Find det stærkeste test med størrelse α = 0.05. OPGAVE 1.2 Man søger en testprocedure der kan bruges når man har en observation fra en binomialfordeling med antalsparameter n = 5 og ukendt sandsynlighedsparameter θ, og man ønsker at teste hypotesen H 0 : θ = 1 / 2 mod alternativet H 1 : θ = 2 / 3. Gør rede for at der ikke findes noget ikke-randomiseret test med størrelse α = 0.05. Find det stærkeste test med størrelse α = 0.05.