Preben Blæsild og Jens Ledet Jensen



Relaterede dokumenter
Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Produkt og marked - matematiske og statistiske metoder

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Konfidensintervaller og Hypotesetest

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Statistiske modeller

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Nanostatistik: Konfidensinterval

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Nanostatistik: Opgavebesvarelser

Hvorfor er normalfordelingen så normal?

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Personlig stemmeafgivning

Susanne Ditlevsen Institut for Matematiske Fag susanne

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Estimation og konfidensintervaller

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

StatDataN: Test af hypotese

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Schweynoch, Se eventuelt

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Kapitel 12 Variansanalyse

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Uge 10 Teoretisk Statistik 1. marts 2004

1 Hb SS Hb Sβ Hb SC = , (s = )

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Statistik II 4. Lektion. Logistisk regression

Løsning til eksaminen d. 14. december 2009

Højde af kvinder 2 / 18

Lidt om fordelinger, afledt af normalfordelingen

Kapitel 12 Variansanalyse

Forelæsning 9: Inferens for andele (kapitel 10)

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Nanostatistik: Test af hypotese

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Løsning til eksaminen d. 29. maj 2009

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Kvantitative Metoder 1 - Forår 2007

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Normalfordelingen og Stikprøvefordelinger

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

En Introduktion til SAS. Kapitel 5.

Note om Monte Carlo metoden

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Løsning eksamen d. 15. december 2008

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Statistik og Sandsynlighedsregning 2

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Kvantitative Metoder 1 - Forår Dagens program

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Produkt og marked - matematiske og statistiske metoder

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Kvantitative Metoder 1 - Forår Dagens program

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Kvantitative Metoder 1 - Efterår Dagens program

Definition. Definitioner

Vejledende besvarelser til opgaver i kapitel 14

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Statistiske principper

Kapitel 4 Sandsynlighed og statistiske modeller

Transkript:

χ 2 Test Preben Blæsild og Jens Ledet Jensen Institut for Matematisk Fag Aarhus Universitet Egå Gymnasium, December 2010

Program 8.15-10.00 Forelæsning 10.15-12.00 Statlab: I arbejder, vi cirkler rundt 12.00-12.30 Frokost 12.30-14.30 Øvelser: I fremlægger jeres resultater

Program for forelæsning Challenger katastrofen Model / Teststørrelse / p-værdi χ 2 -test 2 modeller, 2 hypoteser teststørrelse, frihedsgrader hvorfor χ 2 -fordeling χ 2 -test generelt Brug af excel Andre test - Andre modeller

Challenger Challenger katastrofen 28/1-1986 Aftenen før opsendelse: ingeniører forsøgte at advare mod problemer med O-ringe ved lave temperaturer Temperatur: 31 F ( 1 C)

Challenger Data (Rogers Commission report 1986) Missed opportunity: så kun på flyvninger med fejl

Challenger Model Hver opsendelse kan enten resultere i fejl i O-ringe eller resultere i ingen fejl i O-ringe Sandsynligheden for fejl er p(t ) T er temperaturen Data: 24 sammenhørende værdier af temperatur og indikator for fejl Fejl i 7 og ingen fejl i 17

Challenger Hypotese Ingen afhængighed af temperatur: p(t ) = konstant Under hypotesen: de 7 flyvninger med fejl vælges tilfældigt blandt de 24 flyvninger Eksempel på alternativ: log ( p(t ) 1 p(t )) = α βt P(Data) = c(α, β) exp{24α β 24 i=1 T ix i } x i er 1 ved fejl og 0 ved ingen fejl Teststørrelse: 24 i=1 T ix i = i:x i =1 T i observeret værdi = 446

Challenger Simulere p-værdi Trække 7 tilfældigt blandt de 24 og beregne sum af de 7 tilhørende temperaturer. Gentage 1 million gange. Density 0.000 0.005 0.010 0.015 0.020 Histogram of sim Data: 446 440 460 480 500 520 540 sim Konklusion: hvis der ingen sammenhæng er mellem temperatur og fejlsandsynlighed, vil sandsynligheden for at få en sum af temperaturer fra 7 flyvninger med fejl, der er mindre end eller lig med 446 være cirka 0.32% Da denne er lille tror vi ikke på hypotesen om ingen sammenhæng

Challenger p-værdi p-værdien: forestiller os at vi laver uafhængige gentagelser af eksperimentet i situationen hvor hypotesen er sand Beregner hvor ofte vi får udfald der er mere ekstreme end det faktisk observerede p-værdi = hyppighed af mere ekstreme udfald Mere ekstrem: defineres ud fra valg af teststørrelse

Challenger p-værdi p-værdien < 0.05: det observerede er meget usædvanligt under hypotesen: data strider mod hypotesen og vi tror ikke på hypotesen p-værdien > 0.05: det observerede er normalt under hypotesen: data strider ikke mod hypotesen, der er ikke grund til at forkaste hypotesen p-værdien er IKKE sandsynligheden for at hypotesen er sand

Challenger Tre vigtige punkter Model: bestemt af den sandsynlighedsmekanisme der frembringer data Teststørrelse: vælges klogt af statistiker p-værdi: beregnes (eller simuleres) under hypotesen

Challenger En test af jer Er det godt at få en stor p-værdi? JA NEJ

To dataeksempler Teststørrelse χ 2 approksimationen Dataeksempel I Ved 715 indlæggelser af spædbørn har man registreret om moderen har givet lav eller høj omsorg og om barnet har overlevet død lever lav 20 373 høj 6 316 715 Spørgsmål: er overlevelse uafhængig af graden af omsorg? Hvad synes I?

To dataeksempler Teststørrelse χ 2 approksimationen Generel model I n individer vælges tilfældigt fra population: individer er uafhængige For hvert individ undersøges to egenskaber der er r muligheder for den ene egenskab der er s muligheder for den anden egenskab r s tabel: x ij er antallet af individer der falder i celle (i, j) d.v.s. har værdien i for den første egenskab og værdien j for den anden egenskab x 11 x 1s x 1.... x r1 x rs x r x 1 x s n

To dataeksempler Teststørrelse χ 2 approksimationen General model I Sandsynlighed for at falde i række i og søjle j, d.v.s. celle (i, j) er p ij grundmodel: p ij er vilkårlige: p ij > 0, r s i=1 j=1 p ij = 1 Hypotese om uafhængighed: p ij = ρ i σ j ρ i = sandsynlighed for at falde i række i σ j = sandsynlighed for at falde i søjle j Sandsynlighed for at falde i søjle j givet at individ falder i række i er σ j, d.v.s. uafhængig af i

To dataeksempler Teststørrelse χ 2 approksimationen Dataeksempel II Blandt 1176 Thulearbejdere, der deltog i oprydning efter nedstyrtning af B52 bombefly fik 40 kræft indenfor en bestemt tidsperiode Blandt 3025 Thulearbejdere, der var rejst hjem før nedstyrtningen, fik 100 kræft i en tilsvarende tidsperiode kræft ikke kræft total under B52 40 1136 1176 før B52 100 2925 3025 Spørgsmål: er der samme kræfthyppighed i de to grupper af Thulearbejdere

To dataeksempler Teststørrelse χ 2 approksimationen Generel model II Vi har r populationer Fra den i te population vælges n i individer tilfældigt For hvert individ undersøges en egenskab der er s muligheder for denne egenskab r s-table: x ij er antallet af individer fra population i der falder i kasse j x 11 x 1s n 1.... x r1 x rs n r x 1 x s n

To dataeksempler Teststørrelse χ 2 approksimationen General model II Sandsynlighed for at individ fra population i falder i kasse j er p ij grundmodel: p ij er vilkårlige: p ij > 0, for hvert i: s j=1 p ij = 1 Hypotese om homogenitet: p ij = π j π j = fælles sandsynlighed for at falde i kasse j

To dataeksempler Teststørrelse χ 2 approksimationen Teststørrelse Klassiske (Karl Pearson, 1900): X 2 = celler (observerede forventede) 2 forventede skalerede kvadrerede afstande Statistiker i dag: 2 ln(q)= 2 celler obs ln( ) obs forv Generelt princip: Q = max hypotese P(data) max grundmodel P(data) Generelt resultat: under hypotesen: 2 ln(q) χ 2 (f ), X 2 χ 2 (f ) f = antal (frie) parametre i grundmodel antal (frie) parametre under hypotesen

To dataeksempler Teststørrelse χ 2 approksimationen Frie parametre Resultat: Med følgende setup: model: n individer fordeles på k kasser sandsynligheden for at falde i kasse j er p j sandsynlighederne kan være vilkårlige: p j > 0, k j=1 p j = 1 er antallet af frie parametre k 1 Bevis: p k = 1 p 1 p k 1 (p 1,..., p k 1 ) kan variere i et åbent område: p j > 0, k 1 j=1 p j < 1

To dataeksempler Teststørrelse χ 2 approksimationen Frihedsgrader Model I: test for uafhængighed grundmodel: ingen bånd på p ij : r s 1 frie parametre hypotesen: p ij = ρ i σ j : (r 1) + (s 1) frie parametre f = [r s 1] [(r 1) + (s 1)] = (r 1)(s 1) Model II: test for homogenitet grundmodel: for alle i = 1,..., r er s j=1 p ij = 1: r (s 1) frie parametre hypotesen: p ij = π j : s 1 frie parametre f = [r (s 1)] [s 1] = (r 1)(s 1)

To dataeksempler Teststørrelse χ 2 approksimationen Forventede antal Forventede = samlede antal skøn over sandsynlighed for at falde i kasse under hypotesen Model I: test for uafhængighed forventede ij = n ˆρ i ˆσ j = n x i x j n n Model II: test for homogenitet forventede ij = n i ˆπ j = n i x j n = x i x j n = x i x j n Forventede = rækkesum søjlesum / samlede antal

To dataeksempler Teststørrelse χ 2 approksimationen Cochrans regel Når vi finder p-værdien fra en χ 2 -fordeling er dette en approksimation Må bruges når: alle forventede er 1 højst 20% af de forventede er mindre end 5 Hvis dette ikke er opfyldt, så: eventuelt simulere eventuelt bruge Fishers eksakte test

To dataeksempler Teststørrelse χ 2 approksimationen Beregning af p-værdi Da store værdier af X 2 -teststørrelsen er kritiske og er testsandsynligheden X 2 χ 2 (f ), p-værdi = P(χ 2 (f ) X 2 ), som kan beregnes ved hjælp af Excel funktionen CHIFORDELING, idet P(χ 2 (f ) X 2 ) = CHIFORDELING(X 2 ; f ). Tilsvarende bemærkninger gælder for 2 ln(q)-teststørrelsen.

To dataeksempler Teststørrelse χ 2 approksimationen Illustration af approksimation: 2 ln(q) Ser på 2 2 tabel: x 11 x 12 n 1 x 21 x 22 n 1 Hypotese: p 11 = p 21 = p, p 12 = p 22 = 1 p P(χ 2 (1) 3.84) = 0.05 Finde P(teststørrelse 3.84) Regel: n 1 p 5, n 1 (1 p) 5, n 1 (1 p) 5, n 2 (1 p) 5

To dataeksempler Teststørrelse χ 2 approksimationen Illustration af approksimation: 2 ln(q) n1=25; n2=25; p=0.4 pberegn=0 # sandsynlighed for værdi >= 3.84 for (x1 in 0:n1){ for (x2 in 0:n2){ phat=(x1+x2)/(n1+n2) X2=(x1-n1*phat)^2/(n1*phat)+(n1-x1-n1*(1-phat))^2/(n1*(1-ph (x2-n2*phat)^2/(n2*phat)+(n2-x2-n2*(1-phat))^2/(n2*(1-ph if (X2>=3.84){ pberegn=pberegn+dbinom(x1,n1,p)*dbinom(x2,n2,p)} }} pberegn

To dataeksempler Teststørrelse χ 2 approksimationen Illustration af approksimation: 2 ln(q) n1=25, n2=25 n1=50, n2=25 P( 2lnQ>=3.84) 0.00 0.05 0.10 P( 2lnQ>=3.84) 0.00 0.05 0.10 0.0 0.2 0.4 0.6 0.8 1.0 faelles p 0.0 0.2 0.4 0.6 0.8 1.0 faelles p n1=50, n2=50 n1=100, n2=100 P( 2lnQ>=3.84) 0.00 0.05 0.10 P( 2lnQ>=3.84) 0.00 0.05 0.10 0.0 0.2 0.4 0.6 0.8 1.0 faelles p 0.0 0.2 0.4 0.6 0.8 1.0 faelles p

To dataeksempler Teststørrelse χ 2 approksimationen Illustration af approksimation: X 2 n1=25, n2=25 n1=50, n2=25 P(X2>=3.84) 0.00 0.05 0.10 P(X2>=3.84) 0.00 0.05 0.10 0.0 0.2 0.4 0.6 0.8 1.0 faelles p 0.0 0.2 0.4 0.6 0.8 1.0 faelles p n1=50, n2=50 n1=100, n2=100 P(X2>=3.84) 0.00 0.05 0.10 P(X2>=3.84) 0.00 0.05 0.10 0.0 0.2 0.4 0.6 0.8 1.0 faelles p 0.0 0.2 0.4 0.6 0.8 1.0 faelles p

To dataeksempler Teststørrelse χ 2 approksimationen Hvorfor χ 2 approksimationen Definition på en χ 2 (f )-fordeling: lad U 1,..., U f være uafhængige N(0, 1)-fordelte V = U1 2 + + U2 f siges at følge en χ 2 (f )-fordeling P(χ 2 (1) > 3.84) = 0.05, P(χ 2 (2) > 5.99) = 0.05 Karl Pearson 1900: obs i forv i lineær transformation: ukorrelerede og varians = 1 kvadrere og summere: X 2

To dataeksempler Teststørrelse χ 2 approksimationen To dataeksempler Spædbørnsdødelighed: observerede antal død lever lav 20 373 høj 6 316 715 X 2 = 5.24, P(χ 2 (1) 5.24) = 0.022 forventede antal død lever lav 14.3 378.7 høj 11.7 310.3 715 Thulearbejdere: observerede antal kræft ikke kræft total under B52 40 1136 1176 før B52 100 2925 3025 X 2 = 0.023, P(χ 2 (1) 0.023) = 0.88 forventede antal kræft ikke kræft 39.2 1136.8 100.8 2924.2

To dataeksempler Teststørrelse χ 2 approksimationen Pause Preben tager over

χ 2 -test: generelt χ 2 -test: generelt Tælledata: k kasser x j = antal der falder i kasse j n = x 1 + + x k, samlede antal Grundmodel: sandsynlighed p j for at falde i kasse j er vilkårlig 0 < p j < 1, p 1 + + p k = 1 Hypotese: p j = π j (θ) θ: parameter, π j ( ) kendt funktion ˆθ: find θ der maksimerer k j=1 π j(θ) x j

χ 2 -test: generelt χ 2 -test: generelt Forventede under hypotesen: Teststørrelse: e j = n π j (ˆθ) 2 ln(q) = 2 k j=1 x j ln ( x j e j ) eller X 2 = k (x j e j ) 2 j=1 e j Approksimative p-værdi: sandsynlighed for at få en værdi teststørrelse i en χ 2 (f )-fordeling f = (k 1) (dimension af θ) p-værdi = P(χ 2 (f ) 2 ln(q)) eller P(χ 2 (f ) X 2 )

χ 2 -test: generelt χ 2 -test: k = 2 Tælledata: k = 2 kasser (her kaldet + og ) antal der falder i kasse + er lig med x antal der falder i kasse er lig med n x + ialt x n x n Grundmodel p = sandsynlighed for at falde i kasse + 1 p = sandsynlighed for at falde i kasse 0 < p < 1 Hypotese: p = p 0 hvor p 0 er vilkårlig men kendt frihedsgrader f = k 1 0 = 2 1 0 = 1

χ 2 -test: generelt χ 2 -test: k = 2, X 2 -teststørrelsen X 2 -teststørrelsen beregnes ud fra: observerede antal + ialt x n x n forventede antal + ialt np 0 n(1 p 0 ) n X 2 = (x np 0) 2 + ((n x) n(1 p 0)) 2 np 0 n(1 p 0 ) = (x np 0) 2 ( 1 + 1 ) n p 0 1 p 0 = (x np 0) 2 np 0 (1 p 0 ) = ( (x np 0 ) np0 (1 p 0 ) ) 2

χ 2 -test: generelt χ 2 -test: k = 2, X 2 -teststørrelsens fordeling Hvorfor χ 2 (1): X i = 1 hvis individ i falder i kasse +, 0 ellers sandsynlighed for at falde i kasse + er p 0 n i=1 X i np 0 np0 (1 p 0 ) N(0, 1) Centrale grænseværdisætning: sum af mange små uafhængige led har en fordeling der ligner normalfordelingen Da X = n i=1 X i er X np 0 np0 (1 p 0 ) N(0, 1) X 2 = ( (X np 0 ) np0 (1 p 0 )) 2 χ 2 (1)

χ 2 -test: generelt χ 2 -test: k = 2, eksempel Partiet Æ fik ved sidste valg 25 % af stemmerne. I en opinionsundersøgelse, hvori 1200 deltager, tilkendegiver 335, at de vil stemme på Æ. Har tilslutningen til partiet ændret sig? Teste hypotesen p = 0.25 Æ andet ialt observeret 335 865 1200 forventet 300 900 1200 Da de forventede antal er > 5, beregnes og p-værdien X 2 = (335 300) 2 1200 0.25 0.75 = 5.44 p-værdi = P(χ 2 (1) 5.44) = 0.0197, så tilslutningen har ændret sig. Da 335/1200 = 27.9%, er Æ gået frem.

χ 2 -test: generelt χ 2 -test: k = 3, eksempel 100 personer bliver spurgt om, hvilket af to vaskepulvere A og B de foretrækker. Resultatet blev: A (x 1 ) B (x 2 ) ved ikke (x 3 ) ialt 36 52 12 100 Spørgsmålet om, at vaskepulverne er lige populære, kan afgøres ved at teste hypotesen (p 1, p 2, p 3 ) = (θ, θ, 1 2θ), hvor parameteren θ ligger i intervallet ]0, 0.5[. Starter med at finde ˆθ, der maksimerer funktionen L(θ) = θ x 1 θ x 2 (1 2θ) x 3 eller, ækvivalent hermed, funktionen l(θ) = ln(l(θ)) = (x 1 + x 2 ) ln(θ) + x 3 ln(1 2θ).

χ 2 -test: generelt χ 2 -test: k = 3, eksempel (fortsat) Maksimum for l(θ) antages i ˆθ = x 1 + x 2. 2n De forventede antal bliver derfor så (e 1, e 2, e 3 ) = n(ˆθ, ˆθ, 1 2ˆθ) = ( x 1 + x 2 2 A B ved ikke ialt observeret 36 52 12 100 forventet 44 44 12 100, x 1 + x 2, x 3 ), 2 De forventede antal >5 så X 2 -testet kan benyttes. f = 3 1 1, så X 2 = 2.90 og p-værdi = P(χ 2 (1) 2.90) = 0.0886. Vi kan derfor ikke afvise, at de to vaskepulvere er lige populære.

χ 2 -test: generelt Goodness of fit test Måling: styrken af jordens magnetfelt (målt i lava) vi måler en kontinuert variabel (ingen kasser vi falder i) Spørgsmål: er X = ln(styrken) normalfordelt? d.v.s.: P(a < X < b) = b 1 a exp{ 1 (x µ) 2} dx 2πσ 2 2σ 2 2163 målinger fra forskellige geologiske perioder x 1, x 2,..., x n, n = 2163

χ 2 -test: generelt Kontinuerte data tælledata Inddeler aksen med ln(magnetstyrker): (, z 1 ], (z 1, z 2 ],..., (z k 1, z k ], (z k, ) Ser blot på hvilket interval ( kasse ) x i falder i: a j = antal blandt x 1,..., x n der falder i kasse j

χ 2 -test: generelt Data styrke antal < 0.15 8 0.15-0.25 23 0.25-0.35 22 0.35-0.55 84 0.55-0.85 143 0.85-1.25 227 1.25-1.85 269 1.85-2.75 398 2.75-4.15 396 4.15-6.25 334 6.25-9.35 170 9.35-14.05 73 14.05-21.05 14 > 21.05 2

χ 2 -test: generelt Histogram taethed 0.0 0.1 0.2 0.3 0.4 2 1 0 1 2 3 ln(styrke)

χ 2 -test: generelt Fraktilsamenligning Fraktilsammenligning N(0,1) fraktiler 2 1 0 1 2 3 2 1 0 1 2 3 ln(styrke)

χ 2 -test: generelt Model Model M 0 : p j sandsynlighed for at falde i kasse j er vilkårlig p j > 0, j p j = 1 (siger ikke noget om fordeling af X ) Model M 1 : p j (µ, σ 2 ) = z j z j 1 1 2πσ 2 exp{ 1 2σ 2 (x µ) 2} dx (X er normalfordelt) Forventede under M 1 : e j = n p j (ˆµ, ˆσ 2 )

χ 2 -test: generelt Forventede styrke antal forventede (obs-forv) 2 /forv < 0.15 8 2.0 18.3 0.15-0.25 23 10.1 16.3 0.25-0.35 22 21.6 0.0 0.35-0.55 84 75.2 1.0 0.55-0.85 143 162.8 2.4 0.85-1.25 227 245.2 1.4 1.25-1.85 269 338.9 14.4 1.85-2.75 398 384.7 0.5 2.75-4.15 396 366.4 2.4 4.15-6.25 334 270.6 14.9 6.25-9.35 170 160.6 0.6 9.35-14.05 73 79.7 0.6 14.05-21.05 14 31.5 9.7 > 21.05 2 13.6 9.9 Test for goodness of fit: X 2 = 92.3 p-værdi: 1 P(χ 2 (14 1 2) 92.3) = 6 10 15 (Cochrans regel!)

χ 2 -test: generelt χ 2 -test: Excel

Fordeling af variansestimat t-fordelingen t-test F -fordelingen F -test Andre anvendelser af chi2-fordelingen modeller for normalfordelte data fordeling af variansestimat t-test F -test generelle modeller fordeling af 2ln(Q)-teststørrelsen

Fordeling af variansestimat t-fordelingen t-test F -fordelingen F -test Fordeling af variansestimat i normalfordeling Lad x 1,..., x n være realisationer af uafhængige identisk N(µ, σ 2 )-fordelte stokastiske variable X 1,..., X n. Som skøn over middelværdien µ benyttes den empiriske middelværdi, gennemsnittet, x = 1 n n i=1 x i N(µ, σ2 n ) og som skøn over variansen σ 2 den empiriske varians, dvs. s 2 = 1 n (x i x ) 2 σ 2 χ 2 (n 1)/(n 1), n 1 så i=1 n 1 σ 2 s2 = n (x i x ) 2 χ 2 (n 1). i=1 De tilsvarende stokastiske variable X og s 2 (X) er uafhængige.

Fordeling af variansestimat t-fordelingen t-test F -fordelingen F -test t-fordelingen Hvis U og Z er to uafhængige stokastiske variable således at U N(0, 1) og Z χ 2 (f )/f, er størrelsen t = U Z t-fordelt med f frihedsgrader og vi skriver t t(f ). Symbolsk kan definitionen af t-fordelingen gengives som t(f ) = N(0, 1) χ 2 (f )/f, hvis vi husker på at nævner og tæller symboliserer uafhængige stokastiske variable. Fordelingen kaldes undertiden Student fordelingen eller Student s t-fordeling.

Fordeling af variansestimat t-fordelingen t-test F -fordelingen F -test t-test Lad x 1,..., x n være realisationer af uafhængige identisk N(µ, σ 2 )-fordelte stokastiske variable X 1,..., X n. Hypotese µ = µ 0, hvor µ 0 er kendt. Hvis σ 2 er ukendt benyttes t-teststørrelsen t(x) = t(x 1,..., x n ) = x µ 0 s 2 /n og p-værdien bliver hvor t t(n 1). p-værdi = 2P(t t(x) ),

Fordeling af variansestimat t-fordelingen t-test F -fordelingen F -test F -fordelingen Lad Z 1 og Z 2 være to uafhængige stokastiske variable så Z i χ 2 (f i )/f i, i = 1, 2. Da er den stokastiske variabel F = Z 1 Z 2 F -fordelt med (f 1, f 2 ) frihedsgrader, eller med f 1 frihedsgrader i tælleren og f 2 frihedgrader i nævneren. Symbolsk er definitionen F (f 1, f 2 ) = χ2 (f 1 )/f 1 χ 2 (f 2 )/f 2, hvor tæller og nævner symboliserer uafhængige stokastiske variable.

Fordeling af variansestimat t-fordelingen t-test F -fordelingen F -test F -test Antag, at man i en model har to uafhængige variansskøn og s 2 1 σ 2 χ 2 (f 1 )/(f 1 ), s 2 2 σ 2 χ 2 (f 2 )/(f 2 ) Rimeligheden af modellen kan da ofte vurderes ved hjælp af F = s2 1 s2 2 F (f 1, f 2 ). Beregning af testsandsynligheden p afhænger af modellen.

Referenser χ 2 -test t-test Blæsild,P. og Kristensen,L.B.(2006):JOKER statistik. Hæfte 10 i serien Matematiske emner, Matematiklærerforeningen. Christensen,E.S.: At træffe sine valg i en usikker verden - eller den statistiske modellerings rolle. Aalborg Universitet. Poulsen,J.R Poulsen, Vestergaard,H. og Lundbye-Christensen,S.: Hvad er meningen? Aalborg Universitet. Blæsild,P. og Kristensen,L.B.(2007):Statistik i løb. Hæfte 11 i serien Matematiske emner, Matematiklærerforeningen.

Referenser (fortsat) Begynderlærebog i statistik Jensen,J.L.(2010):Et Nanokursus i Statistik. Institut for Matematiske Fag, Aarhus Universitet. Gratis programpakke R (kan findes på nettet ved at lave Google-søgningen R. og gå ind under The R Project for Statistical Computing )