IDRÆTSSTATISTIK BIND 2

Transkript

1 IDRÆTSSTATISTIK BIND 2

2 ii Det Naturvidenskabelige Fakultet Aarhus Universitet Reprocenter Preben Blæsild og Jørgen Granfeldt 2001 ISBN Bd.2

3 iii Forord Denne bog er skrevet til brug i et statistikkursus for bachelorstuderende ved Center for Idræt, Aarhus Universitet. Bag bogen ligger samme holdninger både til statistisk analyse og til begynderundervisning i statistik, der primært retter sig mod brugere, som i Blæsild og Granfeldt (2000) Statistik for biologer og geologer. Et vigtigt holdepunkt i statistisk analyse er modelbegrebet. Man vælger en statistisk model, som kan belyse den faglige problemstilling. Det vil sige, at parametrene i modellen kan fortolkes i den faglige problemstilling, og at interessante faglige hypoteser svarer til restriktioner på parametrene. En faglig hypotese afprøves ved at undersøge (teste), om man kan acceptere en reduktion af modellen til en ny model, som er enklere ved at have færre parametre. Gør man sig det klart, kan man hurtigt lære at analysere temmelig komplicerede problemstillinger korrekt. Ydermere bliver analysen til at følge også for folk, som hverken er specialister på det faglige område eller er professionelle statistikere. Et tidsvarende brugerkursus i statistik må benytte EDB og en statistisk programpakke. Ved dette kursus er valgt regnearket Excel og den statistik pakke der under navnet Dataanalyse optræder som et tilføjelsesprogram til Excel, men der er ikke benyttet faciliteter, som er specielle for denne statistik pakke, og bogen kan uden vanskelighed anvendes sammen med andre statistiske programpakker. Argumentet for at benytte Excel er, at regnearket er tilgængeligt på de fleste PC-er imodsætning til mere kostbare og specialiserede statistiske programpakker såsom for eksempel SAS, Genstat og BMDP. Disse programpakker er designet specielt til brug i forbindelse med statistisk analyse og kan derfor udføre beregningerne i meget mere avancerede statistiske modeller end regnearket Excel kan. Disse noter demonsterer forhåbenligt at i forbindelse med et elementært kursus i statistik er Excel et brugbart alternativ. Når man bruger statistiske programpakker i undervisningen bliver modellerne, som beskrevet ovenfor, det faste holdepunkt når man skal orientere sig i udskrifterne. Man kan bruge en programpakke til statistisk analyse, når man har lært dels at specificere modeller i programpakken og dels at teste reduktionen fra én model til en simplere ved at hente relevante oplysninger ud fra udskrifterne fra estimationen i de to modeller.

4 iv Kun få kan lære statistik uden at få metoderne ind gennem fingrene. Vi har derfor valgt både at præsentere, hvordan de enkleste modeller kan regnes på lommeregner, og hvordan de kan regnes ved at orientere sig i udskrifter fra en programpakke. For normalfordelte data vises både for én, to og k observationsrækker, samt én regressionslinje, hvordan modellerne regnes igennem på lommegner, mens en mere kompliceret model som tosidet variansanalyse kun skal kunne klares med henvisning til programudskrifter. Et statistikkursus for studerende, der ikke har et vist kendskab til de mest basale begreber i sandsynlighedsteorien, fremstår for os som en umulighed. I Kapitel 2 introduceres og/eller repeteres disse begreber, der illustreres ved en række eksempler, som er valgt ud fra det princip, at de matematisk skulle være lette at håndtere. Kapitel 3 er at betragte som et katalog vedrørende definition af og egenskaber ved de fordelinger som anvendes i forbindelse med de statistiske modeller i de senere kapitler. Kaptitel 2 gennemgås efter diskussionen i Kapitel 1 af grafiske og numeriske metoder i forbindelse med beskrivende statistik. Herefter fortsættes med modellerne for normalfordelte data i Kapitel 4 idet de hertil relaterede fordelinger fra Kapitel 3 omtales undervejs. Efter adskillige eksempler på statistisk analyse i forbindelse med normalfordelingen i Kapitel 4 diskuteres hovedtrækkene i en analyse af en parametrisk statistisk model i generelle termer i Kapitel 5. Derefter gennemgås Kapitel 6 om multinomialfordelte data og Kapitel 7 om Poissonfordelte data. Bogen slutter med omtale af nogle simple ikke-parametriske test i Kapitel 8. Som nævnt ovenfor foretrækker vi at betragte parametriske statistiske modeller. Formålet med Kapitel 8 er at orientere læserne om at ikke alle deler denne holdning og for at give et kort indblik i de alternative metoder. Det vil være muligt at læse kapitlerne i en anden rækkefølge, men man skal være opmærksom på, at de statistiske grundbegreber som nulhypotese, test, testsandsynlighed, signifikansniveau og så videre gennemgås i forbindelse med Afsnit 4.2. Uden dataeksempler, som udspringer af en faglig problemstilling, bliver en lærebog til et brugerkursus i statistik temmelig uinteressant. En del af eksemplerne er taget fra Andersen (1998) Statistik for Idrætsstuderende med forfatterens tilladelse, hvilket vi er taknemmelige for. Vi vil også gerne takke medarbejdere og studerende ved Center for Idræt, Aarhus Universitet og ved Institut for Idræt, Københavns Universitet, som har stillet data og deres historie til rådighed for bogens eksempler og opgaver. Bogen er blevet brugt ved Idrætsstatistik i efteråret 2000 og bygger på erfaringer fra et lignede kursus i efteråret 1999 og en særlig tak går til Jakob Krabbe Pedersen og Lars Bo Kristensen for deres store indstats som instruktorer på disse to kurser og for deres påvisning af trykfejl. Bogen er skrevet LATEX, og Jacob Goldbach har skrevet de stylefiler i LATEX, som definerer

5 v udseendet af bogen, men derudover har Jacob Goldbach tålmodigt besvaret utallige spørgsmål om LATEX ligesom Frank Allan Hansen, Niels Væver Hartvig og Michael Kjærgård Sørensen velvilligt har assisteret os. I forhold til versionen af bogen fra maj 2001 er der rettet en del trykfejl og nogle få figurer er blevet tilføjet. Vi vil gerne takke Lars Madsen for meget kompetent bistand med LATEX spørgsmål i forbindelse med revisionen og Michael Kjærgård Sørensen for at have produceret de nye figurer. Århus, august 2005 Preben Blæsild og Jørgen Granfeldt

6 vi

7 vii Indhold 1 Data og beskrivende statistik Prik- og pindediagrammer Histogrammer Empiriske størrelser Grupperede data Kvalitative data Flerdimensionale data Anneks til Kapitel Opgaver til Kapitel Begreber fra sandsynlighedsteorien Sandsynlighedsrum Definition af sandsynlighedsmål Regneregler for sandsynligheder Betingede sandsynligheder og uafhængighed Stokastiske variable Diskrete stokastiske variable Kontinuerte stokastiske variable Stokastiske vektorer Diskrete stokastiske vektorer Kontinuerte stokastiske vektorer Marginale fordelinger Uafhængighed Betingede fordelinger Middelværdi og varians Opgaver til Kapitel

8 viii 3 Specielle fordelinger Normalfordelingen og relaterede fordelinger Normalfordelingen Den todimensionale normalfordeling χ 2 -fordelingen t-fordelingen F-fordelingen Diskrete fordelinger Binomialfordelingen Multinomialfordelingen Poissonfordelingen Den hypergeometriske fordeling Den negative binomialfordeling Opgaver til Kapitel Normalfordelte data Fraktilsammenligning Ugrupperede observationer Grupperede data Transformation Anneks til Afsnit Én observationsrække med kendt varians Anneks til Afsnit Hovedpunkter til Afsnit Én observationsrække med ukendt varians Anneks til Afsnit Hovedpunkter til Afsnit To observationsrækker Test for varianshomogenitet Ens varians Forskellig varians Parrede observationer Anneks til Afsnit Hovedpunkter til Afsnit k observationsrækker Test for varianshomogenitet

9 ix Test for ens middelværdier Forskelle og ligheder i behandlingen af to og k observationsrækker Notation og test i forbindelse med en følge af modeller Anneks til Afsnit Hovedpunkter til Afsnit Lineær regression Lineær regression uden gentagelser Lineær regression med gentagelser Hypoteser om regressionsparametrene Korrelation og/eller regression Anneks til Afsnit Hovedpunkter til Afsnit Tosidet variansanalyse Anneks til Afsnit Hovedpunkter til Afsnit Opgaver til Kapitel Indeks I.1 5 Statistisk analyse Data Modelopstilling Modelkontrol Statistisk inferens Likelihood inferens Begreber fra generel testteori Approksimativ likelihood teori Afsluttende bemærkninger Opgaver til Kapitel Multinomialfordelte data Eksempler Inferens i én multinomialfordeling Test af simpel hypotese Uafhængighed af inddelingskriterier Inferens i flere multinomialfordelinger

10 x Homogenitet af flere multinomialfordelinger Fishers eksakte test Test for goodness of fit Anneks til Kapitel Hovedpunkter til Kapitel Opgaver til Kapitel Poissonfordelte data Eksempler Sandsynlighedsteoretiske resultater vedrørende Poissonfordelingen Én observationsrække Inferens i flere fordelinger Poissonmodellen med proportionale parametre Den multiplikative Poissonmodel Anneks til Kapitel Hovedpunkter til Kapitel Opgaver til Kapitel Ikke-parametriske test Fortegnstestet Rangtest Wilcoxons test for én observationsrække Wilcoxons test for to observationsrækker Kruskal-Wallis test Anneks til Kapitel Hovedpunkter til Kapitel Opgaver til Kapitel A Forskellige matematiske begreber A.1 A.1 Notation fra mængdelæren A.1 A.2 Rækker A.3 A.3 Dobbeltintegraler og partiel differentiation A.4 A.3.1 Dobbeltintegraler A.5 A.3.2 Partiel differentiation A.5 B Simulerede fraktildiagrammer B.1

11 xi C Matematiske symboler C.1 D Det græske alfabet D.1 Indeks I.1

12 xii

13 5 Statistisk analyse Statistisk analyse Vi har i Kapitel 4 set adskillige eksempler på statistiske analyser og i disse eksempler er e- stimater og teststørrelser valgt ud fra heuristiske argumenter. Disse valg er dog baseret på en generel metode, der omtales i dette kapitel. Denne metode kan benyttes i andre situationer, hvor valg af estimatorer og teststørrelser ikke kan baseres på heuristiske argumenter. Kapitlet indeholder en beskrivelse af de vigtigste ingredienser i en statistisk analyse samt en præsentation af de basale matematiske og/eller filosofiske begreber, der ligger til grund for de statistiske metoder, vi betragter i disse noter. Næsten alle de statistiske metoder, der er blevet eller vil blive omtalt i noterne, kan faktisk opfattes som specialtilfælde - eller illustrationer - af den generelle metodik, som diskuteres i dette kapitel. Eneste undtagelse er metoderne i Kapitel 8. Formålet med kapitlet er at fremstille de grundliggende begreber og ideer så overskueligt som muligt, og vi har valgt at gøre dette med reference til teorien for én normalfordelt observationsrække med kendt varians i Afsnit 4.2. En nybegynder i statistisk analyse kan betragte kapitlet som udstilling af fundamentale begreber i statistisk analyse, som er blevet og også senere vil blive anvendt og illustreret igen og igen. En mere erfaren læser kan derimod betragte kapitlet som et lille opslagsværk vedrørende begreber og terminologi i statistisk analyse. Afsnit 5.1 vedrører videnskabelige eksperimenter og data. Vi har valgt at fokusere på tre hovedingredienser eller aktiviteter i en statistisk analyse i) modelopstilling ii) modelkontrol iii) statistisk inferens som omtales i Afsnit Statistik inferens baseret på begrebet likelihood diskuteres i Afsnit 5.5 og i Afsnit 5.6 omtales nogle få begreber fra den generelle testteori. Approksimative statistiske metoder omtales i Afsnit 5.7 og endelig indeholder Afsnit 5.8 nogle afsluttende bemærkninger.

14 Modelopstilling 5.1 Data Udgangspunktet for en statistisk analyse er et datasæt x, der er resultatet af et eksperiment, udført med det formål at få indblik i en speciel faglig sammenhæng. Betegnelsen eksperiment skal her forstås i en bred forstand. Data fra idræt kan for eksempel være bestemmelser af kondital, hæmatokritværdier eller andre fysiologiske målinger. Data er ofte indsamlet for at få indblik i, hvorledes træning eller konkurrence påvirker målingerne. En anden form for data er resultater fra konkurrencer, der studeres for at få indsigt i, hvordan forskellige personer eller hold klarer sig i forhold til hinanden eller for at sammenligne præstationer udført under forskellige omstændigheder. 5.2 Modelopstilling Karakteristisk for et datasæt x i et eksperiment er, at det er stokastisk; det vil sige, at hvis man gentager eksperimentet eller målingerne under lignende omstændigheder, bliver resultatet ikke nødvendigvis x. Dette er i modsætning til en deterministisk situation, hvor udfald på forhånd kan bestemmes med sikkerhed. Men selv om udfaldene af eksperimentet ikke kan angives på forhånd er der ofte en regelmæssighed på et højere niveau, som man netop kan erkende, hvis forsøget gentages mange gange. En byggesten i beskrivelsen af et eksperiment er derfor en sandsynlighedsteoretisk model. En sandsynlighedsteoretisk model består af tre komponenter: 1) udfaldsrummet, X, som er samtlige værdier (udfald), som eksperimentet kan få; 2) hændelsessystemet, A, som omfatter alle de hændelser vi vil betragte; og 3) sandsynlighedsmålet, P, som angiver sandsynligheden af alle hændelser i A. Det stokastiske element i et eksperiment beskrives af hændelsessystemet og sandsynlighedsmålet, som beskriver alle hændelser vi er interesserede i og deres sandsynligheder. Vi beskriver ofte det stokastiske ved et datasæt ved at opfatte data x som en realisation af en stokastisk vektor X. Denne stokastiske vektor kan man tænke på som identitetsafbildningen på udfaldsrummet X og dens fordeling som givet ved sandsynlighedsmålet P. Vi indskrænker os til kun betragte diskrete og kontinuerte stokastiske vektorer. Hændelsessystemet vil omfatte alle etpunktsmængder, alle intervaller og alle mængder, der kan dannes udfra dem med de sædvanlige mængdeoperationer, som foreningsmængde, fællesmængde og komplementærmængde. Sandsynlighedsmålene på disse hændelsessystemer kan repræsenteres enten ved deres fordelingsfunktionen F eller deres tæthedsfunktion f. En statistisk model er en parametriseret mængde af sandsynlighedsteoretiske modeller. Sædvanligvis er udfaldsrummene og hændelsessystemerne identiske for alle de sandsynlighedsteo-

15 5.3 retiske modeller, og i det tilfælde kan man tænke på en statistisk model som en sandsynlighedsteoretisk model, hvor sandsynlighedsmålet er blevet erstattet med en parametriseret klasse af sandsynlighedsmål, P = {P ω ω Ω}. Alternativt kan klassen af sandsynlighedsmål repræsenteres med en parametriseret klasse af fordelinger, F = {F ω ω Ω}, eller en parametriseret klasse af tætheder { f( ;ω) ω Ω}. Her er parameteren ω = (ω 1,...,ω k ), og vi antager altså, at Ω, parameterrummet (parametermængden), er en delmængde af R k. Parameteren ω bør vælges, således at den er relevant for det faglige problem, der ligger til grund for eksperimentet. Det vil sige, at parameteren skal vælges, således at udsagn vedrørende det faglige problem kan formuleres ved hjælp af ω. Med undtagelse af modellerne i Kapitel 8 er alle de statistiske modeller, der betragtes i disse noter, på formen Vores foretrukne repræsentation af sandsynlighedsmålene er via tætheder, og vi kalder funktionen (X,A ;P) = (X,A ;{P ω ω Ω}). X Ω R (x,ω) f(x;ω) (5.1) for modelfunktionen. Modelfunktionen er tætheden som funktion af både udfaldet x og parameteren ω. For at gøre de matematiske overvejelser lettere vil vi antage, at parametermængden Ω kan vælges som et område i R k ; det vil sige, at Ω er en åben 1 og sammenhængende 2 delmængde af R k. Vi har nu fået fastlagt de termer og den notation vi vil bruge i omtalen af statistiske modeller. Modelopstilling opfatter vi som den proces, hvor man identificerer komponenterne i den statistiske model: udfaldsrum, hændelsessystem og klassen af fordelinger. Det er sædvanligvis uproblematisk at bestemme sig for udfaldsrummet, og dermed er hændelsessystemet også givet. Det væsentligste arbejde er i forbindelse med identifikation af den parametriserede klasse af fordelinger, som man vil betragte. Det betyder også, at man i omtalen af modellerne ofte undlader at nævne hele triplet (X,A ;{P ω ω Ω}), men fokuserer på fordelingerne {P ω ω Ω}. Endda går man ofte så vidt, at man nøjes med at specificere parametermængden Ω, idet både udfaldsrum, hændelsessystem og fordelingsklasse er underforstået. I arbejdet med at identificere en klasse af fordelinger inddrager man almindelig og specifik viden om forsøgsomstændighederne og undertiden erfaringer fra statistiske analyser af lignende forsøg. Sædvanligvis er de indledende grafiske procedurer, der omtales i Kapitel 1, særdeles 1 Ω er åben, hvis et vilkårligt punktω Ω er centrum for en kugle, der helt er indeholdt i Ω. 2 Ω er sammenhængende, hvis to vilkårlige punkter ω og ω i Ω kan forbindes med hinanden ved hjælp af linjestykker, der alle er indeholdt i Ω.

16 Modelkontrol nyttige i forbindelse med modelopstilling. Dette trin i en statistisk analyse kræver ofte en så betydelig indsigt i den faglige sammenhæng, at et samarbejde mellem fagmanden fra idræt og statistikeren er påkrævet. 5.3 Modelkontrol Dette punkt i en statistisk analyse vedrører vurdering af rimeligheden af den opstillede statistiske model. Det undersøges, om data x strider mod en eller flere væsentlige konsekvenser af modellen. Hvis dette er tilfældet, forkastes modellen og en ny opstilles; hvis ikke, er man klar til at gå videre til næste punkt i analysen, statistisk inferens. Bemærk, at man ved den skitserede procedure på ingen måde opnår sikkerhed for, at modellener korrekt. Det er vanskeligt at give en generel beskrivelse af dette punkt i en statistisk analyse, idet metoderne dels afhænger af modellen og dels af de betragtede aspekter ved modellen. Desuden skal det understreges, at modelkontrol ikke er begrænset til de indledende faser af en statistisk undersøgelse. I mange modeller, for eksempel i regressionsmodeller, sker den væsentligste del af modelkontrollen efter, at man har estimeret i modellen. Som det fremgår af næsten alle de følgende kapitler, indgår såvel grafiske som numeriske undersøgelser i kontrollen af en model. Eksempel 4.1 (Fortsat) Ved opstillingen af en model for data x som består af de 15 målingerx 1,...,x 15 af laktat koncentrationen i den samme blodprøve med en kendt koncentration på 80 mg/l benytter vi oplysningen om, at erfaringsmæssigt kan sådanne målinger betragtes som normalfordelte med en spredning på 5mg/l. Vi opfatter derfor de 15 målinger som realisationer af uafhængige og identisk fordelte stokastiske variable X 1,...,X 15. Vi betragter altså modellen X i N(µ,σ 2 0), i = 1,...,n, hvor n = 15 og σ0 2 = 25. Parameteren µ varierer i R, og da de stokastiske variable er uafhængige er modelfunktionen f(x; µ) = n i=1 1 2πσ0 2 ( 1 = 2πσ0 2 e 1 2σ 0 2 (x i µ) 2 ) n 2 e 1 2σ 2 0 n i=1(x i µ) 2. (5.2) Modellen kontroleres ved hjælp af en fraktilsammenligning, som beskrevet i Afsnit 4.1.

17 Statistisk inferens Formålet med en statistik analyse er at opnå indsigt i den faglige problemstilling, der gav anledning til eksperimentet. Ved modelopstillingen blev parameteren ω valgt, således at den repræsenterer de aspekter ved det faglige problem, som er af speciel interesse. Statistisk inferens vedrører spørgsmålet om at formulere udsagn om parameteren ω - og dermed om det faglige problem - på baggrund af data x, udfaldet af eksperimentet. Disse udsagn har som formål at angive, i hvilken grad de forskellige parameterværdier ω, eller rettere de tilsvarende fordelingsfunktioner F ω (eller tæthedsfunktioner f( ; ω)), kan anses for at give en rimelig beskrivelse af data x. Estimationsteori og testteori anses traditionelt som de vigtigste discipliner i statistisk inferens. I estimationsteorien søges en afbildning ω ω ω : X Ω x ω ω ω(x), (5.3) der til data x tilordner en bestemt parameterværdi ω ω ω(x), se Figur 5.1. Denne værdi omtales som estimatet for (skønnet over) parameteren ω. Den tilsvarende stokastiske vektor ω ω ω(x) omtales som en estimator for ω. Vi vil ofte bruge notationen ω ω ω ω eller ω ω ω ω til at antyde, at ω ω ω er et estimat for ω. Figur 5.1 Illustration af en estimator ω ω ω.

18 Statistisk inferens Det er ofte en del af en statistisk analyse at undersøge, om en enklere statistiske model end den, der som udgangspunkt blev opstillet, giver en tilfredsstillende beskrivelse af data. Det kan netop være på den måde, man formulerer og besvarer et relevant fagligt spørgsmål. Lad Ω 0 betegne en delmængde af parameterrummet Ω. Hypotesen H 0 : ω Ω 0 (5.4) repræsenterer da en reduktion af den statistiske model. Hvis Ω 0 kun har ét element ω 0, omtales hypotesen som en simpel hypotese eller som en punkthypotese. I modsat fald betegnes hypotesen som sammensat. Testteorien angiver metoder til at vurdere, om hypotesen H 0 er rimelig eller ej på grundlag af data x. Matematisk set er et test blot en opdeling af værdimængden X i to disjunkte mængder R = {x X : H 0 forkastes på grundlag af x} A = {x X : H 0 forkastes ikke på grundlag af x}, (5.5) der betegnes som henholdsvis forkastelses- og acceptområdet for H 0. Mængden R (ikke at forveksle med de reelle tal R) omtales undertiden også som det kritiske område for H 0. Ofte fås den betragtede opdeling af værdimængden X som beskrevet på følgende måde, se også Figur 5.2: Lad T være en afbildning af X ind i de reelle tal og lad T R og T A være en opdeling af værdimængden T = T(X ) i to disjunkte mængder. Hvis R = T 1 (T R ) = {x X : T(x) T R } A = T 1 (T A ) = {x X : T(x) T A }, (5.6) omtales T som en testor af hypotesen H 0. Værdien T(x) af T svarende til data x omtales som teststørrelsen. Ud fra heuristiske argumenter er det ofte muligt at angive estimatorer og testorer i simple, konkrete situationer. Imidlertid er det naturligvis af værdi at have en general metodik, baseret på simple principper, der anviser estimatorer og testorer også i mere komplicerede situationer. Den metodik, vi skal omtale i det følgende, baserer sig på likelihood funktionen, som introduceres i det næste afsnit. De hertil hørende størrelser omtales som henholdsvis maksimum likelihood estimatoren og likelihood ratio testoren.

19 Likelihood inferens Figur 5.2 Illustration af en testor T for hypotesen H 0. Ideerne bag likelihood inferens og de første grundliggende udviklinger af dette begreb skyldes den engelske genetiker R. A. Fisher. Likelihood inferens er baseret på likelihood funktionen, som vi nu introducerer og diskuterer. Fra formuleringen af den statistiske model i Afsnit 5.2 ses det, at for fast værdi af parameteren ω er modelfunktionen f(x; ω) tæthedsfunktionen for den stokastiske vektor X. Hvis P ω betegner sandsynlighedsmålet svarende til tæthedsfunktionen f(x;ω) har vi derfor, at f(x;ω) = P ω (X = x), (5.7) hvis X er diskret. Hvis X er kontinuert er relationen mellem f(x;ω) og P ω givet ved hvor I x er en lille mængde omkring x, hvis indhold er dx. f(x;ω)dx P ω (X I x ), (5.8) For fast værdi af ω beskriver modelfunktionen altså sandsynlighederne knyttet til alle mulige realisationer af X. Data x er imidlertid en bestemt og fast realisation af X, og da vi ønsker at udtale os om forskellige værdier af ω i lys af data x, kunne vi prøve at betragte modelfunktionen som funktion af ω for fastholdt x. Vi har da stadig fortolkningen, at f(x; ω) er sandsynligheden af observationen x, hvis parameteren er ω. Det har vi direkte via (5.7), hvis X er diskret, eller

20 Likelihood inferens via fortolkningen i (5.8), hvis X er kontinuert. I den forstand er f(x;ω) et udtryk for troligheden eller rimeligheden af ω i lys af data x. R.A. Fisher valgte termen likelihood, fordi likelihood i lighed med probability i engelsk daglig tale bruges til at udtrykke grader af tiltro. Ved at vælge en anden term end probability understregede Fisher, at vi ikke har at gøre med sandsynligheder på parametrene. Termen likelihood er ikke oversat til dansk, og vi kalder f(x;ω) som funktion af ω for likelihood funktionen og betegner den L(ω) = f(x;ω) ω Ω, (5.9) idet vi underforstår afhængigheden af de observerede data. Men hvis vi ønsker at understrege, at vi betragter funktionen svarende til data x, skriver vi L(ω;x) i stedet for L(ω). Et eksempel på en likelihood funktion kan ses i Figur 5.3. Figur 5.3 Likelihood funktionen L(µ) (ganget med ) for middelværdien µ i én normalfordelt observationsrække med kendt varians (σ0 2 = 25) for data i Eksempel 4.1. Likelihood funktionen laver en ordning i parametermængden. Hvis vi et øjeblik betragter kun to parameterværdier ω 1 og ω 2, og på baggrund af data x ønsker at vælge, hvilken af de to parameterværdier, der bedst forklarer data, må det blive den, som har den største værdi af likelihood funktionen L(ω), fordi det er den som gør data mest sandsynlig. Vi siger, at værdien ω 1 er mere likely end ω 2 i lys af data x, hvis L(ω 1 ) > L(ω 2 ). På dansk vil vi undertiden bruge

21 ordet trolig i denne tekniske betydning, og altså sige, at ω 1 er mere trolig end ω 2 i lys af data x, hvis L(ω 1 ) > L(ω 2 ). Likelihood funktionens ordning af parametermængden leder umiddelbart til, at hvis vi vil angive én parameterværdi, som er i bedst overensstemmelse med data x, må det blive den værdi, som gør de observerede data mest sandsynlige, det vil sige den værdi, hvor likelihood funktionen antager sit maksimum. Vi har hermed introduceret begrebet maksimum likelihood estimation. Hvis der eksisterer en entydigt bestemt værdi ˆωˆωˆω, for hvilken likelihood funktionen L( ) antager sit maksimum, det vil sige L( ˆωˆωˆω) > L(ω) for alle ω Ω således at ω ˆωˆωˆω, kaldes denne værdi ˆωˆωˆω af parameteren for maksimum likelihood estimatet for ω. Med andre ord er maksimum likelihood estimatet ˆωˆωˆω = ( ˆωˆωˆω(x)) den mest trolige værdi af parameteren ω i lys af data x. Den tilsvarende stokastiske vektor ˆωˆωˆω(X) omtales som maksimum likelihood estimatoren. Undertiden er det lettere at maksimere log likelihood funktionen 5.9 l(ω) = lnl(ω) ω Ω, (5.10) end selve likelihood funktionen L( ). I de modeller, vi betragter, er likelihood funktionen (mindst) to gange differentiabel med kontinuerte (partielle) afledede, og det letter arbejdet med at finde den værdi, hvor likelihood funktionen antager sit maksimum. Da parametermængden er antaget at være et område, kan ˆωˆωˆω = ( ˆω 1,..., ˆω k ) findes som en løsning til ligningerne l ω j (ω) = 0, j = 1,2,...,k. (5.11) Disse ligninger, der kaldes likelihood ligningerne, kan undertiden løses eksplicit, men i nogle tilfælde må man benytte numeriske procedurer for at finde ˆωˆωˆω. Desuden må man også vurdere om en løsning til likelihood ligningerne er et punkt, hvor likelihood funktionen antager sit maksimum. Ofte består data x af n enkeltmålinger x 1,...,x n, det vil sige x = (x 1,...,x n ). Hvis vi som model kan benytte, at x 1,...,x n er udfald af uafhængige og identisk fordelte stokastiske variable X 1,...,X n, hvor tæthedsfunktionen for X i er f(x i ;ω),i = 1,...,n, vil vi omtale data som én observationsrække fra fordelingen F ω. Antagelsen om uafhængighed af de stokastiske variable medfører - som bekendt fra sandsynlighedsteorien - at tæthedsfunktionen for X er produktet af tæthedsfunktionerne for X i, i = 1,...,n. Likelihood funktionen L( ) og log likelihood funktionen l( ) bliver derfor i denne situation henholdsvis L(ω) = n i=1 f(x i ;ω) (5.12)

22 Likelihood inferens og l(ω) = n i=1 ln f(x i ;ω). (5.13) Eksempel 4.1 (Fortsat) Af (5.2) ses, at likelihoodfunktionen for µ er ( 1 L(µ) = 2πσ0 2 ) n 2 e 1 2σ 2 0 se Figur 5.3, og dermed at log likelihood funktionen for µ er l(µ) = n 2 ln(2πσ 2 0) 1 2σ 2 0 n i=1(x i µ) 2, (5.14) n i=1 (x i µ) 2. (5.15) Differentieres log likelihood funktionen l i (5.15) én gang med hensyn til µ og sættes lig med 0, fås likelihood ligningen 0 = dl dµ (µ) = 1 n σ0 2 (x i µ). i=1 Løses ligningen med hensyn til µ fås løsningen ˆµ = x = 1 n som maksimerer l. Maksimum likelihood estimatet for middelværdien µ er gennemsnittet af observationerne. Som nævnt i forbindelse med Eksempel 4.1 er dette et intuitivt rimeligt estimat. Det er en realisation af den stokastiske variabel X = 1 n n i=1 n i=1 x i, X i N(µ, σ 0 2 n ), som har den rigtige middelværdi µ og en varians σ0 2 /n, som aftager med antallet af observationer. Vi giver nu en diskussion af testteori baseret på likelihood funktionen. Indledningsvis bemærker vi to ting. For det første er værdien af likelihood funktionen beregnet i maksimum likelihood estimatet, L( ˆωˆωˆω(x)), en funktion af data x, og dermed en stokastisk variabel. For det andet er fortolkningen af L( ˆωˆωˆω(x)), at det er den maksimale sandsynlighed for data x i den givne statistiske model. Antag, at vi i en statistisk model med parametermængde Ω og på grundlag af data x ønsker at undersøge, om data kan beskrives med delmodellen Ω 0, hvor Ω 0 betegner en delmængde af Ω, det vil sige Ω 0 Ω.

23 5.11 Vi bruger sprogbrugen, at vi ønsker at teste hypotesen H 0 : ω Ω 0. Lad ˆωˆωˆω(x) betegne maksimum likelihood estimatet for ω i den oprindelige model, og lad ˆωˆωˆω 0 (x) betegne maksimum likelihood estimatet for ω under H 0, det vil sige i den statistiske model med parametermængde Ω 0. Likelihood ratio teststørrelsen Q(x) defineres da som: Q(x) = max L(ω) ω Ω 0 max L(ω) = L( ˆωˆωˆω 0 (x)) L( ˆωˆωˆω(x)). (5.16) ω Ω Man bemærker, at Q(x) 1 fordi det er samme funktion, der maksimeres i tæller og nævner og at der maksimeres over en mindre mængde i tællereren. Desuden er 0 < Q(x), da Q(x) er et forhold mellem to sandsynligheder. Alt i alt er altså 0< Q(x) 1. Vi ser dernæst på fortolkningen af likelihood ratio teststørrelsen. Q(x) er troværdighedsforholdet mellem den mest trolige værdi ˆωˆωˆω 0 af ω under H 0 og den mest trolige værdi ˆωˆωˆω af ω overhovedet. Hvis Q(x) 1 er L( ˆωˆωˆω 0 ) L( ˆωˆωˆω); der eksisterer altså en værdi af parameteren under hypotesen, der er næsten ligeså trolig som den mest trolige værdi overhovedet, og vi har derfor ingen grund til at betvivle H 0 i denne situation. Hvis derimod Q(x) 0 er L( ˆωˆωˆω 0 ) << L( ˆωˆωˆω); den mest trolige værdi under hypotesen er altså meget mindre trolig end den mest trolige værdi overhovedet, og derfor må vi betvivle H 0. Med andre ord, observationen x er kritisk for H 0 hvis Q(x) er lille. Helt på samme måde som likelihood funktionen lavede en ordning i parametermængden Ω, laver likelihood ratio teststørrelsen en ordning i udfaldsrummet X. Vi siger, at x 1 er mere (eller sige så) kritisk for H 0 som x 2, hvis Q(x 1 ) Q(x 2 ). Begrundelsen er, at Q(x) er forholdet mellem den maksimale sandsynlighed for data under hypotesen relativt til den maksimale sandsynlighed under modellen. For at få et indtryk af hvor lille Q(x) skal være, før vi forkaster H 0, betragtes mængden af alle mulige udfald y af eksperimentet, som er mindst lige så kritiske for H 0 som det observerede udfald x, det vil sige mængden {y X : Q(y) Q(x)}. (5.17) For at vurdere størrelsen af mængden i (5.17) relativt til størrelsen af X benytter vi sandsynlighedsteorien.

24 Likelihood inferens Hvis hypotesen H 0 er simpel, det vil sige hvis Ω 0 = {ω 0 }, omtales sandsynligheden for mængden i (5.17), ε(x) = P ω0 ({y X : Q(y) Q(x)}), (5.18) som testsandsynligheden for likelihood ratio testet. (Synonymt bruges betegnelserne det observerede signifikansniveau eller p-værdien.) Det ses af (5.18), at testsandsynligheden er sandsynligheden - beregnet under H 0 - for de mulige udfald y, der er mindst lige så kritiske for H 0 som det observerede udfald x. Er ε(x) lille, er der således ikke stor sandsynlighed for at få udfald, der er mindst lige så kritiske for H 0 som det observerede udfald x, og derfor forkaster vi H 0. Altså hvis ε(x) er lille forkastes H 0. Er ε(x) stor, er der stor sandsynlighed for udfald, der er mindst lige så kritiske som x, og følgelig er der ingen grund til at forkaste H 0 ; vi siger da, at H 0 accepteres. Altså hvis ε(x) er stor accepteres H 0. Bemærk, at accept af H 0 på ingen måde betyder, at vi har bevist (i matematisk forstand) rigtigheden af H 0, men blot at vi i det nærværende forsøg ikke har kunnet konstatere signifikante (betydningsfulde) afvigelser fra H 0. Lad os for en sikkerheds skyld fremhæve logikken bag det argument, der implicerer, at hypotesen H 0 forkastes, hvis testsandsynligheden ε(x) er lille. Statistikeren betragter to præmisser: 1) enten er hypotesen H 0 falsk eller også er en hændelse med lille sandsynlighed indtruffet og 2) en hændelse med lille sandsynlighed indtræffer ikke. Ud fra disse to præmisser drages konklusionen hypotesen H 0 er falsk. Et spørgsmål er stadig ubesvaret. Hvor lille skal testsandsynligheden ε(x) være, før vi forkaster H 0? Principielt afhænger svaret af hypotesens natur. For eksperimentelt at afvise velrenommérede videnskabelige hypoteser, som for eksempel Newtons 2. lov, kræves, at der konstateres stærkt signifikante afvigelser fra hypotesen, det vil sige at testsandsynligheden skal være meget lille, for eksempel 0.1%. Mindre velbegrundede hypoteser, såsom at koncentrationen af laktat i en blodprøve er 80mg/l, forkastes for langt større testsandsynligheder (1 eller 5%). Likelihood ratio testet med signifikansniveau α forkaster hypotesen H 0, hvis ε(x) α, (5.19) hvilket medfører, at det tilsvarende forkastelsesområde (eller kritiske område) R α er R α = {x X : ε(x) α} (5.20) samt at det tilsvarende acceptområde er A α = {x X : ε(x) > α}. (5.21) I den statistiske litteratur er det foretrukne signifikansniveau traditionelt 5%, men også niveauet 1% benyttes i forbindelse med mere velbegrundede hypoteser. I dette kursus vil vi i forbindelse med eksempler og opgaver benytte test på 5%-niveau, medmindre andet er nævnt.

25 5.13 Vi afslutter dette afsnit med nogle bemærkninger vedrørende likelihood ratio testet i det tilfælde, hvor hypotesen H 0 er sammensat, det vil sige hvor delmængden Ω 0, der specificerer hypotesen, har mere end ét element. I dette tilfælde defineres testsandsynligheden for likelihood ratio testet som ε(x) = sup ω Ω 0 P ω ({y X : Q(y) Q(x)}), (5.22) altså som den største af sandsynlighederne - under H 0 - for mængden i (5.17). Forkastelses- og acceptområdet defineres også i dette tilfælde som i formlerne (5.20) og (5.21). Temmelig ofte er det vanskeligt (eller umuligt) at beregne de eksakte værdier af testsandsynligheden for likelihood ratio testet som defineret i (5.18) eller (5.22). I Afsnit 5.7 diskuterer vi, hvorledes man beregner approksimationer for testsandsynlighederne i sådanne situationer. Eksempel 4.1 (Fortsat) Vi betragter nu test af hypotesen H 0 : µ = µ 0 = 80. Likelihood ratio teststørrelsen Q(x) er forholdet mellem maksimum af likelihood funktionen under H 0 og maksimum af likelihood funktionen uden H 0 s begrænsning. Q(x) = max L(µ) µ H 0 max L(µ) = L(µ 0 ) L( x ). µ R Hvis Q(x) er meget lille, forklares observationen meget dårligere under H 0 end under den oprindelige model uden restriktioner på µ. Så de værdier, der er mere kritiske for H 0 end observationen x, er {y Q(y) Q(x)}. Igen ser man af tekniske grunde på lnq. lnq(x) = l(µ 0 ) l( x ) = 1 2σ0 2 [ n (x i µ 0 ) 2 n (x i x ) 2 ] i=1 i=1 = n( x µ 0 ) 2 2σ0 2 = 1 2 u2 (x), (5.23) hvor u(x) netop er teststørrelsen (4.5), som blev udledt i Eksempel 4.1. De observationer, som er mere kritiske for H 0 end observationen x er {y Q(y) Q(x)} = {y 2lnQ(y) 2lnQ(x)} = { y u 2 (y) u 2 (x) } = {y u(y) u(x) }. og man ser, at likelihood ratio testet for H 0 er det samme som testet baseret på (4.5) u(x) = u(x 1,...,x n ) = x µ 0 σ 2 0 /n.

26 Begreber fra generel testteori 5.6 Begreber fra generel testteori I Afsnit 5.5 har vi diskuteret et specielt signifikanstest, nemlig likelihood ratio testet. Som nævnt er det undertiden vanskeligt at finde testsandsynligheden for dette test og derfor også de tilsvarende forkastelses- og acceptområder. I sådanne situationer betragter man sommetider alternative teststørrelser, der findes ved hjælp af heuristiske argumenter og/eller sandsynlighedsteoretiske overvejelser. I dette afsnit giver vi en kortfattet omtale af egenskaber ved en generel teststørrelse T som defineret i Afsnit 5.4. Bemærkningerne er derfor gyldige for såvel likelihood ratio testet som for de alternative test. Signifikanstestet af hypotesen H 0 : ω Ω 0 svarende til testoren T siges at have signifikansniveau α (eller kort, T er et test på niveau α), hvis sup P ω (X R) = α, (5.24) ω Ω 0 altså hvis den største sandsynlighed for at forkaste H 0, det vil sige den største sandsynlighed for at X tilhører det kritiske område R - beregnet under H 0 - er α. Med andre ord, signifikansniveauet α for et test er mål for risikoen for at forkaste en sand hypotese. Det er indlysende, at det ville være ønskeligt, at α var 0, men sådanne signifikanstest findes ikke. Det er karakteristisk for statistisk inferens, at det ikke med sikkerhed er muligt at udtale sig, om hypotesen H 0 er sand eller falsk. På dette punkt adskiller statistisk inferens sig fra matematik og logik. I de to sidstnævnte discipliner drager man konklusioner på grundlag af faste præmisser. I statistisk inferens drager man konklusioner på grundlag af data, der betragtes som en realisation af en stokastisk vektor, hvis variation beskrives ved hjælp af en sandsynlighedsteoretisk model. Konklusionerne i statistisk inferens formuleres derfor - naturligvis - ved hjælp af sandsynlighedsteorien. En anden vigtig forskel mellem de tre discipliner består i, at matematik og logik er deduktive, det vil sige, at de slutter fra det generelle til det specielle. I modsætning hertil er statistisk inferens induktiv, idet man her slutter fra det specielle (data) til det generelle (en videnskabelig model). I forbindelse med testteori taler man undertiden om fejl af type I og type II. Disse fremgår af Tabel 5.1. Bemærk, at sandsynligheden for at begå en fejl af type I præcis er signifikansniveauet α. Kvaliteten af et statistisk test afhænger blandt andet af dets evne til at afsløre signifikante afvigelser fra hypotesen H 0, hvilket kan udtrykkes ved styrkefunktionen for testet. Med betegnelserne fra Afsnit 5.4 er styrkefunktionen for testoren T af hypotesen H 0 : ω Ω 0 defineret som pow(ω) = P ω (T T R ),

27 5.15 H 0 forkastes H 0 accepteres H 0 sand type I ingen H 0 falsk ingen type II Tabel 5.1 De forskellige typer af fejl i testteorien. det vil sige, at for enhver værdi af parameteren ω er styrken pow(ω) sandsynligheden - beregnet ved hjælp af sandsynlighedsmålet svarende til ω - for at forkaste hypotesen H 0. Bemærk, at hvis hypotesen er simpel, Ω 0 = {ω 0 }, så er pow(ω 0 ) netop lig med signifikansniveauet α, samt at hvis vi for ω ω 0 lader β(ω) betegne sandsynlighed for fejl af type II - svarende til parameterværdien ω - så er β(ω) = 1 pow(ω). Ideelt set burde værdien af styrkefunktionen for en simpel hypotese H 0 : ω = ω 0 derfor være konstant lig med 1 med undtagelse af værdien i ω 0, som burde være 0. Som nævnt ovenfor findes der imidlertid ikke testorer med en sådan styrkefunktion. Et eksempel på en styrkefunktion er vist i Figur 5.4. Figur 5.4 Styrkefunktionen for u-testet på niveau 5% for hypotesen H 0 : µ = 80. Standardafvigelsen σ er 5, svarende til problemstillingen i Eksempel 4.1. Vi afslutter dette afsnit med at omtale konfidensområder, som er et begreb, hvis definition

28 Begreber fra generel testteori er relateret til testteorien og som ofte benyttes i anvendelser. I lys af data x er (1 α) konfidensområdet for parameteren ω defineret som C 1 α (x) = {ω 0 hypotesen H 0 : ω = ω 0 accepteres ved et signifikanstest på niveau α på grundlag af data x }. (5.25) Hvis parameteren er en-dimensional er området typisk et interval, (1 α) konfidensintervallet. Der er indlysende, at konfidensområdet afhænger af det betragtede test samt det valgte signifikansniveau. Test udføres sædvanligvis på niveau 5%, og de tilsvarende områder er i så tilfælde 95% konfidensområder. En fortolkning af 95% konfidensområder baserer sig på fortolkningen af sandsynligheder som grænseværdier af relative hyppigheder. Antag, at eksperimentet, der resulterede i data x, blev gentaget et uendeligt antal gange og antag, at man for resultatet y af hver gentagelse af eksperimentet beregnede området C 1 α (y). Den sande værdi af parameteren ω ville da være indeholdt i det beregnede område i 95% af gentagelserne. Denne fortolkning er naturligvis ikke så gavnlig, når man står med sit interval C 1 α (x) beregnet på grundlag af data x. Men det er samme fortolkning, som vi har mødt i forbindelse med test. Enten omfatter intervallet C 1 α (x) den sande parameter eller også er der indtruffet en hændelse med en sandsynlighed mindre end α. Undertiden omtales konfidensintervallet for ω som intervalestimatet for ω. Et sædvanligt estimat, for eksempel maksimum likelihood estimatet ˆωˆωˆω(x), udpeger kun én værdi af parameteren i lys af data x. Konfidensintervallet eller intervalestimatet C 1 α (x) er i praksis værdifuldt, fordi det ikke blot udpeger en enkelt værdi af ω men er et udtryk for, hvor meget information data x indeholder vedrørende den ukendte parameter ω. Hvis konfidensintervallet er stort, er der mange værdier af parameteren ω, der giver en rimelig beskrivelse af data x, og i så tilfælde indeholder x begrænset information om ω. Hvis derimod konfidensintervallet er lille, er der relativt få værdier af parameteren, der giver en fornuftig beskrivelse af data x, og x indeholder derfor megen information om værdien af ω. Eksempel 4.1 (Fortsat) For u-testet for hypotesen H 0 : µ = µ 0 er acceptområdet ved et test på niveauα u 1 α/2 u = x µ 0 σ 2 0 /n u 1 α/2 (5.26) og dermed er værdien af styrkefunktionen pow(µ) for u-testet på niveau α beregnet i punktet

29 5.17 µ lig med pow(µ) =1 P µ ( u 1 α/2 X µ 0 σ 2 0 /n u 1 α/2 ) =1 P µ ( u 1 α/2 σ 2 0 /n+µ 0 X u 1 α/2 σ 2 0 /n+ µ 0). Under sandsynlighedsmålet P µ er X N(µ,σ0 2 /n) så pow(µ) =1 (Φ( u 1 α/2 σ0 2/n+ µ 0 µ σ0 2/n ) Φ( u 1 α/2 σ0 2/n+µ 0 µ σ0 2/n )) se Figur 5.4. =1 Φ(u 1 α/2 + µ 0 µ )+Φ( u 1 α/2 + µ 0 µ ), σ0 σ 2/n 0 2/n Af (5.26) fås, at (1 α) konfidensintervallet for µ er x u 1 α/2 σ 2 0 /n µ x + u 1 α/2 σ 2 0 /n. 5.7 Approksimativ likelihood teori Som bemærket i Afsnit 5.5 er det undertiden vanskeligt eller umuligt, at beregne den eksakte værdi af testsandsynligheden ε(x) for likelihood ratio testet i (5.7) eller (5.22). I dette afsnit diskuterer vi, hvorledes testsandsynligheden ε(x) kan approksimeres. Desuden omtales approksimationer af fordelingen af maksimum likelihood estimatoren ˆωˆωˆω = ˆωˆωˆω(X). Bemærk, at testsandsynligheden i (5.18) præcis er værdien af fordelingsfunktionen for likelihood ratio testoren Q(X) beregnet i den observerede værdi Q(x), det vil sige ε(x) = F Q(X) (Q(x)). (5.27) Spørgsmålet om at approksimere testsandsynligheden i (5.18) eller (5.27) er derfor ækvivalent med at finde approksimationer til fordelingen - under H 0 - af likelihood ratio testoren. Lignende bemærkninger gælder i det tilfælde, hvor H 0 er en sammensat hypotese, det vil sige i det tilfælde, hvor testsandsynligheden beregnes ved hjælp af (5.22). Vi indskrænker os her til en detaljeret omtale af resultaterne i det tilfælde hvor parameteren er endimensional, det vil sige k = 1.

30 Approksimativ likelihood teori Approksimationerne, der omtales i det følgende, er baseret på anden ordens Taylor udviklinger af log likelihood funktionen. Disse er gyldige, idet det er antaget, at parameterrummet Ω er et område i R samt at log likelihood funktionen l er mindst to gange differentiabel med kontinuerte (partielle) afledede. Mere præcist har vi l(ω) l( ˆω) =. dl dω ( ˆω)(ω ˆω)+ 1 d 2 l 2 dω 2( ˆω)(ω ˆω)2, (5.28) hvor. = antyder approksimationen, og hvor udtrykket på højre side er Taylor polynomiet af anden grad for l omkring maksimum likelihood estimatet ˆω. Lad j(ω;x) betegne tallet j(ω;x) = d2 l dω2(ω;x). (5.29) Idet ˆω er en løsning til likelihoodligningen (5.11), det vil sige dω dl ( ˆω) = 0, fås af (5.28) at l(ω) l( ˆω). = 1 2 j( ˆω;x)( ˆω ω) 2. (5.30) Funktionen l( ) = l( ) l( ˆω) kaldes den normerede log likelihood funktion og tallet j(ω;x) omtales som den observerede information svarende til data x. Middelværdien af den tilsvarende stokastiske variable j(ω;x), det vil sige kaldes den forventede information eller Fishers informationen. i(ω) = E ω { j(ω;x)}, (5.31) For at forklare, hvorfor ordet information benyttes i denne sammenhæng, bemærker vi, at det fra (5.30) ses, at den normerede log likelihood funktion l i en omegn af ˆω kan approksimeres ved parablen p(ω) = 1 2 j( ˆω;x)( ˆω ω) 2, (5.32) se Figur 5.5. I (5.32) er j( ˆω;x) > 0, idet ˆω er et maksimumspunkt for l. Jo større j( ˆω;x) er, jo mere koncentrerer denne parabel sig om punktet ˆω, og kun for værdier af ω, der ligger meget tæt på ˆω, er l(ω) (eller L(ω)) af samme størrelsesorden som l( ˆω) (eller L( ˆω)). Følgelig er j( ˆω;x) et mål for den information, som data x giver om værdien af den ukendte parameter ω. Vi vender os nu mod en diskussion af, hvorledes fordelingen af henholdsvis maksimum likelihood estimatoren ˆω = ˆω(X) og likelihood ratio testoren Q = Q(X) kan approksimeres. Det kan vises, at fordelingen af ˆω - beregnet under fordelingen svarende til parameteren ω - kan approksimeres ved normalfordeling med middelværdi ω og varians i(ω) 1, som er den inverse til den forventede information i(ω). Dette resultat skrives på følgende måde: ˆω N(ω,i(ω) 1 ). (5.33)

31 5.19 Figur 5.5 Øverst likelihood funktionen svarende til observationen x = 8 i binomialmodellen med sandsynlighedsparameter ω og antalsparameter n = 20. Nederst den normerede log likelihood funktion l( ) = l( ) l( ˆω) og den approksimerende parabel p( ).

32 Approksimativ likelihood teori Approksimationen kan vises at være speciel god i det tilfælde, hvor data x er én observationsrække x 1,...,x n fra en fordeling og hvor n er stor. Af resultaterne i Afsnit og (5.33) fås at ˆω ω i(ω) 1 N(0,1) og dermed følgende approksimation: i(ω)( ˆω ω) 2 χ 2 (1). (5.34) Yderligere kan man undertiden i dette udtryk erstatte den forventede informationsmatriks i(ω) med den forventede eller den observerede informationsmatriks beregnet i ˆω, det vil sige med i( ˆω) eller j( ˆω) = j( ˆω; x). Benyttes den sidstnævnte, opnås approksimationen j( ˆω)( ˆω ω) 2 χ 2 (1). (5.35) Igen er denne approksimation god, hvis x er én observationsrække x 1,..., x n fra en fordeling og n er stor. I stedet for at approksimere fordelingen for likelihood ratio testoren Q(X), betragter man sædvanligvis approksimationer for fordelingen af størrelsen 2 ln Q(X). Man har følgende approksimative resultat for fordelingen af 2lnQ(X) i det tilfælde, hvor hypotesen H 0 er en simpel hypotese, der siger, at værdien af parameteren er ω 2lnQ(X) χ 2 (1). (5.36) Approksimationen er en konsekvens af formlerne (5.30) og (5.35), idet man ved hjælp af disse formler finder, at 2lnQ(X) = 2ln L(ω) L( ˆω) = 2(l(ω) l( ˆω)). = j( ˆω)( ˆω ω) 2 χ 2 (1). (5.37) Små værdier af likelihood ratio testoren Q er kritiske for H 0, hvilket er ækvivalent med at store værdier af 2lnQ(X) er kritiske. Af formel (5.36) får vi derfor følgende vigtige approksimation for testsandsynligheden for likelihood ratio testet for den simple hypotese ω ε(x) =. 1 F χ 2 (1)( 2lnQ(x)), (5.38)

33 5.21 idet vi ved hjælp af (5.18) finder, at ε(x) = P ω (Q(X) Q(x)) = P ω ( 2lnQ(X) 2lnQ(x)) = 1 P ω ( 2lnQ(X) < 2lnQ(x)). = 1 F χ 2 (1) ( 2lnQ(x)). Her har vi ved. = brugt formel (5.36) samt den kendsgerning, at fordelingsfunktionen for χ 2 (1)- fordelingen er kontinuert. Eksempel 4.1 (Fortsat) Af formel (5.23) ses, at 2lnQ(x) = 2(l(ω) l( x )) = u 2 (x) χ 2 (1), idet u(x) N(0, 1). I dette tilfælde gælder resultatet i (5.37) altså eksakt og ikke blot approksimativt. I det generelle tilfælde, hvor parameteren ω er k-dimensional gælder der for likelihood ratio testoren af en sammensat hypotese H 0 : ω Ω 0, hvor Ω 0 Ω, approksimationer analoge til (5.36) og (5.38). For at formulere disse resultater behøver vi følgende notation. En hypotese H 0 : ω Ω 0 siges at have d frie parametre θ 1,...,θ d, hvis der eksisterer et område Θ R d og en en-entydig afbildning af Θ på Ω 0, det vil sige Θ R d Ω R k θ = (θ 1,...,θ d ) ω(θ) = (ω 1 (θ),...,ω k (θ)). (5.39) Bemærk, at idet vi har antaget, at parameterrummet Ω er et område, kan grundmodellen betragtes som en hypotese med de k frie parametre ω 1,...,ω k. Bemærk endvidere, at for en simpel hypotese er d = 0. Under visse regularitetsbetingelser, som stort set altid er opfyldt i praksis, har vi følgende approksimationer for likelihood ratio testoren af en sammensat hypotese med d frie parametre 2lnQ(X) χ 2 (k d), (5.40) og ε(x) =. 1 F χ 2 (k d)( 2lnQ(x)). (5.41) Det ses af (5.40), at antallet af frihedsgrader i den approksimerende χ 2 -fordeling er lig med k d, hvor k er antallet af frie parametre i grundmodellen (svarende til Ω) og d er antallet af frie parametre i hypotesen (svarende til Ω 0 ).

34 Afsluttende bemærkninger 5.8 Afsluttende bemærkninger Som nævnt i indledningen opfatter vi hovedbestanddelene i en statistisk analyse som i) modelopstilling ii) modelkontrol iii) statistisk inferens. Som regel gennemløber analysen en eller flere cycliske faser, idet man ved ii) eller iii) opdager utilfredsstillende træk ved modellen og derfor går tilbage til i) for at revidere den. Som beskrevet i indledningen til kapitlet betragter vi næsten udelukkende statistiske modeller, hvor fordelingerne er en parametriseret familie af fordelinger, og den statistiske inferens er baseret på likelihood funktionen. Vi beskæftiger os med ikke-parametrisk statistik i Kapitel 8. Vi møder ofte den opfattelse, at ikke-parametrisk statistik er fri for forudsætninger, og derfor sikker at bruge. Det er en alvorlig misforståelse. Ofte er et ikke-parametriske test udledt under strenge forudsætninger om uafhængighed, identiske fordelinger, og undertiden endda symmetriske fordelinger. Disse forudsætninger er således fælles for den parametriske statistik, som vi præsenterer her, og den ikke-parametriske statistik, og der er kun et lille skridt til at formulere en parametrisk statistisk model. Det ekstra arbejde med at finde en gyldig parametrisk statistisk model lønner sig som regel i den sidste ende, idet det giver anledning til formulere mere detaljerede matematiske modeller, hvilket som regel er motivationen bag det meste eksperimentelle arbejde i naturvidenskaben, herunder også i idræt. Vi har tidligere i dette afsnit bemærket at det ofte er en del af en statistisk analyse at undersøge, om en enklere statistisk model end den, der som udgangspunkt blev opstillet, giver en tilfredsstillende beskrivelse af data, og vi har skitseret hvordan vi bruger statistiske tests til at vurdere det. Det er her meget vigtigt at være opmærksom på, at man aldrig med statistiske tests kan bevise noget. Man kan kun modbevise i den forstand, at man kan overbevise sig om, at data strider mod en simplere model. Hvis man har begrænsede data kan man risikere ikke at kunne afvise reduktionen til en simpel model, som måske i virkeligheden er forkert. Det er derfor et moralsk krav helst på forhånd at sikre sig at man har en chance for at opdage at en hypotese er falsk. Her kommer forsøgsplanlægning ind i billedet. Denne disciplin beskæftiger sig med, hvorledes man, under hensyntagen til ressourcer, kan tilrettelægge eksperimenter, herunder indsamling af data, for at opnå mest mulig information om den relevante faglige sammenhæng. På grund af kursets omfang kan vi ikke beskæftige os indgående med dette aspekt af en statistisk analyse.

35 5.23 Opgaver til Kapitel 5 Opgave 5.1 Antag at X er binomialfordelt med antalsparameter n og sandsynlighedsparameter p, X b(n, p), det vil sige at P(X = x) = samt at x er en observation af X. ( ) n p x (1 p) n x, x x = 0,...,n, a) Vis, at log likelihood funktionen for p er ( ) n l(p) = ln + xln p+(n x)ln(1 p). x b) Vis, at likelihood ligningen for p er samt at x p n x 1 p = 0 ˆp = ˆp(x) = x n. c) Vis ved hjælp af resultaterne i Afsnit 3.2.1, at E ˆp(X) = p og Var ˆp(X) = p(1 p). n Opgave 5.2 Antag, at x 1,...,x n er en observationsrække fra Poissonfordelingen med parameter λ, som har sandsynlighedsfunktion P(X = x) = e λ λ x x!, x = 0,1,... a) Vis, at log likelihood funktionen for λ er hvor x = n i=1 x i. b) Vis, at likelihood ligningen for λ er l(λ) = nλ + x lnλ n i=1 lnx i!, samt at n+ x λ = 0 ˆλ = ˆλ(x) = x = x n.

36 5.24 Opgaver c) Vis ved hjælp af resultaterne i Afsnit idet x po(nλ) - at E ˆλ(X) = λ og Varˆλ(X) = λ n.

37 6 Multinomialfordelte data Multinomialfordelte data Multinomialfordelingen kan introduceres på følgende måde. Betragt et eksperiment for hvilket de følgende fire betingelser er opfyldt: a) Eksperimentet består af n identiske delforsøg. b) Hvert delforsøg kan resultere i præcis én af k hændelser, B 1,...,B j,...,b k. c) Sandsynligheden for de k hændelser er den samme i alle de n delforsøg, P(B 1 ) = π 1,...,P(B j ) = π j,...,p(b k ) = π k. d) Udfaldene af de n delforsøg er uafhængige. Hvis X betegner den k-dimensionale diskrete stokastiske vektor (X 1,...,X j,...,x k ), hvor den j te komponent X j angiver, hvor mange gange hændelsen B j indtræffer i de n delforsøg, er X multinomialfordelt med antalsparameter n og sandsynlighedsvektor π = (π 1,...,π j,...,π k ), kort X m(n,π). Det kan vises, at sandsynlighedsfunktionen for X er P(X = x) = Her er x = (x 1,...,x j,...,x k ) en vektor, således at n! x 1! x j! x k! πx 1 1 πx j j π x k k. (6.1) x j {0,1,...,n}, j = 1,...,k og k x j = n. j=1 Eksempel 6.1 Følgende tre eksperimenter kan beskrives ved hjælp af multimonialfordelingen. i) Antag, at vi kaster en ærlig mønt 100 gange. Lad x 1 og x 2 være antallet af gange mønten viser henholdsvis plat og krone. Betingelserne a) - d) ovenfor kan da antages at være opfyldte, idet eksperimentet består af n = 100 identiske delforsøg, nemlig et kast med mønten. Hvert af de 100 delforsøg har k = 2 udfald, nemlig plat eller krone, og præcis

38 Eksempler ét af dem indtræffer og det må antages at mønten har samme sandsynlighed, 1/2, for at vise henholdsvis plat og krone i de 100 delforsøg. Desuden må det kunne antages, at udfaldene i de 100 kast med mønten er uafhængige. Sammenfattende kan (x 1,x 2 ) opfattes som udfald af en diskrete stokastisk vektor X = (X 1,X 2 ) som er multinomialfordelt med antalsparameter n = 100 og sandsynlighedsvektor π = (1/2, 1/2). ii) Antag, at vi kaster en ærlig terning n gange. Hvis x i betegner antallet af gange terningen viser i øjne, i = 1,..., 6, kan vektoren (x 1,..., x 6 ) opfattes som som et udfald af den stokastiske vektor X = (X 1,..., X 6 ) m(n,π), hvor π = =(1/6,..., 1/6). iii) Antag, at vi nummererer de 52 spillekort og at vi n gange tilfældigt udtrækker ét af de 52 kort, det vil sige trækker et kort og lægger det tilbage inden vi trækker det næste kort. Lad x i, i = 1,..., 52, være antallet af gange kort nummer i trækkes. Vektoren x = {x i } i=1,...,52 kan da opfattes som et udfald af vektoren X = {X i } i=1,...,52, som er multinomialfordelt med k = 52, antalsparameter n og sandsynlighedsvektor π = {π i } i=1,...,52, hvor π i = 1/52. Indenfor langt de fleste fag er der utallige eksempler på data fra eksperimenter, der opfylder de ovenstående fire betingelser, og for hvilke den statiske analyse derfor - uden videre kontrol - kan foretages ved hjælp af en model baseret på multinomialfordelingen. I Afsnit 6.1 introduceres tre datasæt fra idræt, der benyttes som illustrationer senere i kapitlet. Afsnit 6.2 vedrører statistisk inferens baseret på én multinomialfordeling og illustrerer blandt andet test af simple hypoteser og test af hypotesen om uafhængighed af inddelingskriterier. I Afsnit 6.3 illustreres teorien for en model baseret på flere uafhængige multinomialfordelinger med testet for hypotesen om identitet af sandsynlighedsvektorerne i uafhængige multinomialfordelinger. Alle de nævnte test er baseret på den approksimative likelihood teori, som er omtalt i Afsnit 5.7. Afsnit 6.4 viser et eksempel på anvendelsen af Fishers eksakte test i en situation, hvor forudsætningerne for at bruge den approksimative teori ikke er opfyldt. I Kapitel 4 så vi på forskellige grafiske metoder til kontrol af fordelingsantagelserne i en statistisk model. Undertiden kan denne kontrol suppleres med numeriske test, der som regel omtales som test for goodness of fit. Test af denne type er emnet for Afsnit 6.5. Alle testene i dette kapitel kan foretages ved hjælp af en programpakke. I et anneks til dette kapitel gives eksempler på beregninger foretaget ved hjælp af Excel. 6.1 Eksempler I dette afsnit introduceres tre eksempler, som vil blive brugt til at illustrere statistisk inferens i modeller baseret på multinomialfordelingen.

39 6.3 Eksempel 6.2 Af Tabel 1.3 fremgår det, at antallet af sejre, uafgjorte og nederlag i AB s 33 kampe i Faxe Kondi Ligaen var: sejr uafgjort nederlag i alt Lad x = (x 1,x 2,x 3 ) betegne disse antal, det vil sige x = (14, 10, 9). Som model for resultaterne i de 33 kampe vil vi antage, at x er udfald af en diskret stokastisk vektor X som er multinomialfordelt med antalsparameter n = 33 og sandsynlighedsvektor π = (π 1,π 2,π 3 ), hvor for eksempel π 2 er sandsynligheden for uafgjort. Vi antager altså implicit a) at sandsynligheden for henholdsvis sejr, uafgjort og nederlag er den samme i alle kampene, det vil sige, at disse sandsynligheder afhænger ikke af modstanderen og heller ikke af om en kamp spilles på hjemmebane eller på udebane, b) resultatet i en kamp influerer ikke på resultaterne i de andre kampe. I modellen X m(33,π), svarer hypotesen H 0 : π = (1/3,1/3,1/3) til at for AB er sandsynligheden den samme for at vinde, spille uafgjort eller tabe i en tilfældig kamp. Eksempel 6.3 (Andersen 1998) I forskningsprojektet Idræt og Ungdom er 3869 unge klassificeret efter i- drætsaktivitet (timer per uge) og status med hensyn til rygning. Resultatet ses i tabellen nedenfor. rygerstatus timer per uge ryger ikke-ryger idrætsaktivitet Vi kunne naturligvis opskrive de observerede antal som en vektor af længde 10, men det viser sig bekvemt at vælge en notation i overensstemmelse med den måde, observationerne er angivet i den ovenstående tabel. Vi lader derfor x i j angive antallet af unge i den i te kategori af den variable idrætsaktivitet og i den j te kategori af den variable rygerstatus. Med denne notation forekommer det da rimeligt at antage, at matricen {x i j } er en realisation af en stokastisk matriks {X i j }, som er multinomialfordelt med antalsparameter 3869 og sandsynlighedsmatriks {π i j }. Vi vil undersøge spørgsmålet, om de unges rygevaner er uafhængig af idrætsaktiviteten. Lad ρ i betegne sandsynligheden for at en ung tilhører den i te idrætaktivitetskategori og lad tilsva-

40 Inferens i én multinomialfordeling. rende σ j betegne sandsynligheden for at en ung tilhører den j te rygerkategori. Idet π i j betegner sandsynligheden for at ung tilhører den i te idrætaktivitetskategori og den j te rygerkategori, kan spørgsmålet formuleres som en hypotese i multinomialmodellen på følgende måde: H 01 : π i j = ρ i σ j, i = 1,...,5, j = 1,2. (6.2) Eksempel 6.4 I tabellen nedenfor ses antallet af hjemmesejre, uafgjorte og udesejre i de 198 kampe Faxe Kondi Ligaen optalt i henholdsvis første, anden og tredje tredjedel af turneringen. kamp nr. hjemmesejr uafgjort udesejr i alt Lad x i = (x i1,x i2,x i3 ) betegne de observerede antal af henholdsvis hjemmesejre, uafgjorte og udesejre i den i te tredjedel af turneringen. I modellen M 0 : X i m(66,π i ), i = 1,2,3 X 1, X 2 og X 3 er stokastisk uafhængige svarer hypotesen H 01 : π 1 = π 2 = π 3 (= π = (π 1,π 2,π 3 )) til at sandsynlighederne for henholdsvis hjemmesejr, uafgjort og udesejr er den samme i de tre dele af turneringen. 6.2 Inferens i én multinomialfordeling. Lad os indledningsvis repetere de egenskaber ved multinomialfordelingen - omtalt i Afsnit der benyttes i det følgende. En diskret stokastisk vektor X = (X 1,...,X j,...,x k ) er multinomialfordelt med antalsparameter n og sandsynlighedsvektor π = (π 1,...,π j,...π k ), X m(n,π), hvis sandsynlighedsfunktionen for X er P(X = x) = n! x 1! x j! x k! πx 1 1 πx j j π x k k, (6.3)

41 hvor x = (x 1,...,x j,...,x k ) er en vektor, således at x j {0,1,...,n}, j = 1,...,k og k x j = n. j=1 Undertiden vil vi også benytte notationen (X 1,...,X j,...,x k ) m(n,(π 1,...,π j,...π k )) til at angive at X m(n,π). Sandsynlighedsvektoren π tilhører mængden Π = {π R k : π j > 0, j = 1,...,k, k π j = 1}. j=1 Bemærk, at selvom π er en k-dimensional vektor, varierer dens komponenter ikke frit. Kender vi for eksempel π 1,...,π k 1 kan π k beregnes som 1 π 1 π k 1. Med andre ord - i terminologien fra Afsnit har multinomialmodellen k 1 frie parametre. Fra Afsnit ved vi desuden, at middelværdivektoren for X er samt at kovariansmatricen for X har elementerne 6.5 EX = nπ = (nπ 1,...,nπ j,...,nπ k ) (6.4) (Cov X) j j = VarX j =nπ j (1 π j ), j = 1,...,k (6.5) (Cov X) i j = Cov(X i,x j ) = nπ i π j, i j, i, j = 1,...,k. Endelig ved vi, at den marginale fordeling for den j te komponent X j af X er binomialfordelingen med antalsparameter n og sandsynlighedsparameter π j, X j b(n,π j ), j = 1,...,k, det vil sige ( ) n P(X j = x j ) = π x j j (1 π j ) n x j, x j = 0,1,...,n. (6.6) x j (De mest basale egenskaber ved binomialfordelingen er omtalt i Afsnit ) I det følgende får vi flere gange brug for et matematisk resultat, der gives i nedenstående sætning, som vi ikke vil bevise. Sætning 6.1 Antag, at x j > 0 for j = 1,...,k samt at x 1 + +x k = n. Da antager funktionen g : Π R sin maksimale værdi i punktet π π x 1 1 πx j j π x k k ˆπˆπˆπ = ( x 1 n,, x j n,, x k n ). Efter disse indledende bemærkninger er vi nu klar til at betragte den statistiske inferens i multinomialmodellen M 0 : X = (X 1,...,X j,...,x k ) m(n,π).

42 Inferens i én multinomialfordeling. Estimation Af formel (6.3) ses, at likelihood funktionen for π er L(π) = n! x 1! x j! x k! πx 1 1 πx j j π x k k (6.7) og det følger af Sætning 6.1, at maksimum likelihood estimatet for π er π ˆπˆπˆπ(x) = ( x 1 n,, x j n,, x k ); (6.8) n med andre ord er maksimum likelihood estimatet ˆπ j af π j den relative hyppighed, hvormed hændelsen B j indtræffer i de n delforsøg. Fordelingen af ˆπˆπˆπ angives som oftest på følgende måde: n ˆπˆπˆπ = X m(n,π). Hypoteser Hypoteser i multinomialmodellen M 0 testes ved hjælp af approksimative 2lnQ-test som beskrevet i Afsnit 5.7. Som det fremgår af Afsnit 5.7, bestemmes antallet af frihedsgrader i den χ 2 -fordeling, der approksimerer 2lnQ-testorens fordeling, som differensen mellem antallet af frie parametre i M 0 og antallet af frie parametre i hypotesen, der testes. Det er derfor vigtigt præcist at kunne angive antallet af frie parameter i en hypotese. For multinomialmodellen gøres dette på følgende måde. Ladπ være en-entydig afbildning af et område Θ i R d på en delmængde Π 0 af parametermængden Π π : Θ R d Π 0 Π (6.9) θ = (θ 1,...,θ d ) π(θ) = (π 1 (θ),...,π j (θ),...,π k (θ)). Hypotesen H 01 : π Π 0 = π(θ) ( Π) (6.10) siges da at have d frie parametre. Den generelle definition er illustreret i Figur 6.1. Da afbildningen π er defineret på Θ, er en-entydig og har værdimængde Π 0, betyder ovenstående blot, at der til ethvert element θ i Θ findes et og kun et element π(θ) i Π 0 og vice versa; med andre ord bruges mængden Θ til at navngive elementer i Π 0 med. Hypotesen H 01 reducerer modellen M 0 til M 1 : X = (X 1,...,X j,...,x k ) m(n,π), π Π 0.

43 6.7 Figur 6.1 Illustration af definitionen af en hypotese med d frie parametre. Mængden Θ antages at være et område i R d. Mængden Π symboliserer parametermængden i grundmodellen, mens Π 0 symboliserer parametermængden svarende til hypotesen H 0. Estimation under hypotese Vi betragter nu maksimum likelihood estimation i M 1. Under M 1 er sandsynlighedsvektoren af formen π(θ) = (π 1 (θ),...,π j (θ),...,π k (θ)), hvor θ = (θ 1,...,θ i,...,θ d ). Af (6.7) fås, at likelihood funktionen for θ er L(θ) = n! x 1! x j! x k! π 1(θ) x1 π j (θ) x j π k (θ) x k. (6.11) Log likelihood funktionen og likelihood ligningerne bliver derfor henholdsvis ( ) n! l(θ) = ln + k x j ln(π j (θ)) x 1! x j! x k! j=1 og l (θ) = k 1 π j x j (θ), θ i j=1 π j (θ) θ i i = 1,...,d. Hvorledes likelihood ligningerne løses afhænger naturligvis af hypotesen H 01 og kan derfor ikke diskuteres generelt. Det er ofte muligt - som illustreret i det følgende - at maksimalisere likelihood funktion L(θ) ved hjælp af Sætning 6.1, og i de tilfælde er likelihood ligningerne uden interesse.

44 Inferens i én multinomialfordeling. Lad ˆθˆθˆθ betegne maksimum likelihood estimatet for θ. Middelværdivektoren for X beregnet i fordelingen svarende til sandsynlighedsvektoren π( ˆθˆθˆθ), som ifølge (6.4) er e = (e 1,...,e j,...,e k ) = (nπ 1 ( ˆθˆθˆθ),...,nπ j ( ˆθˆθˆθ),...,nπ k ( ˆθˆθˆθ)), (6.12) omtales som vektoren af forventede antal under H 01. Test af hypotese Som bekendt er ˆθˆθˆθ den værdi af parameteren θ, som tilordner den største sandsynlighed til observationen x, og de forventede antal e = nπ( ˆθˆθˆθ) er maksimum likelihood estimatet - under H 01 - for middelværdivektoren for X. Om hypotesen H 01 er sand eller ej, må derfor kunne afgøres ved at undersøge, om vektoren e af forventede antal ligner observationen x eller ej. Tilbage er blot spørgsmålet, om hvorledes sammenligningen af e og x skal foretages. Lad os se på hvilket svar likelihood metoden giver på dette spørgsmål. Af (6.7), (6.8) og (6.11) fås, at likelihood ratio testoren for H 01 er og dermed bliver Q(x) = L( ˆθˆθˆθ) L( ˆπˆπˆπ) = π 1( ˆθˆθˆθ) x 1 π j ( ˆθˆθˆθ) x j π k ( ˆθˆθˆθ) x k ( x1 ) x1 x ) j x j xk ) xk ( ( ( n ) n n x1 ) x j nπ 1 ( ˆθˆθˆθ) nπ j ( ˆθˆθˆθ) = ( ( = ( e1 x 1 x 1 ) x1 ( ) e x j j x j x j ( ) xk ek x k ) xk nπ k ( ˆθˆθˆθ) x k 2lnQ(x) = 2 k x j ln( x j ). (6.13) j=1 e j Hvis de forventede antal alle er større end eller lig med 5 kan approksimationen i (5.41) benyttes, det vil sige, at vi for testsandsynligheden ε(x) har følgende approksimation ε(x) =. 1 F χ 2 (k 1 d)( 2lnQ(x)), (6.14) idet modellerne M 0 og M 1 har henholdsvis k 1 og d frie parametre. Bemærk, at hypotesen H 01 kun kan testes, hvis d < k 1, da antallet af frihedsgrader i den approksimerende χ 2 -fordeling naturligvis skal være positivt. Et par bemærkninger vedrørende beregning af 2 ln Q-testoren ved hjælp af lommeregner. Den hyppigst forekommende fejl er, at 2-tallet på højresiden i formel (6.13) glemmes. Desuden er det vigtigt at gentage, at Q(x) er et likelihood ratio test så 0< Q 1, og derfor er 2lnQ >

45 0. Hvis en beregning resulterer i en negativ værdi af 2lnQ, er der altså kun én forklaring: regnefejl! Sammenligningen af de observerede antal x og de forventede antal e foretages undertiden ved hjælp af X 2 -testoren (læs: chi-i-anden testoren) 6.9 X 2 (x) = k (x j e j ) 2. (6.15) j=1 e j Hvis de forventede antal alle er større end eller lig med 5, kan testsandsynligheden ε (x) for X 2 -testet for en hypotese H 01 med d frie parametre approksimeres på følgende måde ε (x). = 1 F χ 2 (k 1 d) (X 2 (x)). (6.16) Af de to test for H 01 foretrækker vi 2lnQ-testet, idet X 2 -testoren blot er en approksimation af 2lnQ-testoren. I litteraturen, specielt den ældre, ser man dog ofte X 2 -testoren anvendt, hvilket muligvis blandt andet skyldes, at ln-tasten ikke fandtes på den tids lommeregnere og at det derfor var besværligt at beregne 2lnQ. Konfidensintervaller Vi vil ikke diskutere konfidensområder for sandsynlighedsvektoren π i modellen M 0, men nøjes med at angive konfidensintervallet for den j te komponent π j af π. Konstruktionen af dette tager sit udgangspunkt i formel (6.6), ifølge hvilken den j te komponent X j af X er binomialfordelt med antalsparameter n og sandsynlighedsparameter π j. Problemet er hermed reduceret til at finde konfidensintervallet for sandsynlighedsparameteren π i en binomialmodel M b : X b(n,π). I modellen M b kan hypotesen H 0 : π = π 0, hvor π 0 er kendt, testes ved hjælp af u-fordelingen. Testet er baseret på, at fordelingen for X kan approksimeres med en normalfordeling som har samme middelværdi og varians som X, det vil sige X N(nπ,nπ(1 π)), hvilket medfører, at vi har følgende approksimation for fordelingsfunktionen F X for X : F X (x) = P(X x) =. x nπ Φ( ). nπ(1 π) Testet af H 0 : π = π 0 baseret på u-fordelingen kan vises at være ækvivalent med 2lnQ-testet, og det giver anledning til følgende (1 α) konfidensinterval for π beregnet ud fra observationen x : C 1 α (x) = {π 0 H 0 : π = π 0 accepteres med niveau α test} = [π,π + ], (6.17)

46 Inferens i én multinomialfordeling. hvor π = og π + = 1 n+u 2 1 α/2 1 n+u 2 1 α/2 [ x+ 1 ] x(n x) 2 u2 1 α/2 u 1 α/2 + 1 n 4 u2 1 α/2 [ x+ 1 ] x(n x) 2 u2 1 α/2 + u 1 α/2 + 1 n 4 u2. 1 α/2 I disse formler betegner u 1 α/2 (1 α/2)-fraktilen i u-fordelingen. Hvis α = 0.05 er fraktilen u = Der findes mange anvendelser af teorien for én multinomialfordeling som beskrevet i dette afsnit. Vi har her valgt at indskrænke os til at illustrere teorien ved at omtale test af en simpel hypotese og test for uafhængighed af inddelingskriterier. Dette gøres i de følgende to underafsnit til Afsnit 6.2 ved hjælp af Eksempel 6.2 og Eksempel Test af simpel hypotese Vi betragter nu den situation hvor sandsynlighedsvektoren π er fuldstændigt specificeret under hypotsen, det vil sige en såkaldt simpel hypotese. Eksempel 6.2 (Fortsat) I multinomialmodellen med k = 3 M 0 : (X 1,X 2,X 3 ) m(33,(π 1,π 2,π 3 )) er maksimum likelihood estimatet - med fire decimalers nøjagtighed - for sandsynlighedsvektoren π givet ved ˆπˆπˆπ = ( 14 33, 10 33, 9 ) = (0.4242, , ). 33 Vi vil undesøge hypotesen om resultaterne sejr, uafgjort og nederlag forekommer lige hyppigt i AB s kampe, det vil sige hypotesen H 01 : π = (1/3, 1/3,1/3). Det ses, at ˆπˆπˆπ ligger tæt på denne værdi. Hypotesen H 01 er simpel - den har d = 0 frie parametre - så de forventede antal under H 0 kan beregnes uden videre. Vi finder sejr uafgjort nederlag i alt observeret x forventet e Ved hjælp af formel (6.13) fås 2lnQ(x) = , og da de forventede antal alle er større end 5, bliver testsandsynligheden ifølge (6.14) ε(x) = 1 F χ 2 (2)(1.2343) = ,

47 6.11 og hypotesen H 01 accepteres. Vi kan altså ikke afvise, at der er samme sandsynlighed for resultaterne sejr, uafgjort og nederlag i AB s kampe Uafhængighed af inddelingskriterier Problemstillingen omtalt i Eksempel 6.3 er et specialtilfælde af følgende generelle situation. Antag, at n objekter klassificeres efter to inddelingskriterier, hvoraf det første har r kategorier og det andet s kategorier. Data x kan da opfattes som en r s matriks {x i j }, hvor x i j betegner antallet af objekter i den (i, j) te klasse svarende til den i te kategori ved det første kriterium og den j te kategori ved det andet kriterium. 1 j s Σ 1 x 11 x 1 j x 1s x 1 i x i1 x i j x is x i r x r1 x r j x rs x r Σ x 1 x j x s n I tabellen betegner x i og x j henholdsvis summen af observationerne i den i te række og den j te søjle, altså x i = s x i j og x j = r x i j j=1 i=1 Multinomialmodellen for den rs-dimensionale diskrete stokastiske matriks X = {X i j }, har rs 1 frie parametre. M 0 : X = {X i j } m(n,{π i j }), (6.18) Lad ρ i betegne sandsynligheden for at et objekt tilhører den i te kategori ved det første kriterium, i = 1,...,r, og lad tilsvarende σ j betegne sandsynligheden for den j te kategori ved det andet kriterium, j = 1,...,s. Hypotesen H 01 : π i j = ρ i σ j, i = 1,...,r, j = 1,...,s, (6.19) omtales som hypotesen om uafhængighed mellem de to inddelingskriterier, og den har d = (r 1)+(s 1) = r+ s 2 frie parametre, idet r i=1 ρ i = 1 og s σ j = 1. j=1

48 Inferens i én multinomialfordeling. Under M 0 er likelihood funktionen for π = {π i j } n! L(π) = x 11! x rs! og maksimum likelihood estimatet for π er givet ved r i=1 s π x i j j=1 ˆπ i j = x i j, i = 1,...,r, j = 1,...,s. n i j (6.20) Likelihood funktionen for ρ = (ρ 1,...ρ i,...,ρ r ) og σ = (σ 1,...,σ j,...σ s ) findes af (6.20) ved at indsætte π i j = ρ i σ j, og vi får n! r s L(ρ,σ) = (ρ i σ j ) x i j x 11! x rs! i=1 j=1 n! r = ρ x s i i σ x j j. x 11! x rs! Det ses, at L(ρ,σ) indeholder en faktor, som kun afhænger af ρ, samt en faktor, som kun afhænger af σ. Da ρ og σ desuden varierer uafhængigt af hinanden, kan vi anvende Sætning 6.1 på hver af disse faktorer. Vi finder, at maksimum likelihood estimaterne for ρ og σ er bestemt ved i=1 ˆρ i = x i n, i = 1,...,r og ˆσ j = x j, j = 1,...,s, (6.21) n altså som de relative hyppigheder for henholdsvis den i te kategori ved det første inddelingskriterium og den j te ved det andet. Matricen e = {e i j } af forventede antal under H 01 har elementer j=1 e i j = n ˆρ i ˆσ j (6.22) = x i x j n. Det forventede antal i den (i, j) te klasse findes således som produktet af den i te rækkesum og den j te søjlesum divideret med totalsummen. Ved hjælp af (6.22) finder vi nu følgende beregningsformel for 2lnQ-testoren for H 01 : ( ) 2lnQ(x) = 2 r s xi j x i j ln (6.23) i=1 j=1 e i j ( ) = 2 r s xi j x i j ln i=1 j=1 x i x j /n = 2 r [ x i j ln(xi j ) ln(x i ) ln(x j )+ln(n) ] s i=1 j=1 = 2[ r s i=1 j=1 x i j ln(x i j ) r x i ln(x i ) s x j ln(x j )+nln(n)]. i=1 j=1

49 6.13 Ved beregninger af 2lnQ i hånden er det nyttigt at have et lille program på lommeregneren, som beregner Σ x ln(x), idet den kantede parentes fremkommer ud fra tabellen over observerede antal som denne størrelse beregnet for indmaden af tabellen minus størrelsen beregnet for rækkesummerne minus størrelsen beregnet for søjlesummerne plus størrelsen beregnet for totalsummen. Igen er det vigtigt at huske 2-tallet på højresiden i denne formel. Som nævnt ovenfor er antallet af frie parametre i grundmodellen M 0 lig med rs 1, og da antallet af frie parametre i H 01 er r + s 2, bliver antallet af frihedsgrader i 2lnQ-testet for H 01 lig med f = (rs 1) (r+ s 2) = (r 1)(s 1). Hvis de forventede antal under uafhængighedshypotesen alle er større end eller lig med 5, kan testsandsynligheden derfor beregnes som Accept af H 01 reducerer modellen M 0 til modellen ε(x) =. 1 F χ 2 (r 1)(s 1)( 2lnQ(x)). (6.24) M 1 : X = {X i j } m(n,({ρ i σ j })). (6.25) I M 1 kan det vises, at vektorerne af rækkesummer X = (X 1,...,X i,...,x r ) og søjlesummer X = (X 1,...,X j,...,x s ) er stokastisk uafhængige og multinomialfordelte. Mere præcist har vi X = (X 1,...,X i,...,x r ) m(n,(ρ 1,...,ρ i,...,ρ r )) X = (X 1,...,X j,...,x s ) m(n,(σ 1,...,σ j,...,σ s )) (6.26) X og X er stokastisk uafhængige. Inferens i M 1 vedrørende henholdsvis vektoren ρ af rækkesandsynligheder og vektoren σ af søjlesandsynligheder kan derfor foretages ved at betragte fordelingen af henholdsvis rækkesummer X og søjlesummer X Eksempel 6.3 (Fortsat) Suppleres tabellen over observerede antal med rækkesummer, søjlesummer og totalsum får vi følgende: rygerstatus timer per uge ryger ikke-ryger i alt idrætsaktivitet i alt

50 Inferens i én multinomialfordeling. Ud fra denne tabel beregnes de forventede antal e ved hjælp af formel (6.22) og med tre decimalers nøjagtighed finder vi: Af formel (6.23) fås, at rygerstatus timer per uge ryger ikke-ryger i alt idrætsaktivitet i alt ln Q(x) = 2[ ] = , og da de forventede antal alle er større end 5, kan testsandsynligheden for uafhængighedshypotesen ved hjælp af (6.23) beregnes til ε(x) = 1 F χ 2 (4)( ) = , og hypotesen H 01 forkastes. På grundlag af denne undersøgelse kan vi altsåkonkludere, at der er en sammenhæng mellem idrætsaktivitet og rygestatus. Af figuren nedenfor ses, at procentdelen af rygere aftager når idrætsaktiviteten vokser.

51 Inferens i flere multinomialfordelinger Teorien for statistisk inferens i én multinomialfordeling, omtalt i Afsnit 6.2, kan uden videre generaliseres til flere multinomialfordelinger. Vi vil ikke gennemgå denne teori her, men blot illustrere den ved hjælp af et enkelt eksempel Homogenitet af flere multinomialfordelinger Problemstillingen skitseret i Eksempel 6.4 er et specialtilfælde af følgende generelle situation. Antag, at data kan beskrives som udfald af r uafhængige s-dimensionale diskrete stokastiske vektorer X i = (X i1,...,x i j,...,x is ), som er multinomialfordelt med antalsparameter n i og sandsynlighedsvektor π i = (π i1,...,π i j,...,π is ), i = 1,...,r, samt at vi ønsker at undersøge om sandsynlighedsvektorerne i de r fordelinger kan antages at være identiske. Observationerne kan da opstilles i et r s skema som nedenfor, hvor I modellen x j = r x i j og n = r n i. i=1 i=1 M 0 : X i = (X i1,...,x i j,...,x is ) m(n i,π i ) = m(n i,(π i1,...,π i j,...,π is )) X 1,...,X,X i,...,x,x r er stokastisk uafhængige (6.27) omtales hypotesen H 01 : π 1 = = π i = = π r = π = (π 1,...,π j,...,π s ) (6.28) som hypotesen om homogenitet. 1 j s Σ 1 x 11 x 1 j x 1s n 1 i x i1 x i j x is n i r x r1 x r j x rs n r Σ x 1 x j x s n Idet en s-dimensional multinomialfordeling har s 1 frie parametre og idet modellen M 0 består af r uafhængige fordelinger af denne slags, har M 0 i alt r(s 1) frie parametre. Likelihood

52 Inferens i flere multinomialfordelinger funktionen under M 0 er L(π 1,...,π i,...,π r ) = r n i! x i1! x i j! x is! πx i1 i1 πx i j i j π x is is, (6.29) i=1 og maksimum likelihood estimatet under M 0 er givet ved ˆπ i j = x i j n i, i = 1,...,r, j = 1,...,s. Modellen svarende til homogenitetshypotesen er M 1 : X i = (X i1,...,x i j,...,x is ) m(n i,π) = m(n i,(π 1,...,π j,...,π s )) X 1,...,X i,...,x r er stokastisk uafhængige (6.30) Denne model har s 1 frie parametre og likelihood funktionen for π fås ved at sætte π i j = π j i (6.29), det vil sige { } r n i! L(π) = π x 1 πx j x i1! x i j! x is! 1 j πs x s i=1 Ved hjælp af Sætning 6.1 ses det, at maksimum likelihood estimatet for den fælles sandsynlighedsparameter π er givet ved ˆπ j = x j, n j = 1,...,s. (6.31) De forventede antal under M 1 bliver derfor e i j = n i ˆπ j (6.32) = n ix j, i = 1,...,r, j = 1,...,s; n altså det forventede antal i den j te kategori i den i te fordeling er produktet af den i te rækkesum og den j te søjlesum divideret med totalsummen. Beregningsformlen for 2 ln Q-testoren er ( ) 2lnQ(x) = 2 r xi j x i j ln s i=1 j=1 = 2 r = 2 r s i=1 j=1 s i=1 j=1 s i=1 j=1 = 2[ r x i j ln e i j ( xi j n i x j /n ) x i j [ ln(xi j ) ln(n i ) ln(x j )+ln(n ) ] x i j ln(x i j ) r n i ln(n i ) s x j ln(x j )+n ln(n )]. i=1 j=1 (6.33) Antallet af frihedsgrader i 2lnQ-testet er f = r(s 1) (s 1) = (r 1)(s 1) så hvis de forventede antal er større end eller lig med 5, kan testsandsynligheden for homogenitetshypotesen beregnes som ε(x) =. 1 F χ 2 (r 1)(s 1)( 2lnQ(x)). (6.34)

53 6.17 I modellen M 1 kan det vises, at vektorsummen X = X 1 + +X r er multinomialfordelt med antalsparameter n og sandsynlighedsvektor π, X = (X 1,...,X j,...,x s ) m(n,π) = m(n,(π 1,...,π j,...,π s )). (6.35) Dette resultat kan benyttes, hvis man ønsker at drage yderligere inferens om den fælles sandsynlighedsvektor π. Forskelle og ligheder mellem testene for uafhængighed og homogenitet Sammenlignes formlerne (6.22)-(6.24) og (6.32)-(6.34) ses, at beregningerne er identiske for de to test. Testene vedrører forskellige hypoteser og foretages i forskellige modeller. Uafhængighedstestet foretages i en model, der kun involverer én multinomialfordeling, kun det totale antal observationer n er ikke-stokastisk. Homogenitetstestet foretages i en model, der omfatter r multinomialfordelinger, og i denne model er antallene af observationer n 1,...,n i,...,n r i de r fordelinger ikke-stokastiske. Der anvendes med andre ord forskellige strategier ved indsamlingen af data i de to situationer. Eksempel 6.4 (Fortsat) Spørgsmålet om der er forskel på sandsynlighederne for henholdsvis hjemmesejr, uafgjort og udesejr i de tre dele af Faxe Kondi Ligaen kan besvares i modellen M 0 : X i m(66,π i ), i = 1,2,3, X 1, X 2 og X 3 er stokastisk uafhængige ved at teste hypotesen om identitet af sandsynlighedsvektorerne, altså hypotesen H 01 : π 1 = π 2 = π 3 (= π = (π 1,π 2,π 3 )).

54 Inferens i flere multinomialfordelinger Figuren nedenfor antyder, at H 01 kan accepteres. Suppleres tallene side 6.4 med søjlesummerne får vi kamp nr. hjemmesejr uafgjort udesejr i alt i alt og ved hjælp af (6.32) beregnes de forventede antal - med tre decimalers nøjagtighed - til: kamp nr. hjemmesejr uafgjort udesejr i alt i alt Da de forventede antal alle er større end 5, finder vi ved hjælp af (6.33) og (6.34), at 2lnQ(x) = 2[ ]= og at ε(x) = 1 F χ 2 (4)(2.4890) = Hypotesen om homogenitet accepteres, det vil sige, at sandsynlighederne for henholdsvis hjemmesejr, uafgjort og udesejr i de tre dele af turneringen kan antages at være ens.

55 6.19 Den simple hypotese H 02 : π = (π 1,π 2,π 3 ) = (1/3,1/3,1/3), det vil sige hypotesen om at de tre udfald - hjemmesejr, uafgjort, udesejr - af en kamp er lige sandsynlige ser ikke ud til at kunne accepteres ud fra figuren ovenfor. Antallet af hjemmesejre ser ud til at være signifikant større end antallet af uafgjorte og udesejre. Hypotesen kan ifølge bemærkningen efter formel (6.35) testes i modellen M : X m(198,π), hvor X = X 1 + X 2 + X 3. Ved hjælp af tabellen hjemmesejr uafgjort udesejr i alt observeret x forventet e beregnes 2lnQ-teststørrelsen og den tilsvarende testsandsynlighed til 2lnQ(x) = og ε(x) = 1 F χ 2 (2)( ) = , så H 02 forkastes. 95% konfidensintervallet for π 1 - sandsynligheden for hjemmesejr - kan beregnes ved hjælp af (6.17). Da x = 90 og n = 198 bliver 95% konfidensintervallet for π 1 [0.3867, ]. Vi kan således ikke afvise hypotesen om at sandsynligheden π 1 for hjemmesejr er Fishers eksakte test Alle de test, som vi har benyttet i Afsnit 6.2 og 6.3, har været approksimative test, der er baseret på den approksimative likelihood teori omtalt i Afsnit 5.7. For de betragtede test har vi brugt kriteriet, at de forventede antal e alle skulle være større end eller lig 5, for at testet kunne anvendes. Dette kriterium er baseret på numeriske simulationer, og for nogle modeller gælder der, at det kan slækkes, således at den udregnede testsandsynlighed er troværdig, selvom nogle af de

56 Fishers eksakte test forventede antal er noget mindre end 5. Spørgsmålet om, hvad man skal gøre, hvis de forventede antal er for små, trænger sig dog ofte på i anvendelser af teorien. Vi skal nu omtale Fishers eksakte test, der ofte benyttes i forbindelse med r s tabeller, hvor nogle af de forventede antal er for små. Metoden kan altså anvendes for test af uafhængighed mellem inddelingskriterier og test for homogenitet. Vi giver en detaljeret beskrivelse af metoden for 2 2 tabeller, som giver det princip, der benyttes i det generelle tilfælde. Beregningerne i Fishers eksakte test er ofte for omfattende til at kunne gøres manuelt, men nogle statistikpakker (dog ikke Excel) er i stand til at udføre testet. Lad os indledningsvis betragte et eksempel, som ikke har noget med idræt at gøre, men som er interessant idet det var genstand for meget stor opmærksomhed i medierne. Eksempel 6.5 I en undersøgelse, foretaget af Kræftens Bekæmpelses Cancerregister, beskæftiger man sig med spørgsmålet, om børn med bopæl tæt ved højspændingsanlæg har en forøget risiko for at få kræft. Undersøgelsen er en såkaldt case-kontrol undersøgelse. I Cancerregisteret er der i perioden registreret 1707 tilfælde af sygdommene leukæmi, hjernesvulst eller lymfom blandt børn, der på tidspunktet for diagnosen var under 15 år. Disse børn udgør casegruppen. For hvert af børnene i denne gruppe er der tilfældigt udvalgt et antal børn af samme køn og alder. Disse børn udgør kontrolgruppen. For samtlige børn har man derefter vurderet, om de har boet så tæt ved højspændingsledninger, at de på årsbasishar været udsat for et gennemsnitligt magnetfelt på 0.10 µt (microtesla) eller mere. Vi skal her betragte casegruppen for lymfomer og den tilsvarende kontrolgruppe, som blev valgt fem gange så stor. For denne gruppe er de observerede antal: eksponering 0.10 µt < 0.10 µt i alt case kontrol i alt Princippet i en case-kontrol undersøgelse er at sammenligne hyppigheder. Hvis for eksempel hyppigheden af tilfælde med eksponering 0.10 µt er signifikant større i casegruppen end i kontrolgruppen, konkluderes det, at eksponering medfører en øget risiko for kræft. Hvis størrelserne af de to grupper anses for faste, er det rimeligt at betragte modellen M 0 : X i b(n i, p i ) i = C, K, X C og X K er stokastisk uafhængige (6.36) og i denne teste hypotesen H 0 : p C = p K. (6.37)

57 6.21 Af tabellen over observerede antal ses, at ˆp C = og ˆp K = , dvs. hyppigheden for de eksponerede i casegruppen er fem gange så stor som hyppigheden i kontrolgruppen. Spørgsmålet er nu, om denne forskel er signifikant. De forventede antal under H 0 findes ved hjælp af (6.32) til eksponering 0.10 µt < 0.10 µt i alt case kontrol i alt I (1,1)-cellen er det forventede antal 1, og vi kan derfor ikke bruge det approksimative test. Fishers eksakte test i 2 2 tabeller Af hensyn til den senere omtale af Fishers test i den generelle r s tabel formulerer vi modellen i (6.36) og hypotesen (6.37) ved hjælp af multinomialfordelingen i stedet for binomialfordelingen. Vi betragter altså modellen M 0 : X i = (X i1,x i2 ) m(n i,(π i1,π i2 )), i = 1,2, X 1 og X 2 er stokastisk uafhængige og i denne hypotesen om identitet af de to sandsynlighedsvektorer, dvs. H 0 : π 1 = π 2 = π = (π 1,π 2 ). Fisher foreslog at teste hypotesen H 0 ved at betragte den betingede fordeling, under H 0, af (X 1,X 2 ) givet X = X 1 + X 2. Benyttes (6.35), findes den betingede fordeling af følgende beregninger: P((X 1,X 2 ) = (x 1,x 2 ) X = x ) = P((X 1,X 2 ) = (x 1,x 2 )) P(X = x ) n 1! x = 11!(n 1 x 11 )! πx 11 1 πn 1 x 11 n 2! 2 x 21!(n 2 x 21 )! πx 21 n! πx 1 x 1!(n x 1 )! 1 πn x πn 2 x 21 2 hvilket efter passende forkortelser kan skrives ved hjælp af binomialkoefficienter på følgende måde ( x 1 )( ) n x 1, P((X 1,X 2 ) = (x 1,x 2 ) X = x ) = x 11 ( n n 1 x ) 11. n 1

58 Fishers eksakte test Bemærk, at da vi har betinget med X = x, er størrelserne x 1,n 1,n 2 og derfor også n, faste i dette udtryk, således at kun x 11 varierer. Den diskrete fordeling med sandsynlighedsfunktionen h(x : M,N,n) = ( )( ) M N M x n x ( ) N, x = K 0,...,K 1, n hvor K 0 = max{0,n+m N} og K 1 = min{m,n}, kaldes den hypergeometriske fordeling med parametre M, N og n. Det ovenstående viser derfor, at den betingede fordeling af X 11 givet søjle- og rækkesummer er den hypergeometriske fordeling med parametre x 1, n og n 1. Testsandsynligheden for Fishers eksakte test er ε F (x) = y h(y;x 1,n,n 1 ), (6.38) hvor * over summationstegnet antyder, at summationen skal foretages over alle y for hvilke h(y;x 1,n,n 1 ) h(x 11,x 1,n,n 1 ). Denne definition af testsandsynligheden kan forklares på følgende måde. Benyttes sandsynlighederne i den betingede fordeling som et mål for, hvor ekstreme de forskellige observationer er, får vi den sædvanlige fortolkning af testsandsynligheden, som sandsynligheden for de udfald y, der er ligeså ekstreme eller mere ekstreme end det observerede udfald x 11. Vi har tidligere bemærket, at beregningerne i testet for uafhængighed mellem inddelingskriterier er identiske med beregningerne i testet for homogenitet. Det er derfor ikke overraskende, at de ovenstående beregninger giver samme resultat, hvis man ønsker at teste uafhængighed i en 2 2 tabel. Den eneste forskel er, at parametrene i den betingede hypergeometriske fordeling bliver x 1, n og x 1 i stedet for x 1, n og n 1 Manuelt kan det være besværligt at beregne testsandsynligheden i (6.38), men som omtalt tidligere har alle de gængse statistikpakker en procedure til at beregne denne. Eksempel 6.5 (Fortsat) Den relevante hypergeometriske fordeling for dette datasæt har parametrene 6, 1500, og 250. Fordelingen er vist i Figur 6.2. I dette tilfælde bliver ε F (x) = 0.062, hvilket ikke giver anledning til at forkaste hypotesen (6.37). Med andre ord, gruppen af lymfomer er ikke signifikant forskellig fra kontrolgruppen med hensyn til eksponering fra magnetfelter. Lad os til sidst i dette eksempel se på, hvilke konklusioner vi havde fået, hvis vi fejlagtigt

59 6.23 Figur 6.2 Sandsynlighedsfunktionen for den hypergeometriske fordeling med parematre (M, N, n)=(6,1500,250). havde brugt 2lnQ-testet eller X 2 -testet. Af størrelserne 2lnQ(x) = ε(x) = 1 F χ 2 (1)(3.546) = X 2 (x) = ε (x) = 1 F χ 2 (1)(4.819) = ses det, at 2lnQ-testet giver samme konklusion som Fishers eksakte test. Brug af X 2 -testet i denne situation medfører derimod, at man fejlagtigt konstaterer en signifikant forskel på casegruppen og kontrolgruppen. Årsagen til den megen omtale i medierne var, at konklusionen i undersøgelsen var baseret på X 2 -testet. Fishers eksakte test for r s tabeller Princippet for dette test er det samme som for 2 2 tabellen. Testsandsynligheden beregnes i den betingede fordeling af r s tabellen givet række- og søjlesummer ved at summere de betingede sandsynligheder for alle tabeller, der har en mindre betinget sandsynlighed end den observerede tabel. Regnearbejdet her er næsten altid så besværligt, at det er nødvendigt at benytte en statistikpakke for at udføre testet.

60 Test for goodness of fit 6.5 Test for goodness of fit I Afsnit 4.1 så vi, hvorledes man ved hjælp af fraktildiagrammer grafisk er i stand til at undersøge, om data x = (x 1,...,x n ) kan betragtes som en stikprøve fra en klasse af fordelinger, der er karakteriseret ved en positions- og/eller en skalaparameter. Vurderinger af fraktildiagrammer, og andre grafiske metoder til kontrol af en statistisk model, er naturligvis i et vist omfang subjektive, selvom man ved hjælp af simulationer, som i Appendiks B, kan opnå indsigt i, h- vorledes de relevante tegninger skal vurderes. Hvis antallet af observationer n i stikprøven er tilstrækkelig stort, kan den grafiske kontrol suppleres med et numerisk test, et såkaldt test for goodness of fit. Denne form for modelkontrol er generel, det vil sige, at den også kan anvendes i situationer, hvor den betragtede fordelingsklasse ikke er en positions-skala familie. Mere præcist ønsker vi at undersøge, om data kan opfattes som en stikprøve fra en fordeling F θ, der tilhører en fordelingsklasse F = {F θ : θ Θ}, som er parametriseret ved en d-dimensional parameter θ, altså θ Θ R d. Ønsker man eksempelvis at undersøge, om x er en stikprøve fra normalfordelingen er d = 2, idet normalfordelingen parametriseres ved (µ,σ 2 ) middelværdi og varians. Hvis fordelingsklassen F er mængden af Poisson fordelinger, er d = 1, da disse fordelinger parametriseres ved middelværdien λ, etc. Antag, at y 0 < y 1 <... < y j <... < y k bestemmer en inddeling af R i k intervaller I 1,...,I j,...,i k, hvor I j = ]y j 1,y j ], j = 1,...,k. Lad a j betegne antallet af observationer, som tilhører det j te interval, altså a j = #{i : x i I j }, j = 1,...,k. Da observationerne x 1,...,x n antages at være uafhængige og identisk fordelte, vælger vi følgende model for de observerede antal a = (a 1,...,a j,...,a k ) : M 0 : (a 1,...,a j,...,a k ) m(n,(π 1,...,π j,...,π k )), (6.39) hvor π j er sandsynligheden for at observationen tilhører det j te interval I j, det vil sige π j = P(X 1 I j ), j = 1,...,k. Under hypotesen H 0 : X i F θ, i = 1,...,n,

61 6.25 er π j = π j (θ) = F θ (y j ) F θ (y j 1 ), j = 1,...,k, (6.40) så H 0 kan betragtes som en hypotese i multinomialmodellen M 0. Da θ er d-dimensional, er antallet af frie parametre i H 0 netop d. Likelihood funktionen under H 0 svarende til de observerede antal a er L(θ) = n! a 1! a j! a k! π 1(θ) a1 π j (θ) a j π k (θ) a k. Da udtrykkene i (6.40) ofte kan være komplicerede, vælger man at estimere θ på grundlag af de oprindelige observationer x 1,...x n, altså ved hjælp af likelihood funktionen L(θ) = n f(x i ;θ), (6.41) i=1 hvor f( ;θ) betegner tæthedsfunktionen svarende til F θ. Lad ˆθˆθˆθ betegne maksimum likelihood estimatet for θ beregnet ved hjælp af (6.41). Estimaterne for parametrene i multinomialfordelingen bliver da π j ( ˆθˆθˆθ) = Fˆθˆθˆθ (y j) Fˆθˆθˆθ (y j 1), og de forventede antal e under H 0 bliver dermed e j = nπ j ( ˆθˆθˆθ) (6.42) = n{fˆθˆθˆθ (y j) Fˆθˆθˆθ (y j 1)}, j = 1,...,k. Testsandsynligheden for 2lnQ-testoren for H 0 2lnQ(a) = 2 k a j ln( a j ) (6.43) j=1 e j approksimeres ved ε(a) =. 1 F χ 2 (k 1 d)( 2lnQ(a)), (6.44) forudsat at de forventede antal e alle er større end eller lig med 5. I litteraturen ser man meget ofte X 2 -testet anvendt i forbindelse med test for goodness of fit. Med notationen her er X 2 -testoren og den tilsvarende testsandsynlighed: X 2 (a) = k (a j e j ) 2 (6.45) j=1 e j ε (a). = 1 F χ 2 (k 1 d) (X 2 (a)), (6.46) hvor approksimationen kan anvendes, hvis de forventede antal er større end eller lig med 5.

62 Test for goodness of fit Eksempel 6.6 Hvis vi ved hjælp af et test for goodness of fit ønsker at undersøge, om observationerne x 1,..., x n kan opfattes som en stikprøve fra normalfordelingen, som parametriseres ved sin middelværdi µ og varians σ 2, det vil sige d = 2, estimerer vi først disse to parametre: n µ x = 1 n i=1 σ 2 s 2 = 1 n 1 x i n i=1 (x i x ) 2. Idet fordelingsfunktionen for normalfordelingen med middelværdi x og varians s 2 kan udtrykkes ved hjælp af fordelingsfunktionen for den standardiserede normalfordeling på følgende måde bliver de forventede antal ifølge (6.42) e j = n{φ( y j x s F ( x,s 2 ) x (y) = Φ(y ), s ) Φ( y j 1 x )}, j = 1,...,k. (6.47) s Som illustration af test for goodness of fit for normalfordelingen ser vi igen på målingerne i Eksempel 1.1 af højden hos 247 astmaplagede piger i alderen år. Vi betragter den grupperede version af disse data, som er givet i Tabel 1.4, idet dog intervallerne ]112,116] og ]164,168] erstattes med henholdsvis ],116] og ]164, [. Fra omtalen af Eksempel 1.1 i Afsnit 4.3 ved vi, at µ x = σ 2 s 2 = De observerede og forventede antal, beregnet ved hjælp af (6.47), er angivet i Tabel 6.1. Indledningsvis betragter vi 14 intervaller, men for at imødekomme kravet, om at de forventede antal skal være større end eller lig med 5, bliver vi nødt til at slå nogle af intervallerne sammen som antydet. Efter dette har vi k = 10 intervaller, og da d = 2 bliver antallet af frihedsgrader i testet for goodness of fit lig med k 1 d = = 7. For 2lnQ-testet får vi fra (6.43) og (6.44), at 2lnQ(a) = og ε(a) = 1 F χ 2 (7)(7.2653) = Formlerne (6.45) og (6.46) medfører, at vi for X 2 -testet finder X 2 (a) =

63 6.27 interval a e ],116] ]116,120] ]120,124] ]124,128] ]128,132] ]132,136] ]136,140] ]140,144] ]144,148] ]148,152] ]152,156] ]156,160] ]160,164] ]164, [ Tabel 6.1 Beregning af test for goodness of fit for normalfordelingen for data i Tabel 2.2. og dermed ε (a) = 1 F χ 2 (7)(7.5472) = Intet af testene, af hvilke vi - som tidligere omtalt - foretrækker 2lnQ-testet, giver altså anledning til at betvivle, at observationerne kan betragtes som en stikprøve fra normalfordelingen, hvilket er i overensstemmelse med fraktilsammenligningen i Figur 4.3.

64 6.28 Beregninger i Excel Anneks til Kapitel 6 Beregninger i Excel I Excel er der ikke dialogbokse, der foretager beregningerne i modellerne i dette kapitel. Beregningerne foretages dog forholdsvis let og i disse er funktionen SUMPRODUKT meget nyttig, idet teststørrelsen 2lnQ(x) = 2 k i=1 x i ln( x i e i ) bortset fra faktoren 2 (husk denne) netop er en sum af produkter mellem de observerede antal x i og logaritmen ln( x i ) til forholdet mellem de observerede antal x i og de forventede antal e i. e i Endvidere er funktionenchitest som vist nedenfor ofte nyttig. Eksempel 6.2 (Fortsat)!" I regnearket nedenfor indeholder cellerne B4:D5 de observerede og forventede antal. ) *+ + #$%& ' ' ' ( ' ( ' " Indholdet af cellenb7 beregnes som =LN(B$4/B$5) (= ln(x 1 /e 1 )) og analoge formler oprettes i cellerne C7 og D7. (De to $ tegn letter oprettelsen af de analoge formler). Teststørrelsen ib9 beregnes som og testsandsynligheden ib10 som =2 SUMPRODUKT(B4 :D4;B7 :D7) (= 2 k i=1 x i ln( x i e i )) =CHIFORDELING(B9;2) (= 1 F χ 2 (k 1) ( 2lnQ(x)).

65 Eksempel 6.3 (Fortsat) Data, suppleret med! række- og søjlesummer "!"! samt totalsum, # ses i cellernea4:d10. $ $ $ $ % % % % % % % % &'() # $ % $ % $ % $ % % * +, % $ % % -.,,, % % % $ % % 6.29 Ud fra disse celler beregnes de forventede antal i cellerne F5:G9. Først beregnes indholdet aff5 som =B$10 $D5/$D$10 (= x 1 x 1 /n) og derefter oprettes analoge formel i de øvrige celler (De fire $ tegn letter oprettelsen af de analoge formler). CellerneB13:C17 indeholder størrelserne ln(x i j /e i j ). Først beregnes indholdet af B13 som =LN(B5/F5) (= ln(x 11 /e 11 )) hvorefter analoge formler oprettes i de resterende celler. Teststørrelsen ib20 beregnes som =2 SUMPRODUKT(B5 :C9;B13 :C17) (= 2 og testsandsynligheden ib21 som r i=1 s x i j ln( x i j )) j=1 e i j =CHIFORDELING(B20;4) (= 1 F χ 2 ((r 1)(s 1)) ( 2lnQ(x)).

66 6.30 Beregninger i Excel FunktionenCHITEST beregner ud fra de observerede antal {x i j } og de forventede antal {e i j } testsandsynligheden for X 2 -testet, det vil sige hvor ε (x) = 1 F χ 2 ((r 1)(s 1)) (X 2 (x)), X 2 (x) = r i=1 s (x i j e i j ) 2. j=1 e i j Funktionen kaldes via ruten Indsæt Funktion Statistik CHITEST som giver en boks, hvor de observerede værdier angives efter Observeret værdi og de forventede efter Forventet værdi. Testsandsynligheden i B24 er fremkommet således eller ved direkte at indtaste =CHITEST(B5 :C9;F5 :G9). Værdien af X 2 -teststørrelsen ib23 er derefter beregnet som =CHIINV(B24;4). Eksempel 6.4 (Fortsat) Da beregningerne for et homogenitetstest er de samme som beregningerne for testet for uafhængighed af inddelingskriterier, kan Excel beregningerne i dette eksempel udføres på samme måde som i Eksempel 6.3 ovenfor.

67 6.31 Hovedpunkter til Kapitel 6 Generelle modeller og hypoteser Model: Grundmodellen er baseret på den k-dimensionale multinomialfordeling med antalsparameter n og sandsynlighedsvektor π = (π 1,...,π j,...,π k ) Modelkontrol: M 0 : X = (X 1,...,X j,...,x k ) m(n,π), π Π. Check, at betingelser a) - d) side 6.1 med rimelighed kan antages at være opfyldt. Estimat: Sandsynlighedsvektoren π estimeres på grundlag af de observerede antal x = (x 1,...,x j,...,x k ) som vektoren af relative hyppigheder Fordelingen af estimatet angives ved Konfidensintervaller: π ˆπˆπˆπ(x) = ( x 1 n,, x j n,, x k n ). n ˆπ = X m(n,π). Under M 0 er X j b(n,π j ), så konfidensintervallet for π j kan beregnes på samme måde, som konfidensintervallet for sandsynlighedparameteren π i binomialmodellen X b(n, π) beregnes på grundlag af observationen x. Dette interval, som er baseret på en approksimation, er hvor og Hypoteser: π = π + = 1 n+u 2 1 α/2 1 n+u 2 1 α/2 C 1 α (x) = [π,π + ], [ x+ 1 ] x(n x) 2 u2 1 α/2 u 1 α/2 + 1 n 4 u2 1 α/2 [ x+ 1 ] x(n x) 2 u2 1 α/2 + u 1 α/2 + 1 n 4 u2. 1 α/2 En hypotese om sandsynlighedsvektoren har d frie parametre, hvis den er af formen H 0 : π Π 0 = π(θ)( Π),

68 6.32 Hovedpunkter til Kapitel 6 hvor Π 0 er værdimængden for en en-entydig afbildning π fra en åben delmængde Θ af R d ind i Π. Mængden omtales som parametermængden for hypotesen H 0 Test af hypoteser: Hvis ˆθˆθˆθ er maksimum likelihood estimatet for parameteren θ under H 0, er vektoren e af forventede antal under H 0 givet ved e = (e 1,...,e j,...,e k ) = (nπ 1 ( ˆθˆθˆθ),...,nπ j ( ˆθˆθˆθ),...,nπ k ( ˆθˆθˆθ)). Af de to approksimative test, 2lnQ-testet og X 2 -testet, for H 0 foretrækker vi 2lnQtestet. Begge test er baseret på en sammenligning af de observerede antal x og de forventede antal e. Hvis de forventede antal alle er større end eller lig med 5, kan følgende teststørrelser og de tilsvarende approksimative testsandsynligheder benyttes. 2 ln Q-testet: 2lnQ(x) = 2 k x j ln( x j ) j=1 e j ε(x). = 1 F χ 2 (k 1 d) ( 2lnQ(x)), X 2 -testet: X 2 (x) = k (x j e j ) 2 j=1 e j ε (x). = 1 F χ 2 (k 1 d) (X 2 (x)).

69 6.33 Specielle modeller og hypoteser Uafhængighed af inddelingskriterier: De observerede antal x er en r s tabel {x i j }, som beskrives ved M 0 : X = {X i j } m(n,({π i j })). Hypotesen H 0 : π i j = ρ i σ j, i = 1,...,r, j = 1,...,s, omtales som hypotesen om uafhængighed af inddelingskriterier. Maksimum likelihood estimaterne for vektorerne ρ og σ af række- og søjlesandsynligheder er ˆρ i = x i n, i = 1,...,r og ˆσ j = x j n, og de forventede antal e = ={e i j } beregnes som j = 1,...,s, e i j = x i x j n. Hvis disse alle er større end eller lig med 5 bliver teststørrelsen (husk 2-tallet) og testsandsynligheden 2lnQ(x) = 2[ r s i=1 j=1 Accepteres H 0 er modellen M 0 reduceret til i hvilken der gælder x i j ln(x i j ) r x i ln(x i ) s x j ln(x j )+nln(n)] i=1 j=1 ε(x). = 1 F χ 2 ((r 1)(s 1)) ( 2lnQ(x)). M 1 : X = {X i j } m(n,({ρ i σ j }), X = (X 1,...,X i,...,x r ) m(n,(ρ 1,...,ρ i,...,ρ r )) X = (X 1,...,X j,...,x s ) m(n,(σ 1,...,σ j,...,σ s )) X og X er stokastisk uafhængige. Homogenitet af flere multinomialfordelinger: I modellen M 0 : X i = (X i1,...,x i j,...,x is ) m(n i,π i ) = m(n i,(π i1,...,π i j,...,π is )) X 1,...,X i,...,x r er stokastisk uafhængige testes hypotesen om homogenitet, eller identitet, af de r multinomialfordelinger H 0 : π 1 = = π i = = π r = π = (π 1,...,π j,...,π s ).

70 6.34 Hovedpunkter til Kapitel 6 Maksimum likelihood estimatet for komponenterne i den fælles sandsynlighedsvektor er ˆπ j = x j, j = 1,...,s, n og de forventede antal beregnes som 2lnQ-teststørrelsen er (husk 2-tallet) e i j = n ix j. n 2lnQ(x) = 2[ r s i=1 j=1 og testsandsynligheden kan beregnes som x i j ln(x i j ) r n i ln(n i ) s x j ln(x j )+n ln(n )] i=1 j=1 ε(x). = 1 F χ 2 ((r 1)(s 1)) ( 2lnQ(x)), hvis de forventede antal alle er større end eller lig med 5. Accepteres H 0 er modellen reduceret til M 1 : X i = (X i1,...,x i j,...,x is ) m(n i,π) = m(n i,(π 1,...,π j,...,π s )) og i denne gælder der, at X 1,...,X i,...,x r er stokastisk uafhængige X = (X 1,...,X j,...,x s ) m(n,π) = m(n,(π 1,...,π j,...,π s )).

71 6.35 Opgaver til Kapitel 6 Opgave 6.1 I tabellen nedenfor ses en grupperet version af antallet af mål scoret i Faxe Kondi Ligaen (Gruppen 0 1 svarer til kampe hvor der blev scoret 0 eller 1 mål, mens gruppen >5 svarer til kampe hvor der blev scoret mere end 5 mål). Tabellen er desuden opdelt efter den første, anden og tredje tredjedel af turneringen. a) Vis, at fordelingen af mål er den samme i de tre dele af turneringen. b) Angiv et 95% konfidensinterval for sandsynligheden for at der scores mere end 5 mål i en kamp. Opgave 6.2 For de fleste af holdene i Faxe Kondi Ligaen er det umiddelbart ud fra Tabel 1.3 let at bedømme om der er forskel på holdenes resultater på hjemmebane og på udebane, mens det for andre klubber ikke er oplagt, om der er en forskel. Tabellen nedenfor viser resultaterne for OB. sejr uafgjort nederlag i alt hjemme ude i alt a) Er det rimeligt, at antage at der ikke er forskel på OB s resulater hjemme og ud? b) Antag, at der ikke er forskel påob s resulater hjemme og ude. Gør rede for at sejr, uafgjort og nederlag er lige sandsynlige udfald af OB s kampe. (For AB s vedkommende gik vi i Eksempel 6.2 direkte til spørgsmål b) her, idet det ud fra resultaterne i Tabel 1.3 er oplagt at der ikke er forskel på resultaterne hjemme og ude.)

72 6.36 Opgaver Opgave 6.3 På side 6.19 så vi, at fordelingen af hjemmesejre, uafgjorte og udesejre i de 198 kampe i Faxe Kondi Ligaen hjemmesejr uafgjort udesejr i alt kunne beskrives ved modellen (X 1,X 2,X 3 ) m(198,(π 1,π 2,π 3 )). Af tallene antyder, at hypotesen om at sandsynligheden π 2 for en uafgjort er lig med sandsynligheden π 3 for udesejr kan accepteres. Opgaven her vedrører test af denne hypotese. Lad p betegne den fælles værdi af π 2 og π 3 under hypotesen. a) Vis, at hypotesen kan formuleres som følgende hypotese med 1 fri parameter om sandsynlighedsvektoren (π 1,π 2,π 3 ): H 0 : (π 1,π 2,π 3 ) = (1 2p, p, p), p ]0,0.5[. b) Vis, at likelihood funktionen for p under H 0 er hvor n = 198, (x 1,x 2,x 3 ) = (90,52,54). n! L(p) = x 1!x 2!x 3! (1 2p)x 1 p x 2+x 3 n! = x 1!x 2!x 3! 2 (x 2+x 3 ) (1 2p) x 1 (2p) x 2+x 3, c) Vis - eventuelt ved hjælp af Sætning at maksimum likelihood estimatet for p er d) Vis, at de forventede antal under H 0 er og test hypotesen. ˆp = x 2 + x 3 2n. hjemmesejr uafgjort udesejr i alt Opgave 6.4 Ved de olympiske lege i Sydney blev der uddelt 301 guldmedaljer, 299 sølvmedaljer og 328 bronzemedaljer. Nedenfor ses medaljerne fordelt på de seks områder Afrika, Asien (inklusive Rusland og de baltiske lande), Australien (inklusiv New Zeeland), Europa, Nordamerika

73 og Sydamerika (inklusiv Mellemamerika).! " " 6.37 a) Vis, at det antages, at fordelingen af medaljer på de seks områder er den samme for de tre slags medaljer. b) Angiv et 95% konfidensområde for sandsynligheden for at en medalje tilfalder Europa. Opgave 6.5 Tallene nedenfor vedrører de 404 trækninger i Viking Lotto, der er foretaget indtil 04- #$%&'()*+##$%#)%%,&+#$%./ /-)$%# #$%&'()*+##$%#)%%,&+#$% )$%# nedenfor / / / / / / / / /0 /3 02 -/ / -/ / / 16 / / / / /4 )$%#./ / den Ved hver trækning udtrækkes der 6 vindertal blandt tallene fra 1 til 48. I de første 230 trækninger blev der udtrukket 3 tillægstal og der efter 2. I de 404 trækninger er der derfor 2424 vindertal og 1038 tillægstal. Fordelingen af vindertal og tillægstal ses i tabellen Besvar ved hjælp af Excel følgende spørgsmål: a) Vis, at fordelingen af tallene fra 1 til 48 er den samme for vindertallene og for tillægstallene.

74 6.38 Opgaver b) Undersøg, om tallen fra 1 til 48 udtrækkes lige hyppigt. Opgave 6.6 I Lotto er der indtil den foretaget i alt 595 trækninger. I en trækning udtrækkes der 7 vindertal. I de første trækninger blandt tallene fra 1 til 34, senere kom tallet 35 til og endnu senere tallet 36. Antallet af tillægstal har også varieret og i de 595 trækninger er der udtrukket i alt 1534 tillægstal. Fordelingen af vindertal og tillægstal ses i tabellen nedenfor. Besvar ved hjælp af Excel følgende spørgsmål: a) Vis, at det ved test på 5% niveau ikke kan antages, at fordelingen af tallene fra 1 til 36 er den samme for vindertallene og for tillægstallene. Betragt nu kun tallene fra 1 til 34. b) Vis at fordelingen af tallene fra 1 til 34 er den samme for vindertallene og for tillægstallene. c) Undersøg, om tallene fra 1 til 34 udtrækkes lige hyppigt.

75 7 Poissonfordelte data Poissonfordelte data Én af grundene til at Poissonfordelingen ofte optræder i praksis er Poisson processen, som er en sandsynlighedsteoretisk model, der beskriver hvorledes hændelser indtræffer tilfældigt i for eksempel tid, plan eller rum. Ifølge modellen er antallet af hændelser, der indtræffer i en delmængde af den betragtede mængde, for eksempel i et tidsinterval eller i et område af planen eller rummet, Poissonfordelt. I Afsnit 7.2 gives en kort beskrivelse af Poisson processen. Desuden omtales nogle få e- genskaber ved Poissonfordelingen, som benyttes ved analyse af en statistisk model baseret på denne fordeling. I afsnit 7.1 introduceres de eksempler, der benyttes ved illustrationerne af teorien i dette kapitel. Statistisk analyse af én observationsrække ved hjælp af Poissonfordelingen diskuteres i Afsnit 7.3, mens vi i Afsnit 7.4 som to eksempler på analyse ved hjælp af flere Poissonfordelinger omtaler Poissonmodellen med proportionale parametre og den multiplikative Poissonmodel. Vi afslutter denne introduktion med en generel bemærkning vedrørende observationsrækker fra diskrete fordelinger. Hvis antallet n i én observationsrække x 1,...,x n er meget stort, angives observationer gerne - af pladshensyn - på tabelform, det vil sige, at man for enhver observeret værdi j angiver antallet a j af x-er i observationsrækken, der antager værdien j, altså a j = #{i : x i = j} Bemærk, at man ved at angive observationerne på tabelform bevarer information om hvilke værdier man har observeret. Derimod kan rækkefølgen af de enkelte observationer x i, i = 1,...,n, naturligvis ikke rekonstrueres ud fra a-erne; dette er dog uden betydning, idet x-erne antages at være udfald af uafhængige og identisk fordelte stokastiske variable og nummereringen af de enkelte observationer er derfor uden betydning. Angivelse af diskrete observationer på tabelform kan naturligvis betragtes som en form for gruppering, der i modsætning til den sædvanlige gruppering af kontinuerte data ikke giver anledning til tab af information vedrørende værdierne af de enkelte observationer.

76 Eksempler 7.1 Eksempler I dette afsnit introduceres de datasæt, der vil blive brugt til at illustrere statistisk analyse i modeller baseret på Poissonfordelingen. Eksempel 7.1 Tabellen nedenfor viser - på tabelform - fordelingen af mål i de 198 kampe i Faxe Kondi Ligaen delt op efter første, anden og tredje tredjedel af turneringen. Fordelingerne er vist i Figur 7.1. antal mål kamp 1-66 kamp kamp j a j a j a j i alt Vi ønsker her dels at beskrive fordelingen af mål i de tre dele af turneringen og dels at undersøge om de tre fordelinger kan antages at være identiske, det vil sige vi ønsker at undersøge om fordelingen af mål kan antages at være den samme i de tre dele af turneringen. Eksempel 7.2 Ved de olympiske lege i Sidney 2000 var de nordiske lande medaljehøst: Danmark 6, Finland 4, Norge 10, Sverige 12. Vi ønsker at belyse spørgsmålet om der er forskel på landenes medaljehøst, eventuelt også i lyset af antal indbyggere i landene. Indbyggerantallene er (i millioner): Danmark 5.3, Finland 5.2, Norge 4.5, Sverige 8.9. Eksempel 7.3 I tabellen nedenfor ses medaljefordelingen for de seks nationer, der fik flest medaljer ved de

77 7.3 Figur 7.1 Fordelingen af mål i første, anden og tredje tredjedel af Faxe Kondi Ligaen olympiske lege i Sydney 2000, se også Figur 7.2. land guld sølv bronze USA RUS CHN AUS GER FRA Vi ønsker blandt andet at undersøge om medaljernes karat afhænger af de seks nationer. 7.2 Sandsynlighedsteoretiske resultater vedrørende Poissonfordelingen Poissonfordelingen er omtalt i Afsnit og i dette afsnit resumeres de sandsynlighedsteoretiske resultater vedrørende Poissonfordelingen, som benyttes i diskussionen af statistik analyse

78 Sandsynlighedsteoretiske resultater vedrørende Poissonfordelingen!"#$% Figur 7.2 Medaljefordelingen for de seks nationer, der fik flest medaljer ved de olympiske lege i Sydney i modeller baseret på denne fordeling. Desuden gives en kort introduktion af Poisson processen, der er en matematisk model til beskrivelse af, hvorledes hændelser indtræffer tilfældigt i blandt andet tid, plan og rum. Endelig nævnes i Sætning 7.1 et matematisk resultat, som vil blive benyttet flere gange i dette kapitel. En diskret stokastisk variabel X er Poissonfordelt med parameter λ > 0, kort X po(λ), hvis sandsynlighedsfunktionen (tæthedsfunktionen) for X er po(x;λ) = e λ λ x, x = 0,1,2,... (7.1) x! Hvis X po(λ) er middelværdien og variansen for X og dermed er dispersionsindekset (eller dispersionskoefficienten) EX = λ (7.2) Var X = λ, (7.3) cd = Var X EX = 1. (7.4) På dette punkt adskiller Poissonfordelingen sig fra andre diskrete fordelinger. For eksempel fås det af resultaterne i Afsnit at dispersionsindekset for binomialfordelingen b(n, π) er lig

79 med 1 π og derfor mindre end 1, mens det for den negative binomialfordeling b (κ,π) er (1 π) 1 og derfor større end 1, se Afsnit Følgende resultat forbinder sandsynlighedsfunktionen for b(n, π) fordelingen med sandsynlighedsfunktionen for Poissonfordelingen: ( n b(x;n,π) = )π x (1 π) n x e λ λ x = po(x;λ), for n og π 0 så nπ λ. x x! (7.5) Resultatet benyttes i modelovervejelser til at skifte fra en model baseret på binomialfordelingen til en model baseret på Poissonfordelingen. Halesandsynligheder i Poissonfordelingen kan approksimeres med halesandsynligheder i normalfordelingen med samme middelværdi og varians. Hvis X po(λ) gælder ( lim P a X λ ) b = Φ(b) Φ(a). (7.6) λ λ Bemærk, at vi approksimerer sandsynligheder i en diskret fordeling, Poissonfordelingen, med sandsynligheder i en kontinuert fordeling, normalfordelingen. Vi skriver kort 7.5 X po(λ) og λ stor X N(λ,λ). (7.7) Mange approksimative resultater i dette afsnit kan forstås ved at tænke på at man regner i den approksimerende normalfordeling til Poissonfordelingen. I praksis kan man anvende den approksimerende normalfordeling for λ > 5. Antag, at X 1,...,X i,...,x n er uafhængige stokastiske variable, således at X i po(λ i ), i = 1,...,n. Lad X betegne summen af de variable, det vil sige X = X 1 + +X i + +X n, og lad tilsvarende λ betegne summen af parametrene, λ = λ λ i + + λ n. Da gælder følgende resultater for fordelingen af summen og for den betingede fordeling af de variable givet summen: og X po(λ ) (7.8) (X 1,...,X i,...,x n ) X = x m(x, λ 1,, λ i,, λ n )). (7.9) λ λ λ Betingningsresultatet i (7.9) er nøglen til at forstå mange ligheder mellem tests i multinomialfordelingen og i Poissonfordelingen. Vi giver nu en ganske kort beskrivelse af Poisson processen, der er en af grundene til, at Poissonfordelingen ofte optræder i praksis. Poisson processen er en sandsynlighedsteoretisk model for, hvorledes hændelser indtræffer tilfældigt. Antag, at vi betragter hændelser i en delmængde S af den reelle akse, planen eller rummet, for eksempel tidspunkter for registreringer på en Geiger-tæller, nedslagssteder for meteoritter, positioner af bakteriekolonier på

80 Sandsynlighedsteoretiske resultater vedrørende Poissonfordelingen en agarplade, fangstpositioner for fisk, positioner for indsamlede sten etc. Lad N(A) betegne antallet af hændelser i mængden A S. Antag, at de følgende tre forudsætninger er opfyldt: a) Sandsynligheden, for at der indtræffer præcis n hændelser i A, afhænger kun af A (A s længde, areal eller rumfang), det vil sige, at P(N(A) = n) afhænger kun af A og n. b) Antallet af hændelser i disjunkte mængder er uafhængige, det vil sige, at N(A) og N(B) er uafhængige stokastiske variable, hvis mængderne A og B er disjunkte, det vil sige P(N(A) = n,n(b) = m) = P(N(A) = n)p(n(b) = m), hvis A B = /0. c) Sandsynligheden, for at der indtræffer mere end én hændelse i A, er lille, hvis A er lille, eller mere præcist P(N(A) 2) 0, for A 0. A Det kan da vises, at der eksisterer et λ > 0, så det for alle delmængder A af S gælder, at antallet af hændelser i A er Poissonfordelt med parameter λ A, altså N(A) po(λ A ). (7.10) Parameteren λ omtales som intensiteten af Poisson processen på S. da er Ved hjælp af formlerne (7.8) og (7.9) samt betingelse b) kan det vises, at hvis A = k A i, hvor A i A j = /0 hvis i j, i=1 (N(A 1 ),...,N(A k )) N(A) = n m(n, A 1 A,, A k A )); med andre ord, givet at der indtræffer n hændelser i A, er antallene af hændelser i de disjunkte delmængder A 1,..., A k (som tilsammen udgør A) multinomialfordelt med antalsparameter n og en sandsynlighedsvektor, der angiver, hvor stor en del de enkelte delmængder A 1,...,A k udgør af A. I det følgende skal vi flere gange bruge et matematisk resultat, der er formuleret nedenfor i Sætning 7.1. Sætning 7.1 Antag, at x > 0 og c > 0. Da antager funktionen g :]0, [ R λ e cλ λ x

81 7.7 sin maksimale værdi i punktet ˆλ = x c. 7.3 Én observationsrække I dette afsnit betragter vi én observationsrække fra Poissonfordelingen. Vi antager altså, at observationerne x 1,...,x n kan betragtes som udfald af uafhængige stokastiske variable X 1,..., X n, som alle er Poissonfordelte med parameter λ, det vil sige, at vi betragter modellen M 0 : X i po(λ), i = 1,...,n. (7.11) Estimation Likelihood funktionen for λ er L(λ) = n e λ λ x i i=1 x i! = e nλ λ x hvor x = x 1 + +x n. Heraf finder vi ved hjælp af Sætning 7.1, at maksimum likelihood estimatet ˆλ for λ er ˆλ = x = 1 n x = 1 n n i=1 1 x i!, n i=1 x i. (7.12) Parameteren λ, som ifølge (7.2) er middelværdien i po(λ)-fordelingen, estimeres altså ved den empiriske middelværdi. Af (7.8) ses, at der gælder følgende resultat vedrørende fordelingen af maksimum likelihood estimatoren: nˆλ = X po(nλ). (7.13) Inferens vedrørende værdien af λ, for eksempel test af hypotesen λ = λ 0, kan foretages ved at betragte fordelingen af X. Modelkontrol Modellen M 0 kan kontrolleres ved et χ 2 -test for goodness of fit, som beskrevet i Afsnit 6.5, hvis stikprøvestørrelsen n er tilstrækkelig stor. En alternativ kontrol af modellen M 0 baserer sig på, at dispersionsindekset for Poissonfordelingen er 1, se formel (7.4). Det må derfor forventes, at forholdet t = s2 x (7.14)

82 Én observationsrække mellem den empiriske varians s 2 og den empiriske middelværdi x er tæt på 1. For store værdier af λ eller for store værdier af n gælder følgende approksimation for fordelingen af den til t svarende stokastiske variabel t χ 2 (n 1)/(n 1). Dette udsagn læses t er en realisation af en stokastisk variabel hvis fordeling kan approksimeres med χ 2 (n 1)/(n 1)-fordelingen. Approksimationen kan benyttes, hvis n 15 eller x 5. Resultat benyttes ofte til test af M 0, idet modellen accepteres ved et test på niveau α, hvis χα/2 2 (n 1)/(n 1) t χ2 1 α/2 (n 1)/(n 1), (7.15) Testet i (7.15) omtales som Fishers dispersionsindeks for Poissonfordelingen. Hvis Poissonmodellen M 0 forkastes, fordi den observerede værdi af t er for stor, kan man på grund af bemærkningen efter formel (7.4) forsøge at beskrive observationsrækken ved hjælp af en model baseret på den negative binomialfordeling. Hvis M 0 forkastes på grund af en for lille værdi af t, peger bemærkningen på en binomialmodel, hvis rimelighed dog som regel checkes ved at undersøge om betingelserne a) - d) side 6.1 er opfyldt for k = 2. Beregningen af den empiriske middelværdi og varians, ved hjælp af hvilke dispersionsindekset er defineret, afhænger af, om alle de enkelte observationer er til rådighed eller om observationerne er givet på tabelform. Med indlysende betegnelser har vi og S = n x i = ja j, i=1 j SK = n x 2 i = j 2 a j i=1 j x = 1 n S og s2 = 1 S2 (SK n 1 n ). I det næste afsnit omtales endnu to approksimative test for modellen M 0, nemlig 2lnQtestet i formel (7.38) og det hermed ækvivalente X 2 -test, som vises at være beslægtet med testet baseret på dispersionsindekset, jævnfør formel (7.39) og bemærkningerne derefter. Eksempel 7.1 (Fortsat) For fordelingen af målene i de tre dele af turneringen har vi følgende beregninger, med fire decimalers nøjagtighed: n S SK x (ˆλ) s 2 t kamp kamp kamp

83 7.9 I alle tre tilfælde er antallet n = 66 af observationer stort nok til at Fishers dispersionsindeks t kan benyttes. De observerede værdier af t skal vurderes i en χ 2 ( f)/ f -fordeling med f = 65. På side 11 i Statistical Tables ses, at 2.5% og 97.5% fraktilen i denne fordeling er henholdsvis og Ifølge (7.15) accepteres modellen M 0 derfor ved et test på niveau 5% i alle tre tilfælde. Antallet af observationer n = 66 er tilpas stort til at vi i denne situation også kan benytte test for goodness of fit til kontrol af M 0. De forventede antal under M 0, der beregnes som e j = ne ˆλ ˆλ j / j!, j = 0,1,...,10, er antal mål kamp 1-66 kamp kamp j a j e j a j e j a j e j i alt For at imødekomme kravet om at de forventede antal skal være større end eller lig med 5 er det i alle tre tilfælde nødvendigt at slå grupperne 0 og 1 sammen til en gruppe (0-1) samt at slå grupperne 5, 6, 7, 8, 9, 10 sammen til en gruppe ( 5). Idet e 5 = n(1 4 e ˆλ ˆλ j 4 / j!) = n e j, j=0 j=0

84 Én observationsrække får vi antal mål kamp 1-66 kamp kamp j a j e j a j e j a j e j i alt I alle tre tilfælde gælder, at antallet af grupper er k = 5 og modellen M 0 har én fri parameter λ, så antallet af frihedsgrader i testet for goodness of fit bliver f = k 1 1 = 3. Vi finder, at 2lnQ 1 = ε 1 = 1 F χ 2 (3)(4.9160) = lnQ 2 = ε 2 = 1 F χ 2 (3)(4.9434) = lnQ 3 = ε 3 = 1 F χ 2 (3)(3.6016) = Testet for goodness of fit giver derfor heller ingen anledning til at betvivle modellen M 0 i nogen af tilfældene. Konfidensinterval Vi starter med at give formlen for et approksimativt 1 α konfidensinterval for middelværdien λ baseret på én observation x fra en po(λ) fordelt stokastisk variabel X. Konfidensintervallet er approksimativt, fordi det bygger på den approksimerende N(λ,λ) fordeling, jævnfør (7.7). I denne holder uligheden u 1 α/2 < X λ 0 λ0 < u 1 α/2 (7.16) med sandsynlighed 1 α. Løses uligheden (7.16) med hensyn til λ 0 fås den ækvivalente ulighed X u2 1 α/2 u 1 α/2 X u2 1 α/2 < λ 0 < X u2 1 α/2 + u 1 α/2 X u2 1 α/2, (7.17) som også holder med sandsynlighed 1 α. Indsættes den aktuelle observation i (7.17) fås 1 α konfidensintervallet for middelværdien i en Poissonfordeling som C 1 α (x) = [λ,λ + ], (7.18) hvor λ = x+ 1 2 u2 1 α/2 u 1 α/2 x+ 1 4 u2 1 α/2, (7.19)

85 7.11 og λ + = x+ 1 2 u2 1 α/2 + u 1 α/2 x+ 1 4 u2 1 α/2. (7.20) Bemærk, at formlen (7.17) understreger, at det er grænserne for konfidensintervallet, der er stokastiske, og at fortolkningen af et konfidensinterval baseret på observationen x er, at enten er λ 0 i konfidensintervallet, eller der er indtruffet en hændelse med sandsynlighed mindre end α. Da desuden (X λ 0 )/ λ 0 er testor for hypotesen H 0 : λ = λ 0 har konfidensintervallet ifølge (7.16) også fortolkningen som de værdier af parameteren, som ikke vil blive forkastet som nulhypotese på grundlag af observationen x. Undertiden er man interesseret i at beregne et konfidensinterval for en parameter λ, i situationer hvor den Poissonfordelte stokastiske variabel X har middelværdi cλ, hvor c betegner en kendt konstant. I de tilfælde beregnes konfidensintervallet for middelværdien cλ efter formlerne (7.19) og (7.20), og det transformes til et konfidensinterval for λ. Det første eksempel på den situation er netop én observationsrække, hvor x po(nλ) og (7.19) og (7.20) er grænserne for 1 α konfidensintervallet for nλ, som transformeres til et konfidensinterval for λ med grænserne [ 1 n (nλ) = 1 x + 1 ] n 2 u2 1 α/2 u 1 α/2 x u2, (7.21) 1 α/2 og [ 1 n (nλ) + = 1 x + 1 ] n 2 u2 1 α/2 + u 1 α/2 x u2 1 α/2. (7.22) Eksempel 7.1 (Fortsat) Ved hjælp af (7.21) og (7.22) beregnes 95% konfidensintervallet for λ, middelværdien af antal scorede mål i én kamp til: n x (S) x (ˆλ) λ λ + kamp kamp kamp Inferens i flere fordelinger I dette afsnit giver vi et par eksempler på statistisk analyse af modeller, der involverer flere Poissonfordelinger. Desuden vises det, at der på grund af resultatet i formel (7.9) er en intim

86 Inferens i flere fordelinger forbindelse mellem analyse af sådanne modeller og analysen af modeller baseret på multinomialfordelingen Poissonmodellen med proportionale parametre Udgangspunktet for den følgende diskussion er, at datasættet x består af observationerne x 1,..., x k, der kan betragtes som udfald af uafhængige stokastiske variable X 1,...,X k, som alle er Poissonfordelt men med hver sin parameter, det vil sige, at grundmodellen er M 0 : X i po(λ i ), i = 1,...,k. (7.23) Antag, at m 1,...,m k er kendte tal, og at vi er interesseret i at teste hypotesen, om at parametrene i modellen M 0 er proportionale med m 1,...,m k som proportionalitetsfaktorer, det vil sige hypotesen H 01 : λ i = m i λ, i = 1,...,k. (7.24) Den tilsvarende model M 1 : X i po(m i λ), i = 1,...,k. (7.25) har én fri parameter λ. Bemærk, at man i modellen M 0 kan undersøge, om x 1,...,x k kan betragtes som én observationsrække fra po(λ)-fordelingen, ved at teste hypotesen svarende til at m 1 = = m k = 1. Likelihood funktionen under M 0 er L(λ 1,...,λ k ) = k e λ λ x i i i i=1 x i! = e λ k λ x k i i i=1 i=1 1 x i!, hvor λ = λ 1 + +λ k. Log likelihood funktionen under M 0 bliver derfor l(λ 1,...,λ k ) = λ + k x i ln(λ i ) k ln(x i!). (7.26) i=1 i=1 Da parametrene λ 1,...,λ k er variationsuafhængige, ses det af det første udtryk for likelihood funktionen ved hjælp af Sætning 7.1, at maksimum likelihood estimatet for λ i under M 0 er ˆλ i = x i, i = 1,...,k. Log likelihood funktionen for λ under H 01 fås ved i (7.26) at erstatte λ i med m i λ. Vi finder l(λ) = k λm i + k x i ln(m i λ) k ln(x i!) (7.27) i=1 i=1 i=1 = λm + x ln(λ)+ k x i ln(m i ) k ln(x i!), i=1 i=1

87 hvor m = m 1 + +m k. Likelihood ligningen for λ bliver derfor dl dλ = m + x λ = 0, 7.13 som har løsning λ = x. Det ses, at hvis x > 0 er maksimum likelihood estimatet for λ under m M 1 x ˆλ =. (7.28) m Det forventede antal svarende til observationen x i - det vil sige middelværdien af X i beregnet under sandsynlighedsmålet svarende til ˆλ - er derfor e i = m i ˆλ = x Af formlerne (7.26) - (7.29) ses det, at 2lnQ-teststørrelsen for H 01 er m i m. (7.29) 2lnQ(x) = 2[l(ˆλ 1,..., ˆλ k ) l(ˆλ)] (7.30) = 2[ k x i ln(x i ) k x i ln(m i ˆλ)] i=1 i=1 = 2 k x i ln( x i ). i=1 e i Antallet af frihedsgrader i den χ 2 -fordeling, der approksimerer fordelingen af 2lnQ under H 01, er k 1, idet der er k frie parametre i M 0 og én fri parameter i M 1. Hvis de forventede antal alle er større end eller lig med 5, har vi følgende approksimation af testsandsynligheden for H 01 : ε(x) =. 1 F χ 2 (k 1)( 2lnQ(x)). (7.31) Hypotesen H 01 kan også testes ved hjælp af X 2 -teststørrelsen, som er Den tilsvarende approksimation af testsandsynligheden er X 2 (x) = k (x i e i ) 2. (7.32) i=1 e i ε (x). = 1 F χ 2 (k 1) (X 2 (x)). (7.33) Fordelingen af maksimum likelihood estimatoren for λ under H 01 angives som regel på følgende måde: m ˆλ = X po(m λ). (7.34) Erstattes x med x i (7.19) og (7.20) fås grænserne for 1 α konfidensintervallet for m λ. Det kan transformeres til et konfidensinterval for λ med grænserne [ 1 = m (m λ) 1 x + 1 ] m 2 u2 1 α/2 u 1 α/2 x u2 1 α/2, (7.35)

88 Inferens i flere fordelinger og [ 1 + = m (m λ) 1 x + 1 ] m 2 u2 1 α/2 + u 1 α/2 x u2 1 α/2. (7.36) Hvis m 1 = =m k = 1 svarer modellen M 1 til én observationsrække fra Poissonfordelingen. Denne model blev betegnet med M 0 i Afsnit 7.3. I dette tilfælde er så de forventede antal er ens, idet ˆλ = x k = x, og formel (7.30) kan derfor reduceres til Yderligere gælder der i denne situation, at e i = x, i = 1,...,k, (7.37) 2lnQ(x) = 2[ k x i ln(x i ) x ln( x )]. (7.38) i=1 X 2 (x) = k (x i x ) 2 (k 1)s2 = = (k 1)t, (7.39) i=1 x x hvor t er Fishers dispersionsindeks, som defineret i formel (7.14). Der er altså en sammenhæng mellem Fishers dispersionsindeks t og X 2 (x), men det er bemærkelsesværdigt, at mens t forkaster for både store og små værdier, så forkasterx 2 kun for store værdier af X 2 (x). Forklaringen er, at Fishers dispersionsindeks og X 2 er udledt i forskellige modeller og tester forskellige hypoteser. For X 2 er modellen, at observationerne er uafhængige og Poissonfordelt, men ikke nødvendigvis identisk fordelt, og i den model testes netop nulhypotesen, at observationerne er identisk fordelt. Fishers dispersionsindeks udledes derimod i en model, hvor observationerne er uafhængige og identisk fordelt, men iøvrigt har en uspecificeret fordeling. Her betragtes nulhypotesen, at den fælles fordeling er Poissonfordelingen. En illustration af brugen af 2 ln Q-testet til kontrol af modellen, der svarer til én observationsrække fra Poissonfordelingen, bliver givet i fortsættelsen af Eksempel 7.2 nedenfor. Relation til multinomialmodellen Der er en tæt forbindelse mellem test i Poissonmodellen og test i multinomialmodellen. For de to test i (7.30) og (7.32) kan dette forklares ved hjælp af formel (7.9). Betinger vi i modellen M 0 med summen af observationerne x, får vi ifølge (7.9) den betingede model M 0 : (X 1,...,X k ) X = x m(x,(π 1,...,π k )), (7.40) hvor (π 1,...,π k ) = ( λ 1 λ,..., λ k ). λ

89 7.15 Da λ-erne varierer frit, er der heller ingen bånd på variationen af sandsynlighedsvektoren (π 1,..., π k ) i (7.40); med andre ord er den betingede model i (7.40) grundmodellen for en multinomialfordeling med k kategorier og med antalsparameter x. Hypotesen H 01 svarer i denne model til den simple hypotese H 01 : (π 1,...,π k ) = ( m 1 m,..., m k ). m Af (7.29) ses, at de forventede antal under hypotesen H 01 i modellen M 0 er præcis de samme som de forventede antal under hypotesen H 01 i modellen M 0, og dermed er også 2lnQ-testene (eller X 2 -testene) identiske. Selvom beregningerne i de to modeller er identiske er modellerne forskellige. Forskellen mellem modellerne består i den måde, hvorpå data er indsamlet. I multinomialmodellen har man på forhånd lagt sig fast på at betragte observationermed en given sum, som angives ved antalsparameteren sædvanligvis betegnet med n; men i modellen M 0 betegnet med x. I Poissonmodellen derimod har man ikke på forhånd lagt restriktioner på summen af observationerne. Eksempel 7.2 (Fortsat) For at undersøge om de fire nordiske landes medaljehøst ved de olympiske lege i Sydney 2000 kan antages at være ens, når vi ikke tager hensyn til landenes befolkningstal, betragter vi modellen M 0 : X i po(λ i ), i = 1,2,3,4 X 1, X 2, X 3 og X 4 er stokastiske uafhængige og tester i denne hypotesen H 01 : λ 1 = λ 2 = λ 3 = λ 4 (= λ), som er af formen (7.24) med m 1 = m 2 = m 3 = m 4 = 1. Accepteres H 01 reduceres modellen M 0 til M 1 : X i po(λ), i = 1,2,3,4 X 1, X 2, X 3 og X 4 er stokastiske uafhængige. Ved hjælp af formel (7.28) bliver maksimum likelihood estimatet for λ i modellen M 1 ˆλ = 32 4 = 8.

90 Inferens i flere fordelinger De forventede antal beregnes derefter som angivet i (7.29). Vi finder land m i x i e i Danmark Finland Norge Sverige i alt og af (7.30) og (7.31) fås og 2lnQ(x) = ε(x) = 1 F χ 2 (3)(5.1967) = , så hypotesen H 01 accepteres. Ved hjælp af (7.35) og (7.36) finder vi, at 95% konfidensintervallet for λ er: [5.6671, ]. Ønsker vi at undersøge om medaljehøsten per indbygger er den samme i de fire nordiske lande tager vi igen udgangspunkt i modellen M 0, men nu tester vi hypotesen H01 : λ i = m i λ, i = 1,2,3,4, som er af formen (7.24) hvor m-erne er befolkningstallene (i millioner) i de fire lande, det vil sige m 1 = 5.3, m 2 = 5.2, m 3 = 4.5 og m 4 = 8.9. Accepteres H01 reduceres modellen M 0 til M1 : X i po(m i λ), i = 1,2,3,4 X 1, X 2, X 3 og X 4 er stokastiske uafhængige. Ved hjælp af formel (7.28) bliver maksimum likelihood estimatet for λ i modellen M 1 ˆλ = = De forventede antal beregnes derefter som angivet i (7.29). Vi finder - med fire decimalers nøjagtighed - land m i x i e i Danmark Finland Norge Sverige i alt

91 7.17 Formlerne (7.30) og (7.31) medfører, at 2lnQ(x) = og ε(x) = 1 F χ 2 (3)(3.8535) = , så hypotesen H01 accepteres. 95% konfidensintervallet for λ, som i M1 er middelværdien af medaljer per 1 million indbyggere i de fire nordiske lande, er findes ved hjælp af (7.35) og (7.36) til: [0.9485, ]. Eksemplet viser altså, at der ikke er signifikant forskel på de fire nordiske landes medaljehøst ved de olympiske lege i Sydney 2000 hverken absolut eller når befolkningsantallene tages i betragtning. Eksempel 7.1 (Fortsat) For at undersøge om parametrene i de tre Poissonfordelinger - én for hver tredjedel af turneringen - er identiske, benytter vi (7.13) og betragter modellen M 0 : X i po(66λ i ), i = 1,2,3 X 1, X 2 og X 3 er stokastiske uafhængige. Hypotesen H 01 : λ 1 = λ 2 = λ 3 er derfor af formen som i (7.24) med m i = 66, i = 1,2,3. Af beregningerne i skemaet og formlerne (7.28) - (7.31) finder vi, at m i x i e i kamp kamp kamp i alt ˆλ = = , 2lnQ(x) =

92 Inferens i flere fordelinger og ε = 1 F χ 2 (2)(3.7401) = Vi accepterer derfor hypotesen, om at parametrene i de tre Poissonfordelinger er identiske, hvilket her betyder, at der er ikke signifikant forskel på fordelingen af mål i kampe i de tre dele af turneringen. Under H 01 er summen af alle observationerne Poissonfordelt, idet X po(m λ), Da x = 573 og m = 198, fås ved hjælp af formlerne (7.35) og (7.36) at 95% kondidensintarvallet for λ - middelværdien af antal scorede mål i en tilfældig kamp i Faxe Kondi Ligaen er [λ,λ + ] = [2.6665,3.1408] Den multiplikative Poissonmodel Denne model benyttes i situationer, hvor observationerne - som vist nedenfor - kan opskrives i en r s tabel svarende til to inddelingskriterier med henholdsvis r og s kategorier. Observationen svarende til den i te kategori ved det første kriterium og den j te kategori ved det andet kriterium betegnes med x i j, i = 1,...,r, j = 1,...,s. Strukturen af data er altså den samme som ved en tosidet variansanalyse uden gentagelser, og som det fremgår af det følgende, er der visse lighedspunkter mellem denne model og den multiplikative Poissonmodel. Modellerne er dog meget forskellige. Den førstnænte er en model for kontinuerte variable, hvor man betragter en hypotese om additiv struktur af middelværdierne, mens Poissonmodellen er en model for diskrete data, hvor man - som det ses nedenfor - betragter en hypotese om en multiplikativ struktur af middelværdierne.

93 7.19 Vi illustrerer teorien ved hjælp af data i Eksempel 7.3, som er angivet i en 6 3 tabel. 1 j s Σ 1 x 11 x 1 j x 1s x 1 i x i1 x i j x is x i r x r1 x r j x rs x r Σ x 1 x j x s x I tabellen betegner x i og x j henholdsvis summen af observationerne i den i te række og den j te søjle, mens x er summen af alle observationerne, det vil sige x i = s x i j, j=1 x j = r x i j, i=1 x = r s x i j i=1 j=1 Forudsætter vi, at alle observationer er udfald af uafhængige stokastiske variable, kan de modeller, vi vil betragte, skrives på følgende måde. Grundmodellen M 0 : x i j po(λ i j ), i = 1,...,r, j = 1,...,s. Den multiplikative model eller modellen for ingen vekselvirkning M 1 : x i j po(α i β j ), i = 1,...,r, j = 1,...,s. Modellen med kun rækkevirkning M 2 : x i j po(α i β), i = 1,...,r, j = 1,...,s. Modellen med kun søjlevirkning M2 : x i j po(αβ j ), i = 1,...,r, j = 1,...,s. Modellen for homogenitet M 3 : x i j po(αβ), i = 1,...,r, j = 1,...,s. De fire sidstnævnte modeller svarer alle til hypoteser, om hvorledes de to inddelingskriterier påvirker fordelingerne i grundmodellen. Modellen M 1 svarer til hypotesen H 01 : λ i j = α i β j, ifølge hvilken de to kriterier virker uafhængigt af hinanden. Fortolkningen af modellerne M 2, M2 og M 3 i relation til de to inddelingskriterier er indlysende.

94 Inferens i flere fordelinger Parametrisering af modellerne Modellen M 1 har r + s 1 frie parametre, hvilket dog ikke fremgår af opskrivningen af modellen ovenfor. Der findes adskillige måder at parametrisere M 1 på. Den måde, vi har valgt, er bekvem for teoretiske overvejelser men adskiller sig fra den, som programpakker benytter. Lad α, β og λ betegne summen af henholdsvis α-erne, β-erne og λ-erne og lad endvidere Idet ρ i = α i, i = 1,...,r og σ j = β j, j = 1,...,s. α β λ = r s i=1 j=1 λ i j = r s i=1 j=1 har vi følgende omskrivning af parameteren under M 1 : α i β j α i β j = α β α β α i β j = r s α i β j = α β, j=1 j=1 = λ ρ i σ j. Da ρ = (ρ 1,...,ρ r ) og σ = (σ 1,...,σ s ) er henholdsvis en r-dimensional og en s-dimensional sandsynlighedsvektor (komponenterne i de to vektorer er positive og summer sammen til 1), ses det, at antallet af frie parametre i M 1 er d 1 = 1+(r 1)+(s 1) = r+ s 1. Med denne parametrisering bliver modellerne M 1, M 2, M 2 og M 3 og deres indbyrdes forhold som angivet i nedenstående skema: ր M 1 : X i j po(λ ρ i σ j ) ց M 2 : X i j po(λ ρ i /s) M 2 : X i j po(λ σ j /r) ց M 3 : X i j po(λ /(rs)) ր I anvendelser af den multiplikative Poissonmodel er det altid spørgsmålet om eventuel virkning af de to inddelingskriterier der har interesse. Det vil sige hypotesen om ingen rækkevirkning og hypotesen om ingen søjlevirkning H 0R : ρ = ( 1 r,..., 1 r ) H 0S : σ = ( 1 s,..., 1 s ). Som det fremgår af oversigten over modellerne kan begge hypoteser testes i to modeller. Således svarer både reduktionenm 1 M 2 og reduktionen M 2 M 3 til hypotesen H 0S om ingen søjlevirkning. Sagt på en anden måde kanh 0S testes både i M 1 og i M2, og hvis hypotesen ikke

95 7.21 forkastes svarer det til reduktionen til henholdsvis M 2 og M 3. Vi skal nedenfor se, at uanset om hypotesen H 0S om ingen søjlevirkning testes i M 1 eller i M2, så er testet det samme. Tilsvarende bemærkninger kan gøres om hypotesen H 0R om ingen rækkevirkning. Estimation Test for de forskellige modelreduktioner udføres ved hjælp af approksimative 2 ln Q-test, som beskrevet i Afsnit 5.7. For at udføre disse test skal vi for hver model kende maksimum likelihood estimatet, værdien ˆl af log likelihood funktionen beregnet i maksimum likelihood estimatet og antallet d af frie parametre i modellen. Desuden skal vi beregne de forventede antal e, for at kunne afgøre om det approksimative test kan benyttes. Disse størrelser beregnes i det følgende for de fem betragtede modeller. M 0 : Likelihood funktionen er L({λ i j }) = r 1 s e λ i j λ x i j i j i=1 j=1 x i j! r s λ x r s i j i j i=1 j=1 i=1 j=1 = e λ 1 x i j!. (7.41) Da λ i j -erne er variationsuafhængige, får vi af det øverste udtryk ved hjælp af Sætning 7.1, at maksimum likelihood estimatet for λ i j er ˆλ i j = x i j, og af det nederste udtryk ses, at den tilsvarende værdi af log likelihood funktionen er ˆl 0 = x + r s i=1 j=1 x i j ln(x i j ) r s i=1 j=1 ln(x i j!). (7.42) Endelig er antallet af frie parametre d 0 = rs, og de forventede antal (e 0 ) i j = x i j. M 1 : Likelihood funktionen svarende til modellen er L(λ,ρ,σ) = r s i=1 j=1 x = e λ λ e λ ρ i σ j (λ ρ i σ j ) x 1 i j x i j! 1 x i j!. r i=1 ρ x s i i σ x r s j j j=1 i=1 j=1 (7.43) Da λ,ρ og σ varierer uafhængigt af hinanden, finder vi ved at bruge Sætning 7.1 på den første faktor og Sætning 6.1 på de næste to faktorer, at maksimum likelihood estimatet er givet ved ˆλ = x, ˆρ i = x i x, ˆσ j = x j x.

96 Inferens i flere fordelinger Værdien af log likelihood funktionen i maksimumspunktet er ˆl 1 = x + x ln(x )+ r x i ln( x i i=1 x )+ s x j ln( x j ) r j=1 x i=1 = x + r x i ln(x i )+ s x j ln(x j ) x ln(x ) r i=1 j=1 Antallet af frie parametre er d 1 = r+ s 1, og de forventede antal er s j=1 s i=1 j=1 ln(x i j!) (7.44) ln(x i j!). (e 1 ) i j = x i x j x ; (7.45) det vil sige, at det forventede antal i den (i, j) te celle er produktet af den i te rækkesum og den j te søjlesum divideret med totalsummen. M 2 : Anvendes Sætning 7.1 på den første faktor og Sætning 6.1 på den anden faktor i likelihood funktionen L(λ,ρ) = r s i=1 j=1 x = e λ λ e λ ρ i /s (λ ρ i /s) x 1 i j x i j! r ρ x i i ( 1 r s 1 s )x x i j!, i=1 findes maksimum likelihood estimatet under M 2 til ˆλ = x, ˆρ i = x i x. i=1 j=1 Den maksimale værdi af log likelihood funktionen under M 2 er ˆl 2 = x + x ln(x )+ r x i ln( x i ln( 1 i=1 x )+x s ) r = x + r x i ln(x i ) x ln(s) r i=1 i=1 s j=1 ln(x i j!). Antallet af frie parametre er d 2 = r, og de forventede antal bliver s i=1 j=1 ln(x i j!) (7.46) (e 2 ) i j = x i s ; (7.47) de forventede antal i den i te række er altså alle lig med det gennemsnitlige antal observationer i den i te række. M 2 : For denne model findes i analogi med M 2, at ˆλ = x, ˆσ j = x j x,

97 d 2 ˆl 2 = x + s x j ln(x j ) x ln(r) r j=1 i=1 s j= ln(x i j!), (7.48) = s og de forventede antal i den j te søjle er alle lig med gennemsnittet af observationerne i den j te søjle, det vil sige M 3 : ses, at og (e 2 ) i j = x j r. (7.49) Anvendes Sætning 7.1 på den første faktor i likelihood funktionen Endvidere er d 3 = 1 og L(λ ) = r s i=1 j=1 x = e λ λ e λ /(rs) (λ /(rs)) x 1 i j x i j! ( 1 r )x ( 1 r s 1 s )x x i j!, ˆλ = x, i=1 j=1 ˆl 3 = x + x ln(x ) x ln(r) x ln(s) r s i=1 j=1 ln(x i j!), (7.50) (e 3 ) i j = x rs ; (7.51) med andre ord er det forventede antal i alle celler lig med gennemsnittet af alle observationer. Test af hypoteser Af formlerne (5.40), (7.42) og (7.44) fås, at hypotesen om multiplikativ virkning (eller ingen vekselvirkning) af de to inddelingskriterier testes ved hjælp af størrelsen H 01 : λ i j = λ ρ i σ j, i = 1,...,r, j = 1,...,s, (7.52) 2lnQ(x) = 2[ˆl 0 ˆl 1 ] (7.53) = 2[ r s i=1 j=1 x i j ln(x i j ) r x i ln(x i ) s x j ln(x j )+x ln(x )], i=1 som skal vurderes i en χ 2 -fordeling med d 0 d 1 = (r 1)(s 1) frihedsgrader. Hvis de forventede antal e 1 i (7.45) er større end eller lig med 5 kan testsandsynligheden beregnes som j=1 ε(x) = 1 F χ 2 ((r 1)(s 1))( 2lnQ(x)). (7.54) Hypotesen om ingen søjlevirkning kan specificeres ved H 0S : σ = (σ 1,...,σ j,...,σ s ) = ( 1 s,, 1 s,, 1 s ).

98 Inferens i flere fordelinger I modellen M 1 svarer hypotesen H 0S til reduktionen til M 2 og testes ved at betragte størrelsen 2lnQ(x) = 2[ˆl 1 ˆl 2 ] (7.55) = 2[ s x j ln(x j ) x ln( x j=1 s )]. Ved sammenligning med (7.38) ses, at 2 ln Q(x) er identisk med teststørrelsen for hypotesen om identitet af parametrene for de s søjlesummer X 1,...,X s. Testsandsynligheden for hypotesen om ingen søjlevirkning - svarende til reduktionen M 1 M 2 - kan derfor beregnes som ε(x) = 1 F χ 2 (s 1)( 2lnQ(x)), (7.56) hvis det fælles forventede antal for søjlesummerne x /s er større end eller lig med 5. Hypotesen om ingen rækkevirkning er H 0R : ρ = (ρ 1,...,ρ i,...,ρ r ) = ( 1 r,, 1 r,, 1 r ). I modellen M 2 svarer hypotesen til reduktionen til M 3 og testes i denne model ved at betragte 2lnQ(x) = 2[ˆl 2 ˆl 3 ] (7.57) = 2[ r x i ln(x i ) x ln( x i=1 r )]. Af (7.38) ses, at denne teststørrelse er identisk med teststørrelsen for identitet af parametrene for de r rækkesummer. Hvis det fælles forventede antal for rækkesummerne x /r er større end eller lig med 5, beregnes testsandsynligheden som ε(x) = 1 F χ 2 (r 1)( 2lnQ(x)). (7.58) Vi har nu vist, hvordan man kan foretage reduktioner i modellen M 0 via ruten M 0 M 1 M 2 M 3. Af formlerne (7.42), (7.44), (7.46), (7.48) og (7.50) ovenfor ses, at vi har følgende identiteter: 2[ˆl 1 ˆl 2 ] = 2[ˆl 2 ˆl 3 ] d 1 d 2 = d 2 d 3 = 2[ s x j ln(x j ) x ln( x )], = s 1, j=1 s 2[ˆl 1 ˆl 2 ] = 2[ˆl 2 ˆl 3 ] d 1 d 2 = d 2 d 3 = 2[ r x i ln(x i ) x ln( x )], = r 1. i=1 r Heraf ses, at testet for hypotesen om ingen søjlevirkning er givet ved formlerne (7.55) og (7.56), uanset hvilken af ruterne M 0 M 1 M 2 M 3 eller M 0 M 1 M 2 M 3, vi betragter.

99 7.25 Med andre ord; har vi accepteret modellen om multiplikativ virkning, påvirker en eventuel rækkevirkning ikke testet for ingen søjlevirkning - testet er det samme selvom det udføres i de to forskellige modeller M 1 og M 2. En lignende bemærkning gælder naturligvis for testet af hypotesen om ingen rækkevirkning. Fordelingsresultater og relation til multinomialmodellen Ved hjælp af formel (7.8) kan det vises, at komponenterne X i i den stokastiske vektor bestående af rækkesummerne X = (X 1,...,X i,...,x r ) er stokastisk uafhængige samt at X i po(λ ρ i ), i = 1,...,r. (7.59) Tilsvarende er komponenterne X j i vektoren af søjlesummer X = (X 1,...,X j,...,x s ) stokastisk uafhængige og X j po(λ σ j ), j = 1,...,s. (7.60) De to vektorer X og X er imidlertid ikke stokastisk uafhængige, idet summen af komponenterne i begge tilfælde er X. Betinger vi i modellen M 0 med summen af alle observationerne x får vi ifølge (7.9) den betingede model M 0 : {X i j } X = x m(x,({ λ i j λ })). (7.61) Da λ-erne varierer frit, er der ingen bånd på sandsynlighedsmatricen i multinomialfordelingen og modellen M 0 svarer til grundmodellen baseret på multinomialfordelingen med antalsparameter x for et r s skema. Hypotesen H 01 svarer i denne model til hypotesen H 01 : λ i j λ = ρ i σ j, i = 1,...,r, j = 1,...,s, (7.62) det vil sige til hypotesen om uafhængighed af inddelingskriterier. Det ses af formlerne (6.23), (6.24), (7.53) og (7.54), at testene for H 01 og H 01 er identiske, selvom det drejer sig om test af forskellige hypoteser i forskellige modeller. Vi har altså hermed set endnu et eksempel på, at man ved at betinge med summen af alle observationer i en model baseret på Poissonfordelingen kommer tilbage til en velkendt multinomialfordelingsmodel. Når man i en konkret situation skal afgøre, om man skal benytte Poissonmodellen eller multinomialfordelingsmodellen, skal man benytte sig af information om, hvorledes observationerne i r s skemaet er indsamlet. Som tidligere nævnt skal multinomialmodellen benyttes, hvis man på forhånd har lagt sig fast på at betragte, hvorledes et givet antal objekter klassificeres efter de to inddelingskriterier; Poissonmodellen benyttes derimod, hvis antallet af objekter, der klassificeres, ikke er kendt på forhånd. Da analysen af data forløber på samme måde i de to modeller,er det ikke vigtigt at erkende hvilken af de to modeller, man har for så vidt strukturen af data angår. Forskellen mellem de to

100 Inferens i flere fordelinger modeller ligger kun i, at i Poissonmodellen er der information i det totale antal observationer x om intensiteten af det fænomen man observerer, mens det totale antal n i multinomialmodellen ikke indeholder information. Af formel (6.26) ses, at vektorerne af rækkesummer X og søjlesummer X er betinget uafhængige givet totalsummen X, det vil sige, at X og X er uafhængige i den betingede fordeling givet X = x. Som afslutning på omtalen af teorien for den multiplikative Poissonmodel understreger vi, at det af formlerne (7.31), (7.38), (7.57) og (7.58) ses, at testet for ingen rækkevirkning i denne model er ækvivalent med testet for identitet af parametrene i Poissonmodellen for de r rækkesummer, se formel (7.59). Eksempel 7.3 (Fortsat) Suppleres tabellen side 7.3 med række- og søjlesummer samt totalsum får vi: land guld sølv bronze i alt USA RUS CHN AUS GER FRA i alt I denne situation forekommer det rimeligt at betragte en model for 6 3 skemaet baseret på Poissonfordelingen. (At multinomialmodellen ikke forekommer at være korrekt for disse data skyldes, at hverken rækkesummer, søjlesummer eller totalsummen er kendt på forhånd) Som grundmodel betragter vi altså modellen M 0 med r = 6 og s = 3. De forventede antal i den multiplikative model M 1 findes ved hjælp af (7.45) og ovenstående skema til: land guld sølv bronze i alt USA RUS CHN AUS GER FRA i alt Da de forventede antal alle er større end eller lig med 5 kan reduktionen til den multiplikative

101 7.27 model testes ved hjælp af formlerne (7.53) og (7.54). Vi finder 2lnQ(x) = og ε(x) = 1 F χ 2 (10)( ) = Hypotesen H 01 accepteres altså og dermed reduktionen til den multiplikative model M 1. Som nævnt ovenfor kan hypotesen om ingen søjlevirkning undersøges ved at teste om parametrene for søjlesummerne er identiske. Ingen søjlevirkning betyder i dette tilfælde, at medaljernes karat ingen indflydelse har på antallet af medaljer. Da det forventede antal observationer i den j te søjle under hypotesen om ingen søjlevirkning er x /s - her x /3 - er de observerede og forventede antal følgende: søjlesummer guld sølv bronze i alt observeret forventet Af (7.55) og (7.56) fås, at og 2lnQ(x) = , ε(x) = 1 F χ 2 (2)(1.1450) = , og hypotesen om ingen søjlevirkning accepteres. Fordelingen af medaljer kan altså antages at være uafhængig af medaljernes karat. For at vurdere om fordelingen af medaljer er den samme for de seks lande betragtes rækkesummerne, og det undersøges, om parametrene i fordelingerne for rækkesummerne er identiske. Vi finder - med tre decimalers nøjagtighed: rækkesummer USA RUS CHN AUS GER FRA i alt observeret forventet Ved hjælp af (7.57) og (7.58) finder vi, at 2lnQ(x) = , og ε(x) = 1 F χ 2 (5)( ) 0, og hypotesen om ingen rækkevirkning forkastes. Antallet af medaljer afhænger ikke overraskende af landene.

102 Inferens i flere fordelinger Slutmodellen for disse data er således M 2 : x i j po(α i β) = po(λ ρ i /s), i = 1,...,6 j = 1,2,3. I denne model gælder, at søjlesummerne er uafhængige og x i po(λ ρ i ), i = 1,...,6. Estimaterne er ˆλ = x og ˆρ i = x i /x, i = 1,...,6, det vil sige ˆλ = 397, ˆρ 1 = = 0.244, ˆρ 2 = = 0.222, ˆρ 3 = = ˆρ 4 = = 0.146, ˆρ 5 = = 0.144, ˆρ 6 = =

103 7.29 Anneks til Kapitel 7 Beregninger i Excel Excel har ikke specielle dialogbokse der udfører beregninger i de modeller for Poissonfordelte data, der er omtalt i dette kapitel. Beregningerne udføres dog let som vist nedenfor. Eksempel 7.1 (Fortsat) Regnearket nedenfor viser beregningen af Fishers dispersion indeks samt testet for goodness of fit til kontrol af modellen M 0 for fordelingen af målene i kampene ()$"!! % '$*!$!)+&!$"!$! ()$"!! % %,-.!/ % % % % % % % % % % % % % % % % % % % % %!&&& %!"#$ % "$& '$#&!$ % % % % Først beregningen af Fishers dispersionsindeks på side 7.8. Data på tabelform er i cellerne A2:B12 og for sådanne data beregnes summen S og kavdratsummen SK som S = j ja j og SK = j j 2 a j. Værdierne j 2 er beregnet i cellerned2:d12. Værdien id2 beregnes som A2 A2

104 7.30 Beregninger i Excel og analoge formler oprettes i cellerne D3:D12. Summen i G1 og kvadratsummen i G2 beregnes ved hjælp af funktionensumprodukt som og =SUMPRODUKT(A2 :A12;B2 :B12) =SUMPRODUKT(B2 :B12;D2 :D12) (= j (= j ja j ) j 2 a j ). Da antallet af observationer er n = 66 beregnes empirisk middelværdi x og varians s 2 i G3 og G4 som og G1/66 (= S/n) = (G2 G1 G1/66)/65 (= 1 S2 (SK n 1 n )) og værdien af Fishers dispersionsindeks t ig5 som G4/G3 (= s2 x ). Grænserne for acceptområdet ig6 ogg7 beregnes i en χ 2 (65)/65-fordeling som henholdsvis =CHIINV(1 0,025;65)/65 (χ (65)/65) og =CHIINV(1 0,975;65)/65 (χ (65)/65). Cellerne A15:H27 vedrører testet for goodness of fit, side 7.9. I cellerne A16:B26 ser vi igen data på tabelform, mens cellerne C16:C26 indeholder de forventede antal. Disse er beregnet ved ic16 at beregne =POISSON(A16;$G$3;FALSK) 66 (n po(0; x )) for derefter at oprette analoge formler ic17:c26. Cellerne E15:G20 indeholder den grupperede version af data og de forventede værdier, der opfylder at de forventede antal er større end eller lig med 5. Indholdet aff16 ogg16 er beregnet som henholdsvis =B16+B17 (= a 0 + a 1 ) og =C16+C17 (= e 0 + e 1 ). Herefter kopieres indholdet af cellerne B18:C20 til cellerne F17:G19. Endelig beregnes værdien if20 som =SUM(B21 :B26) (= 10 a j ) j=5

105 og værdien ig20 som =66 SUM(G16 :G19) (= n 4 e j ). j= Vi mangler nu kun at beregne 2 ln Q-teststørrelsen for testet for goodness of fit og den tilsvarende testsandsynlighed. Hertil beregnes værdien ih16 som =LN(F16/G16) (= ln( a 0 1 e 0 1 )) og analoge formler oprettes i celleren H17:H20. Herefter beregnes værdien if23 som =2 SUMPRODUKT(F16 :F20;H16 :H20) (= 2[a 0 1 ln( a )+ e 0 1 a j ln( a j )+a 5 ln( a 5 )]) j=2 e j e 5 og testsandsynligheden if24 som =CHIFORDELING(F23;3) (= 1 F χ 2 (5 1 1) ( 2lnQ)). Eksempel 7.2 (Fortsat) % Vi viser her, hvorledes beregningerne i Poissonmodellen med proportionale parametre for data på side 7.16 ( & &'!"#$ &' ' kan udføres. Resultatet ' & & & '& er vist nedenfor. ) & & & &'''' &' '&' '&'''' & '&'' '' '& ' * +,, & '& Cellerne B2:B5 indeholder de observerede antal medaljer, x i, og cellerne C2:C5 indbyggerantallene, m i, i millioner. Først beregnes summerne ib6 ogc6. Derefter beregnes de forventede antal, e i, id2:d5. Først beregnes værdien id2 som = $B$6 C2/$C$6 (= x og analoge formler oprettes id3:d5. Herefter beregnes værdien if2 som m 1 m =LN(B2/D2) (= ln( x 1 e 1 )) )

106 7.32 Beregninger i Excel og analoge formler oprettes if3:f5. Endelig beregnes 2lnQ-teststørrelsen ib8 som og testsandsynligheden ib9 som =2 SUMPRODUKT(B2 :B5;F2 :F5) (= 2 k i=1 x i ln( x i e i )) =CHIFORDELING(B8;3) (= 1 F χ 2 (k 1) ( 2lnQ)). Eksempel 7.3 (Fortsat) Som nævnt ovenfor er beregningerne i testet for den multiplikative Poissonmodel identiske med beregningerne i testet for uafhængighed mellem inddelingskriterier i en multinomialmodel. Beregningerne i Excel kan derfor udføres som vist i Eksempel 6.3 på side 6.29.

107 7.33 Hovedpunkter til Kapitel 7 Én observationsrække Model: Observationerne x 1,...,x n betragtes som udfald af uafhængige stokastiske variable X 1,...,X n, som alle er Poissonfordelte med parameter λ, det vil sige M 0 : X i po(λ), i = 1,...,n. Estimat: Maksimum likelihood estimatet ˆλ for λ er ˆλ = x = 1 n x = 1 n n i=1 Fordelingen af maksimum likelihood estimatoren angives ved Modelkontrol: nˆλ = X po(nλ). Hvis stikprøvestørrelsen n er tilstrækkelig stor, kan M 0 kontrolleres ved et χ 2 -test for goodness of fit, som beskrevet i Afsnit 6.5. En alternativ kontrol af modellen M 0 baserer sig på Fishers dispersionsindeks, som er forholdet t = s2 x mellem den empiriske varians s 2 og den empiriske middelværdi x. Beregningen af den empiriske middelværdi og varians afhænger af, om alle de enkelte observationer er til rådighed eller om observationerne er givet på tabelform. Med indlysende betegnelser har vi og S = n x i = ja j, i=1 j x i. SK = n x 2 i = j 2 a j i=1 j x = 1 n S og s2 = 1 S2 (SK n 1 n ). Modellen M 0 accepteres ved et test på niveau α, hvis χα/2 2 (n 1)/(n 1) t χ2 1 α/2 (n 1)/(n 1),

108 7.34 Hovedpunkter til Kapitel 7 Testet er baseret på en approksimation, som kan anvendes hvis n 15 eller x x x 5. Konfidensintervaller: Middelværdien i en Poissonfordelt stokastisk variabel: Et approksimativt 1 α konfidensinterval for parameteren λ baseret på én observation x fra po(λ) fordelingen er af formen C 1 α (x) = [λ,λ + ], hvor λ = x+ 1 2 u2 1 α/2 u 1 α/2 x+ 1 4 u2 1 α/2 og λ + = x+ 1 2 u2 1 α/2 + u 1 α/2 x+ 1 4 u2 1 α/2. I formlerne betegner u 1 α/2 (1 α/2)-fraktilen i u-fordelingen. Hvis α = 0.05 er fraktilen u = Middelværdien i én observationsrække fra Poissonfordelingen: Her er summen x po(nλ) og 1 α konfidensintervallet for λ har grænserne [ ] λ = 1 n x u2 1 α/2 u 1 α/2 x u2 1 α/2 og [ λ + = 1 x + 1 ] n 2 u2 1 α/2 + u 1 α/2 x u2 1 α/2. Flere fordelinger Poissonmodellen med proportionale parametre: Datasættet x består af observationerne x 1,...,x k der kan betragtes som udfald af uafhængige stokastiske variable X 1,...,X k, som alle er Poissonfordelt men med hver sin parameter, det vil sige, at grundmodellen er M 0 : X i po(λ i ), i = 1,...,k. Vi er interesseret i at teste hypotesen, om at parametrene i modellen M 0 er proportionale med de kendte tal m 1,...,m k som proportionalitetsfaktorer, det vil sige hypotesen H 01 : λ i = m i λ, i = 1,...,k. Accepteres hypotesen reduceres M 0 til modellen M 1 : X i po(m i λ), i = 1,...,k.

109 7.35 Bemærk, at man i modellen M 0 kan undersøge, om x 1,...,x k kan betragtes som én observationsrække fra po(λ)-fordelingen, ved at teste hypotesen svarende til at m 1 = = m k = 1. Maksimum likelihood estimatet for λ under M 1 er ˆλ = x, hvor x = x 1 + +x k og m = m 1 + +m k. Det forventede antal i M 1 svarende til observationen x i er og 2lnQ-teststørrelsen for H 01 er m e i = m i ˆλ = x m i m 2lnQ(x) = 2 k x i ln( x i ). i=1 e i Hvis de forventede antal alle er større end eller lig med 5, gælder der følgende approksimation af testsandsynligheden for H 01 : ε(x). = 1 F χ 2 (k 1) ( 2lnQ(x)). Fordelingen af maksimum likelihood estimatoren for λ under H 01 angives som regel på følgende måde: m ˆλ = X po(m λ). Konfidensintervaller for parameteren i Poissonmodellen med proportionale parametre: Erstattes x med x i (7.19) og (7.20) fås grænserne for 1 α konfidensintervallet for m λ. Det transformeres til et konfidensinterval for λ med grænserne [. ] λ = 1 m x u2 1 α/2 u 1 α/2 x u2 1 α/2 og [ λ + = 1 x + 1 ] m 2 u2 1 α/2 + u 1 α/2 x u2 1 α/2.

110 7.36 Hovedpunkter til Kapitel 7 Den multiplikative Poissonmodel: Observationerne kan - som vist side opskrives i en r s tabel svarende til to inddelingskriterier med henholdsvis r og s kategorier. Observationen svarende til den i te kategori ved det første kriterium og den j te kategori ved det andet kriterium betegnes med x i j, i = 1,...,r, j = 1,...,s. Endvidere betegner x i og x j henholdsvis summen af observationerne i den i te række og den j te søjle, mens x er summen af alle observationerne, det vil sige x i = s x i j, j=1 x j = r x i j, i=1 x = r s i=1 j=1 x i j. Idet observationerne antages at være udfald af uafhængige stokastiske variable, betragtes følgende modeller: Grundmodellen M 0 : x i j po(λ i j ), i = 1,...,r, j = 1,...,s. Den multiplikative model eller modellen for ingen vekselvirkning M 1 : x i j po(α i β j ), i = 1,...,r, j = 1,...,s. Modellen for kun rækkevirkning M 2 : x i j po(α i β), i = 1,...,r, j = 1,...,s. Modellen for kun søjlevirkning M2 : x i j po(αβ j ), i = 1,...,r, j = 1,...,s. Modellen for homogenitet M 3 : x i j po(αβ), i = 1,...,r, j = 1,...,s. Benyttes omskrivning af parameteren under M 1 α i β j α i β j = α β α β = λ ρ i σ j. kan modellerne M 1, M 2, M 2 og M 3 og deres indbyrdes forhold angives på følgende måde: : ր M 1 : X i j po(λ ρ i σ j ) ց M 2 : X i j po(λ ρ i /s) M 2 : X i j po(λ σ j /r) ց M 3 : X i j po(λ /(rs)) ր

111 7.37 Hypotesen om multiplikativ virkning (eller ingen vekselvirkning) af de to inddelingskriterier, H 01 : λ i j = λ ρ i σ j, i = 1,...,r, j = 1,...,s, svarer til reduktionen fra M 0 til M 1 og testes ved hjælp af størrelsen 2lnQ(x) = 2[ r s i=1 j=1 x i j ln(x i j ) r x i ln(x i ) s x j ln(x j )+x ln(x )], Hvis de forventede antal under M 1 (e 1 ) i j = x i x j, x alle er større end eller lig med 5, kan testsandsynligheden beregnes som Hypotesen om ingen søjlevirkning, i=1 j=1 ε(x) = 1 F χ 2 ((r 1)(s 1)) ( 2lnQ(x)). H 0S : σ = (σ 1,...,σ j,...,σ s ) = ( 1 s,, 1 s,, 1 s ), svarer i modellen M 1 til reduktionen til M 2 og testes her ved hjælp af størrelsen Testsandsynligheden beregnes som forudsat, at x /s 5. Hypotesen om ingen rækkevirkning, 2lnQ(x) = 2[ s x j ln(x j ) x ln( x j=1 s )]. ε(x) = 1 F χ 2 (s 1) ( 2lnQ(x)), H 0R : ρ = (ρ 1,...,ρ i,...,ρ r ) = ( 1 r,, 1 r,, 1 r ), svarer i modellen M 1 til reduktionen til M 2 og testes her ved at betragte 2lnQ(x) = 2[ r x i ln(x i ) x ln( x i=1 r )]. Hvis x /r 5, beregnes testsandsynligheden som ε(x) = 1 F χ 2 (r 1) ( 2lnQ(x)). I modellen M 2 svarer hypotesen om ingen rækkevirkning til reduktionen til M 3 og testes i denne model ved at betragte størrelsen 2lnQ(x) = 2[ r x i ln(x i ) x ln( x i=1 r )].

112 7.38 Hovedpunkter til Kapitel 7 Hvis x /r 5, beregnes testsandsynligheden som ε(x) = 1 F χ 2 (r 1) ( 2lnQ(x)). I modellen M2 svarer hypotesen om ingen søjlevirkning til reduktionen til M 3. Hvis x /s 5 benyttes teststørrelsen og den tilsvarende testsandsynlighed bliver 2lnQ(x) = 2[ s x j ln(x j ) x ln( x j=1 s )], ε(x) = 1 F χ 2 (s 1) ( 2lnQ(x)).

113 7.39 Opgaver til Kapitel 7 Opgave 7.1 Antag, at X 1,...,X n er uafhængige og identisk Poissonfordelte med parameter λ, X j po(λ), j = 1,...,n. I Opgave 5.2 viste vi, at log likelihood funktionen for λ er l(λ) = nλ + x lnλ n i=1 lnx i! samt at maksimum likelihood estimatet for λ er x a) Vis, at 2lnQ-teststørrelsen for den simple hypotese H 0 : λ = λ 0, hvor λ 0 er en kendt værdi er [ ] 2lnQ(x) = 2 x ln( x )+nλ 0 n x χ 2 (1). λ 0 b) Vis, at dette også er 2lnQ-teststørrelsen for hypotesen H 0 : λ = λ 0 i modellen X po(nλ). c) Test hypotesen λ = 5 hvis x = 7, n = 1 og hvis x = 70, n = 10. Opgave 7.2 En cykelrytter har i løbet af sin karriere på 10 år 13 styrt,mens en anden i løbet af en karriere på 5 år er udsat for 11 styrt. a) Vis, idet antallet af styrt antages at være Poissonfordelt, at der ikke er signifikant forskel på antallet af styrt per år som de to ryttere har været udsatfor. b) Angiv et estimat og 95% konfidensintervallet for antallet af styrt per år.

114 7.40 Opgaver Opgave 7.3 Faxe Kondi Divisionen omfattede 16 hold, der mødtes to gange i turneringen, i alt 240 kampe. Nedenfor ses på tabelform fordelingen af mål i de 240 kampe. a) Vis dels ved hjælp af Fishers dispersionsindeks og dels ved hjælp af et test for goodness of fit, at antallet af mål i de 240 kampe kan betragtes som én Poissonfordelt observationsrække. b) Undersøg ved hjælp af tallene her for Faxe Kondi Divisionen og tallene for Faxe Kondi Ligaen på side 7.18 om der er forskel på antal scorede mål per kamp i de to rækker. Opgave 7.4 I et bachelorprojekt fra Institut for Idræt, Københavns Universitet, med titlen Fysiske krav i elitefodbold for ungdomsspillere undersøger Berg og Blæsild (2000) blandt andet løbemønstre hos spillerne. Man skelner mellem lavintensive aktiviteter, som omfatter stå stille, gå, jog, let løb og baglæns løb, og højintensive aktiviteter, som omfatter halvhurtigt løb, hurtigt 8*#*!" #!$ %$ 215 $ &'($ %$ $ 21 9 Antag, at de observerede tal er Poissonfordelte. løb og sprint. En bestemt spiller videofilmes i en hel kamp og det optælles hvor mange gange i løbet af kampen en spiller har været i hver af de otte kategorier, nævnt ovenfor. De % +. %$) første tal nedenfor 012 *) vedrører 223 (+* en sammenligning 245 # $ 564,!*#-%&!#&".$*$ af en 26 spiller 014 &".$*$ fra Faxe Kondi 77 %/.$ Ligaen 52 (senior) og en spiller fra Ynglinge Ligaen (yngling). a) Illuster de observerede antal for såvel lavintensitet som højintensitet aktiviteter ved hjælp af figurer lavet i Excel. b) Vis for såvel lavintensitet som højintensitet aktiviteter at data kan beskrives ved en multiplikativ Poissonmodel.

115 7.41 c) Undersøg for såvel lavintensitet som højintensitet aktiviteter om der er forskel på senioren Antag igen, at de observerede tal er Poissonfordelte. og ynglingen. De nedenstående tal vedrører en sammenligning af løbemønstre for ynglinge spillere med forskellige positioner på banen. d) Illuster de observerede antal for såvel lavintensitet som højintensitet aktiviteter ved hjælp af figurer lavet i Excel. e) Vis, at højintensitet aktiviteterne kan beskrives ved en multiplikativ Poissonmodel mens dette ikke er tilfældet for lavintensitet aktiviteterne. f) Undersøg, om spillerenes højintensitet aktiviteter afhænger af positionen på banen. De følgende tre opgaver har ikke noget med idræt at gøre men vedrører andre interessante anvendelser af Poissonfordelingen. Opgave 7.5 Data i denne opgave vedrører bombning af den sydlige del af London under Anden Verdenskrig. Området er opdelt i 576 delområder hvert på1/4 km 2, og for hvert delområde er det registreret, hvor mange bomber der faldt i det pågældende område. Registreringerne er gengivet i Tabel 7.1. nedenfor. a) Vis ved at betragte Fishers dispersionsindeks, at det kan antages, at de 576 observationer kan betragtes som en Poissonfordelt observationsrække. b) Angiv et estimat for antallet af bomber, der faldt i et delområde, samt et 95% konfidensinterval for dette antal. c) Angiv et estimat for sandsynligheden for, at der ingen bombe faldt i et delområde, samt et 95% konfidensinterval for denne sandsynlighed. Opgave 7.6 Data i denne opgave består af registreringer af store jordskælv i en periode på 75 år fra 1903 til og med Et jordskælv betegnes som stort, hvis dets størrelse på Richter skalaen er mindst 7.5 eller hvis mere end 1000 mennesker er omkommet ved jordskælvet. Tabel 7.2 nedenfor viser på tabelform det årlige antal jordskælv for de 75 år.

116 7.42 Opgaver j a j n 576 S 537 SK 1059 Tabel 7.1 På tabelform er angivet antallet af bomber, der faldt i de 576 delområder på hvert 1/4 km 2 i det sydlige London under Anden Verdenskrig. Endvidere er antal observationer n, sum S og kvadratsum USS angivet. j a j n 75 S 63 SK 109 Tabel 7.2 På tabelform er angivet det årlige antal store jordskælv for de 75 år fra 1903 til og med Endvidere er antal observationer n, sum S og kvadratsum USS angivet.

117 7.43 a) Vis ved at betragte Fishers dispersionsindeks, at det kan antages, at de 75 observationer kan betragtes som en Poissonfordelt observationsrække. b) Angiv et estimat for det årlige antal store jordskælv i den betragtede periode samt et 95% konfidensinterval for dette antal. Antag, at der i de kommende 25 år vil indtræffe 23 store jordskælv. c) Undersøg om det kan antages, at det årlige antal store jordskælv er det samme for de næste 25 år som for perioden fra 1903 til og med Opgave 7.7 På en større arbejdsplads har man over en periode på 5 uger registreret antallet af tilskadekomster opdelt efter faggruppe og tid på dagen. a) Undersøg, hvorledes ulykkesantallet afhænger af faggruppe og tid på dagen. b) På virksomheden var der i den pågældende periode ansat 2413 faglærte, 988 ufaglærte og 539 lærlinge. Er der samme ulykkeshyppighed i de tre faggrupper? Faggruppe Tid Faglærte Ufaglærte Lærlinge Før frokost Efter frokost Tabel 7.3 Arbejdsulykker inddelt efter faggruppe og tid på dagen.

118 7.44 Opgaver

119 8 Ikke-parametriske test Ikke-parametriske test Som det fremgår af Kapitel 4 - Kapitel 7 er den statistiske inferens i denne bog parametrisk, idet den er baseret på parametriserede klasser af fordelinger. Udgangspunket er at data x opfattes som udfald af en stokastik vektor X, hvis fordelingsfunktion antages at tilhøre en parametriseret klasse af fordelingsfunktioner F = {F ω : ω Ω}. Her er parameteren ω valgt, således at den er relevant for den saglige sammenhæng, der ligger til grund for det eksperiment, hvis resultat var data x. Undertiden kritiseres parametrisk inferens for at være for følsom overfor afvigelser for den valgte fordelingsklasse, eksempelvis hævdes det nu og da, at test udledt i en statistisk model baseret på normalfordelingen er for følsomme over for afvigelser fra antagelsen om normalitet. Argumentet er ofte at den empiriske varians s 2 påvirkes meget af ekstreme værdier. Hvis for eksempel nogle få af observationerne har meget ekstreme værdier vokser den empiriske varians s 2, og da s eller s 2 optræder i nævneren i henholdsvis t- og F-test bliver disse teststørrelser tilsvarende små, hvilket igen betyder, at signifikante afvigelser fra de betragtede hypoteser ikke afsløres. I modsætning til en del andre bøger i elementær statistik har vi i denne bog beskæftiget os en del med det punkt i en statistisk analyse der hedder modelkontrol og som netop vedrører spørgsmålet om data kan beskrives ved hjælp af modellens parametriserede fordelingsklasse. Rimeligheden af fordelingsklassen er i alle eksempler blevet vurderet ved hjælp af grafiske eller numeriske test baseret på de oprindelige observationer eller på residualer i modellen. Hvis denne kontrol af modellen falder negativt ud skal man naturligvis ikke drage inferens i den betragtede model, da konklusioner baseret på en forkert model sjældent er rigtige. Hvis man ved modelkontrollen får det indtryk, at en eller flere observationer er ekstreme i forhold til de øvrige er det naturligt at kontakte personen, der har udført eksperimentet, for at få en forklaring. Hvis det viser sig, at de ekstreme observationer skyldes ændrede forsøgsbetingelser kan man udelade disse observationer fra beregningerne. Hvis fagmanden derimod bekræfter gyldigheden af de ekstreme observationer må modellen forkastes og en ny opstilles. Hvis det viser sig helt umuligt af finde en parametriseret fordelingsklasse, der giver en rimelig beskrivelse af data, kan man ty til ikke-parametrisk statistik, som er baseret på min-

120 Fortegnstestet dre specifikke antagelser vedrørende observationernes fordeling. Det hævdes undertiden, at ikke-parametrisk statistik er fri for forudsætninger, hvilket ikke er korrekt. De fleste ikkeparametriske test er udledt under forudsætninger såsom uafhængighed, identiske fordelinger og undertiden også symmetriske fordelinger af observationerne. Formålet med kapitlet her er at give et indtryk af tankegangen i ikke-parametrisk statistik. I Afsnit 8.1 omtales fortegnstestet, som nok er det simpleste af de ikke-parametriske test. I Afsnit 8.2, der er baseret på Lehmann (1975), omtales de simpleste eksemler på rangtest, det vil sige test baseret på observationernes rang. I afsnittene Afsnit betragtes rangtest for henholdvis én, to og flere observationsrækker. Endelig vises det i et anneks til dette kapitel hvorledes nogle af beregningerne kan foretages ved hjælp af Excel. 8.1 Fortegnstestet Gennemgangen af fortegnstestet er baseret på Eksempel 8.1. Eksempel 8.1 Andersen(1998) Konditallet før og efter et intensivt træningsprogram for 15 idrætsudøvere. idrætsudøver nr. før efter differens differens rang Det er her af interesse at afgøre om træningsprogrammet har haft en virkning på konditallet.

121 Problemstillingen i Eksempel 8.1 kender vi fra det parrede t-test i Afsnit 4.4. Hvis d i er differensen mellem konditallet efter og før træningen for den i te person, undersøgte vi virkningen af træningen ved i modellen at teste hypotesen δ = 0 ved hjælp af 8.3 M 0 : D i N(δ,σD 2 ), i = 1,...,n, (8.1) d t(d) = n t(n 1). s 2 d I fortegnstestet droppes antagelsen om normalitet af D-erne og vi betragter hypotesen H 0 : D i har en kontinuert fordeling som er symmetrisk om 0, i = 1,...,n, hvor som i (8.1) implicit antager, at D-erne er uafhængige og identisk fordelte. Under hypotesen H 0 er P(D i > 0) = P(D i < 0) = 1/2, så hvis S + betegner antallet af differenser med positivt fortegn har vi S + b(n,1/2). Lad s + betegne det observerede antal af positive differenser. Da binomialfordelingen b(n,1/2) er symmetrisk med middelværdi n/2 gælder der, at hvis s + n/2 så er værdien n s + lige så kritisk for H 0 som s + mens værdierne 0,1,...,s + 1 og,n s + + 1,...,n er mere kritiske for H 0 end s +. Tilsvarende, hvis s + n/2 er værdien n s + lige så kritisk som s + mens værdierne 0,1,...,n s + 1 og s + + 1,...,n er mere kritiske for H 0 end s +. Idet der tages hensyn til at b(n,1/2)-fordelingen er diskret beregnes testsandsynligheden i binomialfordelingen som min(s +,n s + ) 1 ε F (d) = b(s + ;n,1/2)+2 i=0 b(i;n,1/2)), (8.2) det vil sige som sandsynligheden for det observerede udfald s + plus to gange sandsynligheden for udfald der er mere kritiske end s +. Bemærkning 8.1 I fortegnstestet betragtes kun observationer hvis differens er forskellig fra 0, det vil sige at n = #{i : d i 0}. Eksempel 8.1 (Fortsat) Af tabellen side 8.1 ses, at det observerede antal positive differenser er s + = 11. Da alle differenser er forskellige fra 0 er n = 15 og af (8.2) fås, at testsandsynligheden for H 0 er ε F (d) = b(11;15,1/2)+2 3 i=0 b(i;15,1/2) =

122 Rangtest Lad os tilsammenligning udføre beregningerne for det parrede t-test. Efter grafisk kontrol af at forudsætningerne for anvendelsen af testet er opfyldt, beregnes teststørrelsen til t(d) = t(14), og den tilsvarende testsandsynlighed for hypotesen δ = 0 bliver ε t (d) = Konklusionen vedrørende hypotesen om at differenserne har en fordeling, der er symmetrisk omkring 0, er altså forskellig ved de to test. Fortegnstestet accepterer hypotesen mens det parrede t-test forkaster hypotesen. Denne forskel kommenteres i en forsættelse af eksemplet nedenfor. 8.2 Rangtest Testene i dette afsnit er alle baseret på rangen af observationerne i en observationsrække som defineret i Definition 1.1. Vi minder om, at hvis x (1)... x (i)... x (n) betegner den ordnede stikprøve for en observationsrække x 1,...,x n så defineres rangen af observationerne således: rang(x (i) ) = i, hvis x (i 1) < x (i) < x (i+1) rang(x (i) ) = = rang(x (i+k 1) ) = i+(k 1)/2, hvis x (i) = = x (i+k 1) (8.3) Rangen af observationen x (i) er altså i, hvis x (i) er den eneste observation med denne værdi, det vil sige hvis x (i 1) < x (i) < x (i+1). Hvis k observationer x (i),x (i+1),...,x (i+k 1) er lige store, det vil sige hvis x (i) = x (i+1) = = x (i+k 1), tildeles de alle rangen i+(k 1)/2, som er gennemsnittet af de k tal i,i+1,...,i+k 1. I engelsk sproget litteratur betegnes de her betragtede range som midranks. De ordnede værdier i stikprøven er de forskellige værdier y 1,y 2,...,y m, som observationerne i stikprøven antager, ordnet efter størrelse, det vil sige y 1 < y 2 < < y m. (8.4) For j = 1,...,m betegnes antallet af observationer med værdien y j med a j. Der er altså m forskellige værdier i stikprøven. Hvis m = n er alle observationerne forskellige og alle a-erne

123 8.5 har værdien 1. Hvis a j = k > 1 forekommer værdien y j altså k gange blandt x-erne. Hvis x (i) = x (i+1) = = x (i+k 1) = y j siges observationerne x (i),x (i+1),...,x (i+k 1) at være sammenfaldende og de tilordnes ifølge ovenstående alle rangen i + (k 1)/2. I engelsk sproget litteratur omtales sammenfaldende observationer som ties. I Afsnit Afsnit betragtes rangtest for henholdvis én, to og flere observationsrækker. I gennemgangen af rangtestene vil vi indledningsvis antage at alle observationerne er forskellige for senere i bemærkninger at angive modifikationer af testene i tilfælde af sammenfaldende observationer Wilcoxons test for én observationsrække For observationsrækken x 1,...,x n betragter vi hypotesen H 0 : X i har en kontinuert fordeling symmetrisk om 0, i = 1,...,n, hvor vi også antager at X-erne er uafhængige og identisk fordelte. Et ikke-parametrisk test for H 0 er Wilcoxons test for én observationsrække, som undertiden omtales som Mann-Whitney testet. Testet er baseret på rangene af de numeriske værdier x 1,..., x n af observationerne. Testet involverer kun de observationer x som er forskellige fra 0. Lad N betegne dette antal, det vil sige N = #{i : x i 0} og lad r + i betegne rangen af x i. Teststørrelsen, der betragtes er W = r i +, (8.5) {i:x i >0} det vil sige summen af rangene for de positive observationer. Hvis hypotesen H 0 er korrekt skal de positive og negative observationer falde tilfældigt mellem hinanden og have nogenlunde de samme numeriske værdier. Summen af rangene for de positive observationer skal derfor stort set være lig med summen af rangene for de negative observationer. Hvis summen af rangene af de positive observationer er meget større end summen af rangene for de negative observationer tyder dette på at der signikant flere positive observationer end negative eller de positive observationer er signifikant større end de negative. Store værdier af W er derfor kritiske for H 0. Et symmetriargument viser tilsvarende at også små værdier er kritiske for H 0. Hvis alle observationer, der er forskellige fra 0, er negative er W = 0, og hvis alle observationer, der er forskellige fra 0, er positive er W = N(N + 1)/2, som er summen af tallene 1,2,...,N. Det kan vises, at fordelingen af W ikke afhænger af X-ernes fælles fordeling, samt at og VarW = EW = N(N + 1) 4 N(N + 1)(2N + 1). 24

124 Rangtest For små værdier af N kan testsandsynligheden findes ved hjælp af tabeller, mens man for store værdier af N benytter at W er normalfordelt. Standardiseres fordelingen af W i sådanne tilfælde er N(N + 1) W U 1 (X) = 4 N(0,1) (8.6) N(N + 1)(2N + 1) 24 og testsandsynligheden for Wilxocons test kan beregnes som ε W (x) = 2(1 Φ( u 1 (x) )), (8.7) hvor u 1 (x) er den observerede værdi af U 1 (X) og hvor Φ er fordelingsfunktionen for N(0,1)- fordelingen. Bemærkning 8.2 Hvis der er sammenfaldende observationer modificeres teststørrelsen U 1 (X) til N(N + 1) W U1 (X) = 4 N(N + 1)(2N + 1) 1 N(0,1) (8.8) (a 3 j a j) j og testsandsynligheden beregnes som ε W (x) = 2(1 Φ( u 1 (x) )). (8.9) Bemærk, at observerede værdier y j for hvilke der er ikke er sammenfaldende observationer, det vil sige for hvilke a j = 1, bidrager ikke til summmen j (a 3 j a j), idet vi for sådanne observationer har a 3 j a j = = 0. Eksempel 8.1 (Fortsat) Vi udfører nu Wilcoxons test på observationsrækken af differenser i dette eksempel. Af tabellen side 8.2 ses at der ikke er sammenfaldende observationer blandt de numeriske differenser som desuden også alle er forskellige fra 0, det vil sige N = 15. I tabellens sjette søjle ses rangene for de numeriske værdier af differenserne i femte søjle. Ved hjælp af fjerde og sjette søjle ses det, at summen af rangene for de positive differenser er w = 98. Formlerne (8.6) og (8.7) medfører, at u 1 (x) = 4 = og 24 ε W (x) = ,

125 8.7 så hypotesen H 0 om at differenserne har en fordeling der er symmetrisk om 0 forkastes. Vi har i dette eksempel fundet tre forskellige testsandsynligheder for hypotesen H 0, nemlig ε F (d) = , ε W (x) = og ε t (d) = Det bør ikke undre. Fortegnstestet, som accepterer H 0, er baseret udelukkende på differensernes fortegn. I Wilcoxons test, der forkaster H 0, benyttes differensernes fortegn samt størrelsesforholdet af deres numeriske værdier, mens det parrede t-test, der forkaster H 0, beregnes ved hjælp af den empiriske middelværdi og varians for differenserne. Testene udnytter altså forskellige aspekter ved differenserne og desuden udnyttes den information, som differenserne indeholder, i forskellig grad. I eksemplet her er det ikke urimeligt at lave ensidede test for H 0, idet man nok mest er intersseret i om træningen har en positiv indflydelse på konditallene, det vil sige om tallene efter træningen er signifikant større end tallene før træningen. Testes H 0 ved ensidede test, forkastes H 0 ved alle tre test, idet testsandsynligden er det halve af testsandsynligheden ved testene ovenfor, da størrelsene s + = 11 (> 15/2), u 1 = (> 0) og t = (> 0) alle indikerer afvigelser i retning af at konditallene forøges ved træningen Wilcoxons test for to observationsrækker Gennemgangen er baseret på data i Eksempel 8.2. Eksempel 8.2 Vi betragter igen data i Eksempel 4.2, som består af konditallene for 20 aktive og 17 ikke-aktive idrætsudøvere. Konditallene er gengivet i tabellen nedenfor hvor også observationernes range i den samlede stikprøve er vist.

126 Rangtest kondital rang aktive ikke-aktive aktive ikke-aktive Som i Eksempel 4.2 er vi interesserede i at undersøge om der er forskel på konditallene for de ikke-aktive og de aktive idrætsudøvere. Som tidligere lader vi x i j betegne den j te observation i den i te observationsrække, j = 1,...,n i, i = 1,2. Her betragter vi en ikke-parametrisk hypotese for de to observationsrækker, nemlig H 0 : X i j har en kontinuert fordeling F, j = 1,...,n i,i = 1,2, hvor vi også antager at X-erne er uafhængige. Med H 0 ønsker vi at undersøge om samtlige n = n 1 +n 2 observationer kan betragtes som én observationsrække med den fælles fordeling F. Et ikke-parametrisk test for denne hypotese er Wilcoxons test for to observationsrækker, som tager udgangspunkt i rangene af observationerne i den samlede stikprøve. Lad R i j betegne

127 8.9 rangen af X i j i den samlede stikprøve og lad R 1 = n 1 R 1 j j=1 være summen af rangene i den første observationsrække. Den mindste værdi af R 1 fremkommer hvis de n 1 observationer i den første observationsrække alle er mindre end observationerne i den anden række og i så tilfælde er R 1 = n 1 (n 1 + 1)/2 som er summen af tallene 1, 2,..., n 1 1, n 1. Omvendt fremkommer den største værdi af R 1 ved at alle observationer i den første række er større end observationerne i den anden række og i så tilfælde er R 1 = (2n n 1 + 1)n 1 /2, som er summen af tallene n 2 + 1, n 2 + 2,..., n 2 + n 1 1, n 2 + n 1. Det kan vises, at under H 0 er middelværdien af R 1 gennemsnittet at den mindste og største værdi denne variabel kan antage, det vil sige samt at ER 1 = n 1(n + 1) 2 Var R 1 = n 1n 2 (n + 1). 12 Hvis R 1 er lille, er observationerne i den første række stort set alle mindre end observationerne i den anden række, hvilket harmonerer dårligt med at observationerne i de to rækker under H 0 har samme fordeling. Tilsvarende antyder en stor værdi af R 1 en afvigelse fra H 0, da det svarer til at alle observationer i den første række stort set er større end observationerne i den anden række. Sammenfattende forkastes H 0 for små og store værdier af R 1. For små værdier af n 1 og n kan testsandsynligheden ved Wilcoxons test for to observationsrækker findes i tabeller. For store værdier af n 1 og n 2 kan det vises at R 1 s fordeling kan approksimeres ved en normalfordeling. Standardiseres denne normalfordeling får vi at U 2 (X) = R 1 n 1(n + 1) 2 n1 n 2 (n + 1) N(0,1). (8.10) 12 Approksimationen kan vises at være tilfredstillende hvis blot n 1 10 og n 2 10 og i sådanne tilfælde kan testsandsynligheden for Wilcoxons test for to observationsrækker beregnes som ε(x) = 2(1 Φ( u 2 (x) )), (8.11) hvor u 2 (x) er den observerede værdi af U 2 (X) og Φ er fordelingsfunktionen for N(0,1)-fordelingen.

128 Rangtest Bemærkning 8.3 I tilfælde af sammenfaldende observationer betragtes følgende modifikation af U 2 (X): R 1 n 1(n + 1) U2 (X) = 2 n (a 3 j 1n 2 (n + 1) a N(0,1). (8.12) j) j 1 12 (n + 1)n (n 1) Den tilsvarende testsandsynlighed beregnes som ε(x) = 2(1 Φ( u 2 (x) )). (8.13) Bemærk, at observerede værdier y j for hvilke der er ikke er sammenfaldende observationer, det vil sige for hvilke a j = 1, bidrager ikke til summmen j (a 3 j a j), idet vi for sådanne observationer har a 3 j a j = = 0. Eksempel 8.2 (Fortsat) Af tabellen side 8.8 ses vi for disse data har sammenfaldende observationer, idet de seks værdier 64.1, 64.9, 68.9, 73.1, 74.1 og 76.3 alle er observeret to gange. Vi har derfor, at (a 3 j a j) = 6(2 3 2) = 36. j Af tredje søjle i tabellen ses at r 1 = 428. Da n 1 = 20 og n 2 = 17 er n = 37 og ved hjælp af (8.12) fås, at u 2 (x) = og af (8.13) fås testsandsynligheden [ ] = ε(x) = 2(1 Φ(1.4634)) = Der er altså - overraskende nok - ikke forskel på konditallene for de ikke-aktive og de aktive. Samme konkusion nåede vi frem til i Afsnit 4.4, hvor vi analyserede data ved hjælp af modellen for to normalfordelte observationsrækker. Her blev hypotesen om ens varianser accepteret ved et F-test med en testsandsynlighed på mens hypotesen om ens middelværdier blev accepteret ved et t-test med en testsandsynlighed på

129 Kruskal-Wallis test Gennemgangen af Kruskal-Wallis test, som er den ikke-parametriske analog til ensidet variansanalyse, er baseret på Eksempel 8.3. Eksempel 8.3 Vi betrager igen data i Eksempel 4.5 vedrørende resultaterne af pigernes længdespring ved atletikstævnet for 1. års studerende ved Institut for Idræt, Københavns Universitet i årene længde rang længde rang længde rang sum 291 sum sum Som tidligere er vi interesseret i at afgøre om længden af springene er uafhængig af årene. Vi lader x i j betegne den j te observation i den i te observationsrække, j = 1,...,n i, i = 1,...,k. Her betragter vi en ikke-parametrisk hypotese for k observationsrækker, nemlig H 0 : X i j har en kontinuert fordeling F, j = 1,...,n i,i = 1...k, hvor vi også antager at X-erne er uafhængige.vi ønsker altså at undersøge om samtlige n = n 1 + +n k observationer kan betragtes som én observationsrække.

130 Rangtest Et ikke-parametrisk test for denne hypotese er Kruskal-Wallis test for k observationsrækker, som tager udgangspunkt i rangene af observationerne i den samlede stikprøve. Lad R i j betegne rangen af X i j i den samlede stikprøve og lad R i = n i R i j j=1 være summen af rangene i den i te observationsrække. Den mindste værdi af R i fremkommer hvis de n i observationer i den i te observationsrække alle er mindre end observationerne i de øvrige rækker og i så tilfælde er R i = n i (n i + 1)/2 som er summen af tallene 1, 2,..., n i 1, n i. Omvendt fremkommer den største værdi af R i ved at alle observationer i den i te række er større end observationerne i de øvrige rækker og i så tilfælde er R i = (2n n i + 1)n i /2, som er summen af de n i tal n n i + 1, n n i + 2,..., n 1, n. Det kan vises, at under H 0 er middelværdien af R i gennemsnittet at den mindste og største værdi denne variabel kan antage, det vil sige ER i = n i(n + 1) 2 og dermed at gennemsnittet R i = R i /n i har middelværdi E R i = n = R, som er gennemsnittet af de n tal 1,2,...,n 1,n. Under H 0 må det forventes at de k ranggennemsnit R i varierer tilfældigt omkring R og Kruskal-Wallis introducerede derfor følgende teststørrelse for H 0 : 12 KW(X) = n (n + 1) k i=1 n i ( R i R ) 2 (8.14) og viste at denne teststørrelse approksimativt er χ 2 (k 1)-fordelt for moderate værdier af alle stikprøvestørrelserne n i. Da store værdier af KW(X) er kritiske for H 0 beregnes testsandsynligheden som hvor KW(x) er den observerede værdi af KW(X). ε(x) = 1 F χ 2 (k 1)(KW(x)), (8.15) Hvis k = 2 kan det vises, at Kruskal-Wallis testet er ækvivalent med Wilcoxons test for to observationsrækker, idet der da gælder, at KW(X) = U 2 (X) 2 (8.16) samt af kvadratet af en N(0,1)-fordelt stokastisk variabel er χ 2 (1)-fordelt. idet Teststørrelsen i (8.14) beregnes let i hånden ud fra rangsummerne i de k observationsrækker k i=1 n i ( R i R ) 2 = k R 2 i R2. (8.17) i=1 n i n

131 8.13 Bemærkning 8.4 I tilfælde af sammenfaldende observationer erstattes teststørrelsen KW(X) med KW (X) = og testsandsynligheden beregnes som KW(X) 1 j(a 3 j a j) (n + 1)n (n 1) (8.18) ε(x) = 1 F χ 2 (k 1) (KW (x)). (8.19) Bemærk igen, at observerede værdier y j for hvilke der er ikke er sammenfaldende observationer, det vil sige for hvilke a j = 1, bidrager ikke til summmen j (a 3 j a j), idet vi for sådanne observationer har a 3 j a j = = 0. Eksempel 8.3 (Fortsat) Af tabellen side 8.11 ses at der er sammenfaldende observationer, idet de fire værdier 3.56, 3.70, 3.91 og 4.22 alle er observeret to gange mens værdien 3.65 er observeret fem gange. Vi har derfor at (a 3 j a j ) = 4(2 3 2)+(5 3 5) = = 144. j Da observationsantallene og rangsummerne - ifølge tabellen - er finder vi ved hjælp af (8.14) og (8.17), at i n i r i sum KW(x) = = og dermed af (8.18) at Af (8.19) fås, at KW (x) = = ε(x) = 1 F χ 2 (2)(0.7052) = Hypotesen H 0 accepteres, så som i Afsnit 4.5 finder vi, at fordelingen af længderne i de tre år kan antages at være identiske. Der blev tallene analyseret som tre normalfordelte observationsrækker og hypotesen om ens varianser blev accepteret ved et Bartlett test med testsandesynlighed

132 Rangtest mens hypotesen om ens middelværdier blev accepteret ved et F-test med testsandsynlighed Eksempel 8.2 (Fortsat) Af tabellen side 8.8 ses, at for disse data er observationsantal og rangsummer: i n i r i sum Fra tidligere ved vi at j (a 3 j a j) = 36. Formlerne (8.14), (8.17) og (8.18) medfører, at Kruskal- Wallis teststørrelsen er Af (8.19) fås, at testsandsynligheden for H 0 er KW (x) = ε(x) = 1 F χ 2 (1)(2.1415) = 0.143, altså samme testsandsynlighed som ved Wilcoxons test for to observationsrækker. Dette skyldes at = samt bemærkningen efter formel (8.16).

133 8.15 Anneks til Kapitel 8 Beregninger i Excel Excel har ikke specielle dialogbokse til beregning af ikke-parametriske test. Hvis der ikke er sammenfaldende observationer beregnes de dog let ved hjælp af funktionen PLADS. Med notationen på side 8.4 er definitionen af denne funktion PLADS(x (i) ) = i, hvis x (i 1) < x (i) < x (i+1) PLADS(x (i) ) = =PLADS(x (i+k 1) ) = i, hvis x (i) = = x (i+k 1). Hvis der ikke er sammenfaldende observationer, ses det at rang(x (i) ) =PLADS(x (i) ) hvis x (i 1) < x (i) < x (i+1), mens rang(x (i) ) =PLADS(x (i) )+(k 1)/2, hvis x (i) = = x (i+k 1) i tilfælde af sammenfaldende observationer. Excel har en dialogboks Rang og fraktil, der beregner fraktiler som funktionen PLADS, idet dog observationerne ordnes i aftagende rækkefølge, så denne dialogboks er ikke til megen hjælp her. Vi indskrænker os her til at vise beregningerne i et eksempel hvor der ikke er sammenfaldende observationer. Eksempel 8.1 (Fortsat)!" Beregningerne af fortegnstestet ses nedenfor: % " ""!"#$! % % % % &'( % % % % % ) % % % #! % % % % % % % % % ) % % % % % % % ) % % % % % % % ) % % % % % % %

134 8.16 Beregninger i Excel Værdierne for konditallene før og efter træningen findes i cellerne B4:C18, mens differenserne for tallene efter og før er beregnet id4:d18 ved id4 at beregne C4 B4 og oprette analoge formler i cellerne D5:D18. Herefter beregnes i E4:E18 en variabel, som er 1, hvis fortegnet af differensen er positivt, og 0, hvis fortegnet er negativt. Indholdet af E4 beregnes som =HVIS(D4 >0;1;0) og analoge formler oprettes i E5:E18. Herefter kan antallet af positive differenser, s +, i H4 beregnes som =SUM(E4 :E18) og testsandsynligheden ε F (x) ih5 som = BINOMIALFORDELING(11; 15; 0, 5; FALSK) + 2 BINOMIALFORDELING(3; 15; 0, 5; SAND), det vil sige ε F (x) = b(s + ;n,1/2)+2 min(s +,n s + ) i=0 b(i; n, 1/2). Wilcoxons test for én observationsrække beregnes på differenserne som vist nedenfor: De numeriske eller absolutte værdier i B3:B17 af differenserne i A3:A17 beregnes ved i B3 at indsætte formlen =ABS(A3) (= d 1 )

135 8.17 og oprette analoge formler i B4:B17. Rangen af de numeriske værdier af differenserne, r i +, er beregnet ic3:c17 ved hjælp af funktionenplads ved ic3 at beregne =PLADS(B3;$B$3 : $B$17;1) (= r 1 + ) og dernæst oprette analoge formler i C4:C17. Herefter beregnes i D3:D17 en variabel hvis værdi er rangen af den numeriske værdi, hvis differensen er positiv, og 0, hvis differensen er negativ. ID3 indtastes formlen =HVIS(A3 >0;C3;0) og analoge formler oprettes id4:d17. Herefter findes værdien af W id18 som =SUM(D3 :D17) (= r i + ). i Teststørrelsen u 1 (x) i (8.6) beregnes ib21 som = (D /4)/KVROD( /24) og den tilsvarende testsandsynlighed ε W (x) i (8.7) beregnes ib22 som =2 (1 NORMFORDELING(B21;0;1;SAND)). Testsandsynligheden for det ensidede test ib23 er blot halvdelen af ε W (x).

136 8.18 Hovedpunkter til Kapitel 8 Hovedpunkter til Kapitel 8 Én observationsrække For observationsrækken x 1,...,x n betragter vi hypotesen H 0 : X i har en kontinuert fordeling symmetrisk om 0, i = 1,...,n, hvor vi også antager at X-erne er uafhængige og identisk fordelte. Fortegnstestet Teststørrelse: S +, antallet af positive observationer. Testsandsynlighed: Wilcoxons test min(s +,n s + ) 1 ε F (x) = b(s + ;n,1/2)+2 i=0 b(i;n,1/2)). Testet involverer kun de observationer x som er forskellige fra 0. Lad N = #{i : x i 0}. Teststørrelse: For store værdier af N betragtes Her er N(N + 1) W U 1 (X) = 4. N(N + 1)(2N + 1) W = 24 r i +, {i:x i >0} hvor r + i er rangen af x i i observationsrækken af de numeriske værdier x 1,..., x n. Testsandsynlighed: ε W (x) = 2(1 Φ( u 1 (x) )), Hvis der er sammenfaldende observationer betragtes følgende modifikationer: Teststørrelse: N(N + 1) W U1 (X) = 4 N(N + 1)(2N + 1) (a 3 j a j) j

137 8.19 Testsandsynlighed: ε W (x) = 2(1 Φ( u 1 (x) )). To observationsrækker Lad x i j betegne den j te observation i den i te observationsrække, j = 1,...,n i, i = 1,2. Hypotese: H 0 : X i j har en kontinuert fordeling F, j = 1,...,n i,i = 1,2, hvor X-erne er uafhængige. Wilcoxons test Teststørrelse: Hvis n 1 10 og n 2 10 betragtes R 1 n 1(n + 1) U 2 (X) = 2, n1 n 2 (n + 1) 12 hvor n = n 1 + n 2 og hvor n 1 R 1 = R i j j=1 er summen af rangene i den første observationsrække, idet R i j betegner rangen af X i j i den samlede stikprøve. Testsandsynlighed: ε(x) = 2(1 Φ( u 2 (x) )), hvor u 2 (x) er den observerede værdi af U 2 (X) og Φ er fordelingsfunktionen for N(0,1)-fordelingen. I tilfælde af sammenfaldende observationer betragtes følgende modifikationer: Teststørrelse: Testsandsynlighed: Flere observationsrækker R 1 n 1(n + 1) U2 (X) = 2 n (a 3 j 1n 2 (n + 1) a j) j 1 12 (n + 1)n (n 1) ε(x) = 2(1 Φ( u 2 (x) )). Lad x i j betegne den j te observation i den i te observationsrække, j = 1,...,n i, i = 1,...,k. Hypotese: hvor X-erne er uafhængige. H 0 : X i j har en kontinuert fordeling F, j = 1,...,n i,i = 1...k,

138 8.20 Hovedpunkter til Kapitel 8 Kruskal-Wallis test Teststørrelse: hvor n = n 1 + +n k og hvor og 12 KW(X) = n (n + 1) R i = 1 n i R = 1 n k i=1 n i R i j j=1 k i=1 n i ( R i R ) 2, n i R i j j=1 betegner henholdsvis gennemsnittet af rangene i det i te række og det totale gennemsnit af rangene R i j af X i j i den samlede stikprøve. Testsandsynlighed: Beregningsformel: ε(x) = 1 F χ 2 (k 1) (KW(x)), k i=1 n i ( R i R ) 2 k R = 2 i R2, i=1 n i n hvor R i og R er henholdsvis summen af rangene i den i te række og totalsummen. I tilfælde af sammenfaldende observationer betragtes følgende modifikationer: Teststørrelse: Testsandsynlighed: KW (X) = KW(X) 1 j(a 3 j a j) (n + 1)n (n 1) ε(x) = 1 F χ 2 (k 1) (KW (x)).

139 8.21 Opgaver til Kapitel 8 Opgave 8.1 Beregn testsandsynligheden for 2 ln Q-testet for hypotesen π = (1/2, 1/2) i modellen (X 1,X 2 ) m(15,π) på grundlag af observationen(x 1,x 2 ) = (11,4) og sammenlign denne med ε F på side 8.3. Opgave 8.2 Betragt tallene i Opgave Undersøg ved hjælp af fortegnstestet og Wilcoxons test for én observatiosrække om vægttabet kan antages at være 6.5 kg ved at betragte x 1,..., x 12, hvor x i = d i 6.5, i = 1,...,12. Opgave 8.3 Betragt data i Opgave 4.15 og undersøg ved hjælp af Wilcoxons test for to observationsrækker om observationerne i grupperne 2 og 3 kan antages at have samme fordeling. Opgave 8.4 Undersøg for såvel piger som for drenge ved hjælp af Kruskal-Wallis s test om resultaterne i kuglestød i Opgave 4.12 kan antages at have en fordeling, der er uafhængig af årene.

140 8.22 Opgaver

141 A Forskellige matematiske begreber A.1 A Forskellige matematiske begreber A.1 Notation fra mængdelæren Hvis A og E er to mængder, er A en delmængde af E, kort A E, hvis alle elementer i A også er elementer i E, det vil sige e A e E. A B A A C A B A B A B A B A\B Figur A.1 Illustration af mængderne A C, A B, A B og A\B. Hvis A E, er komplementærmængden til A (inden for E) mængden A C = {e E : e / A}

142 A.2 A.1 Notation fra mængdelæren Hvis A og B er delmængder af E, er foreningsmængden af A og B mængden A B = {e E : e A og/eller e B}, fællesmængden af A og B er mængden A B = {e E : e A og e B} og mængdedifferensen mellem A og B er A\B = {e A : e / B} = (A B C ). Hvis A 1,A 2...,A n,... er en følge af delmængder af E, omtales mængden n A i = A 1 A n = {e E : e A i for mindst et i = 1...,n} i=1 som en endelig foreningsmængde og mængden n A i = A 1 A n = {e E : e A i for alle i = 1...,n} i=1 som en endelig fællesmængde, mens mængderne A i = {e E : e A i for mindst et i = 1,2,...,} i=1 og A i = {e E : e A i for alle i = 1,2,...} i=1 kaldes henholdsvis en tællelig foreningsmængde og en tællelig fællesmængde. Den tomme mængde /0 er mængden uden elementer. Den opfattes som en delmængde af enhver anden mængde. To delmængder A og B af E siges at være disjunkte, hvis A B = /0, og elementerne i en følge af delmængder, A 1,A 2,..., siges at være parvis disjunkte, hvis A i A j = /0, hvis i j, i, j = 1,2,...

143 A.3 A.2 Rækker Hvis a 1,a 2,...,a n,... er en uendelig følge af reelle tal kaldes en uendelig række. a n = a 1 + a 2 + +a n + n=1 Rækkens n te led er a n og rækkens n te afsnitssum er s n = a 1 + a 2 + +a n. Hvis s n s, når n, er rækken er konvergent med sum s, hvilket vi kort skriver ellers kaldes rækken divergent. s = a n, n=1 Hvis a n = 0 for n > i kaldes rækken en endelig række med i led. Endelige rækker er konvergente da s n = s i for n i. (Undertiden har man - som i to af eksemplerne nedenfor - en følge startende i 0, a 0,a 1,a 2,..., a n,... Rækken n=0 a n er da konvergent med sum s, hvis s n+1 s, når n, hvor s n+1 = a 0 + a 1 + a 2 + +a n.) Rækken n=1 a n siges at være absolut konvergent, hvis rækken af absolutte (numeriske) værdier n=1 a n er konvergent. Der gælder, at a n konvergent n=1 det vil sige, at absolut konvergens medfører konvergens. a n konvergent, n=1 Eksempler Endelige rækker: Hvis a og b er reelle tal og i et helt positivt tal er hvor (a+b) i = i n=0 ( ) i a n b i n, n (binomialrækken) ( ) i i! = n n!(i n)! = i (i 1) 2 1 (n (n 1) 2 1)((i n) (i n 1) 2 1. (A.1)

144 A.4 A.3 Dobbeltintegraler og partiel differentiation Hvis q 1 er et reelt tal og i et helt positivt tal er i q n = 1+q+ + q i = 1 qi+1 n=0 1 q (endelig kvotientrække) (A.2) Uendelige rækker: q n = 1, hvis q < 1 (uendelig kvotientrække) (A.3) n=0 1 q x n n=0 n! = ex, for x R, (eksponentialrækken) (A.4) x n = ln(1 x), for x < 1, (logaritmisk række) (A.5) n=1 n Regnerækker for uendelige rækker er Hvis og hvis k er en konstant er A = a n og B = b n n=1 n=1 A+B = ka = n=1 (a n + b n ) (A.6) ka n. n=1 Hvis rækkerne A = n=1 a n og B = n=1 b n er absolut konvergente og (A.7) c n = a 1 b n + a 2 b n 1 + +a n b 1 er n=1 c n absolut konvergent og AB = c n. n=1 (A.8) A.3 Dobbeltintegraler og partiel differentiation I forbindelse med beregninger relateret til kontinuerte to-dimensionale stokastiske vektorer er de matematiske begreber dobbeltintegraler og partiel differentiation vigtige. Begreberne omtales henholdsvis i Afsnit A.3.1 og A.3.2 nedenfor.

145 A.5 A.3.1 Dobbeltintegraler Lad f være en funktion af to variable og lad A =]a,b[ ]c,d[ være en delmængde af R 2, hvor a < b og c < d. Værdien af dobbeltintegralet I = A f(x 1,x 2 )dx 2 dx 1 = b d a c f(x 1,x 2 )dx 2 dx 1 beregnes da på følgende måde: Hvisg(x 1 )betegner værdien af det inderste integral, det vil sige er I = b d g(x 1 ) = d c f(x 1,x 2 )dx 2, f(x 1,x 2 )dx 2 dx 1 = b a c a g(x 1 )dx 1. Værdien af et dobbeltintegral bestemmes altså ved at integrere to gange. Først integreres funktionen f(x 1,x 2 ) med x 1 fastholdt med hensyn til x 2, hvorefter resultatet af denne integration g(x 1 ) integreres med hensyn til x 1. For alle de funktioner f, som vi skal integrere, kan dobbeltintegralet også beregnes ved at ombytte integrationsordenen, det vil sige som d b d I = f(x 1,x 2 )dx 1 dx 2 = h(x 2 )dx 2, c a c hvor b h(x 2 ) = f(x 1,x 2 )dx 1. a A.3.2 Partiel differentiation Lad F(x 1,x 2 ) være en funktion af to variable. Lad x 2 være fast og antag, at funktionen G x2 af den variable x 1 givet ved G x2 (x 1 ) = F(x 1,x 2 ) er differentiabel. Den partielt afledede af F med hensyn til x 1 defineres da som den afledede af G x2 med hensyn til x 1, hvilket skrives således F(x 1,x 2 ) = d G x2 (x 1 ). x 1 dx 1 Partiel differentiation angives altså ved hjælp af symbolet.

146 A.6 A.3 Dobbeltintegraler og partiel differentiation Tilsvarende defineres den partielt afledede af F med hensyn til x 2 som hvis funktionen F(x 1,x 2 ) = d H x1 (x 2 ), x 2 dx 2 H x1 (x 2 ) = F(x 1,x 2 ) er differentiabel med hensyn til x 2.

147 B Simulerede fraktildiagrammer B.1 B Simulerede fraktildiagrammer For at give læseren nogen erfaring i at vurdere fraktildiagrammer viser vi i dette appendiks fraktildiagrammer for forskellige stikprøver u 1,...,u n fra standard normalfordelingen N(0,1). Stikprøverne er frembragt ved numerisk simulation ved hjælp af funktionen NORMAL i den statistiske programpakke SAS. For hver af stikprøvestørrelserne n = 5, 10, 15, 25, 50, 100, 250 er der simuleret otte stikprøver. De tilsvarende fraktildiagrammer er vist på de følgende sider. Størrelsen af stikprøverne fremgår af de enkelte diagrammers overskrift.

148 B.2

149 B Simulerede fraktildiagrammer B.3

150 B.4

152 B.6

154 B.8

155 C Matematiske symboler C.1 C Matematiske symboler tilhører, som i e E - e tilhører E for alle, som i e E - for alle e i E eksisterer, som i e E - der eksisterer e i E {} mængde, som i {e E : e = 2} - mængden af e i E således at e = 2 # antal elementer i en mængde, som i #E = 7 - antallet af elementer i E er 7 delmængde af, som i A B - alle elementer i A er elementer i B indeholder, som i A B - alle elementer i B er elementer i A fællesmængde, som i A B - alle elementer i A som også er elementer i B foreningsmængde, som i A B - elementer som tilhører enten A eller B /0 den tomme mængde C komplementærmængde, som i A C - alle elementer som ikke tilhører A \ mængdedifferens, som i A\B - alle elementer i A som ikke er er elementer i B [,] lukket interval, som i [a,b] - alle elementer e hvorom det gælder a e b ],[ åbent interval, som i ]a,b[ - alle elementer e hvorom det gælder a < e < b produkt af mængder, som i A B - alle par af elementer (a,b) hvor a tilhører A og b tilhører B konvergens, som i s n s - følgen med elementer s n konvergerer mod s fra til, som i f : R [0,1] - f er en funktion defineret på R med værdier i [0,1] numerisk (absolut) værdi, som i 7 = 7 - den numeriske værdi af 7 er 7

156 C.2 indhold af mængde, som i A - længden (eller arealet eller rumfanget) af mængden A logisk eller, som i A B - enten er udsagnet A eller udsagnet B (eller begge) sandt maksimum, som i 8 4 = 8 - maksimum af 8 og 4 er 8 logisk og, som i A B - begge udsagn A og B er sande minimum, som i 8 4 = 4 - minimum af 8 og 4 er 4 sum, som i produkt, som i uendelig n x i - summen x 1 + x 2 +x n i=1 n x i - produktet x 1 x 2 x n i=1 lim grænseværdi, som i lim n s n = s - grænseværdien for følgen s n når n er s partielt afledet, som i f(x,y)/ x - funktionen f af x og y differentieret med hensyn til x for fastholdt y fordelt som, som i X N(0,1) - X er normalfordelt med middelværdi 0 og varians 1 approksimativt fordelt som, som i X N(0,1) - fordelingen for X kan approksimeres ved en normalfordeling med middelværdi 0 og varians 1. = approksimativt lig med, som f(x). = a - værdien af funktionen f beregnet i x kan approksimeres ved a

157 D Det græske alfabet D.1 D Det græske alfabet Da vi i teksten ofte bruger græske bogstaver bringes her en oversigt over bogstaverne i det græske alfabet. navn lille stort navn lille stort alfa α A ny v N beta β B xi ξ Ξ gamma γ Γ omicron o O delta δ pi π Π epsilon ε E rho ρ P zeta ζ Z sigma σ Σ eta η H tau τ T theta θ Θ upsilon υ Y iota ι I phi ϕ Φ kappa κ K chi χ X lambda λ Λ psi ψ Ψ my µ M omega ω Ω

158 D.2

159 Referencer R.1 Referencer Andersen, E. B. (1998): Statistik for idrætsstuderende. Noter fra kursus afholdt ved Institut for Idræt, Københavns Universitet. Berg, F. og Blæsild, K. (2000): Fysiske krav i elitefodbold for ungdomsspillere. Bachelorprojekt, Institut for Idræt, Københavns Universitet. Blæsild, P. og Granfeldt. J. (2000): Statistik for biologer og geologer. Institut for Matematiske Fag, Aarhus Universitet. Lehmann, E. L. (1975). Nonparametrics: Statistical Methods Based on Ranks. Holden- Day, San Francisco.

160 R.2 Referencer

161 Indeks I.1 Indeks A acceptområde additivitetsmodellen tosidet variansanalyse afhængig variabel lineær regression afskæring lineær regression B Bartlett test 2lnQ for identitet af k > 2 varianser hovedpunkter konstanten C testsandsynlighed Bayes formel beregninger s x beregninger i Excel , 4.10, 4.19, 4.28, 4.50, 4.70, 4.135, 6.28, 7.29, 8.15 beta funktion betinget fordeling betinget sandsynlighed binomialfordeling beregning af punktsandsynligheder definition Excel middelværdi og varians binomialrækken A.3 C χ 2 -fordeling definition Excel fordelingsresultater middelværdi og varians tabel D data flerdimensionale grafisk repræsentation grupperede grupperede, ugrupperet version gruppering idræt , 5.2 kvalitative kvantitative sæt , 5.2 tabelform tabellering todimensionale ugrupperede delmængde A.1 område sammenhængende åben

162 I.2 Indeks diagram blok fraktil kasse lagkage pinde prik probit profil søjle , 1.23 disjunkte mængder A.2 parvis A.2 diskret stokastisk variabel diskret stokastisk vektor , 5.2 dobbeltintegral A.5 E Eksempel , 1.5, 4.7, 4.26, 6.26 højde af piger Eksempel , 4.3, 4.5, 4.10, 4.27 kondital for eliteidrætsudøvere Eksempel , 1.24, 1.26 Excel resultatet af Faxe Kondi Ligaen Eksempel , 1.16, 1.31, 1.35 hypotetiske kondital Eksempel glycogen indhold i muskler Eksempel uniforme sandsynlighedsmål på endelig mængde Eksempel , 2.19 to kampe på tipskuponen Eksempel uniforme sandsynlighedsmål på interval Eksempel superligaholds chancer på hjemme- og udebane Eksempel superligaholds hjemmekampe Eksempel uniform fordeling Eksempel , 2.29 to kampe på tipskuponen, point fordeling 2.14 Eksempel antal hjemmekampe inden første sejr Eksempel , 2.30 tæthedsfunktion for uniform fordeling Eksempel , 2.22, 2.24, 2.29 to kampe på tipskuponen Eksempel , 2.23, 2.24 uniform fordeling på delmængde af R Eksempel , 2.25, 2.31 uniform fordeling på trekant Eksempel sandsynlighedsfunktion for binomialfordeling Eksempel sandsynlighedsfunktion for poissonfordeling Eksempel sandsynlighedsfunktion for hypergeometrisk fordeling Eksempel sandsynlighedsfunktion for negativ binomialfordeling Eksempel , 4.19, 4.21, 5.4, 5.10, 5.13, 5.16, 5.21 bestemmelse af laktatkoncentration Eksempel , 4.35, 4.38 Excel kondital for ikke-aktive og aktive Eksempel Excel tider i semifinalerne i kvindernes 100 m løb 4.42 Eksempel

163 Indeks I.3 Excel muskelglucogen før og efter træning Eksempel , 4.62, 4.67 Excel længdespring Eksempel , 4.82, 4.93 Excel lineær regression af puls på tid Eksempel , 4.93 Excel finaletider i kvindernes 200 m, 400 m og 800 m løb Eksempel puls og iltoptagelse Eksempel , 4.117, Excel tosidet variansanalyse uden gentagelser Eksempel , 4.117, Excel tosidet variansanalyse med gentagelser Eksempel tosidet variansanalyse og det parrede t-test Eksempel multinomialfordelte data Eksempel , 6.10 AB s kampe på hjemme- og udebane Excel Eksempel , 6.13 Excel idrætaktivitet og rygning Eksempel Excel opdeling af resultater i Faxe Kondi Ligaen 6.4 Eksempel , 6.22 undersøgelse af sammenhæng mellem kræft og magnetfelter Eksempel test for goodness of fit Eksempel , 7.8, 7.11, 7.17 antal mål i Faxe Kondi Ligaen Excel Eksempel , 7.15 de nordiske landes medaljehøst ved OL i Sydney Excel Eksempel , 7.26 Excel medaljefordeling ved OL i Sydney Eksempel , 8.3, 8.6 Excel kondital før og efter træning Eksempel , 8.10, 8.14 kondital for ikke-aktive og aktive Eksempel , 8.13 længdespring eksperiment datasæt , 5.2 eksponentialfordeling definition Excel middelværdi og varians eksponentialrækken A.4 empirisk fordelingsfunktion empirisk korrelationskoefficient empirisk middelværdi empirisk spredning empirisk varians én observationsrække Poissonfordelingen tabelform endelig række A.3 eksempler A.3 estimat interval maksimum likelihood notation

164 I.4 Indeks estimation én observationsrække, Poissonfordelingen 7.7 lineær regression maksimum likelihood middelværdien i én observationsrække multiplikativ Poissonmodel proportionale parametre i Poissonmodel teori todimensional normalfordeling tosidet variansanalyse variansen i én observationsrække estimator maksimum likelihood , 5.9 Excel analoge formler Beskrivende statistik binomialfordeling χ 2 -fordeling Diagram (procent) stablet søjlediagram Grupperet søjle , 1.39 Punktdiagram dialogboksen Anava: Enkelt faktor To-faktor med gentagelse To-faktor uden gentagelse dialogboksen F-test: Dobbelt stikprøve for ens varians dialogboksen Regression dialogboksen t-test: Parvis dobbelt stikprøve for middelværdi To stikprøver med ens varians To stikprøver med forskellig varians eksponentialfordelingen F-fordeling fraktildiagram funktionen BINOMIALFORDELING funktionen CHIFORDELING funktionen CHIINV , 6.30 funktionen CHITEST , 6.30 funktionen EKSPFORDELING funktionen FAST funktionen FFORDELING funktionen FINV funktionen FRAKTIL funktionen HYPGEOFORDELING funktionen KOMBIN funktionen NEGBINOMFORDELING funktionen NORMFORDELING funktionen NORMINV funktionen PLADS funktionen POISSON funktionen POTENS funktionen SLUMP funktionen SUMPRODUKT funktionen TFORDELING funktionen TINV Histogram hypergeometrisk fordeling negativ binomialfordeling normalfordeling numeriske variable Poissonfordeling t-fordeling t-test for kendt middelværdi tekst variable test for kendt varians u-test F F-fordeling definition

165 Indeks I.5 Excel fordelingsresultater tabel F-test for identitet af to varianser , 4.55 t 2 = F faglig problem sammenhæng , 5.2, 5.4 fejl type I type II fempunktsopsummeringen f (i) k observationsrækker Fishers dispersionsindeks eksempel Fishers eksakte test eksempel i 2 2 tableller i r s tabeller fordeling approksimativ, likelihood ratio testoren diskret funktion klasse af kontinuert fordelingsfunktion egenskaber ved empirisk stokastisk variabel stokastisk vektor foreningsmængde A.2 endelig A.2 tællelig A.2 forkastelsesområde forklarende variabel lineær regression forsøgsplanlægning fraktildiagram Excel grupperede data simuleret B.1 ugrupperede data vurdering af frie parametre funktion fordeling likelihood log likelihood log likelihood, normeret model , 5.7 styrke tæthed fællesmængde A.2 endelig A.2 tællelig A.2 følge af modeller notation G gamma fordeling gamma funktion goodness of fit 2lnQ-testet lnQ-testet, testsandsynlighed eksempel , 7.9 Poissonmodel test X 2 -testet X 2 -testet, testsandsynlighed grafisk undersøgelse , 5.4 grupperede data empiriske størrelser ugrupperet version af

166 I.6 Indeks græsk alfabet D.1 H histogram homogenitet tosidet variansanalyse homogenitet af flere multinomialfordelinger lnQ-testet, testsandsynlighed beregningsformel for 2 ln Q-testet eksempel fordelingsresultat maksimum likelihood estimat hovedpunkter én observationsrække med kendt varians én observationsrække med ukendt varians 4.30 ikke-parametriske test k observationsrækker lineær regression multinomialmodel Poissonfordelte data to observationsrækker tosidet variansanalyse hypergeometrisk fordeling beregning af punktsandsynligheder definition Excel middelværdi og varians hypotese kritisk observation multinomialmodel punkt sammensat simpel test af hyppighed relativ hældning lineær regression hændelser hændelsessystem , 5.2 højreskæv I inferens likelihood statistisk information Fisher forventet observeret intervalestimat K k observationsrækker estimation notation statistisk model kassediagram kategori numerisk komplementærmængde A.1 konfidens interval område konfidensinterval binomialmodel for afskæringen i lineær regression for forskel mellem to middelværdier; ens varianser for forskel mellem to middelværdier; forskellige varianser for hældningen i lineær regression for middelværdien; kendt varians for middelværdien; ukendt varians for regressionslinjen for spredningen i en normalfordeling for variansen i en normalfordeling

167 Indeks I.7 for variansen i lineær regression multinomialmodel Poissonmodel middelværdien λ baseret på én Poissonfordelt variabel middelværdien λ i én Poissonfordelt observationsrække parameteren i modellen med proportionale parametre kontinuert stokastisk variabel kontinuert stokastisk vektor , 5.2 kontrast korrelation empirisk kovarians regneregler kumulerede antal kvartil afstand, empirisk nedre nedre, empirisk øvre, empirisk øvre kvotientrække endelig A.4 uendelig A.4 L likelihood approksimativ teori estimat, maksimum estimation, maksimum estimator, maksimum funktion inferens ligninger maksimum, estimator ratio test ratio test, approksimativ testsandsynlighed 5.20 ratio testor, approksimativ fordeling lineær regression estimaternes fordeling hypoteser om regressionsparametrene , konfidensintervaller for parametrene med gentagelser modelkontrol test af hypotesen om lineær regression , uden gentagelser log likelihood funktion funktion, normeret logaritmisk række A.4 loven om total sandsynlighed M maksimum likelihood estimat estimation estimator , 5.9 marginal fordeling median empirisk middelværdi af funktion af diskret stokastisk vektor af funktion af kontinuert stokastisk vektor 2.27 af gennemsnit diskret stokastisk variabel empirisk kontinuert stokastisk variabel regneregler middelværdivektor mindste kvadraters metode model funktion , 5.7

168 I.8 Indeks inferens kontrol , 5.4 opstilling , 5.1, 5.2 parametrisk sandsynlighedsteoretisk , 5.2 statistisk multinomialfordeling betingelser for definition egenskaber ved marginale fordelinger middelværdivektor og kovariansmatriks multinomialmodel 2lnQ-testor lnQ-testor, testsandsynlighed X 2 -testoren X 2 -testoren, testsandsynlighed estimation estimation under hypotese flere multinomialfordelinger forventede antal under hypotese frie parametre homogenitet af flere multinomialfordelinger hovedpunkter hypotese hypotese, frie parametre konfidensinterval statistisk inferens test af simpel hypotese, eksempel uafhængighed af inddelingskriterier mængdedifferens A.2 mængdelære , A.1 måle målelig mængde N negativ binomialfordeling beregning af punktsandsynligheder definition Excel middelværdi og varians normalfordeling , 4.1 definition Excel fordelingsresultater middelværdi og varians standard tabeller todimensional normalfordelte data notation følge af modeller numerisk undersøgelse O observation kritisk observationer sammenfaldende observationsrække , 5.9 én; normalfordeling én; Poissonfordelingen én; todimensional normalfordeling område accept kritisk omvendt betinget sandsynlighed opgaver , 2.32, 3.22, 4.142, 5.23, 6.35, 7.39, 8.21 ordnede stikprøve ordnede værdier , 8.4

169 Indeks I.9 P p-fraktil empirisk fordeling p-værdi parameter fri mængde rum parrede t-test partiel differentiation A.5 pindediagram Poisson processen , 7.5 intensitet Poissonfordeling approksimeret med normalfordeling beregning af punktsandsynligheder definition egenskaber ved Excel grænsefordeling for binomialfordeling middelværdi og varians relation til multinomialfordeling ved betingning Poissonmodel én observationsrække, 2 ln Q-test én observationsrække, estimation én observationsrække, Fishers dispersionsindeks én observationsrække, modelkontrol én observationsrække, test for goodness of fit 7.7 én observationsrække, X 2 -test konfidensinterval konfidensinterval for middelværdien λ i Poissonfordeling konfidensinterval for middelværdien λ i Poissonfordelt observationsrække konfidensinterval for parameteren i Poissonmodellen med proportionale parametre multiplikativ multiplikativ, estimation multiplikativ, homogenitet multiplikativ, ingen vekselvirkning multiplikativ, kun rækkevirkning multiplikativ, kun søjlevirkning multiplikativ, parametrisering multiplikativ, relation til multinomialmodel 7.25 multiplikativ, test af hypoteser proportionale parametre proportionale parametre, 2 ln Q-test proportionale parametre, 2 ln Q-test, testsandsynlighed proportionale parametre, estimation proportionale parametre, fordeling af estimator proportionale parametre, relation til multinomial model proportionale parametre, X 2 -test proportionale parametre, X 2 -test, testsandsynlighed position lineær regression prikdiagram probit profildiagram programpakker R rang af observationer , 8.4 rangtest reduktion statistisk model regneregler betinget sandsynlighed middelværdi sandsynligheder

170 I.10 Indeks uendelige rækker A.4 varians og kovarians regressionskoefficient lineær regression regressionslinje lineær regression relativ hyppighed , 6.6, 6.12 residual kvadratsum tosidet variansanalyse respons lineær regression rækkevirkning S S sum af observationer , 7.8 s 2 beregningsformel s 2 (i) k observationsrækker SAK sum af afvigelsernes kvadrater SAK (i) k observationsrækker sammenfaldende observationer sandsynlighed test sandsynlighedsfunktion diskret stokastisk variabel diskret stokastisk variabel, egenskaber ved 2.14 diskret stokastisk vektor marginal fordeling sandsynlighedsmål , 5.2 sandsynlighedsmål sandsynlighedspapir sandsynlighedsrum sandsynlighedsteori , 5.2 SAP sum af afvigelsernes produkter signifikansniveau , 5.14 observeret simultan fordeling SK sum af kvadrater , 7.8 SP sum af produkter spredning empirisk standardafvigelse statistik beskrivende deskriptiv ikke-parametrisk inferens parametrisk model statistikkens slutningsregel statistisk analyse , 5.1, 5.2 approksimativ metode metode stikprøve ordnet størrelse stokastisk variation , 5.2 vektor, multinomialfordelt stokastisk variabel diskret kontinuert stokastisk vektor diskret , 5.2 kontinuert , 5.2 styrkefunktion støtte diskret stokastisk variabel

171 Indeks I.11 diskret stokastisk vektor kontinuert stokastisk variabel stokastisk vektor søjlediagram søjlevirkning T t-fordeling definition Excel fordelingsresultater tabel t-test parrede , t-test for kendt middelværdi Excel tabel χ 2 -fordeling F-fordeling normalfordeling t-fordeling u-fordeling tabelform data Taylor polynomium udvikling teori estimation likelihood, approksimativ test test, generel test af hypoteser om regressionsparametrene , Bartlett dobbeltsidet ensidet F-test for hypotesen om lineær regression , F-test for identitet af middelværdier F-test for identitet af to varianser. 4.37, 4.55 for kendt varians , 4.28 goodness of fit ikke-parametrisk fortegnstest Kruskal-Wallis s for flere observationsrækker Wilcoxons for én observationsrække Wilcoxons for to observationsrækker likelihood ratio , 5.11 p-værdi på niveau α signifikansniveau , 5.14 størrelse styrkefunktion t 2 = F t-test for kendt middelværdi t-test for uafhængighed i N teori , 5.5 teori, generel u-test for kendt middelværdi testor testsandsynlighed approksimativ, likelihood ratio test teststørrelse likelihood ratio tilfældigt tal to observationsrækker skøn over fælles varians test af ens middelværdier; varianser ens , 4.56 test af ens middelværdier; varianser forskellige , 4.57 test af ens varianser

172 I.12 Indeks todimensional normalfordeling definition én observationsrække fra estimation korrelation marginale og betingede fordelinger middelværdivektor og kovariansmatriks modelkontrol test af hypotesen om uafhængighed tomme mængde A.2 tosidet variansanalyse additivitet estimation estimation af rækkevirkningsforskel i additivitesmodellen estimation af søjlevirkningsforskel i additivitesmodellen homogenitet hypotesen om additivitet hypotesen om ingen rækkevirkning hypotesen om ingen søjlevirkning konfidensintervaller i additivitetsmodellen kontrast kun rækkevirkning kun søjlevirkning med gentagelser med gentagelser, variansanalysetabel modelkontrol profildiagram relation til det parrede t-test residualer test i additivitetsmodellen test i modellen for kun rækkevirkning test i modellen for kun søjlevirkning uden gentagelser uden gentagelser, variansanalysetabel transformation tælle tæthedsfunktion kontinuert stokastisk variabel kontinuert stokastisk variabel, egenskaber ved kontinuert stokastisk vektor marginal fordeling U u-fordeling tabel u-test for kendt middelværdi Excel uafhængig variabel lineær regression uafhængighed flere hændelser stokastiske variable stokastiske variable, betingelser for to hændelser uafhængighed af inddelingskriterier lnQ-testet, testsandsynlighed beregningsformel for 2 ln Q-testet eksempel fordelingsresultat forventede antal hypotese maksimum likelihood estimater udfald udfaldsrum , 2.1, 5.2 uendelig række , 2.2, A.3 absolut konvergent A.3 afsnitssum A.3 divergent A.3 eksempler A.4 konvergent A.3 led A.3 regneregler A.4

173 Indeks I.13 undersøgelse grafisk numerisk uniform fordeling tæthedsfunktion uniforme sandsynlighedsmål på endelig mængde på interval V varians af gennemsnit empirisk regneregler variansanalyse variansanalysetabel ensidet variansanalyse tosidet variansanalyse med gentagelser tosidet variansanalyse uden gentagelser venstreskæv

Vis mere