Asymptotisk optimalitet af MLE

Relaterede dokumenter
Asymptotisk estimationsteori

Estimation ved momentmetoden. Estimation af middelværdiparameter

Regularitetsbetingelserne i simple modeller

antal gange krone sker i første n kast = n

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Den flerdimensionale normalfordeling

Nogle Asymptotiske Resultater. Jens Ledet Jensen Matematisk Institut, Aarhus Universitet. 1 Indledning 1

Eksempel 10.1 En autoregressiv proces af orden 1 (ofte blot kaldet en AR(1)- proces) pårhar et opdateringsskema (10.1) med funktionen. for y R.

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Motivation. En tegning

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Hovedpointer fra SaSt

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Løsninger til kapitel 7

Elementær Matematik. Polynomier

STATISTIKNOTER Simple normalfordelingsmodeller

Generelle lineære modeller

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Introduktion til Statistik

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Statistiske Modeller 1: Notat 1

DATV: Introduktion til optimering og operationsanalyse, Følsomhed af Knapsack Problemet

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsteori 1.2 og 2 Uge 5.

9. Binomialfordelingen

Analyse 1, Prøve maj 2009

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Vejledende besvarelser til opgaver i kapitel 15

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Undersøgelse af numeriske modeller

Program. Middelværdi af Y = t(x ) Transformationssætningen

Vejledende opgavebesvarelser

Projekt 1.3 Brydningsloven

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Uge 37 opgaver. Opgave 1. Svar : Starter med at definere sup (M) og inf (M) :

og Fermats lille sætning

Estimation og test i normalfordelingen

GENEREL INTRODUKTION.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

Dagens forelæsning. Claus Munk. kap Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Claus Munk. kap. 1-3

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros

Kvantitative metoder 2

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Sprednings problemer. David Pisinger

Projekt 9.10 St. Petersborg paradokset

Morten Frydenberg version dato:

Sandsynlighedsteori 1.2

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Modul 14: Goodness-of-fit test og krydstabelanalyse

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

De reelle tal. Morten Grud Rasmussen 5. november Se Sætning 3.6 og 3.7 for forskellige formuleringer af egenskaben og dens negation.

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

FUNKTIONER del 1 Funktionsbegrebet Lineære funktioner Eksponentialfunktioner Logaritmefunktioner Rentesregning Indekstal

Supplerende noter II til MM04

Forelæsningsnoter til Stokastiske Processer E05. Svend-Erik Graversen Revideret af Jan Pedersen Kapitel 12 og Appendix B og G af Jan Pedersen

Rettevejledning til HJEMMEOPGAVE 1 Makro 1, 2. årsprøve, foråret 2007 Peter Birch Sørensen

M Å L T E O R I S A N D S Y N L I G H E D S T E O R I 1. 1 F O R E L Æ S N I N G S N O T E R S V E N D E R I K G R A V E R S E N O G

og Fermats lille Projekt 0.4 Modulo-regning, restklassegrupperne sætning ..., 44, 20,4,28,52,... Hvad er matematik? 3 ISBN

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Teoretisk Statistik, 18. november Stikprøveteori: hvor er vi, og hvor skal vi hen? Proportional allokering Optimal allokering

Skitse til notat om hvor de forskellige sandsynlighedsfordelinger kan tænkes at komme fra

Talfølger og -rækker

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Stikprøvefordelinger og konfidensintervaller

Maja Tarp AARHUS UNIVERSITET

Estimation. Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat.

STATISTISK MODELLERING OG ANALYSE 19. DECEMBER 2008 ET MAT3-PROJEKT I BAYESIANSK INFERENS VEJLEDER: JAKOB G. RASMUSSEN GRUPPE: G4-115

Diskrete og kontinuerte stokastiske variable

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Introduktion til uligheder

TEKST NR TEKSTER fra IMFUFA

Lys og gitterligningen

Bjørn Grøn. Analysens grundlag

StudyGuide til Matematik B.

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

r n E[ X n ]/n! for alle r > 0 ifølge monoton konvergens, giver potensrækketeori, at ( ) er ækvivalent med, at ρ n E[ X n ]/n!

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende

Kvadratisk 0-1 programmering. David Pisinger

Kvantemekanik 4 Side 1 af 11 Energi og tid. Hamiltonoperatoren

Transkript:

Kapitel 4 Asymptotisk optimalitet af MLE Lad Y 1, Y 2,... være uafhægige, idetisk fordelte variable med værdier i et rum (Y,K). Vi har givet e model (ν θ ) θ Θ for fordelige af Y 1 (og dermed også for fordelige af de adre Y er), hvor parametermægdeθ er e åbe delmægde afr k. Vi atager edvidere atν θ = f θ µ for et passede grudmålµ på (Y,K), og vi forestiller os at de tilhørede likelihoodfuktio opfylder tilstrækkeligt mage regularitetsbetigelser til at de sædvalige moralske sætiger holder. Vi skal helt specifikt trække på Bartlett s idetiteter, Cramérs sætig og Cramér-Rao s ulighed. Disse moralske sætiger er matematiske sætiger hvis f.eks. (ν θ ) θ Θ er e ekspoetiel familie og/eller hvis loglikelihoodfuktioe opfylder et større atal differetiabilitets- og majoriserigsbetigelser. Vi øsker at diskutere kvalitete af e estimator afθ. De diskussio er ikke så em, år parametermægde er k-dimesioal. E måde at gribe det a på, er at se på e geerel reel parameterfuktioτ :Θ R. Som et oplagt eksempel kaτvære projektioe ed på e ekelt koordiat. Me vi tillader også atτka blade koordiatere, gere på ikke-lieær faco. Blot vil vi atage atτer differetiabel. Idee med at se på reelle parameterfuktioer er at det er relativt emt at se om e estimator afτ(θ) er god eller dårlig. E god estimator θ af de fulde parameterθ fører til e god estimator afτ(θ) ved plug-i pricippet τ=τ( θ). Vi ka vede dee takegag om og sige at hvis vi ka fide e parameterfuktioτ så de tilsvarede plug-i estimator τ fugerer dårligt, så har ma fudet e præcis måde at sige på hvad er er galt med θ. 91

92 Kapitel 4. Asymptotisk optimalitet af MLE Lad os starte med at se på maksimaliserigsestimatore. Hvis ˆθ er maksimaliserigsestimatore for de fulde parameterθpå baggrud af observatioere Y 1,...,Y, så kaldes plug-i estimatore ˆτ =τ (ˆθ ) for maksimaliserigestimatore afτ(se defiitio 3.11 i Søre Feodor Nielses Matematisk Statistik, herefter kaldet [SFN]), fordi det er de værdi, der maksimerer de relevate profillikelihoodfuktio. Uder atagelse af at Cramérs sætig gælder for modelle, har vi at ( as ˆθ N θ, 1 ) i 1(θ) 1, hvor i 1 (θ) er Fisher-iformatioe bereget på baggrud af e ekelt observatio. Da vi har ataget atτer differetiabel får vi ved hjælp af deltametode at ( as ˆτ N τ(θ), 1 ) Dτ(θ) i 1(θ) 1 Dτ(θ) T. Vi ser således at ˆτ er e kosistet estimator afτ(θ), og vi har e ret præcis beskrivelse af hvorda fordelige af ˆτ trækker sig samme omτ(θ) år vokser. Et aturligt spørgsmål er om vi ka fide adre estimatorer afτ(θ), der klarer sig bedre ed ˆτ. Det viser sig at være vaskeligt at svare på helt geerelt. Me vi ka opå et meget tilfredsstillede svar, hvis vi fokuserer på de klasse af estimatorer, der ka skrives på forme ˇτ = g 1 h(y i ) (4.1) Her er h :Y R m e afbildig id i et passede euklidisk rum, og g :R m R er e afbildig id ir. Vi atager at E θ h(y 1 ) 2 < for alle θ Θ, og at g er differetiabel. Bortset fra disse tekiske restriktioer er der stort set tale om e reformulerig af defiitioe af mometestimatorer (se afsit 3.3.3 i [SFN]). Eksempel 4.1 Lad Y 1,...,Y være uafhægigen(ξ,σ 2 )-fordelte variable. Vi ved at maksimaliserigsestimatore afσ 2 er σ 2 = SSD = 1 Yi 2 1 2 Y i.

93 Vi ser at σ 2 har mometforme (4.1) med h(y)=(y 2, y), g(z, w)=z w 2. Her er altså e forholdsvis aturlig situatio hvor e estimator af e étdimesioal størrelse bygges op ved hjælp af e cetral estimator af oget todimesioalt. Typisk bruger vi jo ikke maksimaliserigsestimatore σ 2 i dee situatio, me e korrigeret variat 1 σ 2, der har de fordel at de er cetral. De korrigerede variat passer ikke id i mometforme (4.1), medmidre ma er villig til at arbejde med et -afhægigt g - og det er vi ikke villige til i dee sammehæg. Lad os for e estimator ˇτ på forme (4.1) idføre φ(θ)=e θ h(y 1 ), V(θ)=V θ h(y 1 ). Her erφ(θ) e m-vektor, mes V(θ) er e m m matrix. De cetrale græseværdisætig sikrer at 1 h(y i ) as N (φ(θ), 1 ) V(θ), og ved at bruge deltametode fås at ( as ˇτ N g ( φ(θ) ), 1 Dg( φ(θ) ) V(θ) Dg ( φ(θ) ) ) T Kokurrece mellem ˇτ og maksimaliserigsestimatore ˆτ falder dødt til jorde medmidre g ( φ(θ) ) =τ(θ) for alleθ Θ. (4.2) For hvis dee betigelser er brudt, vil fordelige af ˇτ simpelthe kocetrere sig om oget forkert. Så lad os atage at (4.2) er opfyldt. E aturlig måde at sammelige ˆτ og ˇτ på er at holde de to kostater, der bestemmer de asymptotiske variaser, Dτ(θ) i 1 (θ) 1 Dτ(θ) T og Dg ( φ(θ) ) V(θ) Dg ( φ(θ) ) T op mod hiade. Hvis vi ka etablere e geerel ulighed mellem disse kostater, det vil sige e ulighed der gælder for alleθ, så vil vi foretrække de estimator, der har de midste kostat.

94 Kapitel 4. Asymptotisk optimalitet af MLE Vi eridrer matrix-versioe af Cramér-Rao s ulighed 1. Eftersom h er e cetral estimator afφ(på si vis er det jo ærmest omvedt:φer etop valgt som det der estimeres cetralt af h) gælder der at V(θ)=V θ h(y 1 ) Dφ(θ) i 1 (θ) 1 Dφ(θ) T for alleθ Θ. (4.3) Ulighedsteget mellem matricere i dee ulighed skal forstås på de måde at differese V(θ) Dφ(θ) i 1 (θ) 1 Dφ(θ) T er e positivt semidefiit matrix. For e differetiabel afbildig g :R m R er de afledte Dg(z) for ethvert z er 1 m-matrix, det vil sige e rækkevektor. Ved at bruge de rækkevektor, der svarer til z=φ(θ), giver matrix-versioe af Cramér-Raos ulighed at Ved at flytte rudt, får vi at Dg ( φ(θ) ) ( V(θ) Dφ(θ) i1 (θ) 1 Dφ(θ) T) Dg(φ(θ)) T 0. Dg ( φ(θ) ) V(θ) Dg ( φ(θ) )T Dg ( φ(θ) ) Dφ(θ) i 1 (θ) 1 Dφ(θ) T Dg ( φ(θ) ) T Vi eridrer kæderegle for differetiable afbildiger mellem flerdimesioale rum (se evetuelt formel (12.11) i Measure theory (secod editio)), hvor de afledte af e sammesat fuktio udtrykkes som et matrixprodukt mellem de afledte af de idgåede fuktioer. Bruges kæderegle på (4.2) får vi at Dg ( φ(θ) ) Dφ(θ)=Dτ(θ) for alle θ Θ. (4.4) Vestre side af (4.4) idgår i ulighede forove, så vi ka ved idsættelse opå at Dg ( φ(θ) ) V(θ) Dg ( φ(θ) )T Dτ(θ) i 1 (θ) 1 Dτ(θ) T for alle θ Θ. Med adre ord ka de asymptotiske varias af ˇτ aldrig være midre ed de asymptotiske varias af ˆτ. Det er meget tækeligt at ma ka fide e mometestimator for τ, der asymptotisk set er lige så god som maksimaliserigsestimatore (ja, faktisk er maksimaliserigsestimatore jo ofte selv e mometestimator). Me ma ka ikke slå de! Uaset hvilke reel parameterfuktioτ ma har lagt sig fast på, vil plug-i estimatore ˆτ på baggrud af maksimaliserigsestimatore ˆθ kue stå sig i kokurrece med e hvilke som helst mometestimator af forme 4.1, selv hvis ma forsøger at vælge 1 Sætig 3.26 i [SFN]

95 e estimator der er tilpasset det aktuelleτså godt som muligt. Vi siger at maksimaliserigestimatore er asymptotisk efficiet. Argumetet om asymptotisk efficies er gaske overbevisede. Hvorda ka det så være at vi i e række modeller kovetiosmæssigt ikke bruger maksimaliserigsestimatore? E grudform for disse modeller er estimatio af variase for uafhægige N(ξ,σ 2 )-fordelte variable, som vi kort berørte i eksempel 4.1. I dette eksempel er det emt at vise at korrigerede maksimaliserigsestimator forσ 2 følger præcis samme a- symptotiske ormalfordelig som de rå maksimaliserigsestimator. Der er derfor ikke muligt at skele mellem de to estimatorer på baggrud af asymptotisk efficies, og valget mellem dem må gøres ud fra adre kriterier. E aturligt måde at gøre det på er at se på de eksakte fordeligsresultater - det ma ormalt kalder fiite sample properties. Her vider de cetrale estimator, me geviste forsvider i græse år.

96 Kapitel 4. Asymptotisk optimalitet af MLE