Estimation. Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat.

Relaterede dokumenter
Kombinant. En kombinant er en afbildning. hvor (Y, K) er endnu et målbart rum. Typisk taler vi om reelle kombinanter, hvor Y = R.

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Estimation. Kapitel 4

Statistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Klassisk Taylors formel

Trykfejlsliste - alle fejl Asymptotisk teori

Trykfejlsliste - alle fejl Introduktion til Matematisk Statistik 2. udgave

Kvantitative Metoder 1 - Forår 2007

Fejlstrata. Vi forestiller os at V har. 1) Et underrum L. 2) Et indre produkt, 3) En ortogonal dekomposition V = W W m

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Områdeestimation. Kapitel 7

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

Modelselektion Permeabilitet Permeabilitet Permeabilitet

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Den lineære normale model

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Sandsynlighed og Statistik

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Den lineære normale model

Tema. Dagens tema: Indfør centrale statistiske begreber.

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

så siges modellen at være! domineret af µ. Hvis modellen er parametriseret P =

Simpel Lineær Regression: Model

Kvantitative Metoder 1 - Forår 2007

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Nanostatistik: Konfidensinterval

Løsning til eksaminen d. 14. december 2009

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Estimation og usikkerhed

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Kvantitative metoder 2

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Konfidensintervaller og Hypotesetest

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Opgaver til kapitel 3

Vi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle.

StatDataN: Plot af data

Reeksamen 2014/2015 Mål- og integralteori

Stereologi. Foredrag ved Matematiklærerdagen 18. marts Eva B. Vedel Jensen. Institut for Matematik Science and Technology Aarhus Universitet

Produkt og marked - matematiske og statistiske metoder

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Test af statistiske hypoteser

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik og Sandsynlighedsregning 2

Normalfordelingen og Stikprøvefordelinger

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Om hypoteseprøvning (1)

Eksamen 2014/2015 Mål- og integralteori

Asymptotisk testteori

Statistik og Sandsynlighedsregning 2

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Forår Dagens program

Skriftlig eksamen Science statistik- ST501

Det asymptotiske scenarie

Betingning med en uafhængig variabel

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Trykfejlsliste - alle fejl Introduktion til matematisk statistik

Wigner s semi-cirkel lov

standard normalfordelingen på R 2.

Kvantitative metoder 2

Løsning eksamen d. 15. december 2008

Dagens program: Andel døde musefostre som fkt af indgivet konc.: Eksponentielle familier af fordelinger: Toxitetsvurdering for kølevæske:

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Module 4: Ensidig variansanalyse

To samhørende variable

Simpel Lineær Regression

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Statistik og Sandsynlighedsregning 2

Modul 6: Regression og kalibrering

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Differentialregning i R k

Antag at. 1) f : R k R m er differentiabel i x, 2) g : R m R p er differentiabel i y = f(x), . p.1/18

Kvantitative Metoder 1 - Efterår Dagens program

Transkript:

Estimation Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat. En estimator er en gætteregel.. p.1/22

Estimation X acements (Ω, F) (X, E) P θ ˆθ ν θ Θ θ t ˆθ = t X. p.2/22

Parameterfunktion Lad (ν θ ) θ Θ være en statistisk model på (X, E). Lad τ : Ω Ψ være en parameterfunktion. En estimator af τ er en afbildning s : X Ψ.. p.3/22

Parameterfunktion acements (Ω, F) (X, E) X P θ ˆτ = s(x) ν θ s θ Θ τ Ψ. p.4/22

Eksponentialeksempel Lad X 1,..., X n være uafhængige Exp(λ)-fordelte. Tre estimatorer: ˆλ = 1 n n X i i=1 λ = Empirisk Median(X 1,..., X n ) log 2 ˇλ = n min(x 1,..., X n ). p.5/22

Eksponentialeksempel: Sammenligning De tre estimatorer i et antal simulationer med n = 100, hvor den sande parameter er λ = 10. Extrem Median Mean 0 5 10 15 20. p.6/22

Hvordan vurderes en estimator? Lad ˆθ = t(x) være en estimator af den fulde parameter θ Θ. Kvaliteten af ˆθ vurderes ved at finde dens fordeling under hvert P θ. Vi ønsker: at fordelingen af ˆθ skal koncentrere sig rundt om θ under hvert P θ. p.7/22

vordan vurderes en estimator? Eksempel Lad X 1,..., X n være uafhængige Exp(λ)-fordelte. ˆλ = 1 n n i=1 X i Under P λ er ˆλ Γ-fordelt med form n og skala λ/n. Det vil blandt andet sige: E λˆλ = λ, Vλ = λ2 n (men fordelingsudsagnet er meget præcisere end som så). p.8/22

En estimator af en parameterfunktion? Lad τ : Θ Ψ være en parameterfunktion. Lad ˆτ = s(x) være en estimator af τ. Kvaliteten af ˆτ vurderes ved at finde dens fordeling under hvert P θ. Vi ønsker: at fordelingen af ˆτ skal koncentrere sig rundt om τ(θ) under hvert P θ. p.9/22

vordan vurderes en estimator? Eksempel Lad X 1,..., X n være uafhængige N ( ξ, σ 2) -fordelte. ˆξ = 1 n n i=1 X i Under P ξ,σ 2 er ˆξ N (ξ, σ2 n ). Det vil blandt andet sige: σ E ξ,σ 2 ˆξ = ξ, Vξ,σ 2 ˆξ 2 = n Variansen er ubehageligt ukendt.... p.10/22

Central estimator Lad τ : Θ R være en reel parameterfunktion. Lad ˆτ = s(x) være en estimator for τ. ˆτ er central hvis E θˆτ = τ(θ) for alle θ Mangel på centralitet kaldes bias, og opfattes som en systematisk fejlvisning.. p.11/22

Centralitet og panikobservationer Lad X 1,..., X n være uafhængige reelle variable med P (X i = 1) = p, P (X i = 0) = 1 p for alle i. Estimator: ˆp = a X 1 =... = X N = 0 1 n n i=1 X i ellers b X 1 =... = X N = 1 E pˆp = p + a (1 p) n + (b 1) p n Konklusion: ˆp er ikke central medmindre vi vælger a og b meget omhyggeligt.... p.12/22

Centralitet og skæve fordelinger Hvis fordelingen af ˆτ er ikke-symmetrisk, er middelværdien ikke nødvendigvis det bedste udtryk for midtpunktet. 0.00 0.05 0.10 0.15 Mean Median Mode 0 5 10 15. p.13/22

Centralitet og ækvivarians Hvis (ν θ ) θ Θ og (ξ λ ) λ Λ være to injektive parametriseringer af samme statistiske model på (X, E). Lad φ : Λ Θ være den eksplicitte reparametrisering, dvs. ν φ(λ) = ξ λ for alle λ Λ Hvis s : X Λ er en estimator af λ, så er t = φ s den ved ækvivarians dannede estimator af θ. Hvis s er en central estimator af λ, er t næppe en central estimator af θ.. p.14/22

Sammenligning af centrale estimatorer Lad ˆτ og τ være to centrale estimatorer for en reel parameterfunktion τ : Θ R. De rammer begge rigtigt i middel. Hvis vil vi foretrække ˆτ. V θ ˆτ V θ τ for alle θ Θ. p.15/22

Cramér-Raos sætning Lad Θ R være et åbent interval. Antag passende regularitetsbetingelser. Sætning For enhver målelig afbildning t : X R gælder at V θ (t X) (E θ (t X)) 2 i(θ) for alle θ Θ. Hvis t er en central estimator af θ, er E θ (t X) = 1. Så uligheden siger at V θ (t X) 1 i(θ) for alle θ Θ.. p.16/22

Optimal central estimator Lad Θ R være et åbent interval. Antag passende regularitetsbetingelser. Hvis man kan finde en central estimator ˆθ så V θ ˆθ = 1 i(θ) for alle θ Θ. så har den mindre varians end alle andre centrale estimatorer. Den er derfor optimal.. p.17/22

Mean squarred error Lad τ : Θ R være en reel parameterfunktion, og lad ˆτ være en estimator. ˆτ s mean squarred error er MSE(θ) = E θ (ˆτ τ(θ) ) 2 Lille MSE er bedre end stor MSE. Den generelle formel for 2.momentet om et punkt giver at MSE(θ) = V θ ˆτ + ( E θ ˆτ τ(θ) ) 2. p.18/22

Momentestimator Lad τ : Θ R være en reel parameterfunktion, og lad η : R R være en reel funktion. Hvis t : X R er en central estimator af τ, så er η t en momentestimator for parameterfunktionen η τ.. p.19/22

acements Momentestimator X (Ω, F) (X, E) Θ P θ θ τ t ν θ R η R Morale: søg efter et eller andet centralt.. p.20/22

Standard eksempel Lad X 1,..., X n være iid, med en fordeling der afhænger af θ R. Antag at Y i = f(x i ) har middelværdi E θ Y i = ψ(θ) Da er 1 n n i=1 Y i en central estimator af ψ(θ). Hvis ψ er bijektiv, er ( ˆθ = ψ 1 1 n n i=1 Y i ) en momentestimator for θ.. p.21/22

Mindste kvadraters metode Lad X 1,..., X n være reelle variable, med en fordeling der afhænger af θ Θ. Opstil kombinanten R(x 1,..., x n, θ) = n ( ) 2 xi E θ X i i=1 Find for observerede værdier af X 1,..., X n den θ-værdi, der minimerer θ R(X 1,..., X n, θ) Denne θ-værdi er OLS-estimatoren af θ. (Ordinary Least Squares). p.22/22