Kombinant. En kombinant er en afbildning. hvor (Y, K) er endnu et målbart rum. Typisk taler vi om reelle kombinanter, hvor Y = R.

Relaterede dokumenter
Estimation. Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat.

så siges modellen at være! domineret af µ. Hvis modellen er parametriseret P =

Estimation. Kapitel 4

Statistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Trykfejlsliste - alle fejl Introduktion til Matematisk Statistik 2. udgave

Modelselektion Permeabilitet Permeabilitet Permeabilitet

Områdeestimation. Kapitel 7

Statistik 1TS 2003 Obligatorisk opgave 1

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Estimation og konfidensintervaller

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Klassisk Taylors formel

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Susanne Ditlevsen Institut for Matematiske Fag susanne

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Kvantitative Metoder 1 - Forår 2007

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Om hypoteseprøvning (1)

Sandsynlighed og Statistik

8 Regulære flader i R 3

Maksimaliseringsestimation i praksis

Kvantitative Metoder 1 - Forår 2007

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

standard normalfordelingen på R 2.

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Tema. Dagens tema: Indfør centrale statistiske begreber.

Statistik og Sandsynlighedsregning 2

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Statistik og Sandsynlighedsregning 2

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Note om Monte Carlo metoden

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Asymptotisk testteori

Integration m.h.t. mål med tæthed

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

StatDataN: Plot af data

Løsning eksamen d. 15. december 2008

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Vi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle.

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Fejlstrata. Vi forestiller os at V har. 1) Et underrum L. 2) Et indre produkt, 3) En ortogonal dekomposition V = W W m

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Dagens program: Andel døde musefostre som fkt af indgivet konc.: Eksponentielle familier af fordelinger: Toxitetsvurdering for kølevæske:

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Trykfejlsliste - alle fejl Asymptotisk teori

Kvantitative Metoder 1 - Efterår Dagens program

Statistik 1TS 2005 Obligatorisk opgave 1

Kvantitative Metoder 1 - Forår Dagens program

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Opgaver til kapitel 3

Den lineære normale model

Nanostatistik: Test af hypotese

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

Løsning til eksaminen d. 14. december 2009

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Noter til Specialkursus i videregående statistik

GEOMETRI-TØ, UGE 12. A σ (R) = A f σ (f(r))

Normalfordelingen og Stikprøvefordelinger

Eksamen 2014/2015 Mål- og integralteori

Mat2SS Vejledende besvarelse uge 11

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Eksamen i Mat F, april 2006

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

StatDataN: Test af hypotese

Flerdimensionale transformationer

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Statistiske principper

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trykfejlsliste - alle fejl Introduktion til matematisk statistik

Integration m.h.t. mål med tæthed

Stastistik og Databehandling på en TI-83

Reeksamen 2014/2015 Mål- og integralteori

Løsning til eksaminen d. 29. maj 2009

Transkript:

Kombinant Lad (ν θ ) θ Θ være en statistisk model på (X, E). En kombinant er en afbildning hvor (Y, K) er endnu et målbart rum. R : X Θ Y Typisk taler vi om reelle kombinanter, hvor Y = R. Som regel forsøger kombinanter at sige noget om konkordans.. p.1/24

Eksempel: Likelihood Lad ν θ = f θ µ, θ Θ, være en domineret, parametriseret model på (X, E). Likelihoodfunktionen udfra observationen x, L x (θ) = f θ (x) for θ Θ. Loglikelighoodfunktionen udfra x, l x (θ) = log L x (θ). p.2/24

Eksempel: scorefunktionen Antag at Θ er en åben mængde i R k. Antag at l x eksisterer og er differentiabel overalt. Scorefunktionen: Dl x (θ) = ( l x (θ) θ 1 l x (θ) θ 2... ) l x (θ). θ k Kombinant med værdier i mængden af k-rækkevektorer.. p.3/24

Eksempel: observeret information Antag at Θ er en åben mængde i R k. Antag at l x eksisterer og er to gange differentiabel. Observeret information: D 2 l x (θ) = 2 l x (θ) θ 1 2 2 l x (θ) θ 2 θ 1. 2 l x (θ) θ k θ 1 2 l x (θ) θ 1 θ 2... 2 l x (θ) 2 l x (θ) θ 1 θ k 2 l x (θ) θ 2 θ k θ 2 2.......... 2 l x (θ) θ k θ 2... 2 l x (θ) θ k 2. Kombinant med værdier i mængden af k k-matricer.. p.4/24

Forventet værdi i den sande parameter Kombinant θ E θ R(X, θ) : punktskyens centrum som funktion af θ. θ. p.5/24

Fisher information Momentkonstruktionen kan bruges på den observerede information (koordinat for koordinat). Resultatet kaldes Fisher informationen, i(θ) = E θ D 2 l X (θ) Fisher informationen fanger en meget vigtig modelegenskab!. p.6/24

Hovedsætning Lad Θ R k være åben. Hvis l X (θ) opfylder visse regularitetsbetingelser så er E θ (Dl X (θ)) = 0 for alle θ Θ, Den forventede værdi af scorefunktionen, udregnet i den sande parameter, er nul-rækken.. p.7/24

Hovedsætning Lad Θ R k være åben. Hvis l X (θ) opfylder visse regularitetsbetingelser så er V θ (Dl X (θ)) = i(θ) for alle θ Θ, Variansen af scorefunktionen, udregnet i den sande parameter, er Fisher informationen.. p.8/24

Hovedsætnings indhold Lad Θ R være et åbent interval. Hvis l X (θ) opfylder visse regularitetsbetingelser, vil scorefunktionen l X (θ), regnet ud i den sande parameter, have middelværdi 0 og varians i(θ). Kombinant θ. p.9/24

Hovedsætning, direkte eftervisning Lad X 1,..., X n være uafhængige Exp(λ)-fordelte variable. l X (λ) = n log λ + n i=1 X i λ. l X(λ) = n λ n i=1 X i λ 2, l X(λ) = n λ 2 + 2 n i=1 X i λ 3, i(λ) = n λ 2 E λ l X(λ) = n λ n λ λ 2 = 0 V λ l X(λ) = V λ n i=1 X i λ 4 = n λ2 λ 4 = n λ 2 = i(λ). p.10/24

Momentresultat for eksponentiel familie Lad X være fra en étdimensional eksponentiel familie på X, P θ (X A) = A 1 c(θ) eθ t(x) dµ(x) Definer τ(θ) = E θ t(x), κ(θ) = V θ t(x) Sætning τ(θ) = d dθ log c(θ), d2 κ(θ) = log c(θ) dθ2. p.11/24

Hovedsætning, 1-dim eksponentiel familie Lad X være fra en étdimensional eksponentiel familie på X, l X (θ) = log c(θ) θ t(x). l X(θ) = d dθ log c(θ) t(x), l X(θ) = d2 log c(θ), dθ2 i(θ) = κ(θ) E θ l X(θ) = d dθ log c(θ) τ(θ) = 0 V θ l X(θ) = V θ t(x) = κ(θ) = i(θ).. p.12/24

Forskellige parametriseringer Lad en statistisk model P have to étdimensionale parametriseringer, og lad φ være reparametriseringsafbildningen. Antag at φ er C 2. PSfrag replacements P Θ φ Λ l X (θ) - θ-loglikelihood l X (λ) - λ-loglikelihood Fundamental relation: l X (θ) = l X φ(θ).. p.13/24

Forskellige parametriseringer Sætning Hvis λ-parametriseringen opfylder at så er E λ l X(λ) = 0, E θ l X (θ) = 0, V λ l X(λ) = i(λ) V θ l X (θ) = ĩ(θ) Korollar Alle fejlparametriserede eksponentielle familier opfylder at E θ Dl X (θ) = 0, V θ Dl X (θ) = i(θ). p.14/24

Cramér-Raos sætning Lad Θ R være et åbent interval. Antag passende regularitetsbetingelser. Sætning For enhver målelig afbildning t : X R gælder at V θ (t X) (E θ (t X)) 2 i(θ) for alle θ Θ.. p.15/24

Fortolkning af Cramér-Raos sætning Gentagne observationer af t(x) under P θ vil danne en punktsky. V θ (t X): punktskyens bredde. Ønskes lille E θ (t X): hvor hurtigt flytter skyen sig med θ. Ønskes stor Hurtigtflyttende punktsky kun mulig hvis skyen er bred, eller hvis i(θ) er stor. Velseparerede punktskyer kun mulig hvis i(θ) er stor.. p.16/24

Estimation Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat. En estimator er en gætteregel.. p.17/24

Estimation X ag replacements (Ω, F) (X, E) P θ ˆθ ν θ θ t ˆθ = t X Θ. p.18/24

Undtagelsesmængde Formelt er en estimator t defineret på hele X. I praksis er der ofte visse mulige x er, der ikke fører til et kvalificeret gæt på θ. De kaldes panikobservationer. Tre løsninger: 1. Undlad global definition af t. 2. Tillad t-værdier uden for Θ. 3. Gør et eller andet arbitrært for panikobservationerne.. p.19/24

Eksempel: møntkast Lad X 1,..., X n være uafhængige reelle variable med Parameter: p (0, 1). P (X i = 1) = p, P (X i = 0) = 1 p for alle i. Vi gætter på: den observerede succesfrekvens. n ˆp = 1 n i=1 X i Undtagelsesobservationer: (x 1,..., x n ) = (0,..., 0) (x 1,..., x n ) = (1,..., 1) fører til estimat 0 hhv. 1.. p.20/24

Eksponentialeksempel: moment idé Lad X 1,..., X n være uafhængige Exp(λ)-fordelte. Idé: Da ( n ) E λ X i = nλ er en fornuftig estimator sikkert i=1 n ˆλ = 1 n i=1 X i I hvert fald er E λˆλ = λ, Vλˆλ = λ 2 n. p.21/24

Eksponentialeksempel: median idé Lad X 1,..., X n være uafhængige Exp(λ)-fordelte. Idé: Da median λ X i = λ log 2 er en fornuftig estimator sikkert λ = Empirisk Median(X 1,..., X n ) log 2. p.22/24

Eksponentialeksempel: ekstremværdi idé Lad X 1,..., X n være uafhængige Exp(λ)-fordelte. Idé: Da min(x 1,... X n ) Exp(λ/n) er en fornuftig estimator måske ˇλ = n min(x 1,..., X n ) I hvert fald er E λˇλ = λ, Vλˇλ = λ 2. p.23/24

Eksponentialeksempel: Sammenligning De tre estimatorer i et antal simulationer med n = 100, hvor den sande parameter er λ = 10. Extrem Median Mean 0 5 10 15 20. p.24/24