Estimation ved momentmetoden. Estimation af middelværdiparameter

Relaterede dokumenter
Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

antal gange krone sker i første n kast = n

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Løsninger til kapitel 7

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Motivation. En tegning

Stikprøvefordelinger og konfidensintervaller

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Program. Middelværdi af Y = t(x ) Transformationssætningen

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Asymptotisk optimalitet af MLE

Konfidens intervaller

Hovedpointer fra SaSt

Generelle lineære modeller

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Introduktion til Statistik

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

9. Binomialfordelingen

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Susanne Ditlevsen Institut for Matematiske Fag susanne

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Susanne Ditlevsen Institut for Matematiske Fag susanne

Maja Tarp AARHUS UNIVERSITET

Estimation og konfidensintervaller

Diskrete og kontinuerte stokastiske variable

Sammensatte hypoteser i en polynomialfordeling

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Kvantitative metoder 2

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Den flerdimensionale normalfordeling

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Uge 40 I Teoretisk Statistik, 30. september 2003

Teoretisk Statistik, 18. november Stikprøveteori: hvor er vi, og hvor skal vi hen? Proportional allokering Optimal allokering

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Morten Frydenberg version dato:

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Teoretisk Statistik, 9. februar Beskrivende statistik

Test i polynomialfordelingen

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Tema. Dagens tema: Indfør centrale statistiske begreber.

Sammenligning af to grupper

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Vejledende besvarelser til opgaver i kapitel 15

Normalfordelingen og Stikprøvefordelinger

Opsamling. Lidt om det hele..!

STATISTISKE GRUNDBEGREBER

Asymptotisk estimationsteori

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Note om Monte Carlo metoden

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

STATISTISKE GRUNDBEGREBER

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Produkt og marked - matematiske og statistiske metoder

Susanne Ditlevsen Institut for Matematiske Fag susanne

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Statistiske Modeller 1: Notat 1

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Nanostatistik: Konfidensinterval

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

StatDataN: Test af hypotese

Nanostatistik: Test af hypotese

Kvantitative Metoder 1 - Forår 2007

Løsning eksamen d. 15. december 2008

Statistik og Sandsynlighedsregning 2

STATISTIKNOTER Simple normalfordelingsmodeller

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Vejledende opgavebesvarelser

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Konfidensintervaller og Hypotesetest

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Undersøgelse af numeriske modeller

Sandsynlighedsregning

Transkript:

Statistik og Sadsylighedsregig 1 STAT kapitel 4.2 4.3 Susae Ditlevse Istitut for Matematiske Fag Email: susae@math.ku.dk http://math.ku.dk/ susae Estimatio ved mometmetode Idimellem ka det være svært (eller umuligt) at fide maximum likelihood estimatore. E ade estimatiosmetode er mometmetode. Atag at vi i et forsøg observerer stokastiske variable X 1,..., X, alle med middelværdi µ. Vi vil gere estimere µ. 6. udervisigsuge, osdag Vi ka da estimere de teoretiske middelværdi µ med geemsittet af vores observatioer (dvs middelværdie af de empiriske fordelig). 1 2 Estimatio af middelværdiparameter Mometestimatore er ˆµ = 1 X i Bemærk at det er e cetral estimator: ( ) 1 E(ˆµ) = E X i = 1 = µ = µ E(X i ) Eksempel: Middelværdie af e biomialfordelt stokastisk variabel X Bi(, p) er p. Vi ka derfor defiere mometestimatore: ˆp = X dvs vi får ige maximum likelihood estimatore: ˆp = X 3 4

Estimatio ved mometmetode Atag u at vi i et forsøg observerer stokastiske variable X 1,..., X, alle med middelværdi µ og varias σ 2. Vi vil gere estimere både µ og σ 2. Vi ka da estimere de teoretiske varias σ 2 med variase i de empiriske fordelig. Mometestimatore er ˆσ 2 = 1 1 (X i X) hvor X er geemsittet af måligere. Bemærk at det er e cetral estimator, som I har vist i MS, opgave 3.26. Estimatio ved mometmetode Mometmetode er ikke automatisk: først skal vi vælge hvilke stokastiske variable, vi vil sætte lig deres middelværdi. I det foregåede valgte vi de to (aturlige) stokastiske variable X og stikprøvevariase. Geerelt: Hvis ma skal estimere k parametre, skal ma midst have k stokastiske variable at sætte lig deres middelværdi. På de måde får ma k ligiger med k ubekedte. 5 6 Kofidesitervaller Atag at vi har estimeret parametere θ ved de stokastiske variabel Eksempel: Hvis X Bi(, p) estimerer vi p ved ˆθ = ˆθ(X 1,..., X ) Vi håber at ˆθ θ, me det ville være godt med et mere præcist udtryk for hvor tæt vi tror at vores estimat er på de sade (ukedte) værdi. Ide: Det er aturligt at tage udgagspukt i estimatets fordelig. E oplagt størrelse til at agive usikkerhede er spredige i dee fordelig. ˆp = X som vi allerede har set er et cetralt estimat: E(ˆp) = p. Derudover har vi set at: ( ) X Var(ˆp) = Var = 1 p(1 p) p(1 p) Var(X) = 2 2 = Vi har altså at spredige på estimatet er SE(ˆp) = p(1 p) Var(ˆp) = Bemærk at SE(ˆp) 0 år. Hvad betyder det? 7 8

Problem: I udtrykket for spredige idgår de ukedte parameter p. I stedet estimerer vi spredige ved at idsætte de estimerede værdi: Eksempel: Atag at vi observerer X = 175 bør med astma ud af = 500 udersøgte bør, dvs ˆp = 175 = 0.35 eller 35% 500 sˆp = ˆp(1 ˆp) Hvor godt er vores estimat ˆp for p? Bemærk at sˆp er de typiske afvigelse vi forveter at estimatet har fra de sade værdi. Dvs vi er mere usikre på vores estimat jo større sˆp er. Med adre ord, i getage forsøg, hvor tæt er ˆp på p? Dette udtrykkes ved stadardfejle på ˆp: SE(ˆp) = Var(ˆp) 9 10 Stadardfejle, SE(ˆp), på estimatet for sadsylighede p, er estimeret ved sˆp = ˆp(1 ˆp) I eksemplet fås 0.35(1 0.35) = 0.021 500 Dette ka bruges til at lave kofidesitervaller for p 95%CI : ˆp ± 1.96 sˆp = 0.35 ± 1.96 0.021 1.96? 99%CI : ˆp ± 2.58 sˆp = 0.35 ± 2.58 0.021 2.58? I eksemplet 95%CI : fra 0.308 til 0.392 Fortolkig? 0.25 0.30 0.35 0.40 0.45 p^ 11 12

sample umber 0 10 20 30 40 50 CI for p^, =500, P=0.35, repetitios=100 0.20 0.25 0.30 0.35 0.40 0.45 0.50 p^ Tallee 1.96 og 2.58 kommer fra Normalfordelige. De skal vi først høre om på SaSt2!!! Me her er e lille forsmag: Normalfordelige kommer fra De cetrale græseværdisætig et matematisk resultat der agiver at stikprøvegeemsit er tilærmelsesvist Normalfordelte: Hvis tilfældige stikprøver udtages fra e populatio med middelværdi m og varias s 2 da er fordelige af stikprøvegeemsittet x tilærmelsesvist Normal med middelværdi m og varias s 2 /. Tilærmelse bliver bedre og bedre jo større (stikprøvestørrelse) er. 13 14 Normalfordelige Normalfordelige 3 2 1 0 1 2 3 µ 3σ µ 2σ µ + 2σ µ + 3σ ét maksimum symmetrisk ikke særlig tuge haler To parametre: µ : middelværdi σ 2 : varias (σ er spredige) 15 16

Normalfordelige - 1.96? Normalfordelige - 2.58? 95% 2.5% 2.5% µ 1.96σ µ µ + 1.96σ 99% 0.5% 0.5% µ 2.58σ µ µ + 2.58σ Vi brugte tallet 1.96 til at kostruere 95% kofidesitervaller. Vi brugte tallet 2.58 til at kostruere 99% kofidesitervaller. 17 18 Fordelig af geemsittet i stikprøver Fordelig af geemsittet i stikprøver Teoretisk fordelig: Normalfordelige 0 1 2 3 = 2 Teoretisk fordelig: Logormalfordelige 0.0 0.5 1.0 1.5 2.0 = 2 0 1 2 3 = 20 1.0 1.1 1.2 1.3 1.4 1.5 0.0 0.5 1.0 1.5 2.0 = 20 0 1 2 3 = 100 0.0 0.5 1.0 1.5 2.0 = 100 19 20

Fordelig af geemsittet i stikprøver Fordelig af geemsittet i stikprøver Teoretisk fordelig: Biomialfordelige, P = 0.375 0 2 4 6 8 = 2 Teoretisk fordelig: Biomialfordelige, P = 0.05 = 2 0.5 0.6 0 2 4 6 8 = 20 0.0 0.2 0.4 0.6 0.8 = 20 0 2 4 6 8 = 100 = 100 21 22 Defiitio 4.8 Atag at vi har observatioer X 1,..., X og e tilhørede statistisk model med parameter θ. Et (1 α)-kofidesiterval, hvor kofidesgrade (1 α) opfylder at 0 (1 α) 1, er et iterval af forme (Y 1, Y 2 ), hvor Y 1 = g 1 (X 1,..., X ) og Y 2 = g 2 (X 1,..., X ) er stokastiske variable, således at der for ehver mulig θ-værdi i modelle gælder P θ (Y 1 < θ < Y 2 ) = 1 α Bemærk: 95% kofidesitervallere foreslået før ( ˆθ 1.96 sˆθ ; ˆθ + 1.96 sˆθ ) er approksimative, og bygger på de cetrale græseværdisætig. De er ku asymptotisk korrekte, dvs skal helst være stor. (Hvad er stor?) Oftest er α = 0.05, me også α = 0.01 bruges tit. Ma vælger selv α. For ogle modeller ka vi godt rege eksakte kofidesitervaller ud, me det er som regel mere besværligt. 23 24