Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Relaterede dokumenter
Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Estimation ved momentmetoden. Estimation af middelværdiparameter

Stikprøvefordelinger og konfidensintervaller

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

antal gange krone sker i første n kast = n

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Konfidens intervaller

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Motivation. En tegning

Løsninger til kapitel 7

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Sammenligning af to grupper

9. Binomialfordelingen

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Diskrete og kontinuerte stokastiske variable

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Generelle lineære modeller

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Maja Tarp AARHUS UNIVERSITET

Kvantitative metoder 2

Renteformlen. Erik Vestergaard

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Den flerdimensionale normalfordeling

Vejledende besvarelser til opgaver i kapitel 15

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Hovedpointer fra SaSt

Teoretisk Statistik, 9. februar Beskrivende statistik

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Morten Frydenberg version dato:

Estimation og test i normalfordelingen

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Program. Middelværdi af Y = t(x ) Transformationssætningen

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Opsamling. Lidt om det hele..!

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Introduktion til uligheder

Asymptotisk estimationsteori

STATISTIKNOTER Simple normalfordelingsmodeller

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

STATISTISKE GRUNDBEGREBER

Skitse til notat om hvor de forskellige sandsynlighedsfordelinger kan tænkes at komme fra

Asymptotisk optimalitet af MLE

STATISTISKE GRUNDBEGREBER

Matematisk Modellering 1 Hjælpeark

Kvantitative Metoder 1 - Forår 2007

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Uge 40 I Teoretisk Statistik, 30. september 2003

x-klasserne Gammel Hellerup Gymnasium

Eksempel 10.1 En autoregressiv proces af orden 1 (ofte blot kaldet en AR(1)- proces) pårhar et opdateringsskema (10.1) med funktionen. for y R.

og Fermats lille sætning

Statistiske Modeller 1: Notat 1

Introduktion til uligheder

STATISTIK x-klasserne Gammel Hellerup Gymnasium

STATISTISKE GRUNDBEGREBER

Susanne Ditlevsen Institut for Matematiske Fag susanne

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Introduktion til Statistik

STATISTISKE GRUNDBEGREBER

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Deskriptiv teori: momenter

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Analyse 1, Prøve maj 2009

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

Modul 14: Goodness-of-fit test og krydstabelanalyse

Sandsynlighedsregning og statistisk

Sammensatte hypoteser i en polynomialfordeling

Sandsynlighedsregning

Nogle Asymptotiske Resultater. Jens Ledet Jensen Matematisk Institut, Aarhus Universitet. 1 Indledning 1

TEKST NR TEKSTER fra IMFUFA

Vejledende opgavebesvarelser

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Undersøgelse af numeriske modeller

Kvadratisk 0-1 programmering. David Pisinger

Forslag til besvarelser af opgaver m.m. i ε-bogen, Matematik for lærerstuderende

Transkript:

Dages program Estimatio: Kapitel 9.4-9.7 Eksempler på middelrette og/eller kosistete estimator (de sidste fra sidste forelæsig) Ko desiterval for store datasæt kap. 9.4 Ko desiterval for små datasæt kap. 9.5 Normalfordelt populatio T-fordelige kap 9.6 Pivotal størrelse kap. 9.7 1

Ko desiterval Kvatitative Metoder 1 - Forår 2007 Som diskuteret i de tidligere afsit, er et estimat i e give stikprøve æste aldrig lig de sade parameter. Derfor vil ma gere have e ide om, hvor usikker estimatet er. Dvs. hvis u ma udtog e ade stikprøve, ville ma så kue få et meget aderledes estimat. Ved at agive fordelige af estimatore får ma e beskrivelse dee usikkerhed. Nogle gage foretrækker ma, istedet at avede e eklere metode til at agive usikkerhede. Idee er, at agive et iterval omkrig estimatet, hvor der er e vis sikkerhed for, at de sade parameter ligger. Dee metode kaldes ko desitervaller. 2

I dette afsit ser vi på ko desitervaller omkrig geemsittet (estimatore for populatiosmiddelværdie ). Ko desitervaller er et iterval omkrig estimatore f.eks. X a; X + a : Vi vil gere udrege sadsylighede for at de sade parameter ligger i itervallet: P ( X a < < X + a). Bemærk er e parameter (og er ikke stokastisk), det er X som er stokastisk. Så det er itervallet, der er stokastisk: P ( X a < < X + a) = P ( a < X < + a) = P (j X j < a) 3

Eksempel (kedt varias): Atag at vi har e tilfældig stikprøve af størrelse fra populatio med middelværdi og varias 2 : Det atages at 2 er kedt. Vi ved u at geemsittet X = 1 P i=1 X i ka avedes som estimator for og at der gælder følgede E( X) = r 2 X = X N(; 2 ) for stor Hvis vi øsker at bestemme sadsylighede for, at ligger i et iterval (e gag stadardafvigelse) omkrig estimatore X : [ X p ; X + p ] P ( X p < < X + p ) = P (jx j < p ) = P ( j X j p < 1) Dee sadsylighed ka u approksimeres, hvis stikprøve er stor ( er stor) ved at 4

avede asymptotiske fordelig (de cetrale græseværdisætig): X p N(0; 1) ) P ( j X j X p < 1) = P ( 1 < < 1) = : (1) ( 1) = 1 2 ( 1) p = 1 2 0; 1587 = 0; 6826 Fortolkig: Med sadsylighed 0; 68 vil de sade parameter ligge i itervallet [ X p ; X + p ]: Dette betyder, at med e tilfældig stikprøve vil ko desitervallet kostrueret omkrig geemsittet ideholde de sade parameter i ca. 2/3 af gagee. Sadsylighede måler "tillide"til metode. Dette iterval kaldes et 68% ko desiterval. Bemærk: Vi beytter at er stor til at approksimere fordelige af X Vi skal kede 2 til beskrive fordelige af X: 5

Eksempel (ukedt varias) I dette eksempel er atagelsere idetiske med det foregåede eksempel bortset fra vi atager at 2 er ukedt. Vi vil ige gere kostruere et 68% ko desiterval. Det viser sig, at der for store gælder, at vi ka erstatte 2 med S 2 ; heraf følger at X Z = q S 2 N(0; 1): 68% ko desitervallet ka altså kostrueres som [ X Bemærk: Vi beytter at er stor til at approksimere fordelige af X Vi better at er stor til at approksimere 2 med S 2 : q S 2 ; q S X + 2 ]: 6

Approksimative ko desgræser for store stikprøver af populatiosgeemsittet hvor k er bestemt ved ko desiveuaet For kedt varias 2 : X k p For ukedt varias 2 : X k r S 2 Ko desiveuaet k 68% 1 90% 1,645 95% 1,96 99% 2,58 Ma aveder qogle gage tommel gerregle at 95% ko desitervallet ka des som : X 2 S 2 7

Husk at for fordeliger med ku e parameter er der ofte e relatitio mellem middelværdi og varias. I disse tilfælde skal stadardfejle ikke baseres på S 2 ; me i stedet som e fuktio af parametere. Adele Hvis populatiosfordelige er Beroullifordelt gælder der følgede approksimative ko desgræser for store stikprøver r ^p(1 X = ^p k ^p) 8

1 Ko desiterval for små stikprøver Når stikprøve er lille, er det ikke muligt at avede approksimatioe fra kap. 9.4. I stedet er ma ødt til at de de eksakte fordelig af estimatore. I dette afsit ser vi først på populatioer som er ormalfordelte. Eksempel (ormalfordelt populatio og kedt varias): I tilfældet hvor vi e tilfældig stikprøve på fra e ormalfordelt populatio gælder der at (se afsit 8.10): X~N(; 2 ): Ko desitervallet ka i dette tilfælde kostruereres som i tilfældet med store stikprøver og kedt varias. De eeste forskel er, at vi u har de eksakte sadsylighed, og ikke "ku"de approksimerede sadsylighed. 9

Eksempel (ormalfordelt populatio og ukedt varias) Som i eksemplet med store stikprøver, vil det her være vigtigt at kede fordelige af T kaldet score: X T = q : I små stikprøver er dee stokastiske variabel ikke stadard ormalfordelt, fordi vi har erstattet med S; som i sig selv er e stokastisk variabel. Løst sagt har S 2 også e varias så derfor bliver variatioe i T større, ed hvis vi kue sætte de sade værdi id (og få e ormalfordelig). S 2 10

For at kue kostruere ko desitervaller skal vi kede fordelige af T. Det viser sig, at T er t-fordelt. t-fordelige er e familie af fordeliger, som er karakteriseret ved atallet af frihedsgrader (degrees of freedom d.f). F.eks. ka T ~t(k) betyder at T er t-fordelt med k frihedsgrader. Det viser sig at T er t-fordelt med 1 frihedsgrader. Der gælder for t-fordelige at de er symmetrisk omkrig 0. Halesadsylighede er agivet i tabel IIIb. 11

Eksempel Atag at = 20: P ( X 2 S p < < X + 2 S p ) = P ( 2 < X p < 2) = F T (2) F T ( 2) = 1 2 (1 F T (2)) = 1 2 0; 03 = 0; 94 Ko desitervallet bliver breder år ma aveder ko desgræsere for e t- fordelig. 94% ko desitervallet er i t-fordelig med = 20 : [ X 2 S p ; X + 2 S p ] Tilsammeligig ville et det approksimative 94% ko desiterval være [ X 1; 88 S p ; X + 1; 88 S p ] 12

Eksempel (ikke ormalfordelt populatio og ukedt varias) Når populatioe ikke er ormalfordelt er T ikke t-fordelt. Me hvis populatioe er ikke er så lagt fra at være ormalfordelt har simulatioer vist, at t-fordelige ka være e god approksimatio. For at approksimatio skal være god, må halere ikke være "for tuge". Det betyder, at sadsylighede for at ligge lagt fra geemsittet må ikke være for stor. Approksimative ko desgræser for et ko desiterval for ; år 2 er ukedt og populatioe er "tæt"på ormalfordelt: r S 2 X k hvor k er givet som 100 (1+) 2 percetile e t-fordelig med 1 frihedsgrad. 13

Hvorår skal ma bruge t-fordelige t-fordelige skal ikke bruges hvis variase er kedt t-fordelige skal bruges hvis variase er ukedt og populatioe er ormalfordelt t-fordeligeka bruges hvis variase er ukedt, er lille og fordelige ikke har tuge haler Hvis > 40 vil tabelle for t-fordelige alligevel give ormalfordeligsapproksimatioe t-fordelige skal ikke bruges ved adele (Beroullifordelt populatio) 14

T-fordelige T-fordelige fremkommer på følgede måde X T = p X q = q hvor S 2 ( 1)S 2 2 ( 1) = Z p Y=( 1) Z = X q N(0; 1) 2 ( 1)S2 Y = ~ 2 2 ( 1)(chi 2 ( 1)) E t-fordelig fremkommer som brøke mellem e stadard ormalfordelt variabel og kvadratrode af e 2 ( 1) fordelt variabel divideret med atallet af frihedsgrader. Tæthedsfuktioe for t-fordelige med k (k > 1) frihedsgrader f(t) =/ 1 (k+1)=2 1 + t2 k 15

Egeskaber ved t-fordelige t-fordelige er symmetrisk omkrig 0 og E(T ) = 0 år k > 1 t-fordelige har tugere haler ed ormalfordelig for k! 1 gælder der at fordeligekoveregere mod ormalfordelige 16

Pivotale størrelser For T Kvatitative Metoder 1 - Forår 2007 X T = q gælder, at fordelige af stikprøvefuktio ikke afhæger af parametere i populatioe og 2 :E såda størrelse kaldes pivotal De itio: E pivotal er e fuktio af stikprøvefuktioe, hvis fordelig ikke afhæger af populatios parametere. E pivotal ka beyttes til at kostruere ko desitervaller. Atag at at g(x; ) er e stokastisk variabel, hvis fordelige ikke afhæger af : Lad A; B være ko desgræser således at A < B S 2 ; P (A < g(x; ) < B) = Dette vil svare til et ko desiterval. Ma ka så løse ulighede mht til og så de ko desgræsere 17

Opsummerig Ko desitervaller for store stikprøver Ko desitervaller for små stikprøver T-fordelige Pivotale størrelser 18

Næste gag Osdag d. 25/4: Estimatio af forskelle i middelværdier kap. 9.8 Estimatio af variatio kap. 9.9 Estimatiosmetoder kap. 9.10 19