Dages program Estimatio: Kapitel 9.4-9.7 Eksempler på middelrette og/eller kosistete estimator (de sidste fra sidste forelæsig) Ko desiterval for store datasæt kap. 9.4 Ko desiterval for små datasæt kap. 9.5 Normalfordelt populatio T-fordelige kap 9.6 Pivotal størrelse kap. 9.7 1
Ko desiterval Kvatitative Metoder 1 - Forår 2007 Som diskuteret i de tidligere afsit, er et estimat i e give stikprøve æste aldrig lig de sade parameter. Derfor vil ma gere have e ide om, hvor usikker estimatet er. Dvs. hvis u ma udtog e ade stikprøve, ville ma så kue få et meget aderledes estimat. Ved at agive fordelige af estimatore får ma e beskrivelse dee usikkerhed. Nogle gage foretrækker ma, istedet at avede e eklere metode til at agive usikkerhede. Idee er, at agive et iterval omkrig estimatet, hvor der er e vis sikkerhed for, at de sade parameter ligger. Dee metode kaldes ko desitervaller. 2
I dette afsit ser vi på ko desitervaller omkrig geemsittet (estimatore for populatiosmiddelværdie ). Ko desitervaller er et iterval omkrig estimatore f.eks. X a; X + a : Vi vil gere udrege sadsylighede for at de sade parameter ligger i itervallet: P ( X a < < X + a). Bemærk er e parameter (og er ikke stokastisk), det er X som er stokastisk. Så det er itervallet, der er stokastisk: P ( X a < < X + a) = P ( a < X < + a) = P (j X j < a) 3
Eksempel (kedt varias): Atag at vi har e tilfældig stikprøve af størrelse fra populatio med middelværdi og varias 2 : Det atages at 2 er kedt. Vi ved u at geemsittet X = 1 P i=1 X i ka avedes som estimator for og at der gælder følgede E( X) = r 2 X = X N(; 2 ) for stor Hvis vi øsker at bestemme sadsylighede for, at ligger i et iterval (e gag stadardafvigelse) omkrig estimatore X : [ X p ; X + p ] P ( X p < < X + p ) = P (jx j < p ) = P ( j X j p < 1) Dee sadsylighed ka u approksimeres, hvis stikprøve er stor ( er stor) ved at 4
avede asymptotiske fordelig (de cetrale græseværdisætig): X p N(0; 1) ) P ( j X j X p < 1) = P ( 1 < < 1) = : (1) ( 1) = 1 2 ( 1) p = 1 2 0; 1587 = 0; 6826 Fortolkig: Med sadsylighed 0; 68 vil de sade parameter ligge i itervallet [ X p ; X + p ]: Dette betyder, at med e tilfældig stikprøve vil ko desitervallet kostrueret omkrig geemsittet ideholde de sade parameter i ca. 2/3 af gagee. Sadsylighede måler "tillide"til metode. Dette iterval kaldes et 68% ko desiterval. Bemærk: Vi beytter at er stor til at approksimere fordelige af X Vi skal kede 2 til beskrive fordelige af X: 5
Eksempel (ukedt varias) I dette eksempel er atagelsere idetiske med det foregåede eksempel bortset fra vi atager at 2 er ukedt. Vi vil ige gere kostruere et 68% ko desiterval. Det viser sig, at der for store gælder, at vi ka erstatte 2 med S 2 ; heraf følger at X Z = q S 2 N(0; 1): 68% ko desitervallet ka altså kostrueres som [ X Bemærk: Vi beytter at er stor til at approksimere fordelige af X Vi better at er stor til at approksimere 2 med S 2 : q S 2 ; q S X + 2 ]: 6
Approksimative ko desgræser for store stikprøver af populatiosgeemsittet hvor k er bestemt ved ko desiveuaet For kedt varias 2 : X k p For ukedt varias 2 : X k r S 2 Ko desiveuaet k 68% 1 90% 1,645 95% 1,96 99% 2,58 Ma aveder qogle gage tommel gerregle at 95% ko desitervallet ka des som : X 2 S 2 7
Husk at for fordeliger med ku e parameter er der ofte e relatitio mellem middelværdi og varias. I disse tilfælde skal stadardfejle ikke baseres på S 2 ; me i stedet som e fuktio af parametere. Adele Hvis populatiosfordelige er Beroullifordelt gælder der følgede approksimative ko desgræser for store stikprøver r ^p(1 X = ^p k ^p) 8
1 Ko desiterval for små stikprøver Når stikprøve er lille, er det ikke muligt at avede approksimatioe fra kap. 9.4. I stedet er ma ødt til at de de eksakte fordelig af estimatore. I dette afsit ser vi først på populatioer som er ormalfordelte. Eksempel (ormalfordelt populatio og kedt varias): I tilfældet hvor vi e tilfældig stikprøve på fra e ormalfordelt populatio gælder der at (se afsit 8.10): X~N(; 2 ): Ko desitervallet ka i dette tilfælde kostruereres som i tilfældet med store stikprøver og kedt varias. De eeste forskel er, at vi u har de eksakte sadsylighed, og ikke "ku"de approksimerede sadsylighed. 9
Eksempel (ormalfordelt populatio og ukedt varias) Som i eksemplet med store stikprøver, vil det her være vigtigt at kede fordelige af T kaldet score: X T = q : I små stikprøver er dee stokastiske variabel ikke stadard ormalfordelt, fordi vi har erstattet med S; som i sig selv er e stokastisk variabel. Løst sagt har S 2 også e varias så derfor bliver variatioe i T større, ed hvis vi kue sætte de sade værdi id (og få e ormalfordelig). S 2 10
For at kue kostruere ko desitervaller skal vi kede fordelige af T. Det viser sig, at T er t-fordelt. t-fordelige er e familie af fordeliger, som er karakteriseret ved atallet af frihedsgrader (degrees of freedom d.f). F.eks. ka T ~t(k) betyder at T er t-fordelt med k frihedsgrader. Det viser sig at T er t-fordelt med 1 frihedsgrader. Der gælder for t-fordelige at de er symmetrisk omkrig 0. Halesadsylighede er agivet i tabel IIIb. 11
Eksempel Atag at = 20: P ( X 2 S p < < X + 2 S p ) = P ( 2 < X p < 2) = F T (2) F T ( 2) = 1 2 (1 F T (2)) = 1 2 0; 03 = 0; 94 Ko desitervallet bliver breder år ma aveder ko desgræsere for e t- fordelig. 94% ko desitervallet er i t-fordelig med = 20 : [ X 2 S p ; X + 2 S p ] Tilsammeligig ville et det approksimative 94% ko desiterval være [ X 1; 88 S p ; X + 1; 88 S p ] 12
Eksempel (ikke ormalfordelt populatio og ukedt varias) Når populatioe ikke er ormalfordelt er T ikke t-fordelt. Me hvis populatioe er ikke er så lagt fra at være ormalfordelt har simulatioer vist, at t-fordelige ka være e god approksimatio. For at approksimatio skal være god, må halere ikke være "for tuge". Det betyder, at sadsylighede for at ligge lagt fra geemsittet må ikke være for stor. Approksimative ko desgræser for et ko desiterval for ; år 2 er ukedt og populatioe er "tæt"på ormalfordelt: r S 2 X k hvor k er givet som 100 (1+) 2 percetile e t-fordelig med 1 frihedsgrad. 13
Hvorår skal ma bruge t-fordelige t-fordelige skal ikke bruges hvis variase er kedt t-fordelige skal bruges hvis variase er ukedt og populatioe er ormalfordelt t-fordeligeka bruges hvis variase er ukedt, er lille og fordelige ikke har tuge haler Hvis > 40 vil tabelle for t-fordelige alligevel give ormalfordeligsapproksimatioe t-fordelige skal ikke bruges ved adele (Beroullifordelt populatio) 14
T-fordelige T-fordelige fremkommer på følgede måde X T = p X q = q hvor S 2 ( 1)S 2 2 ( 1) = Z p Y=( 1) Z = X q N(0; 1) 2 ( 1)S2 Y = ~ 2 2 ( 1)(chi 2 ( 1)) E t-fordelig fremkommer som brøke mellem e stadard ormalfordelt variabel og kvadratrode af e 2 ( 1) fordelt variabel divideret med atallet af frihedsgrader. Tæthedsfuktioe for t-fordelige med k (k > 1) frihedsgrader f(t) =/ 1 (k+1)=2 1 + t2 k 15
Egeskaber ved t-fordelige t-fordelige er symmetrisk omkrig 0 og E(T ) = 0 år k > 1 t-fordelige har tugere haler ed ormalfordelig for k! 1 gælder der at fordeligekoveregere mod ormalfordelige 16
Pivotale størrelser For T Kvatitative Metoder 1 - Forår 2007 X T = q gælder, at fordelige af stikprøvefuktio ikke afhæger af parametere i populatioe og 2 :E såda størrelse kaldes pivotal De itio: E pivotal er e fuktio af stikprøvefuktioe, hvis fordelig ikke afhæger af populatios parametere. E pivotal ka beyttes til at kostruere ko desitervaller. Atag at at g(x; ) er e stokastisk variabel, hvis fordelige ikke afhæger af : Lad A; B være ko desgræser således at A < B S 2 ; P (A < g(x; ) < B) = Dette vil svare til et ko desiterval. Ma ka så løse ulighede mht til og så de ko desgræsere 17
Opsummerig Ko desitervaller for store stikprøver Ko desitervaller for små stikprøver T-fordelige Pivotale størrelser 18
Næste gag Osdag d. 25/4: Estimatio af forskelle i middelværdier kap. 9.8 Estimatio af variatio kap. 9.9 Estimatiosmetoder kap. 9.10 19