Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

Relaterede dokumenter
Scorer FCK "for mange" mål i det sidste kvarter?

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation

Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005

Spørgsmål 1 (5 %) Bestem sandsynligheden for at batteriet kan anvendes i mere end 5 timer.

Repetition. Forårets højdepunkter

Hvorfor n-1 i stikprøvevariansen?

BEVISER TIL KAPITEL 7

Økonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004

bestemmes. kendes ( ) A i Subjektiv information + objektiv information Bayesiansk statistik (gang 10) Bayes sætning

Notato: k grupper observeret tl tdspuktere (logartmerede) t1;t2;:::;t k. Tl tdspukt observeres et atal ( ) ph-vρrder, 1 ; 2 ;:::;. V opfatter dem som

Statistik 9. gang 1 REGRESSIONSANALYSE. Korrelation (kontrol af model) Regression (tilpasning af model)

Statistisk analyse. Vurdering af usikkerhed i forbindelse med statistiske opgørelser forudsætter:

L komponent produceret i linie 1

Men tilbage til regression og Chi-i-anden. test. Begge begreber refererer til normalfordelingen med middelværdi μ og spredning σ.

Variansanalyse. på normalfordelte observationer af Jens Friis

Simpel Lineær Regression - repetition

Fordelingen af gentagne observationer (målinger) kan beskrives ved hjælp af et histogram, der viser antallet af målinger i et givet interval.

Økonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1

Økonometri 1. Instrumentvariabelestimation 26. november Plan for IV gennemgang. Exogenitetsantagelsen. Exogenitetsantagelsen for OLS

Induktionsbevis og sum af række side 1/7

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 21. september 2005

Supplement til sandsynlighedsregning og matematisk statistik

Pearsons formel for χ 2 test. Den teoretiske forklaring

Kvantitative metoder 2

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

Indeks over udviklingen i biltrafikken i Danmark

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

Elementær Matematik. Sandsynlighedsregning

Rettevejledning til Økonomisk Kandidateksamen 2006I, Økonometri 1

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag

Lineære Normale Modeller

Kvantitative metoder 2

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Kvantitative metoder 2

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Betænkning om kommunernes udgiftsbehov. Bilag (med metodediskussion af professor Anders Milhøj)

x-klasserne Gammel Hellerup Gymnasium

χ 2 -fordelte variable

FORDELINGER: HYPERGEOMETRISK FORDELING, BINOMIALFORDELING MIDDELVÆRDI DEFINITION. X er en stokastisk variabel på et endeligt sandsynlighedsfelt ( )

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

EKSAMEN I MATEMATIK-STATISTIK, 27. JANUAR 2006, KL 9-13

Morten Frydenberg Biostatistik version dato:

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Binomialfordelingen: april 09 GJ

Økonometri lektion 7 Multipel Lineær Regression. Testbaseret Modelkontrol

Ikke-parametriske tests af forskel i central tendens. Tests for forskel i central tendens for data på ordinal- og intervalskala

Kvantitative metoder 2

Kvantitative metoder 2

Kogebog: 5. Beregn F d

Regressions modeller Hvad regresserer vi på og hvorfor? Anders Stockmarr Axelborg statistikgruppe 6/

Korrelation (kontrol af model) Regression (tilpasning af model) 1. Grad af fælles variation mellem X og Y. 2. Område og fordeling af sample data

SUPPLEMENT til Anvendt statistik

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Statikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller

Ugeseddel 8. Gruppearbejde:

Økonometri 1. Interne evalueringer. Interne evalueringer. Dagens program. Heteroskedaticitet (Specifikation og dataproblemer) 2.

Regressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder

Økonometri 1. Lineær sandsynlighedsmodel (Wooldridge 8.5). Dagens program: Heteroskedasticitet 30. oktober 2006

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Lineær regressionsanalyse8

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Kvantitative metoder 2 Forår 2007 Ugeseddel 9

Uge 40 I Teoretisk Statistik, 30. september 2003

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Tema. Dagens tema: Indfør centrale statistiske begreber.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Kontrol af udledninger ved produktion af ørred til havbrugsfisk

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Den stokastiske variabel X angiver levetiden i timer for en elektrisk komponent. Tæthedsfunktionen for den stokastiske variabel er givet ved

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Statistik II Lektion 4 Generelle Lineære Modeller. Simpel Lineær Regression Multipel Lineær Regression Flersidet Variansanalyse (ANOVA)

Løsninger til kapitel 7

Lineær regression lidt mere tekniske betragtninger om R^2 og et godt alternativ

IKKE-KONTINUERTE (DISKRETE) STOKASTISKE VARIABLE MIDDELVÆRDI, VARIANS, SPREDNING FORDELINGER: HYPERGEOMETRISK, BINOMIAL, POISSON

Statikstik II 4. Lektion. Generelle Lineære Modeller

Statistik Lektion 15 Mere Lineær Regression. Modelkontrol Prædiktion Multipel Lineære Regression

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Økonometri 1 Efterår 2006 Ugeseddel 9

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Brugen af R 2 i gymnasiet

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

FY01 Obligatorisk laboratorieøvelse. O p t i k. Jacob Christiansen Afleveringsdato: 3. april 2003 Morten Olesen Andreas Lyder

Binomialfordelingen. Erik Vestergaard

Videregående Algoritmik. David Pisinger, DIKU. Reeksamen, April 2005

antal gange krone sker i første n kast = n

Økonometri 1. Avancerede Paneldata Metoder I 24.november F18: Avancerede Paneldata Metoder I 1

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelsøgning Modelkontrol

Estimation ved momentmetoden. Estimation af middelværdiparameter

Analyse af bivariate data: korrelation og regression. korrelation. Korrelation og regression: Co-varians:

Vejledende besvarelser til opgaver i kapitel 15

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Kvalitet af indsendte måledata

Landbrugets efterspørgsel efter Kunstgødning. Angelo Andersen

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelkontrol

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Transkript:

Uge 37 I Teoretsk Statstk, 9.sept. 003. Fordelger kyttet tl N-ford. Gvet: uafhægge observatoer af samme N(µ,σ )-fordelte stokastske varabel. Formelt: X,X,,X uafhægge, alle N(µ,σ )-fordelt. Mddelværd µ og varas σ er ukedte parametre som v øsker at estmere udfra data, vs. fde de værder af µ og σ der "passer bedst mulgt" med data. Hvor uskre er dsse estmater? V øsker også at teste hypoteser om parametree. F.eks: Ka µ tækes at være 0 (eller ade fast, kedt værd)? Eksempel: dollarkurser Eksempel fra AJKM, sde 5: X,,X 3 er ædrgere dollarkurse fra jauar 983 tl december 984. Modelatagelse: X,,X m er uafhægge og N(µ,σ )-fordelte. Statstske spørgsmål: Hvad er estmatere for µ og σ? Hvor uskre er dsse estmater? Har ædrgere vareret omkrg 0, dvs. ka µ atages at være 0 (har kurse svget om samme veau)?

Estmato Ikke overraskede: µ= ˆ X = ( X+ + X) geemst (( ) ( ) ) σ ˆ = S = X X + + X X emp.varas Med adre observatoer vlle have fået adre estmater. Med adre ord: µ ˆ og σ ˆ er fuktoer af de stokastske varable X,,X m og dermed selv stokastske varable med e fordelg. Det er vgtgt at kede estmateres fordelg! Fordelg af ˆ µ = X Når X,,X m er uafhægge N(µ,σ )-fordelte, så er ( ) ( ) ( ) X + + X ~ N µ,σ µ= ˆ X= X + + X ~ N µσ, / Specelt har v altså at E[ µ ˆ ] =µ, dvs. at estmatore " geemst" rammer rgtgt. Varase på ˆµ aftager med så estmatet blver mere og mere præcst jo flere observatoer der er tl rådghed.

() Eksempel: dollarkurser Estmater µ ˆ og σ ˆ µ= ˆ X ~ N( µσ, / 3) obs. X :.47 σ ˆ = S ~ χ () obs. σˆ : 75.87 σ σ er uafhægge. (3) Eksempel: dollarkurser Hypotese: Kursædrgere har vareret tlfældgt omkrg 0, dvs. mddelværde af X er 0: H 0 : µ = 0 Oplagt at basere et test på størrelse af µ= ˆ X. V vl acceptere H 0 hvs X er "tæt på" 0; forkaste H 0 hvs X er "lagt fra" 0. Me hvad betyder "tæt på" og "lagt fra"?

Test af hypotese Ldt mere geerel hypotese: H 0:µ =µ 0 Vl basere testet på størrelse af µ ˆ µ 0 = X µ 0. Som før vl v acceptere H 0 hvs X er "tæt på" µ 0 ; forkaste H 0 hvs X er "lagt fra" µ 0. () Test af hypotese Hvs H 0 : µ = µ 0 er rgtg, så er 0 X ~ N( µ, σ / ) og dermed U = (X µ 0) ~ N(0,) σ Hvs v kedte σ vlle dette fortælle os, hvad der er stort og småt. Me v keder kke σ har ku et estmat: (X µ 0) T = ~ t( ) S t( ) er t-fordelge med frhedsgrader.

(3) Test af hypotese Fordelge af (X µ 0) T = ~ t( ) S afhæger altså kke af de ukedte parametre! Ka udersøge om de observerede værd af T er stor eller llle forhold tl e t(f)-fordelg (se eksempel). t(f) er symmetrsk om 0. t(f) har tugere haler ed N(0,), me lger N(0,) år f er stor (svarede tl at varase σ er godt bestemt af S ). (4) Test af hypotese Observeret værd af T er og T ~t(). V har at (X µ 0) 3 (.47 0) = =.79 S 758.7 P( T >.79) = P(T < -.79) + P(T >.79) = 0.04 så med sadsylghed 4% kue v have fået e T-værd, der var umersk større ed de observerede. V forkaster hypotese!

χ -fordelge Hvs U ~N(0,) sges U at være χ -fordelt med frhedsgrad: U ~ χ (). Hvs U,,U f er uafhægge N(0,)-fordelte sges være χ -fordelt med f frhedsgrader: Q ~ χ (f). Ma ka vse at χ (f) = Γ(f/, ½) så f/ f/ EQ [ ] = = f, varq [ ] = = f. ½ (½) f at = Q= U Fordelge af σ ˆ = S Husk at X~N(, µ σ ) så (X µ)/σ ~ N(0,) og dermed = ( X µ ) σ ~ χ () Erstattes parametere µ med estmatet µ ˆ = X fås stedet frhedsgrader (spaltgssætge): = ( ) X X ~ χ ( ) σ Afhægghed: (X X) + + (X X) = X+ + X X = 0.

() Fordelge af σ ˆ = S Altså: Specelt: = (X X) σ ˆ = S = ~ χ ( ) σ σ σ ˆ ˆ σ σ = σ = =σ E E ( ) σ 4 ˆ ˆ σ σ σ = σ = = var ( ) var ( ) σ Derfor dvderes med - stedet for S! Bemærk at : E[S] = E S σ. Smulta fordelg af µ ˆ = Xog σ ˆ = S V har u beskrevet de margale fordelger af µ= ˆ Xog σ ˆ = S : µ= ˆ X~N( µσ, /) ( X X) ) = σ ˆ = S = ~ χ ( ) σ σ σ Ma ka vse (spaltgssætge) at µ ˆ = Xog σ ˆ = S er uafhægge. De smultae tæthed er således produktet af de margale. Meget fordelagtgt med uafhægghed mellem de to estmater!

Spaltgssætge (forsmplet udgave) V har: Her er ( ) ( ) Q= X µ = X X+ X µ = = ( X X) ( X ) ( X X)( X ) = + µ + µ = = = = Q + Q + Q Q/ σ ~ χ (),Q / σ = ( (X µ )/ σ) ~ χ () og Q = 0. Spaltgssæt: Q og Q uafhægge og Q /σ ~ χ (-) Spaltgssætge (mere geerel udgave) X ~ N(µ,σ ): samme varas, me evt. forsk. mddelværder ( ) ( ) = = = = = Q= X µ = X a X+ a X µ ( X a X) ( a X ) ( X a X)( a X ) = + µ + µ = Q + Q+ Q Ved at Q/σ ~ χ (). Hvs Q = 0 og Q /σ ~ χ (k) så er Q og Q uafhægge og Q /σ ~ χ (-k)

t-fordelge Hvs U og Q er uafhægge og U ~N(0,) og Q ~ χ (f), så er T = U f Q ~ t(f) Dette var præcs hvad der "foregk" før: T ( ) ( ) X µ 0 X µ 0 σ ( ) U = = = S σ S ( ) Q F-fordelge Mage hypoteser ka testes ved at teste om to varaser er es: V σ S σ Q /( ) Q /( ) = = = S Q /( ) Q /( ) Derfor er følgede teressat: Hvs Q ~ χ (f ) og Q ~ χ (f ) samt Q og Q er uafhægge, så er Q/f V = ~F(f,f ) Q /f F-ford. med (f, f ) frhedsgrader. NB: T ~ t(f) Y T ~F(,f).