Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Relaterede dokumenter
hvor a og b er konstanter. Ved middelværdidannelse fås videre

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning

Den todimensionale normalfordeling

3 Stokastiske variable 3.1 Diskrete variable

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

standard normalfordelingen på R 2.

Statistik og Sandsynlighedsregning 2

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

INSTITUT FOR MATEMATISKE FAG c

Sandsynlighedsregning Oversigt over begreber og fordelinger

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Noter til Specialkursus i videregående statistik

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Simpel Lineær Regression

Betingede sandsynligheder Aase D. Madsen

Statistiske modeller

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Matrix Algebra med Excel Forelæsningsnoter til FR86. Jesper Lund

Repetition Stokastisk variabel

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Indblik i statistik - for samfundsvidenskab

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Løsning til eksamen 16/

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Løsning til prøveeksamen 1

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 11: Kapitel 11: Regressionsanalyse

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Skriftlig eksamen Science statistik- ST501

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Sandsynlighedsregning

Susanne Ditlevsen Institut for Matematiske Fag susanne

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Middelværdi og varians. Kovarians. korrelation = 0.02 korrelation = 0.7 korrelation = 1.0

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Sandsynlighedsregning Stokastisk variabel

Statistik og Sandsynlighedsregning 2

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Opgaver i sandsynlighedsregning

Eksamen 2014/2015 Mål- og integralteori

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Løsning til eksaminen d. 14. december 2009

Statistik 1 og Statistiske Modeller 2: Todimensionale normalfordelte data Flerdimensionale normalfordelte data. Jørgen Granfeldt

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Flerdimensionale fordelinger. Erik Michaelsen Nielsen

Løsning eksamen d. 15. december 2008

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Transkript:

IMM, 00--6 Poul Thyregod Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable Todimensionale stokastiske variable Lærebogens afsnit 4 introducerede sandsynlighedsmodeller formuleret ved stokastiske variable. I afsnittet betragtede man også fordelinger for flere end én stokastisk variabel (fx når man betragtede fordelingen af summer mv), men kun under antagelse af at de indgående stokastiske variable var uafhængige. I denne note vil vi udvide nogle af betragtningerne fra afsnit 4 til at omfatte fordelinger af flere stokastiske variable, der ikke nødvendigvis er uafhængige. Vi vil fortrinsvis betragte fordelinger af to stokastiske variable, X og Y. Simultan tæthedsfunktion I analogi med tæthedsfunktionen (probability density function, side 75) for en endimensional kontinuert stokastisk variabel, kan man indføre den simultane tæthedsfunktion for en flerdimensional stokastisk variabel. Den simultane tæthedsfunktion for en todimensional stokastisk variabel (X, Y ) er en funktion, p X,Y (x, y), defineret for alle reelle talpar (x, y) som opfylder p X,Y (x, y) 0 p X,Y (x, y)dydx =

For to vilkårlige talpar, (a, b) og(c, d) meda<bog c<dgælder b [ d P[{a <X b} {c<y d}= p X,Y (x, y)dy dx Sandsynligheden bestemmes altså som et volumen under den flade, der er angivet ved tæthedsfunktionen. Specielt har man de marginale sandsynligheder for X, b [ P[a <X b=p[{a<x b} {<Y < } = og den marginale tæthedsfunktion for X p X (x) = a p X,Y (x, y)dy c a p X,Y (x, y)dy som fås ved at flytte den todimensionale sandsynlighedsmasse ud i margenen. dx Stokastisk uafhængighed Definitionen på stokastisk uafhængighed (Petrucelli side 80) udtrykker, at stokastiske variable er uafhængige, hvis man kan bestemme sandsynligheder i den simultane fordeling ud fra de marginale sandsynlighedsfordelinger. Momenter Det følger af betragtningerne om de marginale sandsynligheder, at det er underordnet om man bestemmer middelværdier og varianser for X og Y (µ X,σX og µ Y,σY ) i den simultane fordeling, eller i de marginale fordelinger. Man indfører kovariansen (covariance) mellem X og Y som COV[X, Y =E[(X µ X )(Y µ Y ) = Ofte bruges symbolet σ XY for kovariansen mellem X og Y. (x µ X )(y µ Y )p X,Y (x, y)dydx

Vi bemærker, at kovariansen mellem X og Y er den samme som kovariansen mellem Y og X. Kovariansen måles i enheden for X gange enheden for Y. Hvis Xog Y er uafhængige, er kovariansen mellem dem nul (men det omvendte gælder ikke nødvendigvis) Undertiden opstilles varianser og kovarianser på matrixform i en såkaldt kovariansmatrix (eller dispersionsmatrix) ([ ) [( )( ) [ X X µx X µx V[X Cov[X, Y Σ = E = Y Y µ Y Y µ Y Cov[X, Y V[Y hvor angiver den transponerede (se side 5). Udtrykket generaliseres let til flere end to stokastiske variable. For vilkårlige stokastiske variable, X og Y gælder V[X ± Y =V[X+V[Y±Cov[X, Y Såfremt X og Y er uafhængige fås netop resultaterne på side 6. Korrelationskoefficient Undertiden betragtes et dimensionsløst mål for samvariationen mellem to variable, den såkaldte korrelationskoefficient. Korrelationskoefficienten, ρ (ro) mellem to stokastiske variable, X og Y defineres som ρ = Cov[X, Y = σ XY V[XV[Y σ X σ Y Det kan vises, at ρ. Den todimensionale normalfordeling Den endimensionale normalfordeling kan generaliseres til flerdimensionale variable. Lige som den endimensionale normalfordeling er parametriseret ved middelværdi og varians er den flerdimensionale normalfordeling parametriseret ved middelværdier, varianser og kovarianser for de betragtede variable. 3

Den todimensionale normalfordeling har tæthedsfunktionen p X,Y (x, y) = [ { π σ X σ exp (x µx ) Y ρ ( ρ ) σx ρ (x µ X)(y µ Y ) + (y µ } Y ) σ X σ Y σy hvor ρ = σ XY σ X σ Y Middelværdien for X og Y er hhv µ X og µ Y og kovariansmatricen er [ σ Σ = X σ XY σ XY Det gælder, at de betingede fordelinger (af Y givet en værdi X = x, og analogt af X givet en værdi Y = y) også er normalfordelinger. For den betingede fordeling af Y givet en værdi X = x gælder σ Y E[Y X = x = µ Y +ρ σ Y (x µ X ) σ X V[Y X = x = σy ( ρ ) Udtrykket for den betingede middelværdi knytter forbindelsen mellem korrelationskoefficienten og regressionen af Y på X. Udtrykket for den betingede varians viser, at i den todimensionale normalfordelingsmodel er variansen omkring regressionslinien konstant (den afhænger således ikke af værdien af x), og endvidere genfinder vi forklaringsgraden ( ρ ), der netop udtrykker den del af den marginale varians, σy for Y, som er forklaret af samvariationen mellem X og Y. Den k-dimensionale normalfordeling Betragt nu en k-dimensional stokastisk variabel (skrevet som søjlevektor), Y = 4 Y. Y k

Y siges at følge en k-dimensional normalfordeling med (den k-dimensionale) middelværdivektor µ og (den k k-dimensionale) kovariansmatrix Σ, hvis tætheden for Y kan skrives på formen p Y (y) = ( π) k Σ exp hvor Σ angiver determinanten af Σ. [ (y µ) Σ (y µ) Lineære transformationer af flerdimensionale variable Lad Y være en k-dimensional stokastisk variabel med middelværdivektor µ og kovariansmatrix Σ og lad A være en p k-dimensional matrix af konstanter, da gælder E[AY=AE[Y=Aµ og endvidere gælder, at kovariansmatricen for AY er AΣA Disse resultater benyttes i Appendix 8. Såfremt specielt Y følger en k-dimensional normalfordeling gælder at AY vil følge en p-dimensional normalfordeling med middelværdivektor og kovariansmatrix bestemt som ovenfor. Det gælder derfor specielt for den multiple regressionsmodel, µ = Xβ, at estimatoren β =(X X) X Y(8.5) følger en normalfordeling med kovariansmatricen σ( β) =σ (X X) som anført nederst på side 56. 5