Kvantitative Metoder 1 - Forår Dagens program

Dagens program Kontinuerte fordelinger Simultane fordelinger Kovarians og korrelation Uafhængighed Betingede fordelinger - Middelværdi og varians - Sammenhæng med uafhængighed 1

Figur 1: En tæthedsfunktion 2

Figur 2: En tæthedsfunktion 3

Kovarians og korrelation X og Y stokastiske variabler Kvantitative Metoder 1 - Forår 2007 Diskret: Fordelingen af (X, Y ) er givet ved den simultane sandsynlighedsfunktion f (x, y) Kontinuert: Fordelingen af (X, Y ) er givet ved den simultane tæthedsfunktion f (x, y) Middelværdi og varians: Diskret: μ X = E (X) = P xf x X (x) og σ 2 X =Var(X) = P (x μ x X) 2 f X (x) Kontinuert: μ X = E (X) = R xf X (x) dx og σ 2 X =Var(X) = R (x μ X ) 2 f X (x) dx 4

Definition: Kovarians og korrelation Kovariansen mellem X og Y er givet ved Korrelationen er givet ved σ X,Y =Cov(X, Y )=E [(X μ X )(Y μ Y )] ρ X,Y = Cov (X, Y ) p Var (X) p Var (Y ) = σ X,Y σ X σ Y Diskret: σ X,Y = P P (x μ y x X)(y μ Y ) f (x, y) Kontinuert: σ X,Y = RR (x μ X )(y μ Y ) f (x, y) dxdy 5

Egenskaber: (i) Cov (X, Y )=E(XY ) μ X μ Y (ii) Cov (X, Y )=Cov(Y,X) (iii) Cov (ax, by )=ab Cov (X, Y ) (iv) Cov (X + Y,Z) =Cov(X, Z)+Cov(Y,Z) Eksempel 5.9b i bogen: Cov (X + Y,X Y ) = Cov(X, X)+Cov(Y,X)+Cov(X, Y )+Cov(Y, Y ) = Var(X)+Cov(X, Y ) Cov (X, Y ) Var (Y ) = Var(X) Var (Y ) 6

Lineære transformationer: Lad X 1,..., X n være stokastiske variabler, da gælder: Ã n! X nx E X i = E (X i ) Ã n! X Var X i = nx Var (X i )+ X i6=j Cov (X i,x j )= nx Var (X i )+2 nx nx Cov (X i,x j ) j=i+1 Hvis X 1,..., X n er parvis ukorrelerede, da gælder: Ã n! X nx Var X i = Var (X i ) 7

Hvis X 1,..., X n er uafhængige og identisk fordelte med E (X i )=μ og Var (X i )=σ 2 E Ã 1 n! nx X i = 1 n nx E (X i )= 1 n nx μ = 1 n nμ = μ Var Ã 1 n! nx X i Ã = 1 n! n Var X X 2 i = 1 nx Var (X n 2 i )= 1 = 1 n 2nσ2 n σ2 8

Eksempel: X 1,X 2,X 3,X 4 er uafhængige og identisk fordelte med E (X i )=μ og Var (X i )=σ 2 U =0.25X 1 +0.25X 2 +0.25X 3 +0.25X 4 V =0.1X 1 +0.2X 2 +0.3X 3 +0.4X 4 Middelværdien af U : E (U) =0.25E (X 1 )+0.25E (X 2 )+0.25E (X 3 )+0.25E (X 4 )=0.25 4μ = μ Variansen på U : Var (U) = Var(0.25X 1 )+Var(0.25X 2 )+Var(0.25X 3 )+Var(0.25X 4 ) = 0.25 2 Var (X 1 )+0.25 2 Var (X 2 )+0.25 2 Var (X 3 )+0.25 2 Var (X 4 ) = 0.25 2 4σ 2 =0.25σ 2 9

Middelværdien af V : E (V )=0.1E (X 1 )+0.2E (X 2 )+0.3E (X 3 )+0.4E (X 4 )=(0.1+0.2+0.3+0.4) μ = μ Variansen på V : Var (V ) = Var(0.1X 1 )+Var(0.2X 2 )+Var(0.3X 3 )+Var(0.4X 4 ) = 0.1 2 Var (X 1 )+0.2 2 Var (X 2 )+0.3 2 Var (X 3 )+0.4 2 Var (X 4 ) = 0.1 2 +0.2 2 +0.3 2 +0.4 2 σ 2 = 0.55σ 2 > Var (U) 10

Uafhængighed X og Y kontinuerte stokastiske variabler med simultan tæthedsfunktion f (x, y) Definition: Uafhængighed X og Y er uafhængige, hvis der gælder f (x, y) =f X (x) f Y (y) for alle (x, y) Resultat Hvis X og Y er uafhængige er g (X) og h (Y ) uafhængige. Eksempel: Hvis X og Y er uafhængige, er X 2 og (a + by ) uafhængige. 11

Eksempel: X 1 og X 2 er uafhængige og X 1 er ligefordelt på [0, 1] og X 2 er ligefordelt på [0, 2] Den marginale tæthed for X 1 : f 1 (x 1 )=1 {0 x1 1} Den marginale tæthed for X 2 : f 2 (x 2 )=1/2 1 {0 x2 2} Den simultane fordeling af (X 1,X 2 ) er givet ved f (x 1,x 2 )=f 1 (x 1 ) f 2 (x 2 )=1/2 1 {0 x1 1} 1 {0 x2 2} 12

Hvad er middelværdien af X 1 X 2 : Z Z E (X 1 X 2 ) = x 1 x 2 f (x 1,x 2 ) dx 1 dx 2 = 1/2 = 1/2 Z 2 Z 1 0 Z 2 0 Z 2 = 1/4 0 1 = 1/4 2 x2 2 Bemærk at E (X 1 ) E (X 2 )=1/2 1=1/2 0 x 1 x 2 dx 1 dx 2 x 2 1 2 x2 1 x 2 dx 2 2 0 1 0 dx 2 =1/4 1/2 2 2 =1/2 13

Betingede fordelinger X og Y stokastiske variabler Kvantitative Metoder 1 - Forår 2007 Diskret: Fordelingen af Y givet X = x er givet ved f (y x) = P (X = x, Y = y) P (X = x) = f (x, y) f X (x) for f X (x) 6= 0 Kontinuert: Fordelingen af Y givet X = x er givet ved f (y x) = f (x, y) f X (x) for f X (x) 6= 0 14

Resultat: Hvis X og Y er uafhængige, gælder der for alle x hvor f X (x) 6= 0: f (y x) =f Y (y) for alle y Eksempel X og U er uafhængige stokastiske variabler X er ligefordelt på [2, 7] og U er ligefordelt på [ 1, 1] Der gælder: f X (x) =1/5 1 {2 x 7} og f U (u) =1/2 1 { 1 u 1} Den simultane tæthedsfunktion for fordelingen af (X, U) er givet ved: f (x, u) =f X (x) f U (u) =1/10 1 {2 x 7} 1 { 1 u 1} 15

Figur 3: Den simultane tæthedsfunktion for (X, U) 16

E (X) =4.5 og Var (X) =25/12 (se evt. udregninger næste side) E (U) =0og Var (U) =4/12 = 1/3 Vi definerer en ny stokastisk variabel Y på følgende måde: Y = a + bx + U hvor a og b er ukendte parametre Middelværdien af Y : E (Y )=E (a + bx + U) =a + be (X)+E (U) =a +4.5b Variansen af Y : Var (Y ) = Var(a + bx + U) =Var(bX + U) = Var(bX)+Var(U) =b 2 Var (X)+Var(U) = 1/3+25/12 b 2 17

X ligefordelt på intervallet [2, 7] Tætheden for X : f X (x) =1/5 1 {2 x 7} Vi har at: E (X) = E X 2 = Z Z xf X (x) dx = x 2 f X (x) dx = Z 7 2 Z 7 2 x 1/5dx =1/5 1/2 x 2 7 2 =4.5 x 2 1/5dx =1/5 1/3 x 3 7 2 = 335 15 = 67 3 Dermed Var (X) =E X 2 E (X) 2 = 67 3 µ 9 2 2 = 25 12 18

Resultat: V er ligefordelt på enhedsintervallet [0, 1] E (V )=1/2 og Var (V )=1/12 Z = c + dv er ligefordelt på intervallet [c, c + d] E (Z) =c + de (V )=c +1/2 d Var (Z) =d 2 Var (Z) =1/12 d 2 Y = a + bx + U hvor X ligefordelt på intervallet [2, 7], ogu er ligefordelt på intervallet [ 1, 1], ogx og U er uafhængige. Den betingede fordeling af Y givet X = x : Ligefordeling på [ 1+a + bx, 1+a + bx] Tætheden for den betingede fordeling af Y givet X = x : f (y x) =1/2 1 { 1+a+bx y 1+a+bx} 19

Den betingede middelværdi af Y givet X = x : E (Y X = x) = Z yf (y x) dy = Z 1+a+bx 1+a+bx 1/2ydy = 1/2 1+a+bx 1 2 y2 1+a+bx = 1/4 (1 + a + bx) 2 ( 1+a + bx) 2 = a + bx 20

Den betingede middelværdi af Y 2 givet X = x : E Y 2 X = x = Z y 2 f (y x) dy = Z 1+a+bx 1+a+bx 1/2y 2 dy = 1/2 1+a+bx 1 3 y3 1+a+bx = 1/6 (1 + a + bx) 3 ( 1+a + bx) 3 = 1/3+(a + bx) 2 Den betingede varians af Y givet X = x : Var (Y X = x) = E Y 2 X = x (E (Y X = x)) 2 = 1/3+(a + bx) 2 (a + bx) 2 =1/3 21

Figur 4: Sammenhørende værdier af (X, Y ) i 100 simulationer når Y =1+2X + U hvor X er ligefordelt på intervallet [2, 7] og U er ligefordelt på intervallet [ 1, 1] og X og U er uafhængige 22

Opfatte den betingede middelværdi af Y givet X som en stokastisk variabel: E (Y X) =a + bx E (E (Y X)) = E (a + bx) =a + be (X) =a +4.5b = E (Y ) Var (E (Y X)) = Var (a + bx) =b 2 Var (X) =25/12b 2 Var (Y ) E (Var (Y X)) = 1/3+25/12b 2 1/3 =25/12b 2 Se side 217 i bogen. Den simultane fordeling af (X, Y ) f (x, y) =f (y x) f X (x) =1/10 1 {2 x 7} 1 { 1+a+bx y 1+a+bx} 23

Figur 5: Tæthedsfunktionen for (X, Y ) 24

Kovariansen mellem X og Y : Cov (X, Y ) = Cov(X, a + bx + U) =Cov(X, bx)+cov(x, U) = b Cov (X, X)+Cov(X, U) = b Var (X) =25/12 b Korrelationen mellem X og Y : Cov (X, Y ) ρ X,Y = p = Var (X)Var(Y ) b Var (X) p Var (X)(b2 Var (X)+Var(U)) = b p b2 +Var(U) / Var (X) Ingen korrelation for b =0 Positiv korrelation for b>0 Negativ korrelation for b<0 Jo større b er numerisk, jo mere korrelation. Jo større Var (X) er i forhold til Var (U), jo mere korrelation. 25

Opsummering Fordelinger af to stokastiske variabler Kovarians og korrelation -Definition - Lineære transformationer - Regneregler (de samme som for diskrete stokastiske variabler) Uafhængighed: - Fortolkning (samme som diskrete tilfælde) - Simultane tæthed er produktet af de marginale tætheder Betingede fordelinger - Betinget middelværdi og betinget varians Eksempel: Specifikation af model for Y som funktion af X hvor: - Den betingede middelværdi af Y givet X er lineær i X - Den betingede varians af Y givet X er konstant 26

Næste gang Torsdag gennemgåes: Afsnit 6.1 - Normalfordelingen Husk: - Der er stedprøve torsdag den 22. marts (med alle hjælpemidler) - Tilmelding til eksamen i uge 10-12 - Intern eveluering i uge 12-13 Bytning af timer: Onsdag d. 21/3 16-18 (HO1) forelæser Peter Birch i Makro 1 Torsdag d. 22/3 10-12 (HO6) forelæser jeg i Kvantitative Metoder 1. 27