Kvantitative Metoder 1 - Efterår Dagens program

Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer af normalfordelinger Eksempel: To normalfordelte variable, simulation 1

Ligefordelinger, (fra sidst) X ligefordelt på intervallet [2, 7] Tætheden for X : f X (x) =1/5 1 {2 x 7} Vi har at: E (X) = E X 2 = Z Z xf X (x) dx = x 2 f X (x) dx = Z 7 2 Z 7 2 x 1/5dx =1/5 1/2 x 2 7 2 =4.5 x 2 1/5dx =1/5 1/3 x 3 7 2 = 335 15 = 67 3 Dermed Var (X) =E X 2 E (X) 2 = 67 3 µ 9 2 2 = 25 12 2

Resultat: V er ligefordelt på enhedsintervallet [0, 1] E (V )=1/2 og Var (V )=1/12 Z = c + dv er ligefordelt på enhedsintervallet [c, c + d] E (Z) =c + de (V )=c +1/2 d Var (Z) =d 2 Var (Z) =1/12 d 2 Fra sidst: Y = a + bx + U hvor X ligefordelt på intervallet [2, 7], ogu er ligefordelt på intervallet [ 1, 1], ogx og U er uafhængige. Den betingede fordeling af Y givet X = x : Ligefordeling på [ 1+a + bx, 1+a + bx] 3

Den standardiserede normalfordeling Normalfordelingen kaldes også den Gaussiske fordeling. Definition: Den standardiserede normalfordeling har tæthed: f (z) = 1 exp µ 12 2π z2 Den standardiserede normalfordeling har fordelingsfunktion: Z z 1 Φ (z) = exp µ 12 2π u2 du Se Tabel over Φ ( ) i bogen side 652-653. 4

Figur 1: Tætheden for en standardiseret normalfordeling 5

Figur 2: Fordelingsfunktionen for en standardiseret normalfordeling 6

Z er standardiseret normalfordelt, dette skrives Z N (0, 1) Egenskaber ved fordelingen af Z: Symmetrisk omkring 0 Middelværdi: E (Z) =0 Varians: Var (Z) =E (Z 2 )=1 Median: z 0.50 =0 10% -fraktil: z 0.10 1.282 5% -fraktil: z 0.05 1.645 2.5% -fraktil: z 0.025 1.960 0.1% -fraktil: z 0.001 3.090 Fraktiler: Se bogen side 654 7

Da fordelingen er symmetrisk gælder for z>0: P (Z z) =P (Z z) dvs. 1 Φ (z) =Φ ( z) dvs. Φ (z) =1 Φ ( z) Dermed gælder: z p = z 1 p F.eks. z 0.95 = z 0.05 =1.645 Ca. 70% af sandsynlighedsmassen ligger i intervallet [ 1, 1] Ca. 95% af sandsynlighedsmassen ligger i intervallet [ 2, 2] Næsten al sandsynlighedsmassen ligger i intervallet [ 3, 3] 8

Figur 3: Tætheden for Z N (0, 1) og 95% af sandsynlighedsmassen i midten af fordelingen 9

Normalfordelingen Kvantitative Metoder 1 - Efterår 2006 Definition: X stokastisk variabel med middelværdi μ og varians σ 2. Den standardiserede variabel Z defineres på følgende måde: Z = X μ σ Da er X normalfordelt, hvis og kun hvis, Z er standardiseret normalfordelt. En anden måde at sige dette på, er følgende: X er normalfordelt, hvis og kun hvis, X kan skrives som μ + σz hvor Z N (0, 1). X er normalfordelt med middelværdi μ og varians σ 2,detteskrivesX N (μ, σ 2 ). 10

Resultat: Tætheden for X N (μ, σ 2 ): f X (x) = Ã! 1 exp (x μ)2 2πσ 2 2σ 2 Fordelingsfunktionen for X N (μ, σ 2 ): µ x μ F X (x) =Φ σ Bevis: Der gælder: F X (x) = P (X x) =P f X (x) = F 0 X (x) µ X μ σ x μ σ µ x μ = Φ σ 11

Figur 4: Tætheden for nomalfordelinger med middelværdi 0 og varians 1 (blå), varians 0.1 (grøn), varians 3 (rød) 12

Figur 5: Fordelingsfunktionen for nomalfordelinger med middelværdi 0 og varians 1 (blå), varians 0.1 (grøn), varians 3 (rød) 13

Figur 6: Tætheden for nomalfordelinger N (0, 1) (blå), N (1, 1) (rød), N (1, 0.1) (grøn) 14

Egenskaber ved fordelingen af X: Symmetrisk omkring μ Middelværdi: E (X) =μ Varians: Var (X) =σ 2 Fordelingen er fuldstændigt beskrevet ved de to parametre μ og σ 2. μ : Position σ : Skalering Ca. 70% af sandsynlighedsmassen ligger i intervallet [μ σ, μ+ σ] Ca. 95% af sandsynlighedsmassen ligger i intervallet [μ 2σ, μ+2σ] Næsten al sandsynlighedsmassen ligger i intervallet [μ 3σ, μ +3σ] 15

Fraktiler (Se også eksempel 6.1c i bogen): z p : p te fraktil i den standardiserede normalfordeling Den p te fraktil i fordelingen af X N (μ, σ 2 ): P F X (x p ) = p dvs. P (X x p ) = p dvs. µ X μ x p μ = p dvs. σ σ µ xp μ Φ = p dvs. σ x p μ = z p dvs. σ = μ + z p σ x p 16

Sandsynligheden for at få en værdi af X der er mindre end lig med b : µ b μ P (X b) =F X (b) =Φ σ Sandsynligheden for at få en værdi af X dererstørreenda : µ a μ P (X >a)=1 P (X a) =1 F X (a) =1 Φ σ Sandsynligheden for at få en værdi af X i intervallet [a, b] : µ µ b μ a μ P (a X b) =F X (b) F X (a) =Φ Φ σ σ 17

Resultater: (i) Lad X N (μ, σ 2 ) da gælder: E (X) = μ E X 2 = Var(X)+E (X) 2 = σ 2 + μ 2 E (X μ) 3 = 0 E (X μ) 4 = 3σ 4 (ii) Lad X N (μ, σ 2 ) da er a + bx N (a + bμ, b 2 σ 2 ) (iii) X N (μ, σ 2 ) og Y N (ν,τ 2 ) og X og Y er uafhængige, da er X + Y N μ + ν,σ 2 + τ 2 (iv) X 1,..., X n er uafhængige og X i N (μ i,σ 2 i ) da er a 1 X 1 +... + a n X n N a 1 μ 1 +... + a n μ n,a 2 1σ 2 1 +... + a 2 nσ 2 n (v) X og Y er normalfordelte, da gælder X og Y er uafhængige Cov (X, Y )= 0 18

To normalfordelte variable U og V er uafhængige standardiserede normalfordelte variable. X og Y defineres på følgende måde: X = a 1 + b 1 U Y = a 2 + b 2 U + c 2 V Middelværdi og varians: μ X = E (X) =a 1 σ 2 X =Var(X) =b 2 1 μ Y = E (Y )=a 2 σ 2 Y =Var(Y )=b 2 2 + c 2 2 Kovarians: Cov (X, Y )=b 1 b 2 19

Korrelation: ρ X,Y = Cov (X, Y ) p Var (X)Var(Y ) = b 1 b 2 p b 2 1 (b 2 2 + c 2 2) = b 2 p (b 2 2 + c 2 2) Hvordan skal a 1,a 2,b 1,b 2 og c 2 vælges, hvis jeg vil have at X og Y har middelværdi 0 og varians 1 samt korrelation ρ : a 1 =0 a 2 =0 b 1 =1 b 2 = ρ c 2 = p (1 ρ 2 ) 20

Figur 7: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0 21

Figur 8: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0.3 22

Figur 11: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y = 0.3 25

Bemærk at Y = a 2 + b 2 b 1 (X a 1 )+c 2 V = μ Y + ρ X,Y σ Y σ X (X μ X )+ q σ 2 Y 1 ρ 2 X,Y V Den betingede fordeling af Y givet X = x : Bemærk at X og V er uafhængige. Derfor er den betingede fordeling af V givet X lig med den marginale fordeling af V. Vi har at: σ Y E (Y X = x) = μ Y + ρ X,Y (x μ σ X ) X Var (Y X = x) = σ 2 Y 1 ρ 2 X,Y 28

Hvis der er positiv korrelation mellem X og Y : E (Y X = x) ½ <E(Y ) for x<μx >E(Y ) for x>μ X Jo større korrelation (både positiv og negativ) mellem X og Y, jo mindre er variansen i den betingede fordeling af Y givet X = x. I eksemplet hvor μ X = μ Y =0og σ 2 X = σ 2 Y =1og ρ X,Y = ρ gælder der: E (Y X = x) = ρx Var (Y X = x) = 1 ρ 2 29

Figur 14: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0.3. De grønne linier er E (Y X = x) og E (Y X = x) ± 3 p Var (Y X = x) 30

Figur 17: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y = 0.9. De grønne linier er E (Y X = x) og E (Y X = x) ± 3 p Var (Y X = x) 33

Opsummering Normalfordelingen: - Tæthed og fordelingsfunktion - Grafisk illustration af tæthed - Fordelingen beskrevet middelværdi af varians - Udregning af sandsynligheder: Transformation til standardiseret normalford. Lineære transformationer af normalfordelte variable Eksempel: - Hvordan simuleres normalfordelte variable - Hvad betyder korrelation for den simultane fordeling af to normalfordelte variable 34

Næste gang Mandag gennemgåes: Afsnit 6.2-6.4 - Exponentialfordelingen - Gammafordelingen - χ 2 -fordelingen Bemærk, (overspringelser): Side 230 linie 12 til side 231 linie 5 Side 235 linie 6 til side 235 linie 23 Afsnit 6.5 Husk: - Intern kursusevaluering: Uge 42+43 - Eksamenstilmelding: Uge 41-43 35