standard normalfordelingen på R 2.

Standard normalfordelingen på R 2 Lad f (x, y) = 1 x 2 +y 2 2π e 2. Vi har så f (x, y) = 1 2π e x2 2 1 2π e y2 2, og ved Tonelli f dm 2 = 1. Ved µ(a) = A f dm 2 defineres et sandsynlighedsmål på R 2 målet µ er kendt som standard normalfordelingen på R 2. Slide 1/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Bundter Bundles (Ω, F, P) X (X, E) Y (X, Y) (Y, K) (X Y, E K) The marginal distributions - the image measures X(P) og Y(P). The joint distribution - the image measure (X, Y)(P). De marginale fordelinger billedmålene X (P) og Y (P).. p.25/40 Den simultane fordeling billedmålet (X, Y )(P). Bemærk at X = ˆX (X, Y ) og Y = Ŷ (X, Y ). Slide 2/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Fra simultan til marginal fordeling Lemma (EH 18.1) Den marginale fordeling af X og Y er givet i termer af den simultane fordeling af X og Y. Bevis: Den simultane fordeling giver os alle sandsynlighederne ( ) P (X, Y ) G for G E K. For A E er den marginale fordeling af X givet ved ( ) P(X A) = P(X A, Y Y) = P (X, Y ) A Y Alternativt formuleret, X (P) = ˆX (X, Y )(P) = ˆX ((X, Y )(P)). Slide 3/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Marginalisering med tætheder Lad (X, E, µ) og (Y, K, ν) være to σ-endelige målrum. Lad X og Y være to stokastiske variable med værdier i hhv. X og Y. Korollar (EH 18.2) Hvis X og Y har simultanfordeling med tæthed f m.h.t. µ ν, dvs. ( ) P (X, Y ) G = f (x, y) dµ ν(x, y) for alle G E K så er hvor G P(X A) = g(x) = A g(x) dµ(x) f (x, y) dν(y) for alle A E for alle x X Slide 4/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Marginaler for standard normalfordelingen Hvis simultanfordelingen af (X, Y ) er standard normalfordelingen på R 2, har den marginale fordeling af X tæthed g(x) = f (x, y) dy = 1 2 +y 2 2π e 2 dy = 1 2π e x2 2 Dvs. X N (0, 1). Ligeledes, Y N (0, 1). I dette tilfælde har vi (X, Y )(P) = f m 2 = (g m) (g m) = X (P) Y (P). Slide 5/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Uafhængighed Lad X og Y være to stokastiske variable defineret på (Ω, F, P) med værdier i hhv. (X, E) og (Y, K). Definition (EH 18.4) Vi siger at X og Y er uafhængige, hvis (X, Y )(P) = X (P) Y (P) Vi skriver ofte X Y, hvis X og Y er uafhængige. Sandsynlighedsteoretisk formulering: P(X A, Y B) = P(X A) P(Y B) for alle A E, B K Slide 6/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

En frekventistisk forklaring på uafhængighed For hændelser A og B, et sandsynlighedsmål ν, og n observationer fra ν har vi ν(a B) ε n (A B) = ε n(a B) ε n (B), ε n (B) hvor ε n er den empiriske fordeling. Brøken (vi antager ε n (B) > 0) ε n (A B) ε n (B) er frekvensen af gange hændelsen A B indtræffer ud af de gange B indtræffer. Hvis det at B er indtruffet ikke ændrer på sandsynligheden for at A indtræffer (A er uafhængig er B) giver frekvensfortolkningen, at ε n (A B) ε n (B) ν(a). Slide 7/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

En frekventistisk forklaring på uafhængighed Definition For hændelser A og B og et sandsynlighedsmål ν med ν(b) > 0 defineres den betingende sandsynlighed for A givet B som ν(a B) = ν(a B). ν(b) Hændelsen A er uafhængig af B, hvis ν(a B) = ν(a). Den symmetriske definition: A og B er uafhængige hvis ν(a B) = ν(a)ν(b) er i overensstemmelse med ovenstående (asymmetriske) definition, og undgår risikoen for division med 0. Ved at se på hændelser (X A) = X 1 (A) og (Y B) = Y 1 (B) på Ω løftes definitionen af uafhængighed til stokastiske variable. Slide 8/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Uafhængighed af flere variable Lad X 1,..., X n være n stokastiske variable defineret på (Ω, F, P) og med værdier i (X 1, E 1 ),..., (X n, E n ). Definition Vi siger at X 1,..., X n er uafhængige, hvis (X 1,..., X n )(P) = X 1 (P)... X n (P) Vi skriver ofte X 1 X 2... X n, hvis X 1,..., X n er uafhængige. Sandsynlighedsteoretiske formulering: X 1,..., X n er uafhængige, hvis n P(X 1 A 1,..., X n A n ) = P(X i A i ) for alle A i E i, i = 1,..., n. i=1 Slide 9/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Adskilte transformationer Lad X 1 og X 2 være to stokastiske variable defineret på (Ω, F, P) med værdier i hhv. (X 1, E 1 ) og (X 2, E 2 ). Lad h 1 : (X 1, E 1 ) (Y 1, K 1 ) og h 2 : (X 2, E 2 ) (Y 2, K 2 ) være målelige afbildninger. Sætning (18.12) Hvis så er X 1 X 2, h 1 (X 1 ) h 2 (X 2 ). Slide 10/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Uafhængighed og varians Hvis X og Y er uafhængige reelle stokastiske variable med 1. moment, så følger det af Tonellis sætning at XY første moment og EXY = XY dp = xy dx (P) dy (P)(x, y) = x dx (P)(x) y dy (P)(y) = EXEY. Hvis X og Y har 2. moment fås V (X + Y ) = EX 2 + EY 2 + 2E(XY ) (EX ) 2 (EY ) 2 2EXEY = VX + VY. Regnereglen gælder når X og Y er uafhængige. Bemærk også at V (X Y ) = V (X + ( Y )) = VX + V ( Y ) = VX + VY. Slide 11/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Uafhængighed og frembringere Lad (X, E) og (Y, K) være målbare rum, og lad D og G være fællesmængdestabile frembringere for hhv. E og K. Lad X og Y være stokastiske variable defineret på (Ω, F, P) med værdier i hhv. (X, E) og (Y, K). Sætning (EH 18.7) De stokastiske variable X og Y er uafhængige, hvis P(X A, Y B) = P(X A)P(Y B) for alle A D, B G Sætning (Kapitel 9 version) Hvis λ er et sandsynlighedsmål på (X Y, E K) med marginaler µ = ˆX (λ) og ν = Ŷ (λ), så er λ = µ ν hvis λ(a B) = µ(a)ν(b) for A D, B G Slide 12/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Alternativt bevis Bevis: Per definition er E K σ-algebraen frembragt af ˆX og Ŷ. Da λ(a Y) = µ(a) = µ(a)ν(y) og λ(x B) = ν(b) = µ(x )ν(b), kan vi frit tilføje X til D og Y til G, hvis de ikke allerede er med. Brolægningen D G = {A B A D, B G} er indeholdt i E K og eftersom ˆX 1 (A) = A Y D G og Ŷ 1 (B) = X B D G for A D, B G følger det af Lemma 4.7 at begge projektioner er målelige m.h.t. σ(d G). Vi konkluderer, at σ(d G) = E K, og eftersom frembringeren er stabil overfor fællesmængdedannelse følger det af entydighedssætningen for sandsynlighedsmål, sætning 3.7, at λ = µ ν. Slide 13/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Uafhængighed Sætning (EH 18.8, 18.9, 18.10) Hvis I 1,..., I r er r disjunkte delmængder af {1,..., n}, og hvis X 1... X m... X n, så er (X i ) i I1... (X i ) i Ir. Slide 14/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Standard normalfordelingen De reelle stokastiske variable X 1,..., X n er uafhængige med X i N (0, 1) for i = 1,..., n hvis og kun hvis den simultane fordeling har tæthed f (x) = ( ) 1 n/2 ( exp x T ) ( ) x 1 n/2 ( n i=1 = exp x i 2 2π 2 2π 2 for x = (x 1,..., x n ) T R n. Vi skal se hvordan bl.a. standard normalfordelingen transformerer under affine transformationer x Bx + a for B en k n matrix og a R k. ) Slide 15/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Den flerdimensionale normalfordeling Den regulære normalfordeling på R n har tæthed f (x) = ( ) 1 n/2 ( ) 1 1/2 ( exp 1 ) 2π detσ 2 (x ξ)t Σ 1 (x ξ) for x R n w.r.t. m n. Her er ξ R n en vektor og Σ en n n symmetrisk, positiv definit matrix. Vi skriver X N (ξ, Σ) hvis fordelingen af X er den regulære normalfordeling som defineret ovenfor. Slide 16/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Den flerdimensionale normalfordeling 0 0.05 0.1 0.15 0.2 3 2 1 0-1 -2-3 -3-2 -1 0 1 2 3 3 1 1 3 3 1 1 3 Slide 17/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Den flerdimensional normalfordeling Sætning (EH 18.23) Den regulære normalfordeling på R n er et sandsynlighedsmål, dvs. ( exp 1 ) 2 (x ξ)t Σ 1 (x ξ) dm n (x) = (2π) n/2 (det Σ) 1/2. Bevis: Baseret på: EH E.6: Da Σ er positiv definit, kan matricen diagonaliseres. Q T ΣQ = diag(λ 1,..., λ n ) with λ 1,..., λ n > 0, Q er en ortogonal matrix, og det Σ = λ 1... λ n. m n er invariant under ortogonale transformationer. Slide 18/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Den flerdimensionale normalfordeling Lad X = (X 1, X 2 ) T være en stokastisk variable med en n-dimensional regulær normalfordeling med ξ = (ξ 1, ξ 2 ) T og { } Σ11 Σ Σ = 12. Σ 21 Σ 22 Her er n = n 1 + n 2 og X 1 og X 2 er hhv. n 1 - og n 2 -dimensionale. Sætning (EH 18.26, 18.27, 18.28, 18.29) X i N (ξ i, Σ ii ) for i = 1, 2. Hvis Σ 12 = Σ T 21 = 0, så er X 1 og X 2 uafhængige. Hvis B er k n med rang k, og a R k, så er a + BX N (a + Bξ, BΣB T ). Slide 19/20 Niels Richard Hansen MI forelæsninger 17. December, 2014

Foldning Hvis X 1,..., X n er uafhængige N (0, σ 2 ), så gælder at n X i N (0, nσ 2 ). i=1 Følger af sætning 18.29. Sæt X = (X 1,..., X n ) T N (0, σ 2 I ), så er n X i = BX i=1 med B = (1,..., 1) og Bσ 2 IB T = nσ 2. Det interessante er, at fordelingen igen er en normalfordeling. Middelværdi og varians følger af generelle formler. Slide 20/20 Niels Richard Hansen MI forelæsninger 17. December, 2014