Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 800 Kgs. Lyngby Danmark Email: bfni@dtu.dk
Dagens emner afsnit 5.3 og 5.4 Simultane kontinuerte fordelinger P(X dx,y dy) = f(x,y)dxdy Uafhængige normalfordelte variable ( normal(µ,σ ) = N(µ,σ )) f(x,y) = 1 π e 1 (x +y ) F R (r) = P( X +Y r) = 1 e 1 r (Rayleigh) X N(λ,σ ),Y N(µ,τ ) X +Y N(λ+µ,σ +τ ) For X i N(0,1) er Y = n i=1 X i χ -fordelt (gamma). Operationer med stokastiske variable f Z (z)dz = P(Z = X +Y dz) = f Z (z)dz = P ( Z = Y X dz) = f(x,z x)dx dz x f(x,zx)dx dz 9. forelæsning
Simultan fordeling for kontinuerte variable P((X,Y) B) = B f(x,y)dxdy Marginale fordelinger f X (x) = f(x,y)dy f Y (y) = Hvis X og Y er uafhængige y x f(x,y)dx f(x,y) = f X (x) f Y (y) 9. forelæsning 3
Uafhængige normalfordelte variable Tætheden for en standardiseret normalfordelt variabel er f(x) = 1 π e 1 x for to uafhængige normal(0,1) variable X og Y får vi f(x,y) = 1 π e 1 x 1 π e 1 y = 1 Bemærk rotationssymmetrien. π e 1 (x +y ) 9. forelæsning 4
Z Den simultane tæthed for (X,Y) Y X Fordelingen er rotationsinvariant
Linearkombinationer af to normalfordelte variable Lad X og Y være uafhængige normal(0, 1)-fordelte variable. Betragt Z = ax +by. 1. Hvis a +b = 1, da er Z også normal(0,1)-fordelt. Det skyldes rotationssymmetrien, Z er den nye førstekoordinat i et drejet koordinatsystem.. Generelt: Z = ( a a +b a +b X + ) b a +b Y... altså er Z normalfordelt med middel 0 og varians a +b. Resultatet kan også vises analytisk ved brug af afsnit 5.4 9. forelæsning 6
Linearkombination Summer af normalfordelte variable side 363 Hvis X og Y er uafhængige og normalfordelt med henholdsvis N(λ,σ ) og N(µ,τ ) så er Z = X +Y normal(λ+µ,σ +τ ) fordelt. For X i normal(µ i,σi) fordelte og uafhængige er Z = b+ n i=1 a ix i normal(b+ n i=1 a iµ i, n i=1 a iσi) fordelt. (Denne står ikke direkte i Pitman, men kan dog let udledes af resultatet side 364.) 9. forelæsning 7
Antag at R 1 og R er to uafhængige stokastiske variable med den samme tæthedsfunktion f(x) = xe 1 x for x 0. Spørgsmål 1 Tætheden af Y = min(r 1,R ) findes til 1 f Y (y) = ye y f Y (y) = 1 (1 ye 1 y )(1 ye 1 y ) 3 f Y (y) = e y 4 f Y (y) = y e y 5 f Y (y) = y e y 6 Ved ikke 9. forelæsning 8
Konstanten 1/ π (X,Y) har simultan tæthed f XY (x,y) = c e 1 (x +y ). (Bemærk! Vi har hidtil taget c = 1/ π for givet, men nu udleder vi det!) P(r R r +dr) = P(r X +Y r +dr) = c e 1 r (π(r+dr) πr ) = πc re 1 r dr +o(dr)... tegn en skitse af X, Y og R for at checke dette. Vi får tætheden af R direkte: f R (r) = πc r e 1 r Eftersom 0 f R (r) dr = 1, må vi have c = 1/ π. f R (r) = re 1 r P(R r) = F R (r) = 1 e 1 r
Størrelse af normalfordelt vektor side 358-361 Hvis talparret (X, Y) er uafhængige standardiserede normalfordelte (normal(0,1)) variable,så er R = X +Y Rayleigh fordelt. f R (r) = re 1 r, F R (r) = 1 e 1 r Middelværdi og varians er E(R) = π, Var(R) = E(R ) E(R) = π 9. forelæsning 10
En skytte skyder mod en skydeskive. Skuddenes placering på skiven kan beskrives ved uafhængige standardiserede normalfordelte variable, hvor skivens centrum er koordinatsystemets nulpunkt. Spørgsmål Sandsynligheden for, at et skud rammer indenfor en cirkel med radius 1, er 1 Φ ( 1 1 4 3 1 4 1 e 1 8 5 ( Φ ( 1 6 Ved ikke ) Φ ( 1 ) ) Φ ( 1 )) Hvor Φ(x) er fordelingsfunktionen for en standardiseret normalfordelt variabel. 9. forelæsning 11
Fordelingen af S = R = X +Y Fra variabelskift: F S (s) = F R ( s) = 1 e 1 s... altså er S eksponentialfordelt med middelværdi. Deraf fås i øvrigt E(X ) = 1 (!) 9. forelæsning 1
En skytte skyder mod en skydeskive. Skuddenes placering på skiven kan beskrives ved uafhængige standardiserede normalfordelte variable, hvor skivens centrum er koordinatsystemets nulpunkt. Spørgsmål 3 Sandsynligheden for, at et skud rammer indenfor en afstand 1 fra koordinatsystemets anden-akse, er 1 Φ(1) 1 4 3 Φ(1) 1 4 1 e 1 5 1 e 1 4 6 Ved ikke Hvor Φ(x) er fordelingsfunktionen for en standardiseret normalfordelt variabel. 9. forelæsning 13
Operationer med stokastiske variable 5.4 Vi har set max og min af stokastiske variable, samt specielle former for summer. For uafhængige diskrete variable har vi tidligere set P(Z = X +Y = z) = f X (x)f Y (z x) x= En foldning.for ikke negative uafhængige X og Y P(Z = X +Y = z) = z x=0 f X (x)f Y (z x) For kontinuerte tætheder får vi f Z (z) = f(x,z x)dx uaf = f X (x)f Y (z x)dx 9. forelæsning 14
Lad X 1 være ligeligt fordelt på enhedsintervallet og X være ligeligt fordelt på intervallet (0;) og uafhængig af X 1. Spørgsmål 4 Tætheden f Z (z) for Z = X 1 +X findes til 1 f Z (z) = 1 for 0 z f Z (z) = z 3 f Z (z) = z for 0 z < 1 1 for 1 z < 3 z for z 3 4 f Z (z) = 1 3 for 0 z 3 5 f Z (z) = z 3 6 Ved ikke 9. forelæsning 15
Lad X 1 være ligeligt fordelt på enhedsintervallet og X være ligeligt fordelt på intervallet (0;) og uafhængig af X 1. Spørgsmål 5 Sandsynligheden P(X 1 +X ) findes til 1 1 3 3 3 4 4 5 6 5 1 6 Ved ikke 9. forelæsning 16
Enten brug f Z (z) Den simultane tæthed af (X 1,X ) er 1 0 x 1 1,0 x f(x 1,x ) = 0 ellers P(X 1 +X ) = x 1 +x 1 dx 1dx Eller vi kan bruge arealbetragtninger og få P(X 1 +X ) = 3 4 9. forelæsning 17
X N(0,1)Y N(0,1) uafhængige f X (z) = f Y (z) = φ(z) = 1 π e z V = ax W = by v = g(x) = ax w = h(y) = by f V (v) = f X(x) dg(x) dx = 1 π e x a = 1 a π e v a Tilsvarende f W (w) = 1 b π e 9. forelæsning 18 w b
Z = ax +by = V +W (her med a > 0 og b > 0 uden tab af generalitet) f Z (z) = = = = 1 abπ 1 abπ f V (v)f W (z v)dv 1 a π e v 1 a b π e e v b +(z v) a a b (z v) b dv dv +b )v zva +z a e (a a b dv 9. forelæsning 19
Med a +b = 1 = = = 1 abπ 1 e (1 a )z b π 1 π e z e v zva +z a 4 z a 4 +z a a b dv 1 ab (v za ) π e a b dv 9. forelæsning 0
Sum af max og min af to eksponentialfordelte variable Vi har tidligere set at for W i exp(λ), X = min(w 1,W ) og Y = max(w 1,W ) er den simultane tæthed: f(x,y) = λ e λ(x+y),0 < x y. Fordelingen af Z = X +Y findes til Overraskende? f Z (z) = z 0 λ e λ(x+(z x)) dx = λ(λz)e λz 9. forelæsning 1
Summer af uafhængige variable Med X bin(n,p) og Y bin(m,p) er Z = X +Y bin(n+m,p) Med X NB(n,p) og Y NB(m,p) er Z = X +Y NB(n+m,p) Med X P(λ) og Y P(µ) er Z = X +Y P(λ+µ) Med X Gamma(r,λ) og Y Gamma(s,λ) er Z = X +Y Gamma(r +s,λ) Summer af mange har normalfordelingen som grænse Summer af normalfordelte variable side 363 Med X N(µ 1,σ 1) og Y N(µ,σ ) er Z = X +Y N(µ 1 +µ,σ 1 +σ ) Med X N(µ 1,σ 1) og Y N(µ,σ ) er W = ax +by N(aµ 1 +bµ,a σ 1 +b σ ) 9. forelæsning
χ fordelingen side 364-366, opgave 5.3.15 Summer af kvadrerede uafhængige standard normalfordelte variable: X i normal(0,1), uafhængige. Da har Y = n i=1 X i tæthed 1 f Y (y) = n/ Γ(n/) y(n/) 1 e y/... og siges at være χ fordelt med n frihedsgrader. (... det er også en Gamma-fordeling Γ(n/, 1/)) Reproduktion: Hvis Y 1 χ (n) og Y χ (m), så er Y 1 +Y χ (n+m). 9. forelæsning 3
Fordeling af forhold side 383 Hvis Z = Y, hvor X og Y er uafhængige X f Z (z) = Se eksempel 5 side 383 x f X (x)f Y (xz)dx 9. forelæsning 4
Z = Y X med X > 0 og Y > 0. F Z (z) = P(Z z) = f Z (z) = df(z) dz = = 0 0 0 zx 0 f(x,y)dydx = d 0 d zx f(x,y)dy 0 dx dz x f(x, zx)dx zx 0 f(x, y)dydx dz 9. forelæsning 5
Opgave 5.4.10 Find tætheden af Y = V, hvor U og V er uafhængige U ligefordelte (0,1) variable. Vi benytter f Y (y) = u f U(u)f V (uy)du. Integrationsgrænserne for u er fra 0 til min ( 1, 1 y ). Så f Y (y) = 1 0 udu = 1, for y < 1 f Y (y) = 1 y 0 F Y (y) = udu = 1 y, for 1 < y y, y 1 1 1, 1 < y y 9. forelæsning 6
F-fordelingen: Forholdet mellem to uafhængige χ fordelte variable Lad Y χ (n) og X χ (m) og betragt Z = Y n X m n ( n ) f Z (z) = m xf X(x)f Y m xz dx f Z (z) =... efter en længere række udregninger finder vi 1 B ( n, m ) 0 ( n z m)n n 1 ( 1+ n z) n+m m hvor B(r,s) = Γ(r)Γ(s) Γ(r +s) Dette kaldes en F(n,m) fordeling - den optræder hyppigt som en fordeling for teststørrelser i statistikken. 9. forelæsning 7
Udledningen af F-fordelingen Med Y χ (n) og X χ (m),vil vi undersøge fordelingen af Z = Y n X m = Y 1 X 1 f Z (z) = 0 xf X1 (x)f Y1 (xz)dx Af tætheden for Y f Y (y), findes tætheden f Y1 (y) for Y 1 = Y n til nf Y (n y) Ved indsættelse af f Z (z) = 0 x m m Γ ( m ) 1(mx) m ( 1 e mx n n n ) 1(nxz) n Γ 1 e nxz dx 9. forelæsning 8
0 x m Γ ( m = n+m ) 1(mx) ( m 1 me mx n n ) 1(nxz) n Γ 1 ne nxz dx ( ( m ) ( n )) 1z n Γ Γ 1 m m n n Funktionen under integralet er næsten en Γ tæthed 0 x m+n 1 e m+nz x dx = 0 Γ ( ) m+n ( m+nz )m+n m+nz n+m ( m+nz x ) m+n 1 Γ ( ) e m+nz x dx m+n ( ( m ) ( n )) 1z n Γ Γ 1 m m n n 9. forelæsning 9
= 0 Γ ( ) m+n ( m+nz )m+n m+nz n+m ( m+nz ( Γ x ) m+n 1 Γ ( ) e m+nz x dx m+n ( m ) ( n Γ )) 1z n 1 m m n n Integralet er 1. Efter de sidste modifikationer får vi f Z (z) = 1 B ( n, ) m ( n z m)n n 1 ( 1+ n z) n+m m Idet B(r,s) = Γ(r)Γ(s) Γ(r +s) En F(n,m) fordeling. 9. forelæsning 30
Lad Y 1, Y og Y 3 være tre punkter, der vælges tilfældigt og uafhængigt i intervallet (0,1). Lad X være punktet tættest på 1. Spørgsmål 6 Fordelingsfunktionen for X er 1 F(x) = 1 (1 x) 3 F(x) = x 3 F(X) = Φ 4 F(x) = x 3 5 F(x) = x 1 3 6 Ved ikke ( x ) 3 1 Hvor Φ(x) er fordelingsfunktionen for en standardiseret normalfordelt variabel. 9. forelæsning 31
Farvede kugler trækkes tilfældigt med tilbagelægning fra en æske. Indholdet af æsken er givet ved Farve Rød blå grøn gul Andel 0.1 0. 0.3 0.4 9. forelæsning 3
Spørgsmål 7 Hvad er sandsynligheden for at få præcis 5 gule kugler i 0 trækninger 1 Ingen af de nedenstående 0 5 (0.4) 5 (0.6) 15 ) 3 Φ( 5 0.1 0 0 0.1 0.9 4 5 0.1 ) 5 1 Φ( 5 0.1 0 0 0.1 0.9 6 Ved ikke 9. forelæsning 33
Spørgsmål 8 Netop røde, 4 blå, 6 grønne og 8 gule i 0 trækninger. 1 0 (0.1) (0.) 4 (0.3) 6 (0.4) 8 4 8 6 4 (0.1) (0.) 4 (0.3) 6 (0.4) 8 3 0.5 4 0! (5!) 4 (0.1) (0.) 4 (0.3) 6 (0.4) 8 5 0!!4!6!8! (0.1) (0.) 4 (0.3) 6 (0.4) 8 6 Ved ikke 9. forelæsning 34
Spørgsmål 9 Netop 5 trækninger for at få 3 røde. 1 5 (0.1) 3 (0.9) 3 ((0.1)(0.9) 4 ) 3 3 (0.1) 3 (0.9) 4 4 (0.1) 3 (0.9) 5 ((0.1) 4 (0.9)) 3 6 Ved ikke 9. forelæsning 35
Afsnit 5.3 og 5.4 Simultane kontinuerte fordelinger P(X dx,y dy) = f(x,y)dxdy Uafhængige normalfordelte variable ( normal(µ,σ ) = N(µ,σ )) f(x,y) = 1 π e 1 (x +y ) F R (r) = P( X +Y r) = 1 e 1 r (Rayleigh) X N(λ,σ ),Y N(µ,τ ) X +Y N(λ+µ,σ +τ ) For X i N(0,1) er Y = n i=1 X i χ -fordelt (gamma). Operationer med stokastiske variable f Z (z)dz = P(Z = X +Y dz) = f Z (z)dz = P ( Z = Y X dz) = f(x,z x)dx dz x f(x,zx)dx dz 9. forelæsning 36