Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder noget udfald, betegnes. Et sandsynlighedsmål er en funktion P, der afbilder hændelser ind i intervallet [; ]. Funktionen P skal opfylde P (S) P (A) i j : A i A j P (A A A n ) P (A ) + P (A ) + + P (A n ) ) Der gælder blandt andet Betinget sandsynlighed: P ( ) P (A c ) P (A) P (A B) P (A) + P (B) P (A B) P (A B) P (A B), P (B) > P (B) A og B er uafhængige, hvis P (A B) P (A) P (B) for alle A, B Uafhængighed medfører, at P (A B) P (A) og P (B A) P (B) Lad A, A,..., A n være en klassedeling af S, dvs. i j : A i A j og A A A n S ) ) Definitionen kan udvides til at gælde uendeligt, men tælleligt mange hændelser, dvs. E E S.
Loven om total sandsynlighed: P (B) P (B A i ) P (A i ) ) i Bayes formel: P (A j B) P (B A j) P (A j ) P (B) P (B A j ) P (A j ) n i P (B A, j,..., n ) i) P (A i ) Symmetrisk sandsynlighed: Når alle udfald i S har samme sandsynlighed, kan sandsynligheden for en hændelse A udregnes ved at tælle, hvor mange udfald der hører til A, og dividere med antallet af udfald i S. Altså P (A) # gunstige # mulige Stokastisk variabel En stokastisk variabel X er en reel funktion defineret på udfaldsrummet S, dvs. X : S R, X(s) x, s S X er diskret, når X antager endeligt mange værdier eller højst tælleligt mange værdier. X er kontinuert, når X antager flere end tælleligt mange værdier. Diskrete fordelinger Sandsynlighedsfunktion for en diskret stokastisk variabel: p(x k ) P (X x k ) Når X er heltallig, dvs. når X kun antager hele tal som værdier, kan sandsynlighedsfunktionen skrives p(k) P (X k) Fordelingsfunktion: F (x) P (X x) p(x k ), k:x k x x R Middelværdi af X: E[X] k x k p(x k ) µ Middelværdi af en afledt stokastisk variabel g(x): E[g(X)] k g(x k ) p(x k ) ) Formlen modificeres, når klassedelingen af S består af uendeligt, men tælleligt mange hændelser.
Varians af X: Var(X) E[(X E[X]) ] E[X ] (E[X]) σ Spredning: σ Var(X) Eksempel. Kast med en terning. Lad X betegne antal øjne. E[X] E[X ] p(k), k,,..., k k Var(X) 9 ( 7 k ( + ) 7 k 7 9 ) 8 47 ) ) Lad Y betegne antal kast, der medgår, indtil en sekser fremkommer. p(k) ( ) k, k,,... E[Y ] k ( ) k ( ) k ) E[(Y + )Y ] (k + )k ( ) k ( 7 ) ) k E[Y ] E[(Y + )Y ] E[Y ] 7 Var(Y ) E[Y ] (E[Y ]) Indikatorvariabel. Lad I A betegne indikatorvariabel for hændelsen A, dvs. I A antager værdien, når A forekommer, og værdien, når A c forekommer. Sæt P (A) p. E[I A ] p, Var(I A ) p( p) Binomialfordelingen. Lad X være antal gange en hændelse A forekommer blandt n uafhængige gentagelser af et forsøg. Sæt P (A) p. Bemærk, at X kan opfattes som en sum af indikatorvariable for hændelsen A, dvs. X I A + I A +... + I An. ( ) n p(k) p k ( p) n k, k,,..., n k E[X] np, Var(X) np( p) At X er binomialfordelt med antalsparameter n og sandsynlighedsparameter p, skrives kort X b(n, p). ) Vedr. summationer, se baggrundsnote til sandsynlighedsregning side ) Vedr. summationer, se baggrundsnote til sandsynlighedsregning side 4
Poissonfordelingen. Lad λ være det gennemsnitlige antal begivenheder, der indtræffer i et område (interval), og lad X være det antal begivenheder, der indtræffer. p(k) e λ λ k, k! k,,,... E[X] λ, Var(X) λ At X er Poissonfordelt med parameter λ, skrives kort X p(λ). Kontinuerte fordelinger Fordelingsfunktion: F (x) P (X x), x R Bemærk, at der gælder lim F (x), lim x F (x) x Hvis der findes en stykkevis kontinuert funktion f, der opfylder x f(x), x R f(u) du F (x), x R så kaldes f tæthedsfunktion for X. Der gælder blandt andet P (a < X x) f(x) dx P (X x), b a x R f(x) dx F (b) F (a) Middelværdi af X: E[X] x f(x) dx µ Middelværdi af en afledt stokastisk variabel g(x): E[g(X)] g(x) f(x) dx Varians af X: Spredning: Var(X) E[(X E[X]) ] E[X ] (E[X]) σ σ Var(X) Eksempel. Lad X være en stokastisk variabel med tæthedsfunktion f(x) x, x. E[X] x x 4 dx 4 ] 4 4
E[X ] x x dx Var(X) ( ) 48 4 4 8 8.7 Lad Y X være en afledt stokastisk variabel. [ ] E[Y ] x x dx 7 x 7 7 E[Y ] Var(Y ) 4 ( 7 Ligefordeling på interval. X U[a; b]. ] ( x) x dx 4 ) 47 44 9 f(x) b a, E[X] a + b Eksponentialfordelingen. X e(λ). a x b, Var(X) b a f(x) λe λ x, x 9. E[X] λ, Var(X) λ Normalfordelingen. X N(µ, σ ). f(x) π σ e (x µ) σ, < x < E[X] µ, Var(X) σ Todimensional stokastisk variabel Diskrete fordelinger Simultan sandsynlighedsfunktion for en todimensional diskret variabel (X, Y ): p(x j, y k ) P (X x j, Y y k ) P (X x j Y y k ) Marginal sandsynlighedsfunktion for X : for Y : p X (x j ) P (X x j ) k p Y (y k ) P (Y y k ) j p(x j, y k ) p(x j, y k ) Middelværdi af en afledt endimensional stokastisk variable g(x, Y ): E[g(X, Y )] g(x j, y k ) p(x j, y k ) j X og Y er uafhængige, hvis p(x j, y k ) p X (x j ) p Y (y k ) for alle j og k. k
Eksempel. Kast med to terninger. Lad X betegne det største antal øjne, der fremkommer, og lad Y betegne summen af antal øjne. Bemærk, af X kan antage værdierne,,...,, og at Y kan antage værdierne,,...,,. Vi udregner værdierne af den simultane sandsynlighedsfunktion: P (X x, Y y) 4 7 8 9 Marginalfordelingen 4 for X: for Y : x 4 P (X x) y 4 7 8 9 P (Y y) 4 7 9 4 Bemærk, at marginalfordelingerne fremkommer ved simpel addition af henholdsvis rækker og søjler i skemaet for den simultane sandsynlighedsfunktion. Udregning af middelværdi og varians af henholdsvis X og Y : E[X] + + + 4 7 + 9 + 4.47 E[X ] + 4 + 9 + 7 + 9 + 79 Var(X) 79 ( ) 847 9 9 9.97 E[Y ] + + + + 7 E[Y ] 4 + 9 + + + 44 974 9 Var(Y ) 9 974 74 7.8 Kontinuerte fordelinger Simultan fordelingsfunktion for en todimensional kontinuert variabel (X, Y ): F (x, y) P (X x, Y y), (x, y) R Hvis der findes en stykkevis kontinuert funktion af to reelle variable, som opfylder f(x, y), (x, y) R
x y f(u, v) dudv F (x, y) så kaldes f(x, y) den simultane tæthedsfunktion for (X, Y ). Marginale tætheder: f X (x) f Y (y) f(x, y) dy f(x, y) dx X og Y er uafhængige, hvis tæthedsfunktionerne opfylder f(x, y) f X (x) f Y (y). Middelværdi af en afledt endimensional stokastisk variabel g(x, Y ): E[g(X, Y )] g(x, y) f(x, y) dxdy Eksempel 4. Lad den simultane tæthedsfunktion for (X, Y ) være givet som f(x, y) x, x, y x De marginale tætheder bliver f X (x) f Y (y) x y x dy x ( x) (x x ), x x dx ] y 4( y), y Bemærk, at X og Y er afhængige. Udregning af middelværdi og varians af henholdsvis X og Y : E[X] E[X ] E[Y ] E[Y ] x (x x 4 )dx 4 x x (x x )dx Var(X) ( ] ( 4 x ] ( ) ) 9 [ y y 4( y + y y )dy 4 y + y4 4 y ( 4 + 4 ) 4 [ y y 4( y + y y )dy 4 y4 4 + y y ( 4 4 + ) Var(Y ) ( ) 7 7 ) ] ] 7
Kovarians og korrelation Kovariansen mellem to stokastiske variable X og Y er defineret ved Cov(X, Y ) E[(X E[X])(Y E[Y ])] E[XY ] E[X] E[Y ] σ XY Bemærk, at X, Y uafhængige E[XY ] E[X] E[Y ] Cov(X, Y ) Når Cov(X, Y ) >, siges X og Y at være positivt korrelerede, og når Cov(X, Y ) <, siges X og Y at være negativt korrelerede. Når Cov(X, Y ) er X og Y ukorrelerede. Korrelationskoefficienten, eller blot korrelationen, er en dimensionsløs udgave af kovariansen: Cov(X, Y ) ρ(x, Y ) σ XY Var(X) Var(Y ) σ X σ Y Egenskaber ved korrelation: ρ(x, Y ) ρ(x, Y ) ± α, β : Y α + βx Eksempel fortsat. Udregning af kovarians og korrelation: E[XY ] + + 4 + + + 8 9 Cov(X, Y ) 8 9 7 7.97 ρ(x, Y ) 9.8 Eksempel 4 fortsat. Udregning af kovarians og korrelation: x E[XY ] xy x dydx x [ y dx x ( x + x )dx (x x 4 + x 4 )dx 4 x + x ] ( 4 + ) 4 + Cov(X, Y ) ρ(x, Y ) 4.4 7 ] x Regneregler Regneregler for middelværdi P (X c) E[X] c E[aX + by ] a E[X] + b E[Y ] 8
E[ a i X i ] i a i E[X i ] i X X E[X ] E[X ]. E[X] E[ X ]. Regneregler for varians P (X c) Var(X). Var(aX + by ) a Var(X) + ab Cov(X, Y ) + b Var(Y ) Var( a i X i ) i i a i Var(X i ) + i<j a i a j Cov(X i, X j ) Regneregler for kovarians X og Y uafhængige Cov(X, Y ) Cov(X, Y ) Cov(Y, X) Cov(X, X) Var(X) Cov(aX, by ) ab Cov(X, Y ) Cov(X + Y, Z) Cov(X, Z) + Cov(Y, Z) Cov(X, Y + Z) Cov(X, Y ) + Cov(X, Z) Cov( a i X i, b j Y j ) a i b j Cov(X i, Y j ) i j i j Udregning af højere ordens momenter Det n te moment for en stokastisk variabel: x n k p(x k) E[X n k ] x n f(x)dx Det n te centrale moment: (x k µ) n p(x k ) E[(X E[X]) n k ] (x µ) n f(x)dx hvor µ E[X].../BR 9