Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) + P( A B ) P( B ) B) Stokastisk variabel diskret: Endeligt antal værdier Sandsynlighedsfordeling: Tabel med ssh. for hvert, P(X=). Kumulativ fordelings funktion Middelværdi μ = E ( ) = P( ) F ( ) = P( X ) = P( i) i Varians σ Standard afvigelse = V μ ( X ) = E[( X ) ] = E( X ) [ E( X σ = SD ( X ) = V ( X ) )]

Bernoulli fordelingen Hvis et eksperiment består af et enkelt forsøg og forsøget enten kan være en succes eller en fiasko, så kaldes forsøget for et Bernoulli forsøg X er en Bernoulli variabel med sandsynlighedsparameter p, hvis P(X=1)=p og P(X=)=1-p. Middelværdi og varians for en Bernoulli variabel: E(X) = E(X²) = V(X) = Hvis for eksempel p=,7: E(X)= V(X)=

Lidt mere repetition Lad X 1, X,, X n være uafhængige Bernoulli variable, alle med samme sandsynlighedsparameter p. S= X 1 +X + +X n er summen af stok. var. E(S) = E(X 1 +X + +X n ) = V(S) = V(X 1 +X + +X n ) =

Binomial fordeling Binomial fordelingen er resultatet af et Binomialt eksperiment: Det Binomiale eksperiment består af et fast antal (n) Bernoulli forsøg. Så i hvert forsøg er der to mulige udfald, succes og fiasko. P( succes )=p, dvs. sandsynligheden for success er den samme i hvert hvert forsøg. (Ligeledes for P( fiasko )=1-p=q) Forsøgene er uafhængige

Binomial fordeling - Eksempler Eksempler: Kast med en mønt n gange. S=(krone (succes), plat (fiasko)). Hvis fair mønt p=,5. Sandsynligheden er konstant og forsøgene er uafhængige, da et møntkasts udfald ikke påvirker udfaldet af det næste kast Træk et kort n gange. S=( spar (succes), andet (fiasko) ). P(spar)=,5 er konstant, hvis vi lægger kortet tilbage i bunken igen, ellers ikke. Uafhængige. Bemærk! Uden tilbagelægning vil P(nummer spar, hvis nummer 1 er en spar)= 1/51 og dermed ikke konstant sandsynlighed

Binomial eksempel Kast en mønt 5 gange og lad X være antallet af krone. Der er 5 = 3 mulige sekvenser af plat og krone i udfaldsrummet. Af disse er der 1 med krone (X=): KKPPP KPKPP KPPKP KPPPK PKKPP PKPKP PKPPK PPKKP PPKPK PPPKK Sandsynligheden for hvert af disse 1 udfald er p q 3 = (1/) (1/) 3 =(1/3), så sandsynligheden for krone i 5 kast er: P(X = ) = 1 (1/3) = (1/3) =.315 Antal udfald med krone Sandsynligheden for hvert af disse udfald

Binomial-fordelingen generelt 1. Sandsynligheden for en given sekvens af succes er ud af n forsøg med sandsynlighed for succes p og sandsynlighed for fiasko q er lig med: p q (n-). Antallet af forskellige sekvenser af n forsøg, der resulterer i succes er er lig med antallet af valg af elementer ud af n elementer: n = n!!( n )! n fakultet: 5 = n! = 1 3L( n 1) n! = 1 5!!(5 )! 1 3 4 5 = 1 1 3 = 1 1 = 1

Binomial-fordelingen Binomial sandsynligheds fordeling: n P( ) = p q ( n ) n! = p!( n )! q ( n ) hvor : p er sandsynligheden for succes i et enkelt forsøg, q = 1-p, n er antallet af forsøg, og er antallet af succeser. n = Egenskab: P( ) = 1 Notation: X ~ B( n, p)

Formen på Binomial fordelingen p =.1 p =.3 p =.5 Binomial Probability: n=4p=.1 Binomial Probability: n=4p=.3 Binomial Probability: n=4p=.5.7.7.7.6.6.6 n = 4 P().5.4.3 P().5.4.3 P().5.4.3....1.1.1. 1 3 4. 1 3 4. 1 3 4 Binomial Probability: n=1 p=.1 Binomial Probability: n=1 p=.3 Binomial Probability: n=1 p=.5 5. 5. 5. n = 1 P() 4. 3.. P() 4. 3.. P() 4. 3.. 1. 1. 1.. 1 3 4 5 6 7 8 9 1. 1 3 4 5 6 7 8 9 1. 1 3 4 5 6 7 8 9 1 Binomial Probability: n= p=.1 Binomial Probability: n= p=.3 Binomial Probability: n= p=.5 n = P()..1 P()..1 P()..1. 1 3 4 5 6 7 8 9 111113141516171819. 1 3 4 5 6 7 8 9 111113141516171819. 1 3 4 5 6 7 8 9 111113141516171819 Binomial fordelingen bliver mere symmetrisk når n øges og p.5.

Middelværdi, varians og standardafvigelse af en Binomial fordeling Antag X~B(n,p) Middelværdi μ = E ( X ) = Varians σ = SD(X)= Standardafvigelse σ = V ( X ) = npq np npq Eksempel: K tæller antallet af kroner i 5 kast (n=5) med en fair mønt (p=,5): μ σ σ K K K = E( K) = = V ( K) = SD( K) = (5)(.5) 1.5 =.5 = (5)(.5)(.5) = 1.5 = 1.118

Kumulativ Binomial fordeling (Tabel 1, Appendiks C) n=5 p.1.5.1..3.4.5.6.7.8.9.95.99.951.774.59.38.168.78.31.1..... 1.999.977.919.737.58.337.187.87.31.7... 1..999.991.94.837.683.5.317.163.58.9.1. 3 1. 1. 1..993.969.913.813.663.47.63.81.3.1 4 1. 1. 1. 1..998.99.969.9.83.67.41.6.49 Binomial kumulativ fordeling F(k) og sandsynligheds fordeling P(k) for K, antallet af krone i 5 kast med en fair mønt. k F(k) P(k).31.31 1.187.156.5.313 3.813.313 4.969.156 5 1..31 1. Individuelle sandsynligheder fra kumulative sandsynligheder F( ) = P(3) = P( X ) = allei Eksempel: n=5 p=.5 P() = F() - F(-1 ) P( i)

Binomial sandsynligheder - eksempel 6% af af SparNord aktierne ejes af af mig ;-). ;-). En En stikprøve på på15 aktier vælges. Hvad er er sandsynligheden for for at at højst 3 af af dem ejes af af mig? n=15 p.5.6.7... 1....4.. 3.18.. 4.59.9.1............ F ( ) F (3) = P( X ) = i P( i) = P( X 3) =.

Andre diskrete fordelinger Binomial: X=Antal succeser i n forsøg. P( succes )=p fast. Negativ Binomial X=Antal forsøg inden man har n succeser. Hypergeometrisk X=Antal gode blandt n valgte, når der totalt er N at vælge imellem, hvoraf S er gode. Poisson Typisk antal hændelser i et givet tidsrum, f antal uheld.

Diskrete og kontinuerte stokastiske Diskret stokastisk variabel: Tæller hændelser Har et tællelig antal af mulige værdier Har diskrete hop mellem efterfølgende værdier Har målelige sandsynligheder for hver enkelt værdi Sandsynlighed er højde En kontinuert stokastisk variabel: Måler (højde, vægt, hastighed, løn) Har et uendelig antal af mulige værdier Går kontinuert fra værdi til værdi Har ingen målelig sandsynlighed til hver individuel værdi Sandsynlighed er areal For eksempel: Binomial n=3 p=.5 P().15 1.375.375 3.15 1. P().4.3..1. Binomial: n=3 p=.5 1 3 For eksempel: Det skraverede område angiver sandsynligheden for mellem og 3 minutter. P().3..1. Minutes to Complete Task 1 3 4 5 6 Minutes

Kontinuert fordeling Halv-Minut Intervaller Kvart-Minut Intervaller Minutes to Complete Task: By Half-Minutes Minutes to Complete Task: Fourths of a Minute.15 P().1.5 P()... 1. 1.5..5 3. 3.5 4. 4.5 5. 5.5 6. 6.5 1 3 4 5 6 7 Minutes Minutes Ottendedel-Minut Intervaller Minutes to Complete Task: Eighths of aminute Uendelig små intervaller Tæthedsfunktion P() f(z) 1 3 4 5 6 7 Minutes 1 3 Minutes 4 5 6 7

Kontinuerte stokastiske variable tæthedsfunktion og fordelingsfunktion Svarer til sandsynligheds fordeling for diskrete variable For en tæthedsfunktion f() defineret på intervallet fra a til b gælder at: f() for alle mellem a og b Det totale areal under kurven mellem a og b er 1. Sandsynligheden for at ligger i et giver interval (indehold i intervallet fra a til b) er arealet under kurven for dette interval. Den kumulative fordelingsfunktion F() er givet som: F()=P(X ) = arealet under f() mellem den mindste mulige værdi af (typisk minus uendelig) og.

Tæthedsfunktion og fordelingsfunktion F() f() b a F(b) F(a) 1 b a = = b a d f a F b F b X a P ) ( ) ( ) ( ) ( = = = b a d f F(b)-F(a) b a f() b X a P ) ( og mellem under Arealet ) ( NB: P(X=)=F()-F()=

Integrationsbonusslide! Stok. Var: Regel Regel Middelværdi: E(X ) Varians: Diskret Kontinuert P( ) f ( ) P( ) = 1 f ( ) d = 1 E ( X ) = P( ) E ( X ) = f ( ) d E ( X ) = P( ) E ( X ) = f ( ) d V ( X ) = E[( X μ) ] = E[ X ] E[ X ]

Uniform fordeling uniform [a,b] tæthed: f()= 1/(b a) for a b ellers E(X) = (a + b)/; V(X) = (b a) /1 Uniform [a, b] fordeling 1/(b-a) f() Hele arealet under f() = 1/(b a) * (b a) = 1. Arealet under f() fra a 1 til b 1 = P(a 1 X b 1 ) = (b 1 a 1 )/(b a) a a 1 b 1 b

Uniform fordeling uniform [,5] tæthed: f()= 1/5 for 5 ellers E(X) = ( + 5)/; V(X) = (5 ) /1 Uniform [a, b] fordeling f() Hele arealet under f() = 1/(5-) * (5 ) = 1. 1/5 1 3 5 Arealet under f() fra 1 til 3 = P(1 X 3) = (3 1)/(5 ) = /5 =,4

Eksponential-fordeling Eksponential-fordelingen Tæthedsfunktionen er givet ved: Eksponential fordeling : λ= f ( ) = λe λ for, λ > Middelværdi og standardafvigelsen er begge lige 1/λ f() 1 Den kumulative fordelingsfunktion er givet ved: F( ) = 1 e λ for. 1 Tid 3 Den eksponentiale fordeling bruges typisk som model for ventetiden mellem to hændelser, f. tiden mellem to maskinsammenbrud eller andre ulykker.

Normal-fordelingen Normal fordelingen er en vigtig fordeling, blandt andet fordi mange andre fordelingen, kan approksimeres til den. Desuden er mange teststørrelser normal-fordelte kommer senere i kurset Bland andre Carl F. Gauss (1777-1855) fandt frem til den, derfor kaldes den også den Gaussiske fordeling. Gaussfordeling Gauss...4-4 - 4 Må ikke printes ;-)

Normal fordelingen Dens kendetegn er: Klokkeformet og symmetrisk omkring dens middelværdi Middelværdi=median=mode Den er karakteriseret ved en middelværdi μ og varians σ² (eller standard afvigelse σ). Notation: X~N(μ,σ²) betyder, at X følger en normal fordeling med middelværdi μ og varians σ² Arealet under kurven indenfor zσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse. Er uanset parametre værdier, defineret for alle (dvs kan antage værdier fra minus uendelig til plus uendelig)

Tæthedsfunktionen for normal-fordelingen Tæthedsfunktionen for normal-fordelingen: f ( ) = 1 πσ e ( μ ) σ for < < f().4.3. Normal-fordelingen: μ =, σ = 1.1 hvor e =,718818K og π = 3, 1415965K. -5 5

Eksempler på normal-fordelinger μ =. μ = 1. μ =. f(x).4.3..1. Samme varians 4 4 6 f(x).8.6.4 σ =. σ =.5 σ = 1. Samme middelværdi... 4 4 6

Standard afvigelsen σ når X~N(μ,σ ) Cirka 68% af all observationer ligger indenfor en standard afvigelse fra middelværdien P( μ σ X μ + σ ) 68% Cirka 95% af alle observationer ligger indenfor to standard afvigelser fra middelværdien P( μ σ X μ + σ ) 95% Cirka 99.7% af alle observationer ligger indenfor 3 standard afvigelser fra middelværdien P( μ 3σ X μ + 3σ ) 99,7%

68% σ 95% σ 99,7% 3σ Arealet under kurven indenfor kσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse.

Sum af uafhængige normal-fordelte stokastiske variable Hvis X 1, X,, X n er uafhængige normal-fordelte stokastiske variable, så er deres sum S også normalfordelt med E(S) = E(X 1 ) + E(X ) + + E(X n ) V(S) = V(X 1 ) + V(X ) + + V(X n ) Bemærk: Det er varianserne der kan lægges sammen, ikke standard afvigelserne! Eksempel: Middelværdi Varians X 1 1 1 X X 3 3 3 S = X 1 + X + X 3. Så er E(S) = 1 + + 3 = 6 og V(S) = 1 + + 3 = 6. Standard afvigelsen af S er 6 =.45.

Linearkombinationer af uafhængige normalfordelte stokastiske variable Hvis X 1, X,, X n er uafhængige normalfordelte stokastiske variable, så vil variablen Q defineret som Q = a 1 X 1 + a X + + a n X n + b også være normal fordelt, med: E(Q) = a 1 E(X 1 ) + a E(X ) + + a n E(X n ) + b V(Q) = a 1 V(X 1 ) + a V(X ) + + a n V(X n ) Bemærk igen, at det er varianserne, der summeres og ikke standard afvigelserne.

Eksempel Eksempel 4.3: Lad X 1, X, X 3 og X 4 være uafhængige normal fordelte stokastiske variable med middelværdi og varians givet som i tabellen. Find middelværdien og variansen af Q = X 1 -X + 3X -4X 4 + 5 Mean Variance X 1 1 4 X -5 X 3 8 5 X 4 1 1 E(Q) = 1 (-5) + 3(8) 4(1) + 5 = 11 V(Q) = 4 + (-) () + 3 (5) + (-4) (1) = 73 SD(Q) = 73 = 8. 544