Elementær sandsynlighedsregning

Relaterede dokumenter
Elementær sandsynlighedsregning

INSTITUT FOR MATEMATISKE FAG c

Sandsynlighedsregning Oversigt over begreber og fordelinger

Repetition Stokastisk variabel

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Betingede sandsynligheder Aase D. Madsen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Sandsynlighedsregning Stokastisk variabel

Opgaver i sandsynlighedsregning

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Kvantitative Metoder 1 - Efterår Dagens program

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Susanne Ditlevsen Institut for Matematiske Fag susanne

Statistik og Sandsynlighedsregning 2

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Teoretisk Statistik, 16. februar Generel teori,repetition

Produkt og marked - matematiske og statistiske metoder

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Løsning til eksamen 16/

Kvantitative Metoder 1 - Forår 2007

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

3 Stokastiske variable 3.1 Diskrete variable

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Produkt og marked - matematiske og statistiske metoder

Den todimensionale normalfordeling

Note om Monte Carlo metoden

Kvantitative Metoder 1 - Forår 2007

Statistik og Sandsynlighedsregning 2

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Hvad skal vi lave i dag?

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Opgaver til Matematisk Modellering 1

Løsning til prøveeksamen 1

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Statistiske modeller

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

standard normalfordelingen på R 2.

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Transkript:

Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder noget udfald, betegnes. Et sandsynlighedsmål er en funktion P, der afbilder hændelser ind i intervallet [; ]. Funktionen P skal opfylde P (S) P (A) i j : A i A j P (A A A n ) P (A ) + P (A ) + + P (A n ) ) Der gælder blandt andet Betinget sandsynlighed: P ( ) P (A c ) P (A) P (A B) P (A) + P (B) P (A B) P (A B) P (A B), P (B) > P (B) A og B er uafhængige, hvis P (A B) P (A) P (B) for alle A, B Uafhængighed medfører, at P (A B) P (A) og P (B A) P (B) Lad A, A,..., A n være en klassedeling af S, dvs. i j : A i A j og A A A n S ) ) Definitionen kan udvides til at gælde uendeligt, men tælleligt mange hændelser, dvs. E E S.

Loven om total sandsynlighed: P (B) P (B A i ) P (A i ) ) i Bayes formel: P (A j B) P (B A j) P (A j ) P (B) P (B A j ) P (A j ) n i P (B A, j,..., n ) i) P (A i ) Symmetrisk sandsynlighed: Når alle udfald i S har samme sandsynlighed, kan sandsynligheden for en hændelse A udregnes ved at tælle, hvor mange udfald der hører til A, og dividere med antallet af udfald i S. Altså P (A) # gunstige # mulige Stokastisk variabel En stokastisk variabel X er en reel funktion defineret på udfaldsrummet S, dvs. X : S R, X(s) x, s S X er diskret, når X antager endeligt mange værdier eller højst tælleligt mange værdier. X er kontinuert, når X antager flere end tælleligt mange værdier. Diskrete fordelinger Sandsynlighedsfunktion for en diskret stokastisk variabel: p(x k ) P (X x k ) Når X er heltallig, dvs. når X kun antager hele tal som værdier, kan sandsynlighedsfunktionen skrives p(k) P (X k) Fordelingsfunktion: F (x) P (X x) p(x k ), k:x k x x R Middelværdi af X: E[X] k x k p(x k ) µ Middelværdi af en afledt stokastisk variabel g(x): E[g(X)] k g(x k ) p(x k ) ) Formlen modificeres, når klassedelingen af S består af uendeligt, men tælleligt mange hændelser.

Varians af X: Var(X) E[(X E[X]) ] E[X ] (E[X]) σ Spredning: σ Var(X) Eksempel. Kast med en terning. Lad X betegne antal øjne. E[X] E[X ] p(k), k,,..., k k Var(X) 9 ( 7 k ( + ) 7 k 7 9 ) 8 47 ) ) Lad Y betegne antal kast, der medgår, indtil en sekser fremkommer. p(k) ( ) k, k,,... E[Y ] k ( ) k ( ) k ) E[(Y + )Y ] (k + )k ( ) k ( 7 ) ) k E[Y ] E[(Y + )Y ] E[Y ] 7 Var(Y ) E[Y ] (E[Y ]) Indikatorvariabel. Lad I A betegne indikatorvariabel for hændelsen A, dvs. I A antager værdien, når A forekommer, og værdien, når A c forekommer. Sæt P (A) p. E[I A ] p, Var(I A ) p( p) Binomialfordelingen. Lad X være antal gange en hændelse A forekommer blandt n uafhængige gentagelser af et forsøg. Sæt P (A) p. Bemærk, at X kan opfattes som en sum af indikatorvariable for hændelsen A, dvs. X I A + I A +... + I An. ( ) n p(k) p k ( p) n k, k,,..., n k E[X] np, Var(X) np( p) At X er binomialfordelt med antalsparameter n og sandsynlighedsparameter p, skrives kort X b(n, p). ) Vedr. summationer, se baggrundsnote til sandsynlighedsregning side ) Vedr. summationer, se baggrundsnote til sandsynlighedsregning side 4

Poissonfordelingen. Lad λ være det gennemsnitlige antal begivenheder, der indtræffer i et område (interval), og lad X være det antal begivenheder, der indtræffer. p(k) e λ λ k, k! k,,,... E[X] λ, Var(X) λ At X er Poissonfordelt med parameter λ, skrives kort X p(λ). Kontinuerte fordelinger Fordelingsfunktion: F (x) P (X x), x R Bemærk, at der gælder lim F (x), lim x F (x) x Hvis der findes en stykkevis kontinuert funktion f, der opfylder x f(x), x R f(u) du F (x), x R så kaldes f tæthedsfunktion for X. Der gælder blandt andet P (a < X x) f(x) dx P (X x), b a x R f(x) dx F (b) F (a) Middelværdi af X: E[X] x f(x) dx µ Middelværdi af en afledt stokastisk variabel g(x): E[g(X)] g(x) f(x) dx Varians af X: Spredning: Var(X) E[(X E[X]) ] E[X ] (E[X]) σ σ Var(X) Eksempel. Lad X være en stokastisk variabel med tæthedsfunktion f(x) x, x. E[X] x x 4 dx 4 ] 4 4

E[X ] x x dx Var(X) ( ) 48 4 4 8 8.7 Lad Y X være en afledt stokastisk variabel. [ ] E[Y ] x x dx 7 x 7 7 E[Y ] Var(Y ) 4 ( 7 Ligefordeling på interval. X U[a; b]. ] ( x) x dx 4 ) 47 44 9 f(x) b a, E[X] a + b Eksponentialfordelingen. X e(λ). a x b, Var(X) b a f(x) λe λ x, x 9. E[X] λ, Var(X) λ Normalfordelingen. X N(µ, σ ). f(x) π σ e (x µ) σ, < x < E[X] µ, Var(X) σ Todimensional stokastisk variabel Diskrete fordelinger Simultan sandsynlighedsfunktion for en todimensional diskret variabel (X, Y ): p(x j, y k ) P (X x j, Y y k ) P (X x j Y y k ) Marginal sandsynlighedsfunktion for X : for Y : p X (x j ) P (X x j ) k p Y (y k ) P (Y y k ) j p(x j, y k ) p(x j, y k ) Middelværdi af en afledt endimensional stokastisk variable g(x, Y ): E[g(X, Y )] g(x j, y k ) p(x j, y k ) j X og Y er uafhængige, hvis p(x j, y k ) p X (x j ) p Y (y k ) for alle j og k. k

Eksempel. Kast med to terninger. Lad X betegne det største antal øjne, der fremkommer, og lad Y betegne summen af antal øjne. Bemærk, af X kan antage værdierne,,...,, og at Y kan antage værdierne,,...,,. Vi udregner værdierne af den simultane sandsynlighedsfunktion: P (X x, Y y) 4 7 8 9 Marginalfordelingen 4 for X: for Y : x 4 P (X x) y 4 7 8 9 P (Y y) 4 7 9 4 Bemærk, at marginalfordelingerne fremkommer ved simpel addition af henholdsvis rækker og søjler i skemaet for den simultane sandsynlighedsfunktion. Udregning af middelværdi og varians af henholdsvis X og Y : E[X] + + + 4 7 + 9 + 4.47 E[X ] + 4 + 9 + 7 + 9 + 79 Var(X) 79 ( ) 847 9 9 9.97 E[Y ] + + + + 7 E[Y ] 4 + 9 + + + 44 974 9 Var(Y ) 9 974 74 7.8 Kontinuerte fordelinger Simultan fordelingsfunktion for en todimensional kontinuert variabel (X, Y ): F (x, y) P (X x, Y y), (x, y) R Hvis der findes en stykkevis kontinuert funktion af to reelle variable, som opfylder f(x, y), (x, y) R

x y f(u, v) dudv F (x, y) så kaldes f(x, y) den simultane tæthedsfunktion for (X, Y ). Marginale tætheder: f X (x) f Y (y) f(x, y) dy f(x, y) dx X og Y er uafhængige, hvis tæthedsfunktionerne opfylder f(x, y) f X (x) f Y (y). Middelværdi af en afledt endimensional stokastisk variabel g(x, Y ): E[g(X, Y )] g(x, y) f(x, y) dxdy Eksempel 4. Lad den simultane tæthedsfunktion for (X, Y ) være givet som f(x, y) x, x, y x De marginale tætheder bliver f X (x) f Y (y) x y x dy x ( x) (x x ), x x dx ] y 4( y), y Bemærk, at X og Y er afhængige. Udregning af middelværdi og varians af henholdsvis X og Y : E[X] E[X ] E[Y ] E[Y ] x (x x 4 )dx 4 x x (x x )dx Var(X) ( ] ( 4 x ] ( ) ) 9 [ y y 4( y + y y )dy 4 y + y4 4 y ( 4 + 4 ) 4 [ y y 4( y + y y )dy 4 y4 4 + y y ( 4 4 + ) Var(Y ) ( ) 7 7 ) ] ] 7

Kovarians og korrelation Kovariansen mellem to stokastiske variable X og Y er defineret ved Cov(X, Y ) E[(X E[X])(Y E[Y ])] E[XY ] E[X] E[Y ] σ XY Bemærk, at X, Y uafhængige E[XY ] E[X] E[Y ] Cov(X, Y ) Når Cov(X, Y ) >, siges X og Y at være positivt korrelerede, og når Cov(X, Y ) <, siges X og Y at være negativt korrelerede. Når Cov(X, Y ) er X og Y ukorrelerede. Korrelationskoefficienten, eller blot korrelationen, er en dimensionsløs udgave af kovariansen: Cov(X, Y ) ρ(x, Y ) σ XY Var(X) Var(Y ) σ X σ Y Egenskaber ved korrelation: ρ(x, Y ) ρ(x, Y ) ± α, β : Y α + βx Eksempel fortsat. Udregning af kovarians og korrelation: E[XY ] + + 4 + + + 8 9 Cov(X, Y ) 8 9 7 7.97 ρ(x, Y ) 9.8 Eksempel 4 fortsat. Udregning af kovarians og korrelation: x E[XY ] xy x dydx x [ y dx x ( x + x )dx (x x 4 + x 4 )dx 4 x + x ] ( 4 + ) 4 + Cov(X, Y ) ρ(x, Y ) 4.4 7 ] x Regneregler Regneregler for middelværdi P (X c) E[X] c E[aX + by ] a E[X] + b E[Y ] 8

E[ a i X i ] i a i E[X i ] i X X E[X ] E[X ]. E[X] E[ X ]. Regneregler for varians P (X c) Var(X). Var(aX + by ) a Var(X) + ab Cov(X, Y ) + b Var(Y ) Var( a i X i ) i i a i Var(X i ) + i<j a i a j Cov(X i, X j ) Regneregler for kovarians X og Y uafhængige Cov(X, Y ) Cov(X, Y ) Cov(Y, X) Cov(X, X) Var(X) Cov(aX, by ) ab Cov(X, Y ) Cov(X + Y, Z) Cov(X, Z) + Cov(Y, Z) Cov(X, Y + Z) Cov(X, Y ) + Cov(X, Z) Cov( a i X i, b j Y j ) a i b j Cov(X i, Y j ) i j i j Udregning af højere ordens momenter Det n te moment for en stokastisk variabel: x n k p(x k) E[X n k ] x n f(x)dx Det n te centrale moment: (x k µ) n p(x k ) E[(X E[X]) n k ] (x µ) n f(x)dx hvor µ E[X].../BR 9