Dagens program Afsnit 2.1-2.3 Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder 1
Stokastiske variable (diskrete) Et eksperiment med usikkerhed beskrives ved en sandsynlighedsmodel. Til ethvert udfald i udfaldsrummet Ω knyttes en "værdi". Denne funktion kaldes en stokastisk variabel. Eksempel 1, Familiemønstre: Familiermed3børn-hvaderbørneneskøn? Udfaldsrum (Køn på 1. barn, Køn på 2. barn, Køn på 3. barn): Ω = {PPP, PPD, PDP, DPP, DDP, DPD, PDD, DDD} 2
Stokastisk variabel X : Antal piger X =0svarer til hændelsen E 0 = {DDD} X =1svarer til hændelsen E 1 = {DDP, DPD, PDD} X =2svarer til hændelsen E 2 = {PPD,PDP,DPP} X =3svarer til hændelsen E 3 = {PPP} (X = x) svarer til hændelsen bestående af alle udfald ω, hvorx (ω) =x Specielt er X (ω) =ω en stokastisk variabel 3
Eksempler på stokastiske variable: Numeriske: Antal piger i familier med 3 børn Afkast af investering i kr Antal gange et spil vindes, hvis der spilles 1000 gange Frekvensen af vundne spil, hvis der spilles 1000 gange Kategoriske: Kønpå1.barnifamilemed3børn Uddannelsesniveau for person i en tilfældig stikprøve 4
Sandsynlighedsfunktion Kvantitative Metoder 1 - Efterår 2006 Definition: Sandsynlighedsfunktionen for den stokastiske variabel X er givet ved: f (x) =P (X = x) =P (X (ω) =x) = X P (ω) Egenskaber: (i) f (x) 0 for alle x (ii) P x f (x) =1 X(ω)=x Fordelingen af en stokastisk variabel kaldes en sandsynlighedsfordeling og den beskrives ved sandsynlighedsfunktionen. 5
Eksempel 2.1c i bogen, Ventetidsfordeling: Vi kaster en mønt, indtil vi får "krone". Hvad er fordelingen af antallet af "plat"? "krone": 1 og "plat": 0 Udfaldsrum Ω = {1, 01, 001, 0001,...} P (1) = 1/2 P (01) = 1/4 P (001) = 1/8 P (0001) = 1/16 osv. X : Antal "plat"inden vi får "krone" X kan antage værdierne 0, 1, 2, 3,... 6
Sandsynlighedsfunktionen for X er givet ved f (x) = 1 2 x+1 for x =0, 1, 2, 3,... 7
Simultane fordelinger Kvantitative Metoder 1 - Efterår 2006 - Vigtigt da man ofte prøver at forstå sammenhænge mellem variable - Vigtigt i den statistiske analyse Fordelingen af to stokastiske variable (X, Y ) To aktiver A og B, der er usikkerhed om en udmelding, der påvirker afkastene på de 2 aktiver. Der er 3 mulige udmeldinger ω 1, ω 2 og ω 3. X (ω i ):Afkast af aktiv A ved udmelding ω i Y (ω i ):Afkast af aktiv B ved udmelding ω i Vi er interesserede i at undersøge, hvordan den simultane fordeling af afkastene på de 2 aktiver ser ud. 8
Definition: Sandsynlighedsfunktionen for (X, Y ) er givet ved: f (x, y) =P (X = x, Y = y) =P (X (ω) =x, Y (ω) =y) Dergældersomførat: f (x, y) 0 for alle (x, y) P P x y f (x, y) =1 9
Eksempel 2: Afkast af 2 aktiver Stokastiske variable: X A : Afkast af aktiv A (i kr) X B : Afkast af aktiv B (i kr) Fordelingen af (X A,X B ) : X A \X B 400 500 600 700 450 0.22 0.22 0.01 0.01 500 0.01 0.01 0.01 0.01 550 0.01 0.01 0.01 0.01 600 0.01 0.01 0.22 0.22 f XA (500) = f (500, 400) + f (500, 500) + f (500, 600) + f (500, 700) = 0.04 f XB (500) = f (450, 500) + f (500, 500) + f (550, 500) + f (600, 500) = 0.25 10
De marginale fordelinger af afkastene: X A \X B 400 500 600 700 450 0.22 0.22 0.01 0.01 0.46 500 0.01 0.01 0.01 0.01 0.04 550 0.01 0.01 0.01 0.01 0.04 600 0.01 0.01 0.22 0.22 0.46 0.25 0.25 0.25 0.25 1 Den marginale fordeling af X A aflæses i sidste søjle Den marginale fordeling af X B aflæses i sidste række 11
Marginale sandsynlighedsfunktioner f X (x) = P (X = x) = X y f Y (y) = P (Y = y) = X x f (x, y) f (x, y) Hvis den stokastiske variabel Y kan antage værdierne y 1,...,y n gælder dette iflg. loven om den totale sandsynlighed idet P (X = x) = P (X = x, Y = y 1 )+P (X = x, Y = y 2 )+... + P (X = x, Y = y n ) = f (x, y 1 )+f (x, y 2 )+... + f (x, y n ) 12
Betingede fordelinger Eksempel 2: Afkast af 2 aktiver, (fortsat) Kvantitative Metoder 1 - Efterår 2006 Hvis vi ved, at afkastet på aktiv B er 500 kroner. Hvilken information giver dette om afkastet på aktiv A? Som udgangspunkt ved vi, at fordelingen af afkastet på aktiv A er følgende: Fordelingen af afkast på aktiv A: X A = x A 450 500 550 600 f XA (x A ) 0.46 0.04 0.04 0.46 Hvis vi ved, at X B =500 Sandsynligheden for X A =450er 22 gange større end sandsynligheden for at X A = 500,X A =550og X A =600 13
Den betingede fordeling af X A givet X B =500er derfor givet ved P (X A =450 X B = 500) = P (X A =450,X B =500) P (X B =500) P (X A =500 X B = 500) = P (X A =500,X B =500) P (X B =500) P (X A =550 X B = 500) = P (X A =550,X B =500) P (X B =500) P (X A =600 X B = 500) = P (X A =600,X B =500) P (X B =500) = 0.22 0.25 =0.88 = 0.01 0.25 =0.04 = 0.01 0.25 =0.04 = 0.01 0.25 =0.04 Den betingede fordeling af X A givet X B =500er en sandsynlighedsfordeling. I dette tilfælde er den betingede fordeling af X A givet X B som den marginale fordeling af X A. =500ikke den samme 14
Den betingede sandsynlighedsfunktion af X givet Y = y er givet ved Bemærk: f (x y) =P (X = x Y = y) = P (X = x, Y = y) P (Y = y) = f (x, y) f Y (y) Den betingede sandsynlighedsfunktion f (x y) og f (x, y) er proportionale f (x y) er en sandsynlighedsfunktion, dvs. P x f (x y) =1 15
Den betingede sandsynlighed af hændelse E givet hændelse F er P (E F )= P (E F ) for P (F ) 6= 0 P (F ) Multiplikationsregler: Lad E og F være hændelser hvor P (F ) > 0, dagælder: P (E F )=P (F ) P (E F ) Lad E 1,..., E k være hændelser hvor P (E 1... E k 1 ) > 0, dagælder: P (E 1... E k )=P (E 1 ) P (E 2 E 1 )...P (E k E 1... E k 1 ) 16
Eksempel 3: I en gruppe bestående af 40 kvinder og 60 mænd er der 30% af kvinderne og 40% af mændene, der er rygere. Jeg vælger en tilfældig person fra denne gruppe. Hvad er sandsynligheden for at vælge en ryger? P ( ryger ) = P ( ryger og kvinde)+p (ryger og mand) = P (ryger kvinde) P (kvinde) +P (ryger mand) P (mand) = 0.30 0.40 + 0.40 0.60 = 0.12 + 0.24 = 0.36 17
Eksempel 4: Overlevelsessandsynligheder En mand er 25 år, hvad er sandsynligheden for, at han bliver mindst 30 år? Vi ved følgende (Danmarks Statistik, Statistikbanken): Dødelighedstavle: 2004:2005 Dødshyppighed pr. 100.000, mænd Dødshyppighed pr. 100.000, kvinder 25 år 74 31 26 år 77 23 27 år 83 21 28 år 81 23 29 år 74 37 30 år 78 38 18
E i : Personen bliver mindst i år for i =0, 1, 2,... Bemærk at E 0 E 1 E 2... E 25 E 26... E 30... Vi har at E 30 = E 30 E 29... E 25 E 29 = E 29... E 25. E 26 = E 26 E 25 19
Vi regner P (E 30 E 25 ) = P (E 30 E 25 ) P (E 25 ) = P (E 30 E 29... E 25 ) P (E 25 ) = P (E 26 E 25 ) P (E 27 E 25 E 26 ) P (E 28 E 25 E 26 E 27 ) P (E 29 E 25 E 26 E 27 E 28 ) P (E 30 E 25 E 26 E 27 E 27 E 29 ) = P (E 26 E 25 ) P (E 27 E 26 ) P (E 28 E 27 ) P (E 29 E 28 ) P (E 30 E 29 ) = (1 74/100000) (1 77/100000) (1 83/100000) (1 81/100000) (1 74/100000) (1 78/100000) 0.9953 20
Opsummering Stokastiske variable og sandsynlighedsfunktioner En sandsynlighedsfunktion giver en beskrivelse af en sandsynlighedsfordeling Simultane fordelinger - Vigtigt at forstå sammenhænge mellem variable - Marginale fordelinger Betingede fordelinger -Hvadbetyderdet - Regneregler Eksempler: -Afkastaftoaktiver - Ventetidsfordeling - Overlevelsessandsynligheder 21
Næste gang Torsdag gennemgåes: Afsnit 2.4-2.5 Bayes regel Uafhængighed 22