Kvantitative Metoder 1 - Forår 2007

Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1

Bernoulli fordeling Kvantitative Metoder 1 - Forår 2007 Eksempler: I et spil er sandsynligheden for at vinde 2/3. Blandt de stemmeberettigede i DK er der 36.6%, der stemmer på V eller C. I en population har andelen p et bestemt karakteristika. X stokastisk variabel med følgende fordeling ½ 1 med ssh. p X = 0 med ssh. (1 p) X er en Bernoulli variabel med sandsynlighedsparameter p. Dette skrives som X Ber(p). Ofte kaldes hændelsen (X =1)for "succes" og hændelsen (X =0)for "fiasko". 2

Vi har at: p = P (X =1)=P ( succes ) Og dermed at: P ( fiasko )=P (X =0)=1 p (= q i bogen) Fordelingen af X : x f (x) 0 1 p 1 p Middelværdien af X : E (X) =1 p +0 (1 p) =p = P (X =1) AndetmomentafX : E (X 2 )=1 2 p +0 2 (1 p) =p Variansen af X : Var (X) =E (X 2 ) E (X) 2 = p p 2 = p (1 p) 3

Sandsynlighedsfunktionen for en Bernoulli variabel X med sandsynlighedsparameter p skrives ofte som: f (x p) =p x (1 p) 1 x hvor x =0eller 1 Eksempel 1: Tilfældig udvælgelse Blandt de stemmeberettigede i DK stemmer andelen p på V eller C. Vi udvælger en tilfældig person blandt de stemmeberettigede. Beskrivelse af ekseperimentet: Stokastisk variabel X : ½ 1 hvis personen stemmer på V eller C X = 0 ellers Dvs. P (X =1)=p og dermed P (X =0)=1 p. 4

Hvis p = 0.366 er middelværdi, varians og spredning E (X) = p =0.366 Var (X) = (1 p) =0.366 0.634 = 0.22824 p p Var (X) = p (1 p) = 0.22824 0.4777 5

Figur 1: Variansen af X som er lig med p (1 p) som en funktion af p 6

Vi udvælger en tilfældig stikprøve bestående af n personer ud af populationen bestående af de stemmeberettigede. Vi gør det med tilbagelægning. Beskrivelse af ekseperimentet: Stokastiske variabler X 1,..., X n hvor for i =1,..., n ½ 1 hvis den i te person stemmer på V eller C X i = 0 ellers Dvs. P (X i =1)=p og dermed P (X i =0)=1 p. X 1,..., X n er uafhængige. Kort: X 1,..., X n uafhængige stokastiske variabler, der er identisk fordelte med X i Ber(p). Meget kort: X i iid Ber(p). Dette kaldes en Bernoulli proces. 7

Vigtig egenskab: Ingen hukommelse Vi udvælger 100 personer tilfældigt. Af de første 3 personer vi udvalgte, stemmer den første og den tredje på V eller C. Hvad er sandsynligheden for, at person nr. 4 stemmer på V eller C : P (X 4 =1 X 1 =1,X 2 =0,X 3 =1) = P (X 4 =1,X 1 =1,X 2 =0,X 3 =1) P (X 1 =1,X 2 =0,X 3 =1) = P (X 4 =1)P (X 1 =1)P (X 2 =0)P (X 3 =1) P (X 1 =1)P (X 2 =0)P (X 3 =1) = P (X 4 =1) = p 8

Binomial fordeling Kvantitative Metoder 1 - Forår 2007 Vi er ofte kun interessede i det samlede antal succeser i uafhængige gentagelser af et Bernoulli eksperiment. Eksempler: I et spil er sandsynligheden for at vinde 2/3. Vi spiller spillet 100 gange. Hvor mange gange vinder vi? Blandt de stemmeberettigede i DK vil vi undersøge, hvor mange % der stemmer på V eller C. Vi udtager en tilfældig stikprøve på 1000 personer med tilbagelægning. Hvor mange af disse stemmer på V eller C? I en population har andelen p et bestemt karakteristika. Vi udtager tilfældig stikprøve på n individer med tilbagelægning. Hvor mange af disse har dette karakteriska? 9

Beskrivelse af eksperimentet: X 1,..., X n uafhængige og X i Ber(p) Stokastisk variabel X der angiver antallet af succes: X = X 1 +... + X n X har sandsynlighedsfunktionen ³ n f (x p) = p x x (1 p) n x hvor x =0, 1,..., n X er binomialfordelt med antalsparameter n og sandsynlighedsparameter p. Dette skrives som X Bin(n, p) Middelværdien af X : E (X) =E (X 1 +... + X n )=E (X 1 )+... + E (X n )=np Variansen af X : Var (X) =Var(X 1 +... + X n )=Var(X 1 )+... +Var(X n )=np (1 p) Spredningen af X : σ X = p Var (X) = p np (1 p) 10

Eksempel 2: Jeg deltager i et spil, hvor sandsynligheden for at vinde er 50%. Jeg spiller spillet 10 gange. Hvor mange gange kan jeg forvente at vinde? X : Antal gange jeg vinder X Bin(10, 0.5) Forventede antal gevinster: E (X) =10 0.5 =5 Spredning: p Var (X) = p 10 0.5 (1 0.5) = 2.5 1.5811 Hvad er sandsynligheden for, at jeg vinder 5 gange, (Tabel bogen s. 648-649): µ µ 10 10 P (X =5)= 0.5 5 0.5 5 = 0.5 10 = 10! 5 5 5!5! 0.510 0.2461 11

Hvad er sandsynligheden for, at jeg vinder 7 gange, (Tabel bogen s. 648-649): µ µ 10 10 P (X =7)= 0.5 7 0.5 3 = 0.5 10 = 10! 7 7 7!3! 0.510 0.1172 Hvad er sandsynligheden for, at jeg vinder mindst 7 gange, (Tabel bogen s. 650-651): 10X 10X µ 10 P (X 7) = P (X = x) = (0.5) x (0.5) 10 x 0.1719 x x=7 x=7 12

Figur 2: Sandsynlighedsfunktionen for X Bin(10, 0.5) 13

Hvad hvis sandsynligheden for at vinde er 2/3. X : Antal gange jeg vinder X Bin(10, 2/3) Forventede antal gevinster: E (X) = 10 2/3 = 20/3 6.67 Spredning: p Var (X) = p 10 2/3 1/3 = p 20/9 1.4907 Hvad er sandsynligheden for, at jeg vinder 5 gange: µ 10 P (X =5)= (2/3) 5 (1/3) 5 = 10! 5 5!5! (2/3)5 (1/3) 5 0.1366 14

Hvad er sandsynligheden for, at jeg vinder 7 gange: µ 10 P (X =7)= (2/3) 7 (1/3) 3 = 10! 7 7!3! (2/3)7 (1/3) 3 0.2601 Hvad er sandsynligheden for, at jeg vinder mindst 7 gange: 10X 10X µ 10 P (X 7) = P (X = x) = (2/3) x (1/3) 10 x 0.5593 x x=7 x=7 15

Figur 3: Sandsynlighedsfunktionen for X Bin(10, 2/3) 16

Egenskab ved binomialfordelinger: Hvis X 1 Bin(n 1,p) og X 2 Bin(n 2,p) og X 1 og X 2 er uafhængige, da gælder at Y = X 1 + X 2 Bin (n 1 + n 2,p) 17

Store Tals Lov Andelen (frekvensen) af succes i n uafhængige Bernoulli eksperimenter. X : Antal succes X Bin(n, p) Y = X/n Der gælder: Bemærk: E (Y ) = E (X/n) = 1 n E (X) = 1 n np = p Var (Y ) = Var(X/n) = 1 n Var (X) = 1 2 n 2np (1 p) = 1 p (1 p) n I gennemsnit er andelen af succes lig med sandsynligheden for succes Variansen og dermed spredningen på andelen af succes er mindre, jo større antallet af gentagelser n er 18

Eksempel 3, (se Lec4): Jeg spiller et spil n gange uafhængigt af hinanden. Sandsynligheden for at vinde i det enkelte spil er 2/3. X : Antal gange jeg vinder, X Bin(n, 2/3) 100 gentagelser: Hvor stor en andel af spillene forventer jeg at vinde: E (X/100) = 2/3 Hvad er spredningen på andelen af vundne spil: p Var (X/100) = p 1/100 2/3 1/3 0.0471 Hvad er sandsynligheden for at andelen af vundne spil er højst 60%: 60X µ 100 P (X/100 0.60) = P (X 60) = (2/3) x (1/3) 100 x 0.0966 x x=0 19

1000 gentagelser: Hvor stor en andel af spillene forventer jeg at vinde: E (X/1000) = 2/3 Hvad er spredningen på andelen af vundne spil: p Var (X/1000) = p 1/1000 2/3 1/3 0.0149 Hvad er sandsynligheden for at andelen af vundne spil er højst 60%: X600 µ 1000 P (X/1000 0.60) = P (X 600) = (2/3) x (1/3) 1000 x 0.0000 x x=0 20

Figur 4: Sandsynlighedsfunktionen for fordelingen af andelen af gevinster når spillet spilles 100 gange 21

Figur 5: Sandsynlighedsfunktionen for fordelingen af andelen af gevinster når spillet spilles 1000 gange 22

Loven om gennemsnit (Store Tals Lov): X 1,..., X n uafhængige med X i Ber(p). Da vil gennemsnittet af X i erne - som er det samme som andelen af succes i n uafhængige Bernoulli eksperimenter - konvergere mod sandsynligheden for succes p, når antallet af gentagelser n konvergerer mod uendeligt. 23

Figur 6: Andelen af vundne spil som en funktion af antal spillede spil 24

Figur 7: Histogram for fordelingen af frekvensen af gevinster når spillet spilles 100 gange baseret på 10000 gentagelser 25

Figur 8: Histogram for fordelingen af frekvensen af gevinster når spillet spilles 1000 gange baseret på 10000 gentagelser 26

1 Opsummering Eksempler på diskrete fordelinger: Kvantitative Metoder 1 - Forår 2007 - Bernoulli fordeling - Binomialfordeling: Uafhængige gentagelser af Bernoulli eksperimenter - Beskrivelse af stikprøveudvægelse i population med interesse for bestemt karakteriska Store Tals Lov: - Gennemsnit af uafhængige identiske fordelte stokastiske variable - Andelen af succes i uafhængige gentagelser af et Bernoulli eksperiment er tæt på sandsynligheden for succes, når antallet af gentagelser er stort 27

Næste gang Onsdag gennemgåes: Afsnit 4.3-4.6, 4.8 Eksempler på diskrete fordelinger Bemærk: Afsnit 4.9 er ikke pensum Husk: - At lave opgaver og SAS-øvelser 28