Mogens Bladt www2.imm.dtu.dk/courses/02405 7. September, 2007
Hvad er sandsynlighedsregning? Formel matematisk måde til at håndtere tilfældigheder. Dybest set en formalisering af udregninger med proportioner. Føles oftest svært ved første kontakt idet det er en væsentligt anden måde at tænke på. Intuition er et vigtigt hjælpemiddel i al matematik men kan være svær at få styr på i sandsynlighedsregningen. Derfor er en formalisering af sandsynlighedsbegrebet nœdvendigt.
ens anvendelser Pålidelighedsanalyse. Dimensionering af systemer (kø systemer; telekommunikation; trafik) Matematisk statistik (det omvendte af sandsynlighedsregning ) Finansiering (modellering af prisfastsættelsesmodeller, optioner, rentemodeller etc.) Markedsanalyser (stikprøveudtagning: meningsmålinger og markedsundersøgelser) Biologi, medicin og genetik. Aktuar videnskab (forsikringsberegninger)
Dette kursus Er en intuitiv introduktion til sandsynlighedsregningen. Vi lægger dermed vægt på forståelse af færdigheder indenfor anvendelser og udregninger af konkrete sandsynligheder. En dybere forståelse af sandsynlighedsregningens grundlag er ikke tilsigtet. Grundlag for kurser i matematisk statistik.
Kursus form 2 45 min forelæsning: 8-8:45 og 9-9:45 2 timers øvelser 2-3 timer til læsning, studie, forståelse 2-3 timers arbejde med opgaver og eksempler Introduktionsskrivelse på hjemmeside Ugentlige forslag til ekstra/hjemme opgaver Løsninger til de fleste opgaver på hjemmeside, kort løsning til opgaver med ulige numre i lærebogen Transparenter tilgængelige på hjemmeside (tilstræbes)
Grundlæggende begreber: 1.1-1.4 Udfaldsrum og hændelser. Manipulation med hændelser: komplementer, snit og forening. Basale antagelser (axiomer): sandsynligheden for den sikre hændelse er 1, sandsynligheden for den umulige hændelse er 0 samt additivitet i sandsynlighed af foreningen af hændelser der udelukker hinanden. Det vigtige (og svære) begreb : betinget sandsynlighed. Uafhængige hændelser.
Udfaldsrum Eksperiment: kast med mønt. Mulige udfald: plat eller krone. Vi kan således definere hændelser ω 1 =plat og ω 2 =krone. Udfaldsrummet (eng: sample space) er defineret som mængden af alle hændelser: Ω = {ω 1, ω 2 } = {plat, krone}. Kast med en terning: mulige udfald 1,2,3,4,5 og 6. Derfor Ω = {1, 2, 3, 4, 5, 6}. Fødsel af børn. Mulige udfald: dreng eller pige. Derfor Ω = {dreng, pige}. Morgendagens aktiekurs. Her er Ω = [0, ) eller måske Ω = {0, 1 8, 2 8,...}.
Hændelser Hændelser er delmængder af Ω. Tag terningekast: Ω = {1, 2, 3, 4, 5, 6}. Så er en hændelse. A = {2, 4, 6} Ω A er den hændelse at vi kaster et lige antal øjne. Nogle gange skriver vi A = {antal øjne i et terningekast er lige}. Hvis vi ikke ved andet om terningen så må vi antage at alle udfald er lige sandsynlige.
Sandsynligheder Sandsynligheden for den sikre hændelse A = Ω er 1. Vi skriver dette som IP(Ω) = 1. Sandsynligheden for den umulige eller tomme hændelse er 0. Vi lader Ø betragte den umulige hændelse og vi skriver IP(Ø) = 0. Den umulige hændelse har man brug for ved manipulation af hændelser: f.eks. hændelsen at vi slår lige og 1 samtidig er umulig. Axiom: Hvis A og B er hændelser så at A B = Ø sætter vi IP(A B) = IP(A) + IP(B).
Sandsynligheder I terningekast antager vi at IP(ω i ) = 1 6, ω i = i, i = 1, 2,..., 6, hvor Ω = {ω 1, ω 2, ω 3, ω 4, ω 5, ω 6 }. Hvad er sandsynligheden for at vi slår lige? A = {2, 4, 6} = {ω 2, ω 4, ω 6 }. Så er IP(A) = IP(ω 2 ) + IP(ω 4 ) + IP(ω 6 ) = 1 6 + 1 6 + 1 6 = 1 2. Generelt: Hvis alle udfald er lige sandsynlige saa er IP(A) = #A #Ω.
Uafhængige hændelser To hændelser A og B siges at være uafhængige hvis IP(A B) = IP(A)IP(B). Hvad er sandsynligheden for at slå to seksere i to slag med en terning? Vi antager, at udfaldet af det første slag ikke har indflydelse på udfaldet i det andet slag. Lad A = {udfaldet af første kast er 6 } og B = {udfaldet af andet kast er 6 }. Så er IP(A B) = IP(A)IP(B) = 1 6 1 6 = 1 36.
Lidt mere kompliceret udfaldsrum... Betragt to kast med terning. Så er udfaldsrummet Ω = {1, 2, 3, 4, 5, 6} {1, 2, 3, 4, 5, 6} = {(1, 1), (1, 2),..., (1, 6), (2, 1),...,, (6, 5), (6, 6)} Betragt hændelsen A at vi slår mindst lige så meget anden gang som første gang. Så er A = {(1, 1), (1, 2),..., (1, 6), (2, 2),..., (2, 6),..., (6, 6)}. Alle udfald er lige sandsynlige (= 1/36) så IP(A) = #A #Ω = 6 + 5 + 4 + 3 + 2 + 1 = 21 36 36.
Stikprøveudtagning med tilbagelægning En bestand af hjorte mærkes. 100 tilfældige hjorte blev mærket. Ved en jagt blev der skudt 170 hjorte. Af disse var 25 mærkede. Sandsynligheden for at skyde en mærket hjort kan så antages 25 at være ca. 170. På denne måde kan man estimere bestanden af hjorte: hvis de 100 mærkede udgør 25 100%, = 14.7%. så er den totale bestand givet ved 170 100 0.147 680.
Basale regneregler med sandsynligheder Vi benævner A c = Ω\A komplementet til A, i.e. x A c hvis og kun hvis x / A. IP(A c ) = 1 IP(A). Dette ses meget let: A og A c er disjunkte (A A c = Ø) og Ω = A A c. Dermed er 1 = IP(Ω) = IP(A A c ) = IP(A) + IP(A c ). Lad A og B være vilkårlige hændelser. Så er IP(A B) = IP(A) + IP(B) IP(A B).
Basale regneregler med sandsynligheder Grønt område = A B c, blåt område = B A c og gult område =A B. Alle områder er disjunkte, så IP(A B) = IP(A B c ) + IP(B A c ) + IP(A B). På den anden side set: IP(A) = IP(A B c )+IP(A B) og IP(B) = IP(B A c )+IP(A B).
Tilbage til hjortene... Af de 680 formodede dyr er 300 hjorte og 380 hinder. Hvad er sandsynligheden for at et tilfældigt skudt dyr enten er mærket eller hind? Lad A = {dyret er mærket} og B = {dyret er hind}. Vi ønsker at beregne IP(A B). IP(A) = 0.147, IP(B) = 380 680 0.559 og IP(A B) = IP(A)IP(B) = 0.082. IP(A B) = IP(A) + IP(B) IP(A B) = 0.147 + 0.559 0.082 = 0.624.
Betingede sandsynligheder Lad A, B Ω være hændelser så at IP(B) > 0. Da definerer vi den betingede sandsynlighed af A givet B ved IP(A B) = IP(A B). IP(B) IP(B) normaliserer B til at være et nyt udfaldsrum. IP(A B) er sandsynligheden for a A og B indtræffer. Hvis vi normaliserer med B så antager at B er indtruffet. Hvis hændelserne er uafhængige så er IP(A B) = IP(A B) IP(B) = IP(A)IP(B) IP(B) = IP(A).
Loven om total sandsynlighed Lad B 1,..., B n være en inddeling af Ω is disjunkte hændelsere Så er IP(A) = IP(A (B 1... B n )) = IP((A B 1 ) (A B 2 )... (A B n )) = IP(A B 1 ) + IP(A B 2 ) +... + IP(A B n ) = IP(A B 1 )IP(B 1 ) + IP(A B 2 )IP(B 2 ) +... + IP(A B n )IP(B n )
Betingede sandsynligheder Vi skyder 2 hjorte. Hvad er sandsynligheden for at nummer to er mærket? Dette afhænger jo af om den første vi skyder var mærket eller ej. Lad A være hændelsen, at den første hjort er mærket. Så er B 1 = A og B 2 = A c en inddeling af Ω. IP(A) = 100 680 og IP(Ac ) = 1 100 680 = 580 680. Lad B være hændelsen, at den anden hjort er mærket. IP(B A) = 99 679 og IP(B Ac ) = 100 679. Så er IP(B) = 99 679 100 680 + 100 679 580 680 = 5 34.
Pålidelighedsanalyse Betragt to komponenter i en maskine som begge er nødvendige for at maskinen virker. Lad A i,y i = 1, 2 være hændelsen at komponent i virker i et år. Hvad er sandsynligheden for at maskinen går i stykker inden der er gået et år? Maskinen går i stykker hvis enten A c 1 eller Ac 2 indtræffer (eller begge!). D.v.s. hvis A c 1 Ac 2 indtræffer. Men nu er A c 1 Ac 2 = (A 1 A 2 ) c (overvej!). Hvis komponenterne fungerer uafhængigt af hinanden, så er IP(A c 1 A c 2) = IP((A 1 A 2 ) c ) = 1 IP(A 1 A 2 ) = 1 IP(A 1 )IP(A 2 ).
Pålidelighedsanalyse Hvis maskinen fungerer hvis blot ét at komponenterne fungerer (e.g. i computere ) saa skitsere vi det som et parrallelt forløb. Lad A i,y i = 1, 2 være hændelsen at komponent i virker i et år. Hvad er sandsynligheden for at maskinen går i stykker inden der er gået et år? Nu er hændelsen vi søger A c 1 Ac 2 = (A 1 A 2 ) c.
Pålidelighedsanalyse Så er IP(A c 1 A c 2) = IP((A 1 A 2 ) c ) = 1 IP(A 1 A 2 ) = 1 IP(A 1 ) IP(A 2 ) + IP(A 1 A 2 ) = (1 IP(A 1 ))(1 IP(A 2 )).
Oversigt over de vigtigste begreber Sandsynligheder er tal mellem 0 og 1 defineret på hændelser og symboliseres ved et IP. Formelt er IP : rummet af hændelser [0, 1], IP(A) [0, 1]. A 1,..., A n disjunkte, så er IP( n i=1 A i) = n i=1 IP(A i). IP(Ω) = 1, IP(Ø) = 0. IP(A c ) = 1 IP(A). Hvis alle udfald er lige sandsynlige it et endeligt udfaldsrum (e.g. terningekast eller plat og krone) så er IP(A) = #A #Ω.
Oversigt over de vigtigste begreber Betingede sandsynligheder IP(A B) for IP(B) > 0: IP(A B) = IP(A B). IP(B) ens vigtigste sætning: Loven om total sandsynlighed IP(B) = n IP(B A i )IP(A i ). i=1 Almindelige regler for manipulation med hændelser: A (B C) = (A B) (A C). (A B) c = A c B b. (A B) c = A c B c