Plan. Markovkæder Matematisk modelling af kølængde, yatzy, smittespredning og partikelbevægelser. Materiale mm.

Relaterede dokumenter
Markovkæder med endeligt tilstandsrum

13 Markovprocesser med transitionssemigruppe

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Produkt og marked - matematiske og statistiske metoder

Markovkæder og kodesprog

Produkt og marked - matematiske og statistiske metoder

Kønsproportion og familiemønstre.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

Skriftlig Eksamen Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

LinAlgDat 2014/2015 Google s page rank

Stokastiske processer og køteori

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

t a l e n t c a m p d k Matematiske Metoder Anders Friis Anne Ryelund 25. oktober 2014 Slide 1/42

Note om Monte Carlo metoden

Kursusgang 3 Matrixalgebra Repetition

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Matematik A. Studentereksamen. Forberedelsesmateriale. Digital eksamensopgave med adgang til internettet

Noget om en symmetrisk random walks tilbagevenden til udgangspunktet

Sandsynlighedsregning

Fig. 1 Billede af de 60 terninger på mit skrivebord

Sandsynlighedsregning

13.1 Matrixpotenser og den spektrale radius

Statistik og Sandsynlighedsregning 2

Det Ingeniør-, Natur- og Sundhedsvidenskabelige basisår Matematik 2A, Forår 2007, Hold 4 Opgave A Kommenteret version

Simulering af stokastiske fænomener med Excel

Stokastiske processer og køteori

Sandsynlighedsregning Stokastisk variabel

Matematik for økonomer 3. semester

En martingalversion af CLT

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Matematisk modellering og numeriske metoder. Lektion 13

Stokastiske processer og køteori

Stokastiske processer og køteori

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Stokastiske processer og køteori

Kvantitative Metoder 1 - Forår 2007

Fornyelsesteori med anvendelser: Afleveringsopgave 1

Teoretisk Statistik, 13 april, 2005

Euklids algoritme og kædebrøker

Simulering af stokastiske fænomener med Excel

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Matricer og lineære ligningssystemer

Elementær sandsynlighedsregning

Gruppeteori. Michael Knudsen. 8. marts For at motivere indførelsen af gruppebegrebet begynder vi med et eksempel.

Matematikken i kunstig intelligens Opgaver om koordinerende robotter

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Matematikken i kunstig intelligens Opgaver om koordinerende robotter LØSNINGER

fortsætte høj retning mellem mindre over større

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Allan C. Malmberg. Terningkast

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Landmålingens fejlteori - Sandsynlighedsregning - Lektion 1

Kursusgang 3 Matrixalgebra Repetition

Stokastiske processer og køteori

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Kvantitative Metoder 1 - Efterår Dagens program

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Kapitlet indledes med en beskrivelse af - og opgaver med - de tre former for sandsynlighed, som er omtalt i læseplanen for

TØ-opgaver til uge 45

Elementær Matematik. Mængder og udsagn

Hvad skal vi lave i dag?

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kvantitative Metoder 1 - Forår Dagens program

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

Projekt 7.9 Euklids algoritme, primtal og primiske tal

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Transkript:

Institut for Matematiske Fag Plan Markovkæder Matematisk modelling af kølængde, yatzy, smittespredning og partikelbevægelser Helle Sørensen Eftermiddagen vil være bygget om 3 4 eksempler: A. B. Random walk (partikelbevægelse). Opgaver C. Yatzy. Kun overfladisk. D. Smittespredning. Meget kort hvis vi overhovedet når det Vil veksle mellem præsentation fra mig og opgaveregning. NAT-workshop, 28 februar 20 Dias 2/38 Materiale mm. A. Disse slides Svært at finde velegnet materiale på dansk. Fremragende lille bog på engelsk: Finite Markov Chains and Algorithmic Applications af Olle Häggström. Se evt. http://www.cambridge.org/gb/knowledge/isbn/ item6979/?site_locale=en_gb En smule Maple i dag. Institut for Matematiske Fag Hjemsted for uddannselserne Matematik, Matematik-Økonomi, Forsikringsvidenskab (Aktuar), Statistik Gymnasietilbud, se http://www.math.ku.dk/formidling/ Vi betragter længden af køen ved kassen i banken/kiosken/... Til hvert tidspunkt kan der ske en af følgende tre ting: En ekspedition slutter (hvis der er en i gang) Der ankommer en ny kunde. Hvis der allerede er k kunder i kø, går kunden igen. Ellers stiller kunden sig i kø. Ingenting Lad X n være antal personer i køen til tid n for n = 0,,2,... De tre hændelser svarer til at X n+ er lig X n, X n +, eller X n, Vi vil lave en model for hvordan X ændrer sig. Tilfældigt hvad der sker, så vi skal have en stokastisk model. Dias 3/38 Dias 4/38

A. Tilstandsrum og overgangsgraf De mulige værdier for X n er 0,,2,...,k. Mængden S = {0,,2,...,k} kaldes tilstandsrummet for X n. Overgangsgrafen illustrerer de mulige overgange mellem tilstande: 0 2 k 2 k k I modellen skal vi beskrive hvor sandsynlige de forskellige overgange er. A. Markovegenskaben Længden af køen til tidpunkt n + afhænger kun af to ting: Antallet at kunder til tid n: i Den tilfældige hændelse til tid n + : ekspedition slutter, kunde ankommer (og bliver), ingenting. Forhistorien er derimod ligegyldig. Det er ligegyldigt hvordan det er kommet for sig at der er s kunder i køen til tid i. Denne egenskab kaldes for markovegenskaben. Fremtiden afhænger kun af fortiden via nutiden. Formelt, formulerer vi dette vha. betingede sandsynligheder: P(X n+ = j X 0 = i 0,X = i,...,x n = i) = P(X n+ = j X n = i) Hvis dette er opfyldt kaldes (X 0,X,X 2,...) en markovkæde. Dias 5/38 Dias 6/38 A. Homogen markovkæde A. Overgangssandsynligheder Vi antager at udviklingen i køen kan beskrives med den samme model til alle tidspunkter, dvs. at P(X n+ = j X n = i) ikke afhænger af tidspunktet n, men kun af i og j. Hvis dette er opfyldt kaldes (X 0,X,...) en homogen markovkæde. Definer Q ij = P(X n+ = j X n = i). Hvordan ser disse overgangssandsynligheder ud? Antag at der ankommer en ny kunde med sandsynlighed p, og at en ekspedition slutter med sandsynlighed q. Begge dele kan ikke ske på en gang. Hvis X n = 0, så bliver X n+ = med sandsynlighed p og X n+ = 0 med sandsynlighed p Hvis X n = k, så bliver X n+ = k med sandsynlighed q og X n+ = k med sandsynlighed q: Hvis X n = i hvor i / {0,k}, så bliver X n+ = i + med sandsynlighed p, X n+ = i med sandsynlighed q, og X n+ = i med sandsynlighed p q. Dias 7/38 Dias 8/38

A. Overgangsmatrix Overgangssandsynligh. samles i en matrix, overgangsmatricen. Element (i,j) er lig P(X n+ = j X n = i), altså sandsynligheden for at gå til tilstand j hvis man er i tilstand i. Q = p p 0 0 0 0 0 q p q p 0 0 0 0 0 q p q p 0 0 0....... 0 0 0 0 q p q p 0 0 0 0 0 q q Egenskaber ved Q: Alle elementer er 0. Alle rækkesummer er A. Tilfældet k = 3 Antag at k = 3 svarende til at kunder går hvis der er 3 personer i køen allerede. Så er tilstandsrummet {0,, 2, 3} og overgangsmatricen er Q = p p 0 0 q p q p 0 0 q p q p 0 0 q q Resten af tiden med dette eksempel arbejder vi med k = 3. Dias 9/38 Dias 0/38 A. Simulation A. Algoritme Lad os prøve at simulere nogle forløb af markovkæden, dvs. imitere processen hvormed kæden udvikler sig. Kæden starter in 0, dvs. X 0 = 0. Tre forskellige værdier for sandsynlighederne: (p, q) lig (0.5, 0.3), (0.25, 0.6), (0.5, 0.5) Har brug for at kunne generere tilfældigheder. Hvordan? Fysisk : terninger, mønter,... Tilfældige tal genereret af en computer, fx. i Maple Algoritme til simulation af X 0,...,X N.. Lad X 0 = 0 og Y 0 = X 0 + = 2. Sæt gammel lig. 3. For n = 0,...,N : Vælg ny efter fordel. givet ved række nummer gammel i Q. Sæt gammel lig ny, sæt Y n+ lig ny 4. Sæt X n = Y n for alle n Dias /38 Dias 2/38

A. Fire simulationer med p = 0.5, q = 0.3 A. Fire simulationer med p = 0.25, q = 0.6 Dias 3/38 Dias 4/38 A. Fire simulationer med p = 0.5, q = 0.5 A. Simulation Hvad får vi få ud af simulationerne? Ide om egenskaber ved udviklingen i processen. Hvordan afhænger egenskaberne af p og q? Hvad er fordelingen af kølængden til tid 00 (for eksempel)? P(X 00 = 0), P(X 00 = ), P(X 00 = 2), P(X 00 = 3)? Fordeling til tid 00? Simuler en masse (0.000) markovkæder op til tid 00 Tæt antal 0er, ere, 2ere, 3ere blandt de 0.000 simulerede værdier af X 00. Beregn andele. Prøv med forskellige værdier af p og q. Dias 5/38 Dias 6/38

A. Simuleret fordeling af X 00 B. Random walk på lille gitter Hvad er fordelingen af X 00? Simuler 0000 kæder op til tid 00 Hvordan fordeler de 00 simulerede værdier af X 00 sig på værdierne 0,, 2 og 3? p q 0 2 3 0.5 0.3 975 62 276 4652 0.25 0.6 5967 257 075 44 0.5 0.5 2489 2559 258 2434 Fire gadehjørner og fire gader: 2 3 4 X n : placering til tidspunkt n (efter n ryk) efter følgende procedure: Start i hjørne, dsv. X 0 = ; På hvert tidspunkt n : Ryk en gang med uret med sandsynlighed p med uret med sandsynlighed p. Med et større gitter kunne dette blive en model for partikelbevægelser på gitter. Dias 7/38 Dias 8/38 B. Opgave B. Opgave Med antagelserne fra før: Hvad er tilstandsrummet? Hvorfor er værdierne p = 0 og p = uinteressante? Antag at 0 < p <. Er det muligt at ramme alle tilstande til alle tidspunkter? Hvorfor er (X 0,X,...) en homogen markovkæde? Opskriv overgangsmatricen Vælg en værdi af p og lav simulationer af markovkæden. Brug Maple eller terninger. Prøv evt. flere forskellige værdier af p. Ny situation. Til hvert tidspunkt n : Slå med en terning og ryk lige så mange gange med uret som terningen viser. Er det muligt at ramme alle tilstande til alle tidspunkter? Opskriv overgangsmatricen Lav simulationer af markovkæden Dias 9/38 Dias 20/38

A. Fordeling af X n A. Fordeling af X Før undersøgte vi fordelingen af X 00 vha. simulationer. Kunne vi have regnet eksplit på det? Før antog vi at X 0 = 0 med sikkerhed. Kan gøre det mere generelt, så også X 0 vælges tilfældigt. Begyndelsesfordeling, µ 0 = (µ 0 0, µ0, µ0 2, µ0 3 ), dvs. P(X 0 = i) = µ 0 i Hvad er så fordelingen af X? Notation, for j = 0,,2,3: µ j = P(X = j) µ j = P(X = j) = P(X = j,x 0 = 0) + P(X = j,x 0 = ) + P(X = j,x 0 = 2) + P(X = j,x 0 = 3) = P(X 0 = 0)P(X = j X 0 = 0) + P(X 0 = )P(X = j X 0 = ) + P(X 0 = 2)P(X = j X 0 = 2) + P(X 0 = 3)P(X = j X 0 = 3) = µ 0 0 Q 0j + µ 0 Q j + µ 2 0 Q 2j + µ 3 0 Q 3j = (µ 0 Q) j Multiplikation af 4 matrix (række) med 4 4 matrix. Sandsynligh. for at X er lig j er j te element i rækkevektoren µ. Altså: µ = µ 0 Q. Dias 2/38 Dias 22/38 A. Fordeling af X n A. Stationær begyndelsesfordeling Fordeling af X 0 : µ 0. Iterativt: Fordeling af X : µ = µ 0 Q Fordeling af X 2 : µ 2 = µ Q = (µ 0 Q)Q = µ 0 Q 2... Fordeling af X n : µ n = µ 0 Q n Element (i,j) i Q n angiver sandsynlighederne for overgang fra i til j i n trin: (Q n ) ij = P(X n = j X 0 = i) Findes der en fordeling µ sådan at hvis X 0 har denne fordeling, så har alle X n den samme fordeling? I så fald kaldes µ en stationær begyndelsesfordeling. Betingelser: µq = µ µ j 0 og µ 0 + µ + µ 2 + µ 3 = (sandsynligheder) Den første betingelse består af fire ligninger med fire ubekendte. Dias 23/38 Dias 24/38

A. Stationær begyndelsesfordeling A. Stationær begyndelsesfordeling Skrevet ud: µ 0 ( p) + µ q = µ 0 µ 0 p + µ ( p q) + µ 2 q = µ µ p + µ 2 ( p q) + µ 3 q = µ 2 µ 2 p + µ 3 ( q) = µ 3 µ j 0 og µ 0 + µ + µ 2 + µ 3 = Regne-regne-regne... Så får vi: Lad z = p/q og c = ( + z + z 2 + z 3 ) Så er µ = c (,z,z 2,z 3 ) en stationær begyndelsesfordeling p = 0.5, q = 0.3: µ = (0.0994,0.654,0.2757,0.4596) p = 0.25, q = 0.6: µ = (0.605,0.2506,0.044,0.0435) p = 0.5, q = 0.5: µ = (0.25,0.25,0.25,0.25) Sammenlign med Q n for n stor og med simulationsresultaterne! Dias 25/38 Dias 26/38 A. Eksistens, entydighed af SBF og konvergens B. Stationær begyndelsesfordeling Sætning Antag at (X 0,X,...) er irreducibel og aperiodisk. Så: Der findes en og kun en stationær begyndelsesfordeling µ For enhver begyndelsesfordeling µ 0 gælder at µ 0 Q n konvergerer mod µ. Uanset hvordan kæden startes, ender den med (cirka) at have fordeling µ. Betingelserne: Irreducibel: Enhver tilstand kan nås fra enhver anden tilstand (i et antal skridt) Aperiodisk: Vil ikke give jer den præcise definition i dag... Betingelserne er ok for kølængde-eksemplet. Antag P(X 0 = ) =, dvs. µ 0 = (,0,0,0). Fordeling af X? Antag i stedet at µ 0 = (0.5,0.5,0,0). Fordeling af X? Beregn Q 2 og forklar strukturen (nullerne). Er kæden irreducibel? Er kæden mon aperiodisk? Kan sætningen bruges til at sige noget om eksistensen af en staionær begyndelsesfordeling? Vis at µ = (0.25,0.25,0.25,0.25) er en stationær begyndelsesfordeling for all p ]0, [. Forklar dette intuitivt. Konvergerer fordelingen af X n mod µ for enhver begyndelsesfordeling? Dias 27/38 Dias 28/38

C. Yatzy Terningespil: Kast med fem terninger. Hvis du har fem ens: Stop! Ellers: Behold de terninger du har flest af, og kast de resterende. Hvis du har fem ens: Stop! Fortsæt indtil du har fem ens. Lad X 0, være antal ens efter første kast, X antal ens efter andet kast, X 2 være antal ens efter tredje kast, osv. Specielt interesseret i at ssh. for yatzy i tre slag, dvs. i P(X 2 = 5). (X 0,X,X 2,...) er en homogen markovkæde med tilstandsrum S = {,2,3,4,5}, så vi kan bruge markovkædetorien. C. Fordeling af X 0 Fordeling af X 0 givet ved: ( 20 µ 0 =, 900, 250 ), 25, For eksempel, P(X 0 = 3): Antal mulige slag i alt: 6 5 = 7776 Antal måder man kan vælge 3 ud af 5: ( 5 3) = 0 Antal muligheder for de tre ens: 6 Antal muligheder for de to andre 5 5 = 25 Antal gunstige slag: 0 6 25 = 500. Sandsynlighed = 500/7776 = 250/. Dias 29/38 Dias 30/38 C. Overgangssandsynligheder Overgangsgraf: 2 3 4 5 Ikke så simpelt at beregne overgangssandsynlighederne men det viser sig at overgangsmatricen er: Q = 20 900 0 20 26 250 80 26 0 0 25 25 5 26 0 0 0 0 5 6 26 6 0 0 0 0 5 er en absorberende tilstand. Når kæden først er nået derhen, slipper den ikke væk igen. C. Overgangssandsynligheder Eksempel: Tredje række, svarende til at man efter n kast har 3 ens. Kaster så med 2 terninger, mulige udfald P(X n+ = 5 X n = 3) = /, thi i et af udfaldene har begge terninger samme antal øjne som de tre ens. P(X n+ = 3 X n = 3) = 25/ thi i 5 5 = 25 af udfaldene har ingen af de to terninger samme antal øjne som de tre ens. P(X n+ = 4 X n = 3) = 0/ thi i ( 2 ) 5 = 0 af udfaldene har netop en af de to terninger samme antal øjne som de tre. Første og anden række er vanskeligere fordi antal øjne man samler på kan skifte! Dias 3/38 Dias 32/38

C. Sandsynlighed for yatzy i tre slag Fordeling af X 2 (største antal ens efter tre kast), µ 2 = µ 0 Q 2 : ( 20, 900, 250 ), 25, der bliver 20 900 20 0 26 250 80 26 25 5 26 0 26 6 25 0 0 5 0 0 0 6 0 0 0 0 µ 2 = (0.00079,0.2562,0.45275,0.24495,0.04606). Specielt er ssh. for at slå yatzy i tre slag, P(X 2 = 5) = 0.04606 2 D. Smittespredning Tre individer. Hvert individ kan enten være syg ( ) eller rask ( ). I alt 2 3 = 8 mulige tilstande: X n er tilstanden til tid n med følgende simple model for smittespredning: Syg til tid n rask til tid n + Rask og uden syge naboer til tid n rask til tid n + Rask og med mindst en syg nabo til tid n syg til tid n + med sandsynlighed p og rask med sandsynlighed p. Så er (X 0,X,...) en homogen markovkæde. Overgangsgraf? Overgangssandsynl.? Absorberende tilstande? Dias 33/38 Dias 34/38 D. Smittespredning D. Tilføjet efter workshoppen Lad Y n være antallet af smittede til tid n. Tilstandsrum S = {0,,2,3}. Mulige overgange: 0 0, 0,, 2, 2 0, 2, 3 0 (Y 0,Y...) er ikke en markovkæde! Hvorfor ikke? Beregn evt. P(Y 2 = 2 Y 0 = 2,Y = ) og P(Y 2 = 2 Y 0 =,Y = ). De er ikke ens! Så giver det ikke mening at tale om overgangsmatricen Q. Vi kunne ikke rigtigt finde ud af at beregne sandsynlighederne på forrige side. Med god grund: vi har brug for antagelser om fordelingen af X 0, altså konfigurationen til tid 0. Antag at hver af de tre personer til tid 0 er syg med ssh. p og rask med sssh. p, samt at der er uafhængighed. Kan nu regne på P(Y 2 = 2 Y 0 = 2,Y = ) og P(Y 2 = 2 Y 0 =,Y = ) og se at de ikke er ens. Dias 35/38 Dias /38

D. Tilføjet efter workshoppen Vil beregne P(Y 2 = 2 Y 0 = 2,Y = ) = P(Y 0=2,Y =,Y 2 =2) P(Y 0 =2,Y =). Hændelsen i nævneren kan ske på tre måde:,,, alle med ssh. p 2 ( p) p Hændelsen i tælleren kan kun ske på en måde: med ssh. p 2 ( p) p p 2. I alt fås P(Y 2 = 2 Y 0 = 2,Y = ) = p5 ( p) 3p 3 ( p) = p2 3 D. Tilføjet efter workshoppen Vil beregne P(Y 2 = 2 Y 0 =,Y = ) = P(Y 0=,Y =,Y 2 =2) P(Y 0 =,Y =). Hændelsen i nævneren kan ske på fire måde:,,,, med ssh. p( p) 2 p, p( p) 2 p( p), p( p) 2 p( p), hhv. p( p) 2 p. Hændelsen i tælleren kan kun ske på to måde:, begge med ssh. p( p) 2 p p 2. I alt fås P(Y 2 = 2 Y 0 =,Y = ) = 2p 4 ( p) 2 2p 2 ( p) 2 (2 p) = p2 2 p Dias 37/38 Dias 38/38