Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 1
NB. Kap. 3: Fordelingen af endimensionelle stokastiske variable Kap. 4: Fordelingen af flerdimensionelle stokastiske variable Kap. 5: Tidsafhængige stokastiske variable Her skal vi fokusere på poissonprocessen. 2
Poissonprocessen - setup Observationstidspunkter, dvs. tidspunkter hvor hændelsen indtræffer t 1,t 2,t 3,... med Hændelsen kan f.eks. være t 1 t 2 t 3... Kundeankomster til et kasseapparat i et supermarked Kollisioner med storebæltsbroen 3
Setup Definer stokastisk variable X(t) der angiver antal gange hændelsen indtræffer i (0,t] Har altså en stokastisk variabel, X(t), til hvert tidspunkt t 0. X(t), t 0 Samme information i T 1,T 2,... som i X(t), t 0 (alle tidspunkter). Manglende information: Man har ikke altid observeret X(t) til alle tidspunkter. 4
Eksempel 5.4. Trafiktælling Antal biler, der passerer en tællestation i løbet af en time. Observerede tidspunkter (265): Intervaller (120 af 30 sek.): 5
Eksempel 5.4. Trafiktælling. Vi har 120 observationer/intervaller af X(30sek.). Antal biler Antal intervaller 0 19 1 29 2 23 3 23 4 15 5 7 6 2 7 2 6
Antagelser for Poissonprocessen (i) Sandsynligheden for at hændelse indtræffer i vilkårligt interval af længde t er proportional med t når t er lille nok (ii) Sandsynligheden for at hændelser indtræffer to gange i et meget kort tidsinterval er forsvindende lille (iii) Antal gange hændelsen indtræffer i to disjunkte tidsintervaller afhænger ikke af hinanden En proces, der opfylder (i), (ii) og (iii) kaldes en Poissonproces. 7
Poissonprocessen Teoretisk Statistik Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 8
Fordeling af X t Sætning 5.1: Under forudsætningerne (i), (ii) og (iii) er X(t) Poiss(λt). Dvs. punktsandsynlighederne er Heuristisk bevis: P ( X(t) = x ) = (λt)x e λt, x = 0,1,2,3,... x! Vil finde punktsandsynlighederne for X(t), dvs. P ( X(t) = x ) under antagelserne (i) (iii). 9
Fordeling af X t Inddel intervallet [0,t] i n lige store dele, hver af længde t/n. ( t ] t 0,, ( n n, 2t ] (n 1)t,..., (, tn n n n n delforsøg. Hvert delintervaller betragtes for sig. I følge (ii) kan vi se bort fra situationen, hvor 2 hændelser indtræffer i samme delinterval. Dvs. der er to mulige udfald i hvert delforsøg/delinterval. Enten indtræffer hændelsen. Eller også indtræffer hændelsen ikke. ] 10
Fordeling af X t I følge (iii) er de n delforsøg uafhængige I følge (i) er der samme sandsynlighed for at hændelsen indtræffer i hvert delforsøg/delinterval: p n = λt/n Dvs. hvis vi lader X(t) være en stokastisk variabel, der angiver antal delintervaller/delforsøg, hvor hændelsen indtræffer (en gang) er X(t) (sådan da) binomialfordelt med antalsparameter n og sandsynlighedsparameter p n = λt/n 11
Fordeling af X t P ( X(t) = x ) ( )( n λt x n hvor p n 0 og np n λt når n. ) x ( 1 λt ) n x n Disse binomialssh. konvergerer mod poisson-sandsynligheder for n (AJKM, side 101): Altså: X(t) Poiss(λt). P ( X(t) = x ) = (λt)x e λt x! 12
Fordeling af X(t) Altså: X(t) Poiss(λt). Specielt er EX(t) = λt, VarX(t) = λt og intensiteten λ er det forventede antal gange hændelsen indtræffer per tidsenhed (t = 1). X(t), t 0 kaldes poissonprocessen. Modelkontrol: Sammenlign de observerede hyppigheder med poisson-sandsynligheder for estimeret værdi af λ. 13
Poissonprocessen Teoretisk Statistik Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 14
Eksempel 5.4. Trafiktælling. Antagelserne Tjo... Hvis vi ser bort fra kødannelse synes antagelserne at være opfyldte: (i) Sandsynligheden for at hændelse indtræffer i vilkårligt interval af længde t er proportional med t når t er lille nok. Synes rimeligt. Des længere et interval, des større ssh. for at observere en bil passere. Proportionalitetesfaktoren λ er intensiteten, hvormed bilerne passerer. 15
Eksempel 5.4. Trafiktælling. Antagelserne (ii) Sandsynligheden for at hændelser indtræffer to gange i et meget kort tidsinterval er forsvindende lille. Også ok, hvis der ses bort fra overhalinger ved selve tællestationen. (iii) Antal gange hændelsen indtræffer i to disjunkte tidsintervaller afhænger ikke af hinanden. Også ok, hvis vi betragter en situation uden kødannelse Imidlertid er kødannelse ikke ualmindeligt på befærdede veje. Og hvis der er kødannelse vil antagelse (iii) ikke være opfyldt. 16
Eksempel. Trafiktælling. Hvis vi måler tid i enheden 30 sek. har vi 120 obs. af X(t) = X(30sek.). Intensiteten i Poissonprocessen kan estimeres til gennemsnittet (jvf. Kap. 8): ˆλ = 1 ( ) 0 19 + 1 29 + 2 23 + + 6 2 + 7 2 = 265/120 = 2.2 120 Modelkontrol: Sammenlign de observerede hyppigheder med Poiss(2.2)-sandsynligheder: 2.2x x! e 2.2 17
Eksempel 5.4. Trafiktælling. Poiss(2.2) Antal biler Antal intervaller Hyppighed Poissonssh. 0 19 0.16 0.11 1 29 0.24 0.24 2 23 0.19 0.27 3 23 0.19 0.20 4 15 0.12 0.11 5 7 0.06 0.05 6 2 0.02 0.02 7 2 0.02 0.01 Total 120 1.00 1.00 18
Poissonprocessen Teoretisk Statistik Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 19
Lad X(t) Poiss(λt): Ventetider i poissonproces P ( X(t) = x ) = (λt)x e λt x! Vi skal finde fordelingen af ventetiden, T 1, til hændelsen indtræffer første gang. At T 1 > t betyder præcis at hændelsen endnu ikke er indtruffet til tid t, dvs. at X(t) = 0. Dermed: P(T 1 > t) = 20
Ventetider i poissonproces F(t) = = 1 e λt T 1 har således tæthed f (t) = F (t) = så T 1 er eksponentialfordelt med parameter λ. Hermed: ET 1 = 1/λ dvs. forventet ventetid til første hændelse er 1/λ. 21
Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 22
Fortolkning Fortolkning af λ: λ er det forventede antal hændelser i det tidsrum, der er defineret som enheden. 1/λ er det forventede tidsrum (også i forhold til enheden) der går før første hændelse. 23
Eksempel: Trafiktælling Tidsenheden er 30 sek. X(t) Poiss(2.2) Det forventede antal biler der passerer tællestationen i løbet af 30 sek. er 2.2. Den forventede ventetid til den første bil passerer er 1 2.2 = 0.45 af tidsenheden (30 sek. ). Hvad nu hvis man ændrer tidsenheden? 24
Tidsenhed og eksponentialfordelingen Vi har set, at eksponentialfordelingen er invariant over for skalatransformationer: T exp(λ) bt exp(λ/b) Det eneste der sker hvis man skifter tidsenhed er at intensiteten λ ændres. Stadig en eksponentialfordeling. Eksempel: Trafiktælling: Hvis tiden måles i minutter i stedet for halve minutter: λ (et minut) = 2.2 2 = 4.4 Forventet ventetid 1/4.4 = 0.23 af et minut, svarende til ca. 13.5 sekunder. 25
Poissonprocessen Teoretisk Statistik, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 26
Grafisk kontrol af eksponentialfordelingsantagelse Data: Uafhængige ventetider x 1,...,x n. Kan de tænkes at stamme fra en eksponentialfordeling? F.eks. Sammenlign fraktildiagrammet (plot af (x (i), p i ), i = 1,...,n, p j = ( j 0.5)/n)) med fordelingsfunktionen F(t) = 1 exp( λt). Problem: hvilket λ skal vælges. Udnyt i stedet, at hvis X exp(λ): p j P(X x ( j) ) = 1 e λx ( j) log(1 p j ) λx ( j) 27
Grafisk kontrol af eksponentialfordelingsantagelse Da skal plot af punkterne log(1 p j ) λx ( j) ( (x( j),log(1 p j ) ), j = 1,...,n ligge omkring en ret linie, der går gennem (0,0). I bekræftende fald kan data antages at være observationer af en eksponentialfordeling. Hældningen er et godt bud på λ. 28
Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 29
Betingede ventetider Da ventetiden til første hændelse er en kontinuert fordeling er den entydigt karakteriseret ved sin fordelingsfunktion P(T 1 t) Der gælder P(T 1 >t 0 +t T 1 > t 0 ) = P(T 1 > t 0 +t,t 1 > t 0 ) P(T 1 > t 0 ) = P(T 1 > t 0 +t) P(T 1 > t 0 ) = e λ(t 0+t) e λt 0 = e λt = P(T 1 > t) 30
Betingede ventetider Dermed også P(T 1 t 0 +t T 1 > t 0 ) = 1 P(T 1 > t 0 +t T 1 > t 0 ) = 1 P(T 1 > t) = P(T 1 t) Dvs. den betingede fordeling af hændelsen (T 1 > t + t 0 ) givet at (T 1 > t 0 ) er lig fordelingen af hændelsen (T 1 > t). For eksempel: Sandsynligheden for at der kommer en taxa indenfor de næste 10 minutter ændres altså ikke af at man allerede har ventet 1 time. 31
Ventetid til k te hændelse Husk at T k Derfor er er ventetiden til hændelsen indtræffer k te gang. 1 F(t) = P(T k > t) = P(X t < k) = k 1 P(X t = i) i=0 Derfor er f (t) = ( 1 F(t) ) =... = λ k (k 1)! tk 1 e λt Altså: T k Γ(k,λ) Erlangfordelt. 32