Teoretisk Statistik, 13 april, 2005

Relaterede dokumenter

Produkt og marked - matematiske og statistiske metoder

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kvantitative Metoder 1 - Efterår Dagens program

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Teoretisk Statistik, 16. februar Generel teori,repetition

Modeller for ankomstprocesser

Kvantitative Metoder 1 - Forår 2007

Statistik og Sandsynlighedsregning 2

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Stokastiske processer og køteori

Diskrete fordelinger. Fire vigtige diskrete fordelinger: 1. Uniform fordeling (diskret) 2. Binomial fordeling. 3. Hyper-geometrisk fordeling

Hvad skal vi lave i dag?

Sandsynlighedsregning

Tema. Dagens tema: Indfør centrale statistiske begreber.

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Elementær sandsynlighedsregning

Uge 10 Teoretisk Statistik 1. marts 2004

Opgaver i sandsynlighedsregning

Produkt og marked - matematiske og statistiske metoder

Elementær sandsynlighedsregning

Vejledende løsninger til opgaver i kapitel 6

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Kiosk-modellen (News vendor s model) og EOQ modellen

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Statistik II 4. Lektion. Logistisk regression

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Kapitel 4 Sandsynlighed og statistiske modeller

Sandsynlighedsregning Oversigt over begreber og fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Normalfordelingen og Stikprøvefordelinger

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Statistik og Sandsynlighedsregning 2

Statistik viden eller tilfældighed

Sandsynlighedsregning Stokastisk variabel

Statistiske modeller

Betingede sandsynligheder Aase D. Madsen

02402 Løsning til testquiz02402f (Test VI)

Løsning til eksamen 16/

Løsning til prøveeksamen 1

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Transkript:

Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 1

NB. Kap. 3: Fordelingen af endimensionelle stokastiske variable Kap. 4: Fordelingen af flerdimensionelle stokastiske variable Kap. 5: Tidsafhængige stokastiske variable Her skal vi fokusere på poissonprocessen. 2

Poissonprocessen - setup Observationstidspunkter, dvs. tidspunkter hvor hændelsen indtræffer t 1,t 2,t 3,... med Hændelsen kan f.eks. være t 1 t 2 t 3... Kundeankomster til et kasseapparat i et supermarked Kollisioner med storebæltsbroen 3

Setup Definer stokastisk variable X(t) der angiver antal gange hændelsen indtræffer i (0,t] Har altså en stokastisk variabel, X(t), til hvert tidspunkt t 0. X(t), t 0 Samme information i T 1,T 2,... som i X(t), t 0 (alle tidspunkter). Manglende information: Man har ikke altid observeret X(t) til alle tidspunkter. 4

Eksempel 5.4. Trafiktælling Antal biler, der passerer en tællestation i løbet af en time. Observerede tidspunkter (265): Intervaller (120 af 30 sek.): 5

Eksempel 5.4. Trafiktælling. Vi har 120 observationer/intervaller af X(30sek.). Antal biler Antal intervaller 0 19 1 29 2 23 3 23 4 15 5 7 6 2 7 2 6

Antagelser for Poissonprocessen (i) Sandsynligheden for at hændelse indtræffer i vilkårligt interval af længde t er proportional med t når t er lille nok (ii) Sandsynligheden for at hændelser indtræffer to gange i et meget kort tidsinterval er forsvindende lille (iii) Antal gange hændelsen indtræffer i to disjunkte tidsintervaller afhænger ikke af hinanden En proces, der opfylder (i), (ii) og (iii) kaldes en Poissonproces. 7

Poissonprocessen Teoretisk Statistik Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 8

Fordeling af X t Sætning 5.1: Under forudsætningerne (i), (ii) og (iii) er X(t) Poiss(λt). Dvs. punktsandsynlighederne er Heuristisk bevis: P ( X(t) = x ) = (λt)x e λt, x = 0,1,2,3,... x! Vil finde punktsandsynlighederne for X(t), dvs. P ( X(t) = x ) under antagelserne (i) (iii). 9

Fordeling af X t Inddel intervallet [0,t] i n lige store dele, hver af længde t/n. ( t ] t 0,, ( n n, 2t ] (n 1)t,..., (, tn n n n n delforsøg. Hvert delintervaller betragtes for sig. I følge (ii) kan vi se bort fra situationen, hvor 2 hændelser indtræffer i samme delinterval. Dvs. der er to mulige udfald i hvert delforsøg/delinterval. Enten indtræffer hændelsen. Eller også indtræffer hændelsen ikke. ] 10

Fordeling af X t I følge (iii) er de n delforsøg uafhængige I følge (i) er der samme sandsynlighed for at hændelsen indtræffer i hvert delforsøg/delinterval: p n = λt/n Dvs. hvis vi lader X(t) være en stokastisk variabel, der angiver antal delintervaller/delforsøg, hvor hændelsen indtræffer (en gang) er X(t) (sådan da) binomialfordelt med antalsparameter n og sandsynlighedsparameter p n = λt/n 11

Fordeling af X t P ( X(t) = x ) ( )( n λt x n hvor p n 0 og np n λt når n. ) x ( 1 λt ) n x n Disse binomialssh. konvergerer mod poisson-sandsynligheder for n (AJKM, side 101): Altså: X(t) Poiss(λt). P ( X(t) = x ) = (λt)x e λt x! 12

Fordeling af X(t) Altså: X(t) Poiss(λt). Specielt er EX(t) = λt, VarX(t) = λt og intensiteten λ er det forventede antal gange hændelsen indtræffer per tidsenhed (t = 1). X(t), t 0 kaldes poissonprocessen. Modelkontrol: Sammenlign de observerede hyppigheder med poisson-sandsynligheder for estimeret værdi af λ. 13

Poissonprocessen Teoretisk Statistik Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 14

Eksempel 5.4. Trafiktælling. Antagelserne Tjo... Hvis vi ser bort fra kødannelse synes antagelserne at være opfyldte: (i) Sandsynligheden for at hændelse indtræffer i vilkårligt interval af længde t er proportional med t når t er lille nok. Synes rimeligt. Des længere et interval, des større ssh. for at observere en bil passere. Proportionalitetesfaktoren λ er intensiteten, hvormed bilerne passerer. 15

Eksempel 5.4. Trafiktælling. Antagelserne (ii) Sandsynligheden for at hændelser indtræffer to gange i et meget kort tidsinterval er forsvindende lille. Også ok, hvis der ses bort fra overhalinger ved selve tællestationen. (iii) Antal gange hændelsen indtræffer i to disjunkte tidsintervaller afhænger ikke af hinanden. Også ok, hvis vi betragter en situation uden kødannelse Imidlertid er kødannelse ikke ualmindeligt på befærdede veje. Og hvis der er kødannelse vil antagelse (iii) ikke være opfyldt. 16

Eksempel. Trafiktælling. Hvis vi måler tid i enheden 30 sek. har vi 120 obs. af X(t) = X(30sek.). Intensiteten i Poissonprocessen kan estimeres til gennemsnittet (jvf. Kap. 8): ˆλ = 1 ( ) 0 19 + 1 29 + 2 23 + + 6 2 + 7 2 = 265/120 = 2.2 120 Modelkontrol: Sammenlign de observerede hyppigheder med Poiss(2.2)-sandsynligheder: 2.2x x! e 2.2 17

Eksempel 5.4. Trafiktælling. Poiss(2.2) Antal biler Antal intervaller Hyppighed Poissonssh. 0 19 0.16 0.11 1 29 0.24 0.24 2 23 0.19 0.27 3 23 0.19 0.20 4 15 0.12 0.11 5 7 0.06 0.05 6 2 0.02 0.02 7 2 0.02 0.01 Total 120 1.00 1.00 18

Poissonprocessen Teoretisk Statistik Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 19

Lad X(t) Poiss(λt): Ventetider i poissonproces P ( X(t) = x ) = (λt)x e λt x! Vi skal finde fordelingen af ventetiden, T 1, til hændelsen indtræffer første gang. At T 1 > t betyder præcis at hændelsen endnu ikke er indtruffet til tid t, dvs. at X(t) = 0. Dermed: P(T 1 > t) = 20

Ventetider i poissonproces F(t) = = 1 e λt T 1 har således tæthed f (t) = F (t) = så T 1 er eksponentialfordelt med parameter λ. Hermed: ET 1 = 1/λ dvs. forventet ventetid til første hændelse er 1/λ. 21

Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 22

Fortolkning Fortolkning af λ: λ er det forventede antal hændelser i det tidsrum, der er defineret som enheden. 1/λ er det forventede tidsrum (også i forhold til enheden) der går før første hændelse. 23

Eksempel: Trafiktælling Tidsenheden er 30 sek. X(t) Poiss(2.2) Det forventede antal biler der passerer tællestationen i løbet af 30 sek. er 2.2. Den forventede ventetid til den første bil passerer er 1 2.2 = 0.45 af tidsenheden (30 sek. ). Hvad nu hvis man ændrer tidsenheden? 24

Tidsenhed og eksponentialfordelingen Vi har set, at eksponentialfordelingen er invariant over for skalatransformationer: T exp(λ) bt exp(λ/b) Det eneste der sker hvis man skifter tidsenhed er at intensiteten λ ændres. Stadig en eksponentialfordeling. Eksempel: Trafiktælling: Hvis tiden måles i minutter i stedet for halve minutter: λ (et minut) = 2.2 2 = 4.4 Forventet ventetid 1/4.4 = 0.23 af et minut, svarende til ca. 13.5 sekunder. 25

Poissonprocessen Teoretisk Statistik, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 26

Grafisk kontrol af eksponentialfordelingsantagelse Data: Uafhængige ventetider x 1,...,x n. Kan de tænkes at stamme fra en eksponentialfordeling? F.eks. Sammenlign fraktildiagrammet (plot af (x (i), p i ), i = 1,...,n, p j = ( j 0.5)/n)) med fordelingsfunktionen F(t) = 1 exp( λt). Problem: hvilket λ skal vælges. Udnyt i stedet, at hvis X exp(λ): p j P(X x ( j) ) = 1 e λx ( j) log(1 p j ) λx ( j) 27

Grafisk kontrol af eksponentialfordelingsantagelse Da skal plot af punkterne log(1 p j ) λx ( j) ( (x( j),log(1 p j ) ), j = 1,...,n ligge omkring en ret linie, der går gennem (0,0). I bekræftende fald kan data antages at være observationer af en eksponentialfordeling. Hældningen er et godt bud på λ. 28

Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ og valg af tidsenhed Grafisk kontrol Betingede ventetider og ventetid til k te hændelse 29

Betingede ventetider Da ventetiden til første hændelse er en kontinuert fordeling er den entydigt karakteriseret ved sin fordelingsfunktion P(T 1 t) Der gælder P(T 1 >t 0 +t T 1 > t 0 ) = P(T 1 > t 0 +t,t 1 > t 0 ) P(T 1 > t 0 ) = P(T 1 > t 0 +t) P(T 1 > t 0 ) = e λ(t 0+t) e λt 0 = e λt = P(T 1 > t) 30

Betingede ventetider Dermed også P(T 1 t 0 +t T 1 > t 0 ) = 1 P(T 1 > t 0 +t T 1 > t 0 ) = 1 P(T 1 > t) = P(T 1 t) Dvs. den betingede fordeling af hændelsen (T 1 > t + t 0 ) givet at (T 1 > t 0 ) er lig fordelingen af hændelsen (T 1 > t). For eksempel: Sandsynligheden for at der kommer en taxa indenfor de næste 10 minutter ændres altså ikke af at man allerede har ventet 1 time. 31

Ventetid til k te hændelse Husk at T k Derfor er er ventetiden til hændelsen indtræffer k te gang. 1 F(t) = P(T k > t) = P(X t < k) = k 1 P(X t = i) i=0 Derfor er f (t) = ( 1 F(t) ) =... = λ k (k 1)! tk 1 e λt Altså: T k Γ(k,λ) Erlangfordelt. 32