Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R Helle Sørensen Uge 6, mandag SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 1 / 19
Program Velkommen I dag: Praktiske bemærkninger Hvad skal vi lave på SaSt2? Sandsynlighedstætheder og kontinuerte fordelinger Integraler (incl. et par eksempler) Fordelingsfunktioner hvis vi når det (ellers onsdag) SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 2 / 19
Praktiske ting og sager Undervisere Susanne Ditlevsen og Helle Sørensen Lars Lau, Nina Munkholt, Christian Mikkelsen Jensen, Jesper Larsen, Rune Ramsdal Ernstsen Bøger R En introduktion til Sandsynlighedsregning af Michael Sørensen En introduktion til Statistik, Bind 2 af Inge Henningsen Freeware statistikprogrampakke (gratis!), kan downloades Sørg for at installere det så hurtigt som muligt Intro til R på onsdag (eftermiddag), materiale om R på hjemmesiden Computerlokaler mandag 8 10, onsdag 13 15, men medbring meget gerne laptop til øvelser hvis der er R-opgaver. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 3 / 19
Praktiske ting og sager Forelæsninger Mandag 10.15 12 i aud. 4 Onsdag 10.15 12 og 15.15 16 i aud. 4 Øvelser: Holdinddeling og lokaler kan ses via ISIS. Vær velforberedt til øvelserne! Medbring meget gerne laptop til øvelser med R-opgaver Mandag 8 10: opgaveregning (med instruktor) Onsdag 8 9: tavlegennemgang v. studerende (med instruktor) Onsdag 9-10: opgaveregning (med instruktor) Onsdag 13-14: opgaveregning (uden instruktor) Onsdag 14 15: tavlegennemgang v. studerende (med instruktor) SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 4 / 19
Praktiske ting og sager Projekter To projekter, formentlig med aflevering 2. marts og 16. marts Begge skal bestås for at kunne gå til eksamen Eksamen Skriftlig prøve med hjælpemidler En løftet pegefinger Husk at arbejde meget med kurset, også hjemme. Vær velforberedt til øvelserne! Ingen nemme genveje: du lærer det kun ved selv at have fingrene i snavset, ikke ved at se andre gøre det beskidte arbejde. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 5 / 19
Hvad er det vi skal på SaSt2 Sandsynlighedsregning og statistik for kontinuerte observationer. Sandsynlighedsregning endimensionale kontinuerte fordelinger: tæthed, fordelingsfkt., middelværdi, varians, transformation mm. Flerdimensionale kontinuerte fordelinger Normalfordelingen og afledte fordelinger Statistik Generel teori: statistisk model, likelihood, test af hypotese Sammenligning af to stikprøver Lineær regression SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 6 / 19
Hvorfor skal vi det? Fordi hele verden ikke kan beskrives med diskrete fordelinger og fordi det er noget vigtig matematik... Eksempler: Vægt, blodtryk, koncentration af hormon i blodet, alkoholpromille Timeløn, årlig indkomst, Ventetid til en bestemt hændelse indtræffer (fx. død/invaliditet pensionsudbetaling, eller ankomst til kasselinie) Ændring i aktiekurs, vægtændring,... Hvis vi vil beskrive sådanne fænomener skal vi have fat i fordelinger med udfaldsrum som er intervaller, evt. (0, ) eller R. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 7 / 19
Eksempel: tilfældigt ankommende begivenheder Antag at en begivenhed indtræffer tilfældigt således at antallet at begivenheder i tidsrummet [0, t] er poissonfordelt med parameter λ, dvs. P(X t = x) = λ x x! e λt hvor X t er antal hændelser i intervallet [0,t]. Lad T være den stokastiske variabel der angiver tidspunktet for første hændelse. Hvad er så P(T > t) for et givet t > 0? P ( T (t 1,t 2 ] ) for 0 < t 1 < t 2? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 8 / 19
Eksempel: tilfældigt ankommende begivenheder Altså: P ( T (t 1,t 2 ] ) t2 t2 = e λt 1 e λt 2 = λe λx dx = p(x)dx t 1 t 1 Og for et lille interval af længde h: Pointer: P ( T (x,x + h] ) λe λx h = p(x)h Sandsynlighed for at havne i interval er lig areal under tæthedsgraf Sandsynlighed for at havne i et lille interval nær x er cirka proportional med intervallængden, med proportionalitetsfaktor p(x). Stor tæthed stor sandsynlighed Funktionen p kaldes en sandsynlighedstæthed. Fordelingen af T kaldes eksponentialfordelingen med parameter med parameter λ. Lad os være lidt mere præcise og generelle... SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 9 / 19
Sandsynlighedstæthed og sandsynlighedsmål Interval I R. En funktion p : I R kaldes en sandsynlighedstæthed (tæthedsfunktion, tæthed) på I hvis p(x) 0 for alle x I og I p(x)dx = 1 Kravene p(x) 0 og I p(x)dx = 1 er rimelige. Hvorfor? Sandsynlighedsmål på I: For pæne delmængder A af I sættes P(A) = 1 A (x)p(x)dx = p(x) dx I A Definerer P faktisk et sandsynlighedsmål på I? Kravene er (side 18): 0 P(A) 1 for alle A P(I ) = 1 P(A B) = P(A) + P(B) hvis A B = /0. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 10 / 19
Kontinuert fordeling og kont. stokastisk variabel P kaldes en kontinuert fordeling, og P har sandsynlighedstæthed p. For δ lille er (ganske som for eksponentialfordelingen): x0 +δ P([x 0,x 0 + δ]) = p(x)dx p(x 0 )δ x 0 Vi kan tænke på P som en fordeling på hele R (i stedet for kun I ): P(B) = P(B I ) for pæne delmængder B R. Svarer til at sætte p(x) = 0 udenfor I. Diskret vs. kontinuert: ssh.funktion tæthed, sum integral. En stokastisk var. X er kontinuert hvis dens fordeling er kontinuert: P(X A) = 1 A (x)p(x)dx, P(X = a) = 1 {a} (x)p(x)dx = 0 Måske har vi været lidt for hurtige: giver integralerne mening? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 11 / 19
Eksempel: ligefordelingen Først ligefordelingen på [0, 1]: træk tilfældigt tal mellem 0 og 1. To delintervaller af [0, 1] med samme længde skal være lige sandsynlige. Derfor skal tætheden være konstant. Den skal desuden integrere til 1, så Så er fx. p(x) = 1 [0,1] (x) 4/5 P([2/5,4/5]) = 1 [2/4,4/5] (x)p(x)dx = 1dx = 2 2/5 5 Altså: sandsynlighed for interval lig intervallængde. Ligefordeling på interval [a,b] for a < b. Tæthed? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 12 / 19
Integraler Betragter kun ikke-negative funktioner i dag (kandidater til tætheder). 1. f : [a,b] [0, ) kontinuert: b a f (x)dx = lim n n i=1 hvor a i = a + ( i 1 2) b a n 2. f : [a,b] [0, ) stykkevis kontinuert: f (a i ) b a n Integral = sum af integraler over kontinuerte delstykker SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 13 / 19
Integraler 3a. f : R [0, ) begrænset og (stykkevis) kontinuert på [ n,n] for alle n. Integralerne n I n = f (x)dx n veldefineret fra situation 1. og 2. In konvergent: f (x)dx = lim n I n og vi siger at f er integrabel In divergent: skriver f (x)dx = + og vi siger at f er ikke integrabel 3b. Tilsvarende for f : [0, ) [0, ) begrænset og (stykkevis) kontinuert på hvert interval [0,n]. Se på n I n = f (x)dx 0 og definer integralet 0 f (x)dx afhængig af om I n konvergerer eller ej. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 14 / 19
Integraler 4. f : (a,b] [0, ) kontinuert på (a,b) men med f (x) for x a. Se på b I n = f (x)dx a+ n 1 og definer integralet b a f (x)dx afhængig af om I n konvergerer eller ej. Siger at f er integrabel eller ikke-integrabel på (a, b]. Hvorfor denne interesse i om en ikke-negativ funktion er integrabel eller ej? Hvis f er integrabel kan vi bruge den som sandsynlighedstæthed: p(x) = f (x) f (x)dx SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 15 / 19
Eksempler To eksempler: f (x) = λe λx, x > 0 for et fast λ > 0. Potentielt problem for x. Er f integrabel? f (x) = x α, 0 < x 1 for et fast α > 0. Potentielt problem for x 0. For hvilke værdier af α er f integrabel? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 16 / 19
Fordelingsfunktion Hvis X har kontinuert fordeling P med tæthed p: P(X x) = P ( X (,x] ) = x 1 (,x] (y)p(y)dy = p(y)dy Fordelingsfunktion for kontinuert fordeling P med tæthed p: x F (x) = p(y)dy, x R Egenskaber for fordelingsfunktionen (lidt mere om dette på onsdag): F er svagt voksende F (x) 0 for x og F (x) 1 for x F (x) = p(x) hvis p er kontinuert i x da F er en stamfunktion til p SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 17 / 19
Eksempler Eksponentialfordelingen med parameter λ: p(x) = λe λx, x > 0 Fordelingsfunktion? Ligefordelingen på [0, 1]: p(x) = 1, a x b Fordelingsfunktion? Ligefordelingen på [a, b]. Fordelingsfunktion? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 18 / 19
Resumé Vigtige ting fra i dag: Sandsynlighedstæthed, kontinuert fordeling, fordelingsfunktion: definitioner og fortolkninger Skal være opmærksom på om integraler faktisk eksisterer således at de faktisk kan normere til tætheder Eksponentialfordelingen og ligefordelingen I skal kunne regne på disse ting! Ondag: Mere om sandsynlighedstætheder og fordelingsfunktioner Middelværdi og varians for kontinuerte fordelinger Intro til R SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 19 / 19