Statistik og Sandsynlighedsregning 2



Relaterede dokumenter
Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Elementær sandsynlighedsregning

Teoretisk Statistik, 16. februar Generel teori,repetition

Statistik og Sandsynlighedsregning 2

Elementær sandsynlighedsregning

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Teoretisk Statistik, 13 april, 2005

Kiosk-modellen (News vendor s model) og EOQ modellen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Kvantitative Metoder 1 - Efterår Dagens program

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Opgaver i sandsynlighedsregning

Sandsynlighedsregning

Sandsynlighedsregning Oversigt over begreber og fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Stokastiske processer og køteori

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Undervisningsbeskrivelse

Eksamen 2014/2015 Mål- og integralteori

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

CIVILINGENIØREKSAMEN. Side 1 af 19 sider. Skriftlig prøve, den: 20. december 2006 Kursus nr : Kursus navn: Sandsynlighedsregning

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Uge 10 Teoretisk Statistik 1. marts 2004

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Skriftlig eksamen Science statistik- ST501

Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Forår 2007

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Statistiske modeller

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Fagplan for statistik, efteråret 2015

Undervisningsbeskrivelse

Borel-σ-algebraen. Definition (EH 1.23)

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Sandsynlighedsregning Stokastisk variabel

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

INSTITUT FOR MATEMATISKE FAG c

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Transkript:

Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R Helle Sørensen Uge 6, mandag SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 1 / 19

Program Velkommen I dag: Praktiske bemærkninger Hvad skal vi lave på SaSt2? Sandsynlighedstætheder og kontinuerte fordelinger Integraler (incl. et par eksempler) Fordelingsfunktioner hvis vi når det (ellers onsdag) SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 2 / 19

Praktiske ting og sager Undervisere Susanne Ditlevsen og Helle Sørensen Lars Lau, Nina Munkholt, Christian Mikkelsen Jensen, Jesper Larsen, Rune Ramsdal Ernstsen Bøger R En introduktion til Sandsynlighedsregning af Michael Sørensen En introduktion til Statistik, Bind 2 af Inge Henningsen Freeware statistikprogrampakke (gratis!), kan downloades Sørg for at installere det så hurtigt som muligt Intro til R på onsdag (eftermiddag), materiale om R på hjemmesiden Computerlokaler mandag 8 10, onsdag 13 15, men medbring meget gerne laptop til øvelser hvis der er R-opgaver. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 3 / 19

Praktiske ting og sager Forelæsninger Mandag 10.15 12 i aud. 4 Onsdag 10.15 12 og 15.15 16 i aud. 4 Øvelser: Holdinddeling og lokaler kan ses via ISIS. Vær velforberedt til øvelserne! Medbring meget gerne laptop til øvelser med R-opgaver Mandag 8 10: opgaveregning (med instruktor) Onsdag 8 9: tavlegennemgang v. studerende (med instruktor) Onsdag 9-10: opgaveregning (med instruktor) Onsdag 13-14: opgaveregning (uden instruktor) Onsdag 14 15: tavlegennemgang v. studerende (med instruktor) SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 4 / 19

Praktiske ting og sager Projekter To projekter, formentlig med aflevering 2. marts og 16. marts Begge skal bestås for at kunne gå til eksamen Eksamen Skriftlig prøve med hjælpemidler En løftet pegefinger Husk at arbejde meget med kurset, også hjemme. Vær velforberedt til øvelserne! Ingen nemme genveje: du lærer det kun ved selv at have fingrene i snavset, ikke ved at se andre gøre det beskidte arbejde. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 5 / 19

Hvad er det vi skal på SaSt2 Sandsynlighedsregning og statistik for kontinuerte observationer. Sandsynlighedsregning endimensionale kontinuerte fordelinger: tæthed, fordelingsfkt., middelværdi, varians, transformation mm. Flerdimensionale kontinuerte fordelinger Normalfordelingen og afledte fordelinger Statistik Generel teori: statistisk model, likelihood, test af hypotese Sammenligning af to stikprøver Lineær regression SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 6 / 19

Hvorfor skal vi det? Fordi hele verden ikke kan beskrives med diskrete fordelinger og fordi det er noget vigtig matematik... Eksempler: Vægt, blodtryk, koncentration af hormon i blodet, alkoholpromille Timeløn, årlig indkomst, Ventetid til en bestemt hændelse indtræffer (fx. død/invaliditet pensionsudbetaling, eller ankomst til kasselinie) Ændring i aktiekurs, vægtændring,... Hvis vi vil beskrive sådanne fænomener skal vi have fat i fordelinger med udfaldsrum som er intervaller, evt. (0, ) eller R. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 7 / 19

Eksempel: tilfældigt ankommende begivenheder Antag at en begivenhed indtræffer tilfældigt således at antallet at begivenheder i tidsrummet [0, t] er poissonfordelt med parameter λ, dvs. P(X t = x) = λ x x! e λt hvor X t er antal hændelser i intervallet [0,t]. Lad T være den stokastiske variabel der angiver tidspunktet for første hændelse. Hvad er så P(T > t) for et givet t > 0? P ( T (t 1,t 2 ] ) for 0 < t 1 < t 2? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 8 / 19

Eksempel: tilfældigt ankommende begivenheder Altså: P ( T (t 1,t 2 ] ) t2 t2 = e λt 1 e λt 2 = λe λx dx = p(x)dx t 1 t 1 Og for et lille interval af længde h: Pointer: P ( T (x,x + h] ) λe λx h = p(x)h Sandsynlighed for at havne i interval er lig areal under tæthedsgraf Sandsynlighed for at havne i et lille interval nær x er cirka proportional med intervallængden, med proportionalitetsfaktor p(x). Stor tæthed stor sandsynlighed Funktionen p kaldes en sandsynlighedstæthed. Fordelingen af T kaldes eksponentialfordelingen med parameter med parameter λ. Lad os være lidt mere præcise og generelle... SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 9 / 19

Sandsynlighedstæthed og sandsynlighedsmål Interval I R. En funktion p : I R kaldes en sandsynlighedstæthed (tæthedsfunktion, tæthed) på I hvis p(x) 0 for alle x I og I p(x)dx = 1 Kravene p(x) 0 og I p(x)dx = 1 er rimelige. Hvorfor? Sandsynlighedsmål på I: For pæne delmængder A af I sættes P(A) = 1 A (x)p(x)dx = p(x) dx I A Definerer P faktisk et sandsynlighedsmål på I? Kravene er (side 18): 0 P(A) 1 for alle A P(I ) = 1 P(A B) = P(A) + P(B) hvis A B = /0. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 10 / 19

Kontinuert fordeling og kont. stokastisk variabel P kaldes en kontinuert fordeling, og P har sandsynlighedstæthed p. For δ lille er (ganske som for eksponentialfordelingen): x0 +δ P([x 0,x 0 + δ]) = p(x)dx p(x 0 )δ x 0 Vi kan tænke på P som en fordeling på hele R (i stedet for kun I ): P(B) = P(B I ) for pæne delmængder B R. Svarer til at sætte p(x) = 0 udenfor I. Diskret vs. kontinuert: ssh.funktion tæthed, sum integral. En stokastisk var. X er kontinuert hvis dens fordeling er kontinuert: P(X A) = 1 A (x)p(x)dx, P(X = a) = 1 {a} (x)p(x)dx = 0 Måske har vi været lidt for hurtige: giver integralerne mening? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 11 / 19

Eksempel: ligefordelingen Først ligefordelingen på [0, 1]: træk tilfældigt tal mellem 0 og 1. To delintervaller af [0, 1] med samme længde skal være lige sandsynlige. Derfor skal tætheden være konstant. Den skal desuden integrere til 1, så Så er fx. p(x) = 1 [0,1] (x) 4/5 P([2/5,4/5]) = 1 [2/4,4/5] (x)p(x)dx = 1dx = 2 2/5 5 Altså: sandsynlighed for interval lig intervallængde. Ligefordeling på interval [a,b] for a < b. Tæthed? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 12 / 19

Integraler Betragter kun ikke-negative funktioner i dag (kandidater til tætheder). 1. f : [a,b] [0, ) kontinuert: b a f (x)dx = lim n n i=1 hvor a i = a + ( i 1 2) b a n 2. f : [a,b] [0, ) stykkevis kontinuert: f (a i ) b a n Integral = sum af integraler over kontinuerte delstykker SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 13 / 19

Integraler 3a. f : R [0, ) begrænset og (stykkevis) kontinuert på [ n,n] for alle n. Integralerne n I n = f (x)dx n veldefineret fra situation 1. og 2. In konvergent: f (x)dx = lim n I n og vi siger at f er integrabel In divergent: skriver f (x)dx = + og vi siger at f er ikke integrabel 3b. Tilsvarende for f : [0, ) [0, ) begrænset og (stykkevis) kontinuert på hvert interval [0,n]. Se på n I n = f (x)dx 0 og definer integralet 0 f (x)dx afhængig af om I n konvergerer eller ej. SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 14 / 19

Integraler 4. f : (a,b] [0, ) kontinuert på (a,b) men med f (x) for x a. Se på b I n = f (x)dx a+ n 1 og definer integralet b a f (x)dx afhængig af om I n konvergerer eller ej. Siger at f er integrabel eller ikke-integrabel på (a, b]. Hvorfor denne interesse i om en ikke-negativ funktion er integrabel eller ej? Hvis f er integrabel kan vi bruge den som sandsynlighedstæthed: p(x) = f (x) f (x)dx SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 15 / 19

Eksempler To eksempler: f (x) = λe λx, x > 0 for et fast λ > 0. Potentielt problem for x. Er f integrabel? f (x) = x α, 0 < x 1 for et fast α > 0. Potentielt problem for x 0. For hvilke værdier af α er f integrabel? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 16 / 19

Fordelingsfunktion Hvis X har kontinuert fordeling P med tæthed p: P(X x) = P ( X (,x] ) = x 1 (,x] (y)p(y)dy = p(y)dy Fordelingsfunktion for kontinuert fordeling P med tæthed p: x F (x) = p(y)dy, x R Egenskaber for fordelingsfunktionen (lidt mere om dette på onsdag): F er svagt voksende F (x) 0 for x og F (x) 1 for x F (x) = p(x) hvis p er kontinuert i x da F er en stamfunktion til p SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 17 / 19

Eksempler Eksponentialfordelingen med parameter λ: p(x) = λe λx, x > 0 Fordelingsfunktion? Ligefordelingen på [0, 1]: p(x) = 1, a x b Fordelingsfunktion? Ligefordelingen på [a, b]. Fordelingsfunktion? SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 18 / 19

Resumé Vigtige ting fra i dag: Sandsynlighedstæthed, kontinuert fordeling, fordelingsfunktion: definitioner og fortolkninger Skal være opmærksom på om integraler faktisk eksisterer således at de faktisk kan normere til tætheder Eksponentialfordelingen og ligefordelingen I skal kunne regne på disse ting! Ondag: Mere om sandsynlighedstætheder og fordelingsfunktioner Middelværdi og varians for kontinuerte fordelinger Intro til R SaSt2 (Uge 6, mandag) Tætheder og kont. fordelinger 19 / 19