Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Relaterede dokumenter
Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative Metoder 1 - Forår Dagens program

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2016 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Elementær sandsynlighedsregning

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Uge 10 Teoretisk Statistik 1. marts 2004

Produkt og marked - matematiske og statistiske metoder

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Elementær sandsynlighedsregning

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 16. december 2003 Kursus nr : (navn) (underskrift) (bord nr)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistiske modeller

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative Metoder 1 - Forår Dagens program

MM501 forelæsningsslides

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Kvantitative Metoder 1 - Efterår Dagens program

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: PQ. juli 200Z Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative Metoder 1 - Forår 2007

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

INSTITUT FOR MATEMATISKE FAG c

Teoretisk Statistik, 16. februar Generel teori,repetition

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 18. august 2016 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 17. december 2015 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

Lidt om fordelinger, afledt af normalfordelingen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 20. december 2017 Kursus nr : (navn) (underskrift) (bord nr)

MM501/MM503 forelæsningsslides

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Løsning til eksamen 16/

Løsning til prøveeksamen 1

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Statistik og Sandsynlighedsregning 2

Sandsynlighedsregning Oversigt over begreber og fordelinger

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Opgaver i sandsynlighedsregning

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Kvantitative Metoder 1 - Efterår Dagens program

Statistik og Sandsynlighedsregning 2

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 18. december 2013 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 20. december 2011 Kursus nr : (navn) (underskrift) (bord nr)

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Note om Monte Carlo metoden

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Reeksamen 2014/2015 Mål- og integralteori

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Statistik og Sandsynlighedsregning 2

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Karakteristiske funktioner og Den Centrale Grænseværdisætning

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Sandsynlighedsregning

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Statistik og Sandsynlighedsregning 2

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 4. juni 2013 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsteori

CIVILINGENIØREKSAMEN. Side 1 af 19 sider. Skriftlig prøve, den: 20. december 2006 Kursus nr : Kursus navn: Sandsynlighedsregning

Transkript:

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk

Dagens emner afsnit 4.5 og 4.6 (Kumulerede) fordelingsfunktion P(X x) = F(x) Fraktiler F(x p ) = p - specielt median F(x m ) = 0.5 Fordeling for maksimum og minimum F max (x) = n i=1 F i(x) og F min (x) = 1 n i=1 (1 F i(x)) Fordelinger af ordnede variable f (k) (x) = nf(x) n 1 (F(x)) k 1 (1 F(x)) n k k 1 Betafordelingen f(x) = 1 B(r,s) xr 1 (1 x) s 1 med B(r,s) = 1 0 xr 1 (1 x) s 1 dx = ( ) Γ(r)Γ(s) = (r 1)!(s 1)!, for (r, s) heltallige Γ(r+s) (r+s 1)

Fordelingsfunktionen (c.d.f.) F(x) For levetidsfordelinger indførte vi overlevelsesfunktionen G(t) = P(T > t) = t f(s) ds For alle stokastiske variable X indfører vi nu fordelingsfunktionen F(x) = P(X x) f(x) f(x) 0.0 1.0 2.0 0.0 1.0 2.0 G(0.6) 0.0 0.2 0.4 0.6 0.8 1.0 F(0.6) 0.0 0.2 0.4 0.6 0.8 1.0 02405 forelæsning 7 3

F for kontinuerte og diskrete variable For kontinuerte variable er F( ) kontinuert (!) og F(x) = x f(ξ) dξ For diskrete fordelinger på Z har vi f(x) 0.0 1.0 2.0 F(0.6) 0.0 0.2 0.4 0.6 0.8 1.0 F(x) = x n= P(X = n) f(n) 0.00 0.15 F( 6) 0 2 4 6 8 10 02405 forelæsning 7 4

Vi betragter en eksponential(λ) fordelt variabel X. Spørgsmål 1 Fordelingsfunktionen for X er 1 F(x) = λe λx 2 F(x) = 1 λe λx 3 F(x) = 1 e λx 4 F(x) = e λx 5 F(x) = x 0 e λx dx 6 Ved ikke 02405 forelæsning 7 5

Eksempler på fordelingsfunktioner N=20, p=0.25 Binomialf. x t=0 n t p t (1 p) n t 0.0 0.2 0.4 0.6 0.8 1.0 0 5 10 15 20 λ = 5 Poissonf. x n=0 λ n n! e λ 0.0 0.2 0.4 0.6 0.8 1.0 0 5 10 15

... flere fordelingsfunktioner Geometrisk f. på N 1 (1 p) x 0.0 0.2 0.4 0.6 0.8 1.0 p=0.20 0 5 10 15 λ = 0.2 Exponentialf. 1 exp( λx) 0.0 0.2 0.4 0.6 0.8 0 5 10 15

... og endnu flere µ = 0, σ = 1 Normalf. x 1 σ 2( t µ 2π e 1 σ ) 2 dt 0.0 0.2 0.4 0.6 0.8 1.0 3 2 1 0 1 2 3 r = 3, λ = 1 Gammaf. 1 r 1 n=0 (λx) n n! e λx 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8

Fraktiler (percentiles) Median m: P(X m) = 0.5 Nedre/øvre kvartil P(X nk) = 0.25 P(X øk) = 0.75 Generelt: p-fraktilen f p er givet ved P(X f p ) = p (Lidt besværligt for diskrete fordelinger) 0.0 0.2 0.4 0.6 0.8 1.0 p=0.5 p=0.25 p=0.9 p=0.75 nk m øk 3 2 1 0 1 2 3 f 0.9

Simulering af stokastiske variable Givet en kontinuert voksende fordelingsfunktion F. Spm: Hvordan kan vi sample en stokastisk variable X med fordelingsfunktion F? Svar: Simulér først U fra en uniform fordeling på [0,1]. Bestem dernæst X = F 1 (U) d.v.s. x er u-fraktilen i F. Hvorfor virker det? Fordi: P(X x) = P(F(X) F(x)) = P(U F(x)) = F(x) 02405 forelæsning 7 10

Brug af dette Matlab genererer tilfældige tal mellem 0 og 1 med rand Transformation med 1 λ ln(u) Lav histogram over disse Tilsvarende histogram over variable genereret med exprnd 02405 forelæsning 7 11

Fordeling af maximum og minimum Hvor høj er den højeste i en gruppe? Hvornår punkterer det første dæk? Hvad er den største bølgehøjde en bro vil blive udsat for? Største fil på hjemmeside Hvornår kommer den sidste, der skal med på skituren? 02405 forelæsning 7 12

Fordelingsfunktionen for maximum Start med n variable X i, i = 1,...,n.... med tilhørende fordelingsfunktioner F i (x). Lad X max være maksimum: X max = max i X i X max er da en stokastisk variabel med fordelingsfunktion F max (x) = P(X max x) = P( i : X i x) Hvis {X i, i = 1,...,n} er uafhængige får vi n F max (x) = F i (x) ( for F i (x) = F(x): F max (x) = F(x) n ) i=1 02405 forelæsning 7 13

Maksimum af to terningekast Lad X og Y være antal øjne på to uafhængige terningekast. Lad Z = max{x,y}. z 1 2 3 4 5 6 P(Z = z) 1 36 3 36 5 36 7 36 9 36 11 36 Dermed får vi z 1 2 3 4 5 6 P(Z z) 1 36 4 36 9 36 16 36 Bemærk! Dette er lige netop (F X (z)) 2 med F X (x) = x/6 02405 forelæsning 7 14 25 36 36 36

Fordelingsfunktionen for minimum Samme n variable X i, samme fordelingsfunktioner F i (x). Lad X min være minimum: X min har fordelingsfunktionen X min = min i X i F min (x) = P(X min x) = 1 P(X min > x) = 1 P( i : X i > x) Hvis {X i, i = 1,...,n} er uafhængige får vi nu 1 F min (x) = n (1 F i (x)) F min (x) = 1 i=1 n (1 F i (x)) i=1 For F i (x) = F(x): F min (x) = 1 (1 F(x)) n 02405 forelæsning 7 15

Minimum af to uniformt fordelte variable Lad X,Y være uafhængige og uniformt fordelt på [0,1]. Lad Z = min{x,y}. Da har vi P(Z z) = 1 (1 z) 2. Mere generelt, for X i, i = 1,...,n, er uafhængige og U([0,1]), får vi: 0.0 0.2 0.4 0.6 0.8 1.0 P(min(X,Y)>0.4) P(minX i x) = 1 (1 x) n i 0.0 0.2 0.4 0.6 0.8 1.0 02405 forelæsning 7 16

Eksempel/opgave En kæde består af n led. Trækstyrken for hvert led har fordelingsfunktionen F(x) = 1 25 x2 0 < x < 5 Vi antager nu, at trækstyrken for hele kæden skal være mindst 1 10 kg med en sandsynlighed på mindst 0.95. Hvor mange led må den da højst bestå af? 02405 forelæsning 7 17

En kæde er ikke stærkere end det svageste led... Vi definerer X i til at være trækstyrken af det i te led. Trækstyrken af kæden er da X min = min i X i med fordelingsfunktion: Vi forlanger P(X min x) = 1 (1 F(x)) n P(X min 0.1) = 1 (1 F(0.1)) n 0,05 Løs m.h.t. n: n log0,95 log(1 F(0.1)) n 128 hvor F(0.1) = 1 25 0.12

En approksimation for fordelingen af minimum Fordelingsfunktionen for X min = min i X i i kædeeksemplet var P(X min x) = 1 (1 F(x)) n Hvis n er stor og F(x) er lille kan vi approksimere (1 F(x)) n = exp(nlog(1 F(x))) exp( nx 2 /25) Der er X min ca. Weibull-fordelt, opg. 4.3.4. For en generel F kan vi approksimere F(x) med det dominerende led i dens Taylor-række, og dermed stadig få en Weibull-fordeling. 02405 forelæsning 7 19

Fordeling af k te mindste side 326 Lad X i, være i.i.d. (i = 1,...,n) med fordelingsfunktion F(x). Lad X (k) benævne den k te mindste. (X max = X (n) X min = X (1) ) Spm: Bestem P(x < X (k) x+dx) = f k (x) dx! 02405 forelæsning 7 20

Svar: Under denne hændelse må der gælde at: èn af X i erne ligger i [x,x+dx] præcis k 1 af dem er mindre end eller lig x og resten (n k) er større eller lig x. f k (x)dx = nf(x)dx n 1 F(x) k 1 (1 (F(x)) n k k 1 således at f k (x) = n n 1 k 1 f(x)f(x) k 1 (1 F(x)) n k 02405 forelæsning 7 21

Fire studerende har aftalt, at mødes på Cafe Mig og Annie kl. 0.00. Antag at hver persons ankomsttidspunkt kan beskrives med en normalfordeling med middelværdi kl. 0.00 og med en standardafvigelse på 5 minutter, uafhængigt af de andres ankomsttidspunkt. Spørgsmål 2 Sandsynligheden for, at den anden person kommer indenfor de første 10 sekunder efter kl. 0.00, er (approksimativt): 1 6 1 1 5 2π 2 4 3 1 5 2π 1 6 1 2 ( 1 ) 6 3 Φ 5 1 2 ( 1 ) 6 4 (Φ 5 5 4 1 ( 5 1 1 2 2π 6 2) 1 2 )2 ( 1 2) 2 6 Ved ikke hvor Φ betegner fordelingsfunktionen for en standardiseret normalfordelt variabel.

Ordning af uniforme variable Hvis X i er U(0,1) (d.v.s. uniformt fordelt på [0,1]) er F(x) = x. Vi fandt det generelle resultat: f k (x) = n n 1 f(x)f(x) k 1 (1 F(x)) n k k 1 Dermed bliver tæthedsfunktionen for X (k) : f k (x) = n n 1 x k 1 (1 x) n k k 1 (Tætheder side 328) 02405 forelæsning 7 23

Et hjælperesultat Fordi f k er en tæthedsfunktion har vi og dermed 1 0 f k (x) dx = 1 1 0 x k 1 (1 x) n k dx = n 1 n 1 k 1 = Γ(k)Γ(n k +1) Γ(n+1) (idet Γ(n) = (n 1)! for n heltallig) 02405 forelæsning 7 24

Betafordelingen Lidt mere generelt siges en stokastisk variabel med tæthed f(x) = 1 B(r,s) xr 1 (1 x) s 1, 0 < x < 1 for vilkårlige r > 0,s > 0 at være beta(r,s) fordelt. Her er B(r,s) = 1 0 x r 1 (1 x) s 1 dx = Γ(r) Γ(s) Γ(r +s) Dermed er X (k) fra før beta(k,n k +1) -fordelt. 02405 forelæsning 7 25

Opgave 4.6.2 Lad X være beta(r, s)-fordelt. Spm: Find E(X m ) for m 1. Svar: E(X m ) = 1 0 x m f(x)dx = 1 B(r, s) 1 0 x m x r 1 (1 x) s 1 dx og dermed E(X m ) = B(r+m,s) B(r, s) = Γ(r+m) Γ(r +s) Γ(r+m+s) Γ(r) 02405 forelæsning 7 26

Opg. 4.6.2. (f): Første momenter i en beta-fordeling E(X) = Γ(r +1) Γ(r+s) Γ(r +s+1) Γ(r) = r r +s E(X 2 ) = Γ(r +2) Γ(r +s) Γ(r +s+2) Γ(r) = r(r+1) (r+s)(r +s+1) Var(X) = E(X 2 ) (E(X)) 2 = rs (r+s) 2 (r +s+1) 02405 forelæsning 7 27

Vi har to æsker, en ulige æske med 1 sort og 3 hvide marmorkugler, og en lige æske med 2 sorte og 2 hvide marmorkugler. Man vælger en æske tilfældigt og dernæst vælges en marmorkugle tilfældigt fra denne æske. Spørgsmål 3 Givet vi trækker en hvid marmorkugle, hvad er da sandsynligheden for at den kommer fra den lige æske 1 2 5 2 1 2 3 3 5 4 2 3 5 Ingen af de ovenstående 6 Ved ikke

Nye begreber i dag Fordelingfunktionen F(x) = P(X x) Fraktiler: f p er givet ved P(X f p ) = p... specielt median, øvre og nedre kvartil (p=0.5, 0.75, 0.25) Simulation udfra fraktilerne Ekstremværdier Ordnede stokastiske variable Betafordelingen. 02405 forelæsning 7 29

Afsnit 4.5 og 4.6 (Kumulerede) fordelingsfunktion P(X x) = F(x) Fraktiler F(x p ) = p - (specielt median F(x m ) = 0.5) Fordeling for maksimum og minimum F max (x) = n i=1 F i(x) og F min (x) = 1 n i=1 (1 F i(x)) Fordelinger af ordnede variable f (k) (x) = nf(x) n 1 (F(x)) k 1 (1 F(x)) n k k 1 Betafordelingen f(x) = 1 B(r,s) xr 1 (1 x) s 1 med B(r,s) = 1 0 xr 1 (1 x) s 1 dx = ( ) Γ(r)Γ(s) = (r 1)!(s 1)!, for (r, s) heltallige Γ(r+s) r+s 1)