Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Relaterede dokumenter
Betingning med en uafhængig variabel

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

Integration m.h.t. mål med tæthed

standard normalfordelingen på R 2.

Eksamen 2014/2015 Mål- og integralteori

Reeksamen 2014/2015 Mål- og integralteori

Integration m.h.t. mål med tæthed

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning

Statistik og Sandsynlighedsregning 2

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Sandsynlighedsregning Oversigt over begreber og fordelinger

Statistik og Sandsynlighedsregning 2

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Flerdimensionale transformationer

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2

Sandsynlighedsteori. Sandsynlighedsteori. Sandsynlighedsteori Et eksperiment beskrives af et udfaldsrum udstyret med et. Et Bayesiansk argument

Løsning til prøveeksamen 1

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Et eksperiment beskrives af et udfaldsrum udstyret med et. alle mulige resultater af eksperimentet

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

Uge 10 Teoretisk Statistik 1. marts 2004

Kvantitative Metoder 1 - Forår Dagens program

Statistik og Sandsynlighedsregning 2

Borel-σ-algebraen. Definition (EH 1.23)

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Lidt om fordelinger, afledt af normalfordelingen

hvor a og b er konstanter. Ved middelværdidannelse fås videre

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr)

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

3 Stokastiske variable 3.1 Diskrete variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

INSTITUT FOR MATEMATISKE FAG c

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: PQ. juli 200Z Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

Produkt og marked - matematiske og statistiske metoder

StatDataN: Middelværdi og varians

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. MI 2007 Obligatorisk opgave 4

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 16. december 2003 Kursus nr : (navn) (underskrift) (bord nr)

Statistisk model. Definition: En statistisk model består af et repræsentationsrum (X, E) og en familie P af sandsynlighedsmål

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Sandsynlighed og Statistik

Kvantitative Metoder 1 - Forår 2007

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Betingede fordelinger

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Differentialregning i R k

Løsning til eksamen 16/

Antag at. 1) f : R k R m er differentiabel i x, 2) g : R m R p er differentiabel i y = f(x), . p.1/18

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Tonelli light. Eksistensbeviset for µ ν gav målet. for G E K ved succesiv integration. Alternativ definition:

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Histogrammetoden For (x i, y i ) R 2, i = 1,..., n, ser vi på den gennemsnitlige

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Estimation. Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat.

Wigner s semi-cirkel lov

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2016 Kursus nr : (navn) (underskrift) (bord nr)

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Histogrammetoden For (x i, y i ) R 2, i = 1,..., n, ser vi på den gennemsnitlige. Histogrammetoden. Histogrammetoden.

4 Oversigt over kapitel 4

MM501 forelæsningsslides

Deskriptiv teori i flere dimensioner

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Betingede sandsynligheder Aase D. Madsen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Transformation: tætheder pår k

Hvorfor er normalfordelingen så normal?

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Den lineære normale model

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Deskriptiv teori i flere dimensioner

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Fejlstrata. Vi forestiller os at V har. 1) Et underrum L. 2) Et indre produkt, 3) En ortogonal dekomposition V = W W m

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Transkript:

Foldning af sandsnlighedsmål Lad µ og ν være to sandsnlighedsmål på (R, B). Fortolkning Lad φ : R R være φ(, ) = + for (, ) R. Lad X og Y være to reelle stokastiske variable defineret på (Ω, F, P). Definition (EH 0.) Billedmålet kaldes foldningen af µ og ν. µ ν = φ(µ ν) Lad Pr(R, B) være mængden af sandsnlighedsmål på (R, B). Som en algebraisk operation på Pr(R, B) er foldning,, kommutativ og associativ. Slide / Niels Richard Hansen MI forelæsninger 4. januar, 05 Sætning (EH 0.) Hvis X og Y er uafhængige er (X + Y )(P) = X (P) Y (P). Fordelingen af en sum af to uafhængige reelle stokastiske variable er altså foldningen af deres marginale fordelinger. Slide / Niels Richard Hansen MI forelæsninger 4. januar, 05 Foldning af tætheder Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og Korollar (EH 0.9) Hvis X og Y er uafhængige reelle stokastiske variable med P(X A) = f () d, P(Y B) = g() d A for A, B B, så har X + Y tæthed h m.h.t. m, hvor B X Γ(λ, β), Y Γ(µ, β) så er X + Y Γ(λ + µ, β). Det væsentlige: X + Y er Γ-fordelt. h() = f g() := f ( )g() d for R Ved induktion følger at hvis X i Γ(λ i, β) for i =,..., n er uafhængige, så er ( n n ) X i Γ λ i, β. i= i= Slide / Niels Richard Hansen MI forelæsninger 4. januar, 05 Slide 4/ Niels Richard Hansen MI forelæsninger 4. januar, 05

Betingning med en uafhængig variabel Sætning Hvis X er en reel stokastisk variabel med første moment og Y er en stokastisk variabel uafhængig af X, så er E(X Y ) = EX. Bevis: Observer at D σ(y ) har formen D = (Y B). Da X D er integrabel følger det af den abstrakte substitutionsformel og Fubinis sætning at X dp = B (Y )X dp = B ()d(x, Y )P(, ) D = dx (P)()dY (P)() B = EX dp. Se opgave.6 i etramaterialet. Slide 5/ Niels Richard Hansen MI forelæsninger 4. januar, 05 D Betinget varians Definition Hvis X har andet moment defineres den betingede varians Sætning Hvis X har andet moment er og V (X D) = E((X E(X D)) D). V (X D) = E(X D) ( E(X D) ) VX = E ( V (X D) ) + V ( E(X D) ). Observer at for D-målelige Y og Z med andet moment er Slide 6/ Niels Richard Hansen MI forelæsninger 4. januar, 05 V (Z + YX D) = Y V (X D) n.o. Udregninger med betinget middelværdi og varians Lad X være antallet af molekler (f.eks. et bestemt DNA fragment) i en prøve. Det er teknisk set kun muligt at tælle en stokastisk brøkdel, Y, og derfor observere Z = YX. Modelantagelser: E(X Y ) = ξ and V (X Y ) = σ. EZ = EYX = E ( E(YX Y ) ) = E ( YE(X Y ) ) = ξey n.o. VZ = E ( V (YX Y ) ) + V ( E(YX Y ) ) = E ( Y V (X Y ) ) + V ( YE(X Y ) ) = σ EY + ξ VY n.o. Betingning i den flerdimensionale normalfordeling Hvis er ( X Y ) N (( ξ µ ) ( Σ Σ, Σ Σ E(X Y ) = ξ + Σ Σ (Y µ). Se opgave.0. Et argument tilsvarende det i opgave.0 giver at V (X Y ) = Σ Σ Σ Σ. )) Slide 7/ Niels Richard Hansen MI forelæsninger 4. januar, 05 Slide 8/ Niels Richard Hansen MI forelæsninger 4. januar, 05

Normalfordelingsmodel af forurening Data En model for forureningskoncentrationen Z 0,..., Z n i ( 0, 0 ),..., ( n, n ) er givet på følgende måde: Simultanfordelingen er en normalfordeling. EZ i = µ (et baseline forureningsniveau). cov(z i, Z j ) = k(( i, i ), ( j, j )). Den. antagelse siger at kovariansen er givet som en funktion af de to positioner. Vi vil kun se på kovariansmodeller af formen for σ > 0 og ρ 0. k(( i, i ), ( j, j )) = σ ρ ( i, i ) ( j, j ) i i i Z i 0..0 5.00.00.00 0.00..0 4.00 4.00.00 89.00 5.0.0 57.00 og vi kan ud fra disse og modellen for Z(, ), Z,..., Z 5 beregne E(Z(, ) Z,..., Z 5 ). Udregningen afhænger af modelparametrene µ og ρ, men ikke af σ. Se R-kode for en implementering. Husk at = 4.6. Slide 9/ Niels Richard Hansen MI forelæsninger 4. januar, 05 Slide 0/ Niels Richard Hansen MI forelæsninger 4. januar, 05 E(Z(, ) Z,..., Z 5 ) for µ = 5 og ρ = 0. E(Z(, ) Z,..., Z 5 ) for µ = og ρ = 0. 0 0 0 0 4 4 ĉ = 0.0 ĉ = 5.6 Slide / Niels Richard Hansen MI forelæsninger 4. januar, 05 Slide / Niels Richard Hansen MI forelæsninger 4. januar, 05

E(Z(, ) Z,..., Z 5 ) for µ = 5 og ρ = 0.9 E(Z(, ) Z,..., Z 5 ) for µ = og ρ = 0.9 0 0 0 4 4 ĉ = 8. ĉ = 8.9 Slide / Niels Richard Hansen MI forelæsninger 4. januar, 05 Slide 4/ Niels Richard Hansen MI forelæsninger 4. januar, 05 Hvordan kommer vi på modellen og vælger µ og ρ? Ventetider og overlevelse Træning, hårdt arbejde, erfaring og mere hårdt arbejde. Ukendte parametre som ρ og µ kan bestemmes ved estimation fra andre datasæt og specialistviden. Men er det ikke bare en oversmart måde at lave et vægtet gennemsnit på? Det er smart at basere sine metoder på eksplicitte sandsnlighedsmodeller, der kan valideres, kritiseres og modificeres i lset af data! Og som rummer mulighed for at belse usikkerheden i konklusionerne. Tid til en begivenhed en ventetide modelleres ved en fordeling på (0, ). Hvis X er eksponentialfordelt har fordelingen af X /λ for λ > 0 tæthed f () = λe λ. Hvis λ > bliver ventetiden mindre, og hvis λ < bliver ventetiden større. Modeller for tid til død eller overlevelsestid bruges indenfor medicin, demografi og livsforsikring. Er eksponentialfordelingen en god model? Slide 5/ Niels Richard Hansen MI forelæsninger 4. januar, 05 Slide 6/ Niels Richard Hansen MI forelæsninger 4. januar, 05

Rater og intensiteter Ud af brøkdelen P(X > ) af individer, der overlever til tid, hvad er brøkdelen af individer, der dør i intervallet (, + δ]? p (δ) := P(X (, + δ]) P(X > ) = +δ f () d P(X > ). Observer at p (0) = 0 og (antag at f er kontinuert) Dvs. for δ > 0 lille er λ() := p (0) = p (δ) δλ(). f () P(X > ). Denne argumentation er baseret på frekvensfortolkningen. Slide 7/ Niels Richard Hansen MI forelæsninger 4. januar, 05 Rater og intensiteter Raten eller intensiteten for en begivenhed umiddelbart efter defineres som λ() = f () P(X > ). For eksponentialfordelingen er Dvs. P(X > ) = λe λ d = e λ. λ() = λe λ e λ = λ. For eksponentialfordelingen er raten konstant: Det faktum at vi er blevet gamle ændrer ikke vores risiko for at dø? Slide 8/ Niels Richard Hansen MI forelæsninger 4. januar, 05 Alternative overlevelsesfordelinger Opgave.5 Weibullfordelingen med formparameter c > 0 har tæthed intensitet f () = c c e c, > 0 λ() = c c. Gompertfordelingen med formparametre a > 0 og c > har tæthed f () = a log c e a c e ac, > 0 og intensitet λ() = a log c c. Vi indfører σ-algebraen D beståenden af mængderne af formen (X B) eller (X B) (X > ) for B (, ]..5 (a). D er faktisk en σ-algebra..5 (b). E(X D ) = X (X ) + ξ() (X >) n.o. hvor ξ() = P(X > ) f ()d. Begge fordelinger kan også udstres med en skalaparameter. Slide 9/ Niels Richard Hansen MI forelæsninger 4. januar, 05 Slide 0/ Niels Richard Hansen MI forelæsninger 4. januar, 05

Opgave.5.5 (c). Weibullfordelingen har tæthed f () = c c e c for > 0. Ved integration finder vi at ξ() = + e c e c d. For c = (eksponentialfordelingen) er ξ() = +. Generelt gælder der at for, så for har vi e c e c d c c ξ() for c > ξ() for c <. Slide / Niels Richard Hansen MI forelæsninger 4. januar, 05