Kvantitative Metoder 1 - Efterår Dagens program

Relaterede dokumenter
Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik og Sandsynlighedsregning 2

Elementær sandsynlighedsregning

Uge 10 Teoretisk Statistik 1. marts 2004

Elementær sandsynlighedsregning

Kvantitative Metoder 1 - Efterår Dagens program

Sandsynlighedsregning Oversigt over begreber og fordelinger

Den todimensionale normalfordeling

Kvantitative Metoder 1 - Forår Dagens program

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kvantitative Metoder 1 - Efterår Dagens program

Betingede sandsynligheder Aase D. Madsen

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Statistik og Sandsynlighedsregning 2

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Statistik og Sandsynlighedsregning 2

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

INSTITUT FOR MATEMATISKE FAG c

Højde af kvinder 2 / 18

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Kvantitative Metoder 1 - Forår 2007

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Reeksamen 2014/2015 Mål- og integralteori

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Lidt om fordelinger, afledt af normalfordelingen

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Kvantitative Metoder 1 - Efterår Dagens program

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Kvantitative Metoder 1 - Forår 2007

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative Metoder 1 - Forår Dagens program

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: PQ. juli 200Z Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Hvorfor er normalfordelingen så normal?

Løsninger til kapitel 6

Nanostatistik: Opgavebesvarelser

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Løsning til prøveeksamen 1

Produkt og marked - matematiske og statistiske metoder

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative Metoder 1 - Forår 2007

Susanne Ditlevsen Institut for Matematiske Fag susanne

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Statistiske modeller

Teoretisk Statistik, 16. februar Generel teori,repetition

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 20. december 2017 Kursus nr : (navn) (underskrift) (bord nr)

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

standard normalfordelingen på R 2.

Løsning eksamen d. 15. december 2008

Eksamen 2014/2015 Mål- og integralteori

StatDataN: Plot af data

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 17. december 2015 Kursus nr : (navn) (underskrift) (bord nr)

Tema. Dagens tema: Indfør centrale statistiske begreber.

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

3 Stokastiske variable 3.1 Diskrete variable

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 20. december 2011 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr)

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Opgaver til kapitel 3

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

MM501 forelæsningsslides

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Diverse opdateringer ved Rasmus Waagepetersen. Version 1.

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 4. juni 2013 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Transkript:

Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer af normalfordelinger Eksempel: To normalfordelte variable, simulation 1

Ligefordelinger, (fra sidst) X ligefordelt på intervallet [2, 7] Tætheden for X : f X (x) =1/5 1 {2 x 7} Vi har at: E (X) = E X 2 = Z Z xf X (x) dx = x 2 f X (x) dx = Z 7 2 Z 7 2 x 1/5dx =1/5 1/2 x 2 7 2 =4.5 x 2 1/5dx =1/5 1/3 x 3 7 2 = 335 15 = 67 3 Dermed Var (X) =E X 2 E (X) 2 = 67 3 µ 9 2 2 = 25 12 2

Resultat: V er ligefordelt på enhedsintervallet [0, 1] E (V )=1/2 og Var (V )=1/12 Z = c + dv er ligefordelt på enhedsintervallet [c, c + d] E (Z) =c + de (V )=c +1/2 d Var (Z) =d 2 Var (Z) =1/12 d 2 Fra sidst: Y = a + bx + U hvor X ligefordelt på intervallet [2, 7], ogu er ligefordelt på intervallet [ 1, 1], ogx og U er uafhængige. Den betingede fordeling af Y givet X = x : Ligefordeling på [ 1+a + bx, 1+a + bx] 3

Den standardiserede normalfordeling Normalfordelingen kaldes også den Gaussiske fordeling. Definition: Den standardiserede normalfordeling har tæthed: f (z) = 1 exp µ 12 2π z2 Den standardiserede normalfordeling har fordelingsfunktion: Z z 1 Φ (z) = exp µ 12 2π u2 du Se Tabel over Φ ( ) i bogen side 652-653. 4

Figur 1: Tætheden for en standardiseret normalfordeling 5

Figur 2: Fordelingsfunktionen for en standardiseret normalfordeling 6

Z er standardiseret normalfordelt, dette skrives Z N (0, 1) Egenskaber ved fordelingen af Z: Symmetrisk omkring 0 Middelværdi: E (Z) =0 Varians: Var (Z) =E (Z 2 )=1 Median: z 0.50 =0 10% -fraktil: z 0.10 1.282 5% -fraktil: z 0.05 1.645 2.5% -fraktil: z 0.025 1.960 0.1% -fraktil: z 0.001 3.090 Fraktiler: Se bogen side 654 7

Da fordelingen er symmetrisk gælder for z>0: P (Z z) =P (Z z) dvs. 1 Φ (z) =Φ ( z) dvs. Φ (z) =1 Φ ( z) Dermed gælder: z p = z 1 p F.eks. z 0.95 = z 0.05 =1.645 Ca. 70% af sandsynlighedsmassen ligger i intervallet [ 1, 1] Ca. 95% af sandsynlighedsmassen ligger i intervallet [ 2, 2] Næsten al sandsynlighedsmassen ligger i intervallet [ 3, 3] 8

Figur 3: Tætheden for Z N (0, 1) og 95% af sandsynlighedsmassen i midten af fordelingen 9

Normalfordelingen Kvantitative Metoder 1 - Efterår 2006 Definition: X stokastisk variabel med middelværdi μ og varians σ 2. Den standardiserede variabel Z defineres på følgende måde: Z = X μ σ Da er X normalfordelt, hvis og kun hvis, Z er standardiseret normalfordelt. En anden måde at sige dette på, er følgende: X er normalfordelt, hvis og kun hvis, X kan skrives som μ + σz hvor Z N (0, 1). X er normalfordelt med middelværdi μ og varians σ 2,detteskrivesX N (μ, σ 2 ). 10

Resultat: Tætheden for X N (μ, σ 2 ): f X (x) = Ã! 1 exp (x μ)2 2πσ 2 2σ 2 Fordelingsfunktionen for X N (μ, σ 2 ): µ x μ F X (x) =Φ σ Bevis: Der gælder: F X (x) = P (X x) =P f X (x) = F 0 X (x) µ X μ σ x μ σ µ x μ = Φ σ 11

Figur 4: Tætheden for nomalfordelinger med middelværdi 0 og varians 1 (blå), varians 0.1 (grøn), varians 3 (rød) 12

Figur 5: Fordelingsfunktionen for nomalfordelinger med middelværdi 0 og varians 1 (blå), varians 0.1 (grøn), varians 3 (rød) 13

Figur 6: Tætheden for nomalfordelinger N (0, 1) (blå), N (1, 1) (rød), N (1, 0.1) (grøn) 14

Egenskaber ved fordelingen af X: Symmetrisk omkring μ Middelværdi: E (X) =μ Varians: Var (X) =σ 2 Fordelingen er fuldstændigt beskrevet ved de to parametre μ og σ 2. μ : Position σ : Skalering Ca. 70% af sandsynlighedsmassen ligger i intervallet [μ σ, μ+ σ] Ca. 95% af sandsynlighedsmassen ligger i intervallet [μ 2σ, μ+2σ] Næsten al sandsynlighedsmassen ligger i intervallet [μ 3σ, μ +3σ] 15

Fraktiler (Se også eksempel 6.1c i bogen): z p : p te fraktil i den standardiserede normalfordeling Den p te fraktil i fordelingen af X N (μ, σ 2 ): P F X (x p ) = p dvs. P (X x p ) = p dvs. µ X μ x p μ = p dvs. σ σ µ xp μ Φ = p dvs. σ x p μ = z p dvs. σ = μ + z p σ x p 16

Sandsynligheden for at få en værdi af X der er mindre end lig med b : µ b μ P (X b) =F X (b) =Φ σ Sandsynligheden for at få en værdi af X dererstørreenda : µ a μ P (X >a)=1 P (X a) =1 F X (a) =1 Φ σ Sandsynligheden for at få en værdi af X i intervallet [a, b] : µ µ b μ a μ P (a X b) =F X (b) F X (a) =Φ Φ σ σ 17

Resultater: (i) Lad X N (μ, σ 2 ) da gælder: E (X) = μ E X 2 = Var(X)+E (X) 2 = σ 2 + μ 2 E (X μ) 3 = 0 E (X μ) 4 = 3σ 4 (ii) Lad X N (μ, σ 2 ) da er a + bx N (a + bμ, b 2 σ 2 ) (iii) X N (μ, σ 2 ) og Y N (ν,τ 2 ) og X og Y er uafhængige, da er X + Y N μ + ν,σ 2 + τ 2 (iv) X 1,..., X n er uafhængige og X i N (μ i,σ 2 i ) da er a 1 X 1 +... + a n X n N a 1 μ 1 +... + a n μ n,a 2 1σ 2 1 +... + a 2 nσ 2 n (v) X og Y er normalfordelte, da gælder X og Y er uafhængige Cov (X, Y )= 0 18

To normalfordelte variable U og V er uafhængige standardiserede normalfordelte variable. X og Y defineres på følgende måde: X = a 1 + b 1 U Y = a 2 + b 2 U + c 2 V Middelværdi og varians: μ X = E (X) =a 1 σ 2 X =Var(X) =b 2 1 μ Y = E (Y )=a 2 σ 2 Y =Var(Y )=b 2 2 + c 2 2 Kovarians: Cov (X, Y )=b 1 b 2 19

Korrelation: ρ X,Y = Cov (X, Y ) p Var (X)Var(Y ) = b 1 b 2 p b 2 1 (b 2 2 + c 2 2) = b 2 p (b 2 2 + c 2 2) Hvordan skal a 1,a 2,b 1,b 2 og c 2 vælges, hvis jeg vil have at X og Y har middelværdi 0 og varians 1 samt korrelation ρ : a 1 =0 a 2 =0 b 1 =1 b 2 = ρ c 2 = p (1 ρ 2 ) 20

Figur 7: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0 21

Figur 8: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0.3 22

Figur 9: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0.6 23

Figur 10: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0.9 24

Figur 11: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y = 0.3 25

Figur 12: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y = 0.6 26

Figur 13: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y = 0.9 27

Bemærk at Y = a 2 + b 2 b 1 (X a 1 )+c 2 V = μ Y + ρ X,Y σ Y σ X (X μ X )+ q σ 2 Y 1 ρ 2 X,Y V Den betingede fordeling af Y givet X = x : Bemærk at X og V er uafhængige. Derfor er den betingede fordeling af V givet X lig med den marginale fordeling af V. Vi har at: σ Y E (Y X = x) = μ Y + ρ X,Y (x μ σ X ) X Var (Y X = x) = σ 2 Y 1 ρ 2 X,Y 28

Hvis der er positiv korrelation mellem X og Y : E (Y X = x) ½ <E(Y ) for x<μx >E(Y ) for x>μ X Jo større korrelation (både positiv og negativ) mellem X og Y, jo mindre er variansen i den betingede fordeling af Y givet X = x. I eksemplet hvor μ X = μ Y =0og σ 2 X = σ 2 Y =1og ρ X,Y = ρ gælder der: E (Y X = x) = ρx Var (Y X = x) = 1 ρ 2 29

Figur 14: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0.3. De grønne linier er E (Y X = x) og E (Y X = x) ± 3 p Var (Y X = x) 30

Figur 15: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0.6. De grønne linier er E (Y X = x) og E (Y X = x) ± 3 p Var (Y X = x) 31

Figur 16: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y =0.9. De grønne linier er E (Y X = x) og E (Y X = x) ± 3 p Var (Y X = x) 32

Figur 17: Plot af værdier af (X, Y ) baseret på 1000 simulationer når X N (0, 1) og Y N (0, 1) og ρ X,Y = 0.9. De grønne linier er E (Y X = x) og E (Y X = x) ± 3 p Var (Y X = x) 33

Opsummering Normalfordelingen: - Tæthed og fordelingsfunktion - Grafisk illustration af tæthed - Fordelingen beskrevet middelværdi af varians - Udregning af sandsynligheder: Transformation til standardiseret normalford. Lineære transformationer af normalfordelte variable Eksempel: - Hvordan simuleres normalfordelte variable - Hvad betyder korrelation for den simultane fordeling af to normalfordelte variable 34

Næste gang Mandag gennemgåes: Afsnit 6.2-6.4 - Exponentialfordelingen - Gammafordelingen - χ 2 -fordelingen Bemærk, (overspringelser): Side 230 linie 12 til side 231 linie 5 Side 235 linie 6 til side 235 linie 23 Afsnit 6.5 Husk: - Intern kursusevaluering: Uge 42+43 - Eksamenstilmelding: Uge 41-43 35