Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Relaterede dokumenter
enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Uge 10 Teoretisk Statistik 1. marts 2004

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Kvantitative Metoder 1 - Forår Dagens program

4 Oversigt over kapitel 4

Elementær sandsynlighedsregning

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Elementær sandsynlighedsregning

Normalfordelingen og Stikprøvefordelinger

Teoretisk Statistik, 16. februar Generel teori,repetition

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

3 Stokastiske variable 3.1 Diskrete variable

Kvantitative Metoder 1 - Forår 2007

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Produkt og marked - matematiske og statistiske metoder

Statistik og Sandsynlighedsregning 2

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

MM501 forelæsningsslides

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Statistiske modeller

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Lidt om fordelinger, afledt af normalfordelingen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Kvantitative Metoder 1 - Forår Dagens program

Løsning eksamen d. 15. december 2008

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 16. december 2003 Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative Metoder 1 - Efterår Dagens program

StatDataN: Middelværdi og varians

Statistik og Sandsynlighedsregning 2

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

MM501/MM503 forelæsningsslides

Eksempel I. Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ =2minutter.

Kvantitative Metoder 1 - Efterår Dagens program

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Kvantitative Metoder 1 - Forår Dagens program

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik og Sandsynlighedsregning 2

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

INSTITUT FOR MATEMATISKE FAG c

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Almindelige kontinuerte fordelinger

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

Løsning til prøveeksamen 1

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Forelæsning 11: Envejs variansanalyse, ANOVA

Statistik og Sandsynlighedsregning 2

Definition. Definitioner

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: PQ. juli 200Z Kursus nr : (navn) (underskrift) (bord nr)

Løsning til eksamen 16/

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Sandsynlighedsregning Oversigt over begreber og fordelinger

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 17. december 2015 Kursus nr : (navn) (underskrift) (bord nr)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Løsning til eksaminen d. 14. december 2009

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Transkript:

Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår 2017 DTU Compute Introduktion til Statistik Efterår 2017 1 / 53

Kapitel 2: Kontinuerte fordelinger Grundlæggende koncepter: Tæthedsfunktion: f (x) (pdf) Fordelingsfunktion: F(x) = P(X x) (cdf) Middelværdi (µ) og varians (σ 2 ) Regneregler for stokastiske variabler Specifikke fordelinger: Normal Log-Normal Uniform Eksponential Funktioner af normalfordeling (afsn. 2.10) (introduceres først i de næste uger): t-fordelingen, χ 2 -fordelingen (Chi-i-anden) og F-fordelingen DTU Compute Introduktion til Statistik Efterår 2017 2 / 53

Chapter 2: Continuous Distributions General concepts: Density function: f (x) (pdf) Distribution: F(x) = P(X x) (cdf) Mean (µ) and variance (σ 2 ) Calculation rules for random variables Specific distributions: Normal Log-Normal Uniform Exponential Funktions of normaldist. (Sec. 2.10) (introduced in the coming weeks): t-distribution, χ 2 -distribution (Chi-square) og F-distribution DTU Compute Introduktion til Statistik Efterår 2017 3 / 53

Oversigt 1 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel 2 Konkrete Statistiske fordelinger Kontinuerte fordelinger i R Uniform fordeling Normalfordelingen Log-Normal fordelingen 3 Eksponentialfordelingen 4 Regneregler for middelværdi og varians DTU Compute Introduktion til Statistik Efterår 2017 4 / 53

Eksempel: Population og fordeling (Uendelig) Population Stikprøve {x 1,x 2,...,x n} Tilfældigt udvalgt Middelværdi µ Statistisk inferens Stikprøvegennemsnit x Tæthed 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 Reprœsenter populationen med fordeling Frekvens 0.00 0.01 0.02 0.03 0.04 Stikprøvens empiriske fordeling 150 160 170 180 190 200 210 Højde x 150 160 170 180 190 200 210 Højde x DTU Compute Introduktion til Statistik Efterår 2017 5 / 53

Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Tæthedsfunktion (probability density function (pdf)) Tæthedsfunktionen for en stokastisk variabel betegnes ved f (x) f (x) siger noget om hyppigheden af udfaldet x for den stokastiske variabel X For kontinuerte variable svarer tætheden ikke til sandsynligheden, dvs. f (x) P(X = x) Et godt plot af f (x) er et histogram (kontinuert) DTU Compute Introduktion til Statistik Efterår 2017 7 / 53

Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Tæthedsfunktion for en kontinuert variabel f (x) 0.0 0.1 0.2 0.3 0.4 P(a < X b) -4-2 a 0 b 2 4 x DTU Compute Introduktion til Statistik Efterår 2017 8 / 53

Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Tæthedsfunktion for en kontinuert variabel Der gælder: Ingen negative værdier f (x) 0 for alle mulige x Areal under kurven er een f (x)dx = 1 DTU Compute Introduktion til Statistik Efterår 2017 9 / 53

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Fordelingsfunktion (distribution function eller cumulative density function (cdf)) Fordelingsfunktion for en kontinuert stokastisk variabel betegnes ved F(x) Fordelingsfunktionen svarer til den kumulerede tæthedsfunktion ved F(x) = P(X x) x F(x) = f (u)du f (x) = F (x) DTU Compute Introduktion til Statistik Efterår 2017 10 / 53

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Fordelingsfunktion (distribution function eller cumulative density function (cdf)) F(x) 0.0 0.2 0.4 0.6 0.8 1.0 P(a < X b) = F(b) F(a) -4-2 a 0 b 2 4 x DTU Compute Introduktion til Statistik Efterår 2017 11 / 53

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Spørgsmål om sandsynligheder (socrative.com, room: PBAC) f (x) 0.0 0.1 0.2 0.3 0.4? -4-2 a 0 b 2 4 x Hvilken sandsynlighed (areal) er markeret? A: b f (x)dx Svar C: b a f (x)dx B: 1 b a f (x)dx C: b a f (x)dx D: 1 a f (x)dx DTU Compute Introduktion til Statistik Efterår 2017 12 / 53

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Spørgsmål om sandsynligheder (socrative.com, room: PBAC) f (x) 0.0 0.1 0.2 0.3 0.4? -4-2 a 0 b 2 4 x Hvordan kan vi nemmest udregne det markerede areal? A: b a f (x)dx Svar D: F(b) F(a) B: b a F(x)dx C: f (b) f (a) D: F(b) F(a) (vi gør det i R med (normalfordelt): pnorm(b) - pnorm(a)) DTU Compute Introduktion til Statistik Efterår 2017 13 / 53

Kontinuerte Stokastiske variable og fordelinger Middelværdi af en kontinuert stokastisk variabel Middelværdi (mean) af en kontinuert stokastisk variabel Middelværdien af en kontinuert stokastisk variabel µ = x f (x)dx Sammenlign med den diskrete definition: µ = alle x x f (x) DTU Compute Introduktion til Statistik Efterår 2017 14 / 53

Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Variansen af en kontinuert stokastisk variabel: σ 2 = (x µ) 2 f (x)dx Sammenlign med den diskrete definition: σ 2 = alle x (x µ) 2 f (x) DTU Compute Introduktion til Statistik Efterår 2017 15 / 53

Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel Spørgsmål om middelværdi (socrative.com, room: PBAC) f (x) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 f 1 (x) f 2 (x) -4-2 0 2 4 x Hvilken pdf har størst middelværdi (begge er symmetriske)? A: µ 1 < µ 2 B: µ 1 > µ 2 C: µ 1 = µ 2 D: Kan ikke afgøres Svar A: µ 1 < µ 2. DTU Compute Introduktion til Statistik Efterår 2017 16 / 53

Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel Spørgsmål om spredning (socrative.com, room: PBAC) f (x) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 f 1 (x) f 2 (x) -4-2 0 2 4 x Hvilken pdf har størst spredning (begge er symmetriske)? A: σ 1 < σ 2 B: σ 1 > σ 2 C: σ 1 = σ 2 D: Kan ikke afgøres Svar B: σ 1 > σ 2 (umiddelbart). Svar D, også fint, da man ikke kan se hvad der er udenfor plottet. DTU Compute Introduktion til Statistik Efterår 2017 17 / 53

Konkrete Statistiske fordelinger Konkrete statistiske fordelinger Der findes en række statistiske fordelinger, som kan bruges til at beskrive og analysere forskellige problemstillinger med Følgende kontinuerte fordelinger: Uniform fordeling Normalfordelingen Log-normalfordelingen Eksponentialfordelingen DTU Compute Introduktion til Statistik Efterår 2017 19 / 53

Konkrete Statistiske fordelinger Kontinuerte fordelinger i R Kontinuerte fordelinger i R R norm unif lnorm exp Betegnelse Normalfordelingen Uniform fordeling Log-normalfordelingen Eksponentialfordelingen d Tæthedsfunktion f (x) (probability density function). p Fordelingsfunktion F(x) (cumulative distribution function). q Fraktil (quantile) i fordeling. r Tilfældige tal fra fordelingen. DTU Compute Introduktion til Statistik Efterår 2017 20 / 53

Konkrete Statistiske fordelinger Uniform fordeling Uniform fordeling Skrivemåde: X U(α,β) (Læses: X følger en uniform fordeling med parametre α og β) Tæthedsfunktion: f (x) = 1 β α Middelværdi: µ = α+β 2 Varians: σ 2 = 12 1 (β α)2 DTU Compute Introduktion til Statistik Efterår 2017 21 / 53

Konkrete Statistiske fordelinger Uniform fordeling Eksempel: Uniform fordeling Uniform fordeling U(4,5) 1 0.8 Taethed, f(x) 0.6 0.4 0.2 0 3.5 4 4.5 5 5.5 x DTU Compute Introduktion til Statistik Efterår 2017 22 / 53

Konkrete Statistiske fordelinger Uniform fordeling Spørgsmål: Uniform fordeling (socrative.com, room: PBAC) Medarbejdere på en arbejdsplads ankommer mellem klokken 8:00 og 8:30. Det antages, at ankomsttiden kan beskrives ved en uniform fordeling. Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder ankommer mellem 8:20 og 8:30? A: 1/2 B: 1/6 C: 1/3 D: 0 Svar C: 10/30=1/3 punif(30,0,30) - punif(20,0,30) [1] 0.33 DTU Compute Introduktion til Statistik Efterår 2017 23 / 53

Konkrete Statistiske fordelinger Uniform fordeling Spørgsmål: Uniform fordeling (socrative.com, room: PBAC) Medarbejdere på en arbejdsplads ankommer mellem klokken 8:00 og 8:30. Det antages, at ankomsttiden kan beskrives ved en uniform fordeling. Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder ankommer efter 8:30? A: 1/2 B: 1/6 C: 1/3 D: 0 Svar: P(X > 30) = 0 1 - punif(30,0,30) [1] 0 DTU Compute Introduktion til Statistik Efterår 2017 24 / 53

Konkrete Statistiske fordelinger Normalfordelingen Normalfordelingen Skrivemåde: X N(µ,σ 2 ) Tæthedsfunktion: f (x) = 1 (x µ)2 σ e 2σ 2 2π Middelværdi: µ = µ Varians: σ 2 = σ 2 DTU Compute Introduktion til Statistik Efterår 2017 25 / 53

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Normalfordelingen 0.5 Normalfordeling 0.45 0.4 0.35 Taethed, f(x) 0.3 0.25 0.2 0.15 0.1 0.05 0 5 4 3 2 1 0 1 2 3 4 5 x DTU Compute Introduktion til Statistik Efterår 2017 26 / 53

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Normalfordelingen Sammenligning af to normalfordelinger med forskellig middelvardi og ens varians 0.45 N(0,1 2 ) N(5,1 2 ) 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0.05 5 0 5 10 DTU Compute Introduktion til Statistik Efterår 2017 27 / 53

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Normalfordelingen Sammenligning af tre normalfordelinger med ens middelvardi og forskellig varians 0.5 0.4 Taethed, f(x) 0.3 0.2 0.1 0 10 8 6 4 2 0 2 4 6 8 10 x DTU Compute Introduktion til Statistik Efterår 2017 28 / 53

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Normalfordeling, sandsynligheder Fordeling af vægt af rugbrød: Antag at vægten af et rugbrød fra en produktionslinie kan beskrives med en normalfordeling X N(500,10 2 ) dvs. middelværdi µ = 500 gram og standardafvigelse σ = 10 gram. Vi vil måle vægten af ét tilfældigt udvalgt brød. Spørgsmål: 1: Hvad er sandsynligheden for at brødet vejer under 490 g? 2: Hvad er sandsynligheden for at brødet vejer mere en ±20 g fra 500 g? DTU Compute Introduktion til Statistik Efterår 2017 29 / 53

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Normalfordeling, spørgsmål 1 f (x) 0.00 0.01 0.02 0.03 0.04 X N(500,10 2 ) 460 480 500 520 540 x er vægt af et rugbrød 1: Hvad er sandsynligheden for at brødet vejer under 490 g? Svar: P(X 490) = F(490) = 0.16 pnorm(490, mean=500, sd=10) DTU Compute Introduktion til Statistik Efterår 2017 30 / 53

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Normalfordeling, spørgsmål 2 f (x) 0.00 0.01 0.02 0.03 0.04 X N(500,10 2 ) 460 480 500 520 540 x er vægt af et rugbrød 1: Hvad er sandsynligheden for at brødet vejer mere end ±20 g fra 500 g? Svar: P(X 480 X > 520) = 2 P(X 480) = 2 F(480) = 0.046 2 * pnorm(480, mean=500, sd=10) DTU Compute Introduktion til Statistik Efterår 2017 31 / 53

Konkrete Statistiske fordelinger Normalfordelingen Spørgsmål: Sandsynlighed i normalfordeling f (x) 0.00 0.01 0.02 0.03 0.04 X N(500,10 2 ) 460 480 500 520 540 x er vægt af et rugbrød Hvad er sandsynligheden for at rugbrødet vejer over 510 g lig med? A: F(510) B: 1 F(490) C: 1 F(520) D: 1 F(510) Svar: P(X > 510) = 1 P(X 510) = 0.16 DTU Compute Introduktion til Statistik Efterår 2017 32 / 53

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Normalfordeling fraktiler f (x) 0.00 0.01 0.02 0.03 0.04 X N(500,10 2 ) 95%?? 460 480 500 520 540 x er vægt af et rugbrød Omvendt spørgsmål :Hvilket interval dækker 95% af rugbrødene? qnorm(c(0.025,0.975), mean=500, sd=10) [1] 480.4 519.6 DTU Compute Introduktion til Statistik Efterår 2017 33 / 53

Konkrete Statistiske fordelinger Normalfordelingen Standard normalfordelingen En standard normalfordeling Z N(0,1 2 ) En normalfordeling med middelværdi 0 og varians 1. Standardisering En vilkårlig normalfordelt variabel X N(µ,σ 2 ) kan standardiseres ved at beregne Z = X µ σ DTU Compute Introduktion til Statistik Efterår 2017 34 / 53

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Standard Normalfordeling f (x) 0.00 0.01 0.02 0.03 0.04 X N(500,10 2 ) f (z) 0.0 0.1 0.2 0.3 0.4 Z = X µ σ Z N(0,1 2 ) 460 480 500 520 540-4 -2 0 2 4 x er vægt af et rugbrød z er standardiseret vægt af et rugbrød (x-akse er i std. afvigelse) f (x) 0.00 0.01 0.02 0.03 0.04 X N(500,10 2 ) f (z) 460 DTU Compute 480 500 520 Introduktion 540 til Statistik-4-2 0 Efterår 20172 354/ 53 0.0 0.1 0.2 0.3 0.4 Z = X µ σ Z N(0,1 2 )

Konkrete Statistiske fordelinger Normalfordelingen Eksempel: Transformation til standard normalfordeling 0.0 0.1 0.2 0.3 0.4 Z = X µ σ = X 500 10 N(0,1 2 ) X N(500,10 2 ) 0 100 200 300 400 500 600 DTU Compute Introduktion til Statistik Efterår 2017 36 / 53

Konkrete Statistiske fordelinger Log-Normal fordelingen Log-Normalfordelingen Skrivemåde: X LN(α,β 2 ) (Hvis X følger log-normal så følger ln(x) normal) Tæthedsfunktion: f (x) = { 1 x 2πβ e (ln(x) α)2 /2β 2 x > 0, β > 0 0 ellers Middelværdi: µ = e α+β 2 /2 Varians: σ 2 = e 2α+β 2 (e β 2 1) DTU Compute Introduktion til Statistik Efterår 2017 37 / 53

Konkrete Statistiske fordelinger Log-Normal fordelingen Eksempel: Log-normal fordelingen 0.25 Log Normalfordeling LN(1,1) 0.2 LN(1,1) Taethed, f(x) 0.15 0.1 0.05 0 0 5 10 15 20 25 30 x DTU Compute Introduktion til Statistik Efterår 2017 38 / 53

Konkrete Statistiske fordelinger Log-Normal fordelingen Log-normal fordelingen Lognormal og Normalfordelingen: En log-normal fordelt variabel Y LN(α,β 2 ), kan transformeres til en standard normalfordelt variabel Z ved Z = ln(y) α β dvs. Z N(0,1 2 ) DTU Compute Introduktion til Statistik Efterår 2017 39 / 53

Eksponentialfordelingen Eksponentialfordelingen Skrivemåde: X Exp(λ) Tæthedsfunktionen { λe λx x > 0 f (x) = 0 ellers Middelværdi µ = 1 λ Varians σ 2 = 1 λ 2 DTU Compute Introduktion til Statistik Efterår 2017 41 / 53

Eksponentialfordelingen Eksempel: Eksponentialfordelingen Eksponential fordeling med β=1 1 0.8 EXP(1) Taethed, f(x) 0.6 0.4 0.2 0 1 0 1 2 3 4 5 6 7 8 9 10 x DTU Compute Introduktion til Statistik Efterår 2017 42 / 53

Eksponentialfordelingen Eksponentialfordelingen Eksponentialfordelingen er et special tilfælde af Gammafordelingen Eksponentialfordelingen anvendes f.eks. til at beskrive levetider og ventetider Eksponentialfordelingen kan bruges til at beskrive (vente)tiden mellem hændelser i poissonproces DTU Compute Introduktion til Statistik Efterår 2017 43 / 53

Eksponentialfordelingen Sammenhæng mellem eksponential- og poissonfordelingen Poisson: Diskrete hændelser pr. enhed Eksponential: Kontinuert afstand mellem hændelser t 1 t 2 tid t DTU Compute Introduktion til Statistik Efterår 2017 44 / 53

Eksponentialfordelingen Eksempel: Eksponentielfordeling Kø-model - poissonproces Tiden mellem kundeankomster på et posthus er eksponentialfordelt med middelværdi µ = 2 minutter. Spørgsmål: En kunde er netop ankommet. Beregn sandsynligheden for at der ikke kommer flere kunder indefor en periode på 2 minutter vha. poissonfordelingen Svar: Eksponentialfordeling: X exp Exp(λ) with λ = 1 µ = 1 2 1 min, find P(X exp > 2). Brug Poissonfordeling: λ 2min = 1, find P(X pois = 0). 1-pexp(q=2, rate=1/2); dpois(x=0, lambda=1) [1] 0.37 [1] 0.37 DTU Compute Introduktion til Statistik Efterår 2017 45 / 53

Regneregler for middelværdi og varians Regneregler for lineær funktion af et X Hvis: X er en stokastisk variabel Vi antager at a og b er konstanter Da gælder (gælder BÅDE kontinuert og diskret): Middelværdi-regel: E(aX + b) = ae(x) + b Varians-regel: V(aX + b) = a 2 V(X) DTU Compute Introduktion til Statistik Efterår 2017 47 / 53

Regneregler for middelværdi og varians Eksempel: Regneregler for lineær funktion af et X X er en stokastisk variabel En stokastisk variabel X har middelværdi 4 og varians 6. Spørgsmål: Beregn middelværdi og varians for Y = 3X + 2 Svar: E(Y) = 3E(X) + 2 = 3 4 + 2 = 10 V(Y) = ( 3) 2 V(X) = 9 6 = 54 DTU Compute Introduktion til Statistik Efterår 2017 48 / 53

Regneregler for middelværdi og varians Regneregler for lineær funktion af flere Xer Hvis: X 1,...,X n er stokastiske variable Da gælder (når de er uafhængige) (gælder BÅDE kontinuert og diskret): Middelværdi-regel: E(a 1 X 1 + a 2 X 2 +.. + a n X n ) = a 1 E(X 1 ) + a 2 E(X 2 ) +.. + a n E(X n ) Varians-regel: V(a 1 X 1 + a 2 X 2 +.. + a n X n ) = a 2 1 V(X 1) +.. + a 2 n V(X n ) DTU Compute Introduktion til Statistik Efterår 2017 49 / 53

Regneregler for middelværdi og varians Eksempel: Regneregler for lineær funktion af flere Xer Flypassager-planlægning Vægten af een passagerer på fly på en strækning antages normalfordelt X N(70,10 2 ). Et fly, der kan tage 55 passagerer, må max. lastes med 4000 kg (kun passageres vægt betragtes som last). Spørgsmål: Beregn sandsynligheden for at flyet bliver overlastet. Hvad er den samlede passagervægt Y på en afgang? A: Y = 55 X B: Y = 55 i=1 X i C: Y = 55 + X D: Ej A,B eller C Svar B: Y = 55 i=1 X i, det er summen af 55 forskellige passagerer. DTU Compute Introduktion til Statistik Efterår 2017 50 / 53

Regneregler for middelværdi og varians Eksempel: Regneregler 3 Hvad er den samlede passagervægt Y på en afgang? Y = 55 i=1 X i, hvor X i N(70,10 2 ) Middelværdi og varians for Y: E(Y) = V(Y) = 55 i=1 55 i=1 E(X i ) = V(X i ) = 55 i=1 55 i=1 70 = 55 70 = 3850 100 = 55 100 = 5500 Bruger normalfordeling for Y: 1-pnorm(4000, mean = 3850, sd = sqrt(5500)) [1] 0.022 DTU Compute Introduktion til Statistik Efterår 2017 51 / 53

Regneregler for middelværdi og varians Eksempel: Regneregler 3 - FORKERT ANALYSE Hvad er Y? I hvert fald IKKE: Y = 55 X!!!!!! Middelværdi og varians for Y: E(Y) = 55 70 = 3850 Bruger normalfordeling for Y: V(Y) = 55 2 V(X) = 55 2 100 = 550 2 = 302500 1-pnorm(4000, mean = 3850, sd = 550) [1] 0.39 Konsekvens af forkert beregning: MANGE spildte penge for flyselskabet!!! DTU Compute Introduktion til Statistik Efterår 2017 52 / 53

Regneregler for middelværdi og varians Lineær kombination af normalfordelte stokastiske variabler er også normalfordelt Lineær kombination af normalfordelte stokastiske variabler er også normalfordelt Theorem 2.40: Let X 1,...,X n be independent normal random variables, then any linear combination of X 1,...,X n will follow a normal distribution, with mean and variance given in Theorem 2.56. DTU Compute Introduktion til Statistik Efterår 2017 53 / 53