Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Relaterede dokumenter
Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Diskrete og kontinuerte stokastiske variable

Normalfordelingen og Stikprøvefordelinger

Definition. Definitioner

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Elementær sandsynlighedsregning

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Kvantitative Metoder 1 - Forår 2007

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvantitative Metoder 1 - Efterår Dagens program

Elementær sandsynlighedsregning

Kvantitative Metoder 1 - Forår 2007

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

INSTITUT FOR MATEMATISKE FAG c

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Sandsynlighedsregning

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Produkt og marked - matematiske og statistiske metoder


Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

4 Oversigt over kapitel 4

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Produkt og marked - matematiske og statistiske metoder

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Oversigt over nyttige fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Kvantitative Metoder 1 - Forår 2007

Note om Monte Carlo metoden

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Kapitel 4 Sandsynlighed og statistiske modeller

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Uge 10 Teoretisk Statistik 1. marts 2004

StatDataN: Middelværdi og varians

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Teoretisk Statistik, 16. februar Generel teori,repetition

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Hvorfor er det lige at vi skal lære det her?

Diskrete fordelinger. Fire vigtige diskrete fordelinger: 1. Uniform fordeling (diskret) 2. Binomial fordeling. 3. Hyper-geometrisk fordeling

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Karakteristiske funktioner og Den Centrale Grænseværdisætning

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

MM501 forelæsningsslides

Kapitel 4 Sandsynlighed og statistiske modeller

Tema. Dagens tema: Indfør centrale statistiske begreber.

Vejledende løsninger til opgaver i kapitel 6

Højde af kvinder 2 / 18

Løsning til eksaminen d. 14. december 2009

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Statistiske modeller

Kvantitative Metoder 1 - Forår Dagens program

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Hvad skal vi lave i dag?

Sandsynlighedsregning Oversigt over begreber og fordelinger

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Konfidensintervaller og Hypotesetest

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr)

Hvorfor er normalfordelingen så normal?

Løsning til eksaminen d. 29. maj 2009

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

MM501/MM503 forelæsningsslides

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Kvantitative Metoder 1 - Forår Dagens program

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Kvantitative Metoder 1 - Forår Dagens program

4 Sandsynlighedsfordelinger og approksimationer

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg.

02402 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel 4

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2016 Kursus nr : (navn) (underskrift) (bord nr)

Løsning til eksamen 16/

Transkript:

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) + P( A B ) P( B ) B) Stokastisk variabel diskret: Endeligt antal værdier Sandsynlighedsfordeling: Tabel med ssh. for hvert, P(X=). Kumulativ fordelings funktion Middelværdi μ = E ( ) = P( ) F ( ) = P( X ) = P( i) i Varians σ Standard afvigelse = V μ ( X ) = E[( X ) ] = E( X ) [ E( X σ = SD ( X ) = V ( X ) )]

Bernoulli fordelingen Hvis et eksperiment består af et enkelt forsøg og forsøget enten kan være en succes eller en fiasko, så kaldes forsøget for et Bernoulli forsøg X er en Bernoulli variabel med sandsynlighedsparameter p, hvis P(X=1)=p og P(X=)=1-p. Middelværdi og varians for en Bernoulli variabel: E(X) = E(X²) = V(X) = Hvis for eksempel p=,7: E(X)= V(X)=

Lidt mere repetition Lad X 1, X,, X n være uafhængige Bernoulli variable, alle med samme sandsynlighedsparameter p. S= X 1 +X + +X n er summen af stok. var. E(S) = E(X 1 +X + +X n ) = V(S) = V(X 1 +X + +X n ) =

Binomial fordeling Binomial fordelingen er resultatet af et Binomialt eksperiment: Det Binomiale eksperiment består af et fast antal (n) Bernoulli forsøg. Så i hvert forsøg er der to mulige udfald, succes og fiasko. P( succes )=p, dvs. sandsynligheden for success er den samme i hvert hvert forsøg. (Ligeledes for P( fiasko )=1-p=q) Forsøgene er uafhængige

Binomial fordeling - Eksempler Eksempler: Kast med en mønt n gange. S=(krone (succes), plat (fiasko)). Hvis fair mønt p=,5. Sandsynligheden er konstant og forsøgene er uafhængige, da et møntkasts udfald ikke påvirker udfaldet af det næste kast Træk et kort n gange. S=( spar (succes), andet (fiasko) ). P(spar)=,5 er konstant, hvis vi lægger kortet tilbage i bunken igen, ellers ikke. Uafhængige. Bemærk! Uden tilbagelægning vil P(nummer spar, hvis nummer 1 er en spar)= 1/51 og dermed ikke konstant sandsynlighed

Binomial eksempel Kast en mønt 5 gange og lad X være antallet af krone. Der er 5 = 3 mulige sekvenser af plat og krone i udfaldsrummet. Af disse er der 1 med krone (X=): KKPPP KPKPP KPPKP KPPPK PKKPP PKPKP PKPPK PPKKP PPKPK PPPKK Sandsynligheden for hvert af disse 1 udfald er p q 3 = (1/) (1/) 3 =(1/3), så sandsynligheden for krone i 5 kast er: P(X = ) = 1 (1/3) = (1/3) =.315 Antal udfald med krone Sandsynligheden for hvert af disse udfald

Binomial-fordelingen generelt 1. Sandsynligheden for en given sekvens af succes er ud af n forsøg med sandsynlighed for succes p og sandsynlighed for fiasko q er lig med: p q (n-). Antallet af forskellige sekvenser af n forsøg, der resulterer i succes er er lig med antallet af valg af elementer ud af n elementer: n = n!!( n )! n fakultet: 5 = n! = 1 3L( n 1) n! = 1 5!!(5 )! 1 3 4 5 = 1 1 3 = 1 1 = 1

Binomial-fordelingen Binomial sandsynligheds fordeling: n P( ) = p q ( n ) n! = p!( n )! q ( n ) hvor : p er sandsynligheden for succes i et enkelt forsøg, q = 1-p, n er antallet af forsøg, og er antallet af succeser. n = Egenskab: P( ) = 1 Notation: X ~ B( n, p)

Formen på Binomial fordelingen p =.1 p =.3 p =.5 Binomial Probability: n=4p=.1 Binomial Probability: n=4p=.3 Binomial Probability: n=4p=.5.7.7.7.6.6.6 n = 4 P().5.4.3 P().5.4.3 P().5.4.3....1.1.1. 1 3 4. 1 3 4. 1 3 4 Binomial Probability: n=1 p=.1 Binomial Probability: n=1 p=.3 Binomial Probability: n=1 p=.5 5. 5. 5. n = 1 P() 4. 3.. P() 4. 3.. P() 4. 3.. 1. 1. 1.. 1 3 4 5 6 7 8 9 1. 1 3 4 5 6 7 8 9 1. 1 3 4 5 6 7 8 9 1 Binomial Probability: n= p=.1 Binomial Probability: n= p=.3 Binomial Probability: n= p=.5 n = P()..1 P()..1 P()..1. 1 3 4 5 6 7 8 9 111113141516171819. 1 3 4 5 6 7 8 9 111113141516171819. 1 3 4 5 6 7 8 9 111113141516171819 Binomial fordelingen bliver mere symmetrisk når n øges og p.5.

Middelværdi, varians og standardafvigelse af en Binomial fordeling Antag X~B(n,p) Middelværdi μ = E ( X ) = Varians σ = SD(X)= Standardafvigelse σ = V ( X ) = npq np npq Eksempel: K tæller antallet af kroner i 5 kast (n=5) med en fair mønt (p=,5): μ σ σ K K K = E( K) = = V ( K) = SD( K) = (5)(.5) 1.5 =.5 = (5)(.5)(.5) = 1.5 = 1.118

Kumulativ Binomial fordeling (Tabel 1, Appendiks C) n=5 p.1.5.1..3.4.5.6.7.8.9.95.99.951.774.59.38.168.78.31.1..... 1.999.977.919.737.58.337.187.87.31.7... 1..999.991.94.837.683.5.317.163.58.9.1. 3 1. 1. 1..993.969.913.813.663.47.63.81.3.1 4 1. 1. 1. 1..998.99.969.9.83.67.41.6.49 Binomial kumulativ fordeling F(k) og sandsynligheds fordeling P(k) for K, antallet af krone i 5 kast med en fair mønt. k F(k) P(k).31.31 1.187.156.5.313 3.813.313 4.969.156 5 1..31 1. Individuelle sandsynligheder fra kumulative sandsynligheder F( ) = P(3) = P( X ) = allei Eksempel: n=5 p=.5 P() = F() - F(-1 ) P( i)

Binomial sandsynligheder - eksempel 6% af af SparNord aktierne ejes af af mig ;-). ;-). En En stikprøve på på15 aktier vælges. Hvad er er sandsynligheden for for at at højst 3 af af dem ejes af af mig? n=15 p.5.6.7... 1....4.. 3.18.. 4.59.9.1............ F ( ) F (3) = P( X ) = i P( i) = P( X 3) =.

Andre diskrete fordelinger Binomial: X=Antal succeser i n forsøg. P( succes )=p fast. Negativ Binomial X=Antal forsøg inden man har n succeser. Hypergeometrisk X=Antal gode blandt n valgte, når der totalt er N at vælge imellem, hvoraf S er gode. Poisson Typisk antal hændelser i et givet tidsrum, f antal uheld.

Diskrete og kontinuerte stokastiske Diskret stokastisk variabel: Tæller hændelser Har et tællelig antal af mulige værdier Har diskrete hop mellem efterfølgende værdier Har målelige sandsynligheder for hver enkelt værdi Sandsynlighed er højde En kontinuert stokastisk variabel: Måler (højde, vægt, hastighed, løn) Har et uendelig antal af mulige værdier Går kontinuert fra værdi til værdi Har ingen målelig sandsynlighed til hver individuel værdi Sandsynlighed er areal For eksempel: Binomial n=3 p=.5 P().15 1.375.375 3.15 1. P().4.3..1. Binomial: n=3 p=.5 1 3 For eksempel: Det skraverede område angiver sandsynligheden for mellem og 3 minutter. P().3..1. Minutes to Complete Task 1 3 4 5 6 Minutes

Kontinuert fordeling Halv-Minut Intervaller Kvart-Minut Intervaller Minutes to Complete Task: By Half-Minutes Minutes to Complete Task: Fourths of a Minute.15 P().1.5 P()... 1. 1.5..5 3. 3.5 4. 4.5 5. 5.5 6. 6.5 1 3 4 5 6 7 Minutes Minutes Ottendedel-Minut Intervaller Minutes to Complete Task: Eighths of aminute Uendelig små intervaller Tæthedsfunktion P() f(z) 1 3 4 5 6 7 Minutes 1 3 Minutes 4 5 6 7

Kontinuerte stokastiske variable tæthedsfunktion og fordelingsfunktion Svarer til sandsynligheds fordeling for diskrete variable For en tæthedsfunktion f() defineret på intervallet fra a til b gælder at: f() for alle mellem a og b Det totale areal under kurven mellem a og b er 1. Sandsynligheden for at ligger i et giver interval (indehold i intervallet fra a til b) er arealet under kurven for dette interval. Den kumulative fordelingsfunktion F() er givet som: F()=P(X ) = arealet under f() mellem den mindste mulige værdi af (typisk minus uendelig) og.

Tæthedsfunktion og fordelingsfunktion F() f() b a F(b) F(a) 1 b a = = b a d f a F b F b X a P ) ( ) ( ) ( ) ( = = = b a d f F(b)-F(a) b a f() b X a P ) ( og mellem under Arealet ) ( NB: P(X=)=F()-F()=

Integrationsbonusslide! Stok. Var: Regel Regel Middelværdi: E(X ) Varians: Diskret Kontinuert P( ) f ( ) P( ) = 1 f ( ) d = 1 E ( X ) = P( ) E ( X ) = f ( ) d E ( X ) = P( ) E ( X ) = f ( ) d V ( X ) = E[( X μ) ] = E[ X ] E[ X ]

Uniform fordeling uniform [a,b] tæthed: f()= 1/(b a) for a b ellers E(X) = (a + b)/; V(X) = (b a) /1 Uniform [a, b] fordeling 1/(b-a) f() Hele arealet under f() = 1/(b a) * (b a) = 1. Arealet under f() fra a 1 til b 1 = P(a 1 X b 1 ) = (b 1 a 1 )/(b a) a a 1 b 1 b

Uniform fordeling uniform [,5] tæthed: f()= 1/5 for 5 ellers E(X) = ( + 5)/; V(X) = (5 ) /1 Uniform [a, b] fordeling f() Hele arealet under f() = 1/(5-) * (5 ) = 1. 1/5 1 3 5 Arealet under f() fra 1 til 3 = P(1 X 3) = (3 1)/(5 ) = /5 =,4

Eksponential-fordeling Eksponential-fordelingen Tæthedsfunktionen er givet ved: Eksponential fordeling : λ= f ( ) = λe λ for, λ > Middelværdi og standardafvigelsen er begge lige 1/λ f() 1 Den kumulative fordelingsfunktion er givet ved: F( ) = 1 e λ for. 1 Tid 3 Den eksponentiale fordeling bruges typisk som model for ventetiden mellem to hændelser, f. tiden mellem to maskinsammenbrud eller andre ulykker.

Normal-fordelingen Normal fordelingen er en vigtig fordeling, blandt andet fordi mange andre fordelingen, kan approksimeres til den. Desuden er mange teststørrelser normal-fordelte kommer senere i kurset Bland andre Carl F. Gauss (1777-1855) fandt frem til den, derfor kaldes den også den Gaussiske fordeling. Gaussfordeling Gauss...4-4 - 4 Må ikke printes ;-)

Normal fordelingen Dens kendetegn er: Klokkeformet og symmetrisk omkring dens middelværdi Middelværdi=median=mode Den er karakteriseret ved en middelværdi μ og varians σ² (eller standard afvigelse σ). Notation: X~N(μ,σ²) betyder, at X følger en normal fordeling med middelværdi μ og varians σ² Arealet under kurven indenfor zσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse. Er uanset parametre værdier, defineret for alle (dvs kan antage værdier fra minus uendelig til plus uendelig)

Tæthedsfunktionen for normal-fordelingen Tæthedsfunktionen for normal-fordelingen: f ( ) = 1 πσ e ( μ ) σ for < < f().4.3. Normal-fordelingen: μ =, σ = 1.1 hvor e =,718818K og π = 3, 1415965K. -5 5

Eksempler på normal-fordelinger μ =. μ = 1. μ =. f(x).4.3..1. Samme varians 4 4 6 f(x).8.6.4 σ =. σ =.5 σ = 1. Samme middelværdi... 4 4 6

Standard afvigelsen σ når X~N(μ,σ ) Cirka 68% af all observationer ligger indenfor en standard afvigelse fra middelværdien P( μ σ X μ + σ ) 68% Cirka 95% af alle observationer ligger indenfor to standard afvigelser fra middelværdien P( μ σ X μ + σ ) 95% Cirka 99.7% af alle observationer ligger indenfor 3 standard afvigelser fra middelværdien P( μ 3σ X μ + 3σ ) 99,7%

68% σ 95% σ 99,7% 3σ Arealet under kurven indenfor kσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse.

Sum af uafhængige normal-fordelte stokastiske variable Hvis X 1, X,, X n er uafhængige normal-fordelte stokastiske variable, så er deres sum S også normalfordelt med E(S) = E(X 1 ) + E(X ) + + E(X n ) V(S) = V(X 1 ) + V(X ) + + V(X n ) Bemærk: Det er varianserne der kan lægges sammen, ikke standard afvigelserne! Eksempel: Middelværdi Varians X 1 1 1 X X 3 3 3 S = X 1 + X + X 3. Så er E(S) = 1 + + 3 = 6 og V(S) = 1 + + 3 = 6. Standard afvigelsen af S er 6 =.45.

Linearkombinationer af uafhængige normalfordelte stokastiske variable Hvis X 1, X,, X n er uafhængige normalfordelte stokastiske variable, så vil variablen Q defineret som Q = a 1 X 1 + a X + + a n X n + b også være normal fordelt, med: E(Q) = a 1 E(X 1 ) + a E(X ) + + a n E(X n ) + b V(Q) = a 1 V(X 1 ) + a V(X ) + + a n V(X n ) Bemærk igen, at det er varianserne, der summeres og ikke standard afvigelserne.

Eksempel Eksempel 4.3: Lad X 1, X, X 3 og X 4 være uafhængige normal fordelte stokastiske variable med middelværdi og varians givet som i tabellen. Find middelværdien og variansen af Q = X 1 -X + 3X -4X 4 + 5 Mean Variance X 1 1 4 X -5 X 3 8 5 X 4 1 1 E(Q) = 1 (-5) + 3(8) 4(1) + 5 = 11 V(Q) = 4 + (-) () + 3 (5) + (-4) (1) = 73 SD(Q) = 73 = 8. 544