Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Relaterede dokumenter
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Normalfordelingen og Stikprøvefordelinger

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Kvantitative Metoder 1 - Forår Dagens program

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kvantitative Metoder 1 - Efterår Dagens program

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Definition. Definitioner

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning

4 Oversigt over kapitel 4

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Kvantitative Metoder 1 - Forår Dagens program

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

INSTITUT FOR MATEMATISKE FAG c

Hvorfor er det lige at vi skal lære det her?

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Sandsynlighedsregning Oversigt over begreber og fordelinger

Statistik og Sandsynlighedsregning 2

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Statistiske modeller

Kvantitative Metoder 1 - Forår Dagens program

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Note om Monte Carlo metoden

Sandsynlighedsregning Stokastisk variabel

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

3 Stokastiske variable 3.1 Diskrete variable

Kvantitative Metoder 1 - Efterår Dagens program

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

StatDataN: Middelværdi og varians

Kvantitative Metoder 1 - Forår 2007

Lidt om fordelinger, afledt af normalfordelingen

Tema. Dagens tema: Indfør centrale statistiske begreber.

Kvantitative Metoder 1 - Forår 2007

Statistik og Sandsynlighedsregning 2

Produkt og marked - matematiske og statistiske metoder

Repetition Stokastisk variabel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Kvantitative Metoder 1 - Forår Dagens program

Løsning eksamen d. 15. december 2008

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Statistik og Sandsynlighedsregning 2

Løsning til eksaminen d. 14. december 2009

Kvantitative Metoder 1 - Efterår Dagens program

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Uge 10 Teoretisk Statistik 1. marts 2004

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

MM501 forelæsningsslides

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Teoretisk Statistik, 16. februar Generel teori,repetition

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Betingede sandsynligheder Aase D. Madsen

Opgaver i sandsynlighedsregning

Kapitel 4 Sandsynlighed og statistiske modeller

Konfidensintervaller og Hypotesetest

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Diverse opdateringer ved Rasmus Waagepetersen. Version 1.

Kvantitative Metoder 1 - Efterår Dagens program

MM501/MM503 forelæsningsslides

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Den todimensionale normalfordeling

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsregning

Højde af kvinder 2 / 18

Almindelige kontinuerte fordelinger

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr)

Transkript:

Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager værdier på R. Diskret stokastisk variabel: Tælleligt antal værdier Sandsynlighedsfordeling: Tabel med ssh. for hvert, P( P( 0. Kumulativ fordelingsfunktion Middelværdi µ ( P( Varians σ Standard afvigelse E V µ F ( P( P( i ( E[( ] E( [ E( σ SD ( V ( ] i Lineær transformation: E [ a b] ae[ ] b V [ a b] a V[ ]

Middelværdi for Lineær transformation: Bevis E[ a b] ( a b P( ( ap( bp( ap ( bp( a ae P [ ] b ( b P(

Varians for Lineær transformation: Bevis V[ a b] E [(( a b E[ a b] ] E [(( a b ( ae[ ] b ] E [( a ae[ ] ] E [( a( E[ ] ] [ ( E[ ] ] E a a V [ ]

Simultan Sandsynlighedsfordeling Definition: Hvis og Y er to diskrete stokastiske variable, så er P(,y P(,Yy en simultan sandsynlighedsfunktion for og Y, hvis 1.. P(, y 0 for P(, y 1 alle og y (joint probability function P( y alle værdier Definition: Den Marginale sandsynlighedsfordeling for hhv. og Y er P( P( P(, y P( y alle y alle af P(, y og y.

Eksempel: Alder og Salg Sammenhæng mellem aldersgruppe ( og købsmønster (Y: Aldergruppe ( Marginale fordeling af Y Købsmønster (Y 1 (16 til 5 (6 til 45 3 (46 til 65 P(y 1 (køb 0.10 0.0 0.10 0.40 (ej køb 0.5 0.5 0.10 0.60 P( 0.35 0.45 0.0 1.00 Marginale fordeling af

Betinget Sandsynligheder for SV For to diskrete stokastiske variable er den betingede sandsynligheden for givet Yy givet ved P ( Y y P(, y P( y Eksempel: Betingede sandsynlighed for køb (Eksempel: Betingede sandsynlighed for køb (Y1 givet kunde i aldergruppen 6 til 45 (. Svar: P(,Y1 P(,1 0.0 og P( 0.45 0.0 P( Y 1 0.44 0.45

Uafhængighed Definition: To diskrete stokastiske variable og Y er uafhængige hvis og kun hvis P (, y P( P( y for alle og y, hvor P( og P(y er de marginale sandsynligheds-funktioner. Eksempel: Er aldersgruppe og købsmønster uafhængige? Svar: P( 3 P( Y 0.0 0.60 0.1 0.10 P( 3, Y Dvs. der er ikke uafhængighed.

Kovarians stokastisk variabel med forventet værdi μ Y stokastisk variabel med forventet værdi μ Y Kovariansen mellem og Y er givet ved [( µ ( Y ] Cov (, Y E µ Y Bemærk: Hvis og Y er uafhængige så er Cov(,Y 0. Hvis og Y har diskrete stokastiske variable med simultan sandsynlighedsfunktion P(,y, så er kovariansen givet ved Cov(, Y ( µ ( y µ P(, y y Y

Middelværdi og Varians for Par af Stokastiske Variable Lad være SV med forventet værdi µ og varians σ Lad Y være SV med forventet værdi µ Y og varians σ Y Da gælder Eksempler: E V [ a by c] aµ bµ c E[ Y ] µ µ Y E[ Y ] µ - µ Y Y [ ] a by c a σ b σ abcov(, Y V V Y [ Y ] σ σ Y Cov(, Y [ Y ] σ σ Cov(, Y Y

Regneregler for middelværdi og varians ( ( ( ( ( ( ( ( 1 1 1 1 1 1 k k k k k k E a E a E a a a a E E E E E Middelværdien af en linearkombination af stokastiske variable 1,,, k. ( ( ( ( ( ( ( ( 1 1 1 1 1 1 k k k k k k V a V a V a a a a V V V V V Hvis 1,,, k er indbyrdes uafhængige, så: Disse regler gælder for både diskrete og kontinuerte stokastiske variable

Bernoulli fordelingen Hvis et eksperiment består af et enkelt forsøg og forsøget enten kan være en succes eller en fiasko, så kaldes forsøget for et Bernoulli forsøg En binær stokastisk variabel er en Bernoulli variabel med sandsynligheds-parameter p, hvis P(Succes P(1 p og P(Fiasko P(0 1-p. Middelværdi og varians for en Bernoulli variabel: E( E( V( Hvis for eksempel p 0,7: E( V(

Mange forsøg Lad 1,,, n være n uafhængige Bernoulli variable, alle med samme sandsynligheds-parameter p. Husk: E( i p og V( i p(1-p Definer: 1 n ( Antal successer Da gælder ~ B(n,p ( følger en binomial fordeling Middelværdi og varians for E( E( 1 n V( V( 1 n

Diskrete og kontinuerte stokastiske Diskret stokastisk variabel: Tæller hændelser Har et tællelig antal af mulige værdier Har diskrete hop mellem efterfølgende værdier Har målelige sandsynligheder for hver enkelt værdi Sandsynlighed er højde For eksempel: Binomial n3 p.5 P( 0 0.15 1 0.375 0.375 3 0.15 1.000 En kontinuert stokastisk variabel: Måler (højde, vægt, hastighed, løn Har et uendelig antal af mulige værdier Går kontinuert fra værdi til værdi Har ingen målelig sandsynlighed til hver individuel værdi Sandsynlighed er areal For eksempel: Det skraverede område angiver sandsynligheden for mellem og 3 minutter.

Kontinuert Stokastisk Variabel og Sandsynlighedstæthedsfunktion Tæthedsfunktionen f( Arealet under kurven f( er 1 Sandsynligheden for mindre end 3 er det røde areal

Kontinuert Stokastisk Variabel og Sandsynlighedstæthedsfunktion Definition: Lad R være en kontinuert stokastisk variabel. f( er (sandsynlighedstæthedsfunktionen for hvis f ( 0 for alle Dvs. kurven f( er aldring under -aksen f ( d 1 Dvs. arealet under kurven f( er 1 a P ( a f ( d Dvs. sandsynligheden for er mindre end a svarer til arealet under kurven til venstre for a

Tæthedsfunktion og Kumulerede Fordelingsfunktion P( 3 f ( d P( 3 P( F(3 F( P( 0 3 F(3 F( Kumulerede fordelingsfunktion: F ( P( f ( t dt Bemærk: F( 0, når - F( 1, når

Middelværdi og Varians Stok. Var: Diskret Kontinuert Regel Regel Middelværdi: E[ h( ] E[ ] Varians: P( V 0 P( 1 f ( d 1 ( E[( ] E[ ] E[ µ f ( 0 E ( P( E ( f ( d E ( h( h( P( E ( h( h( f ( d E ( P( E ( f ( d ] Bemærk: Integralerne kan typisk ikke udregnes.

Flere Regneregler Regneregler for middelværdi og varians er præcist som for diskrete stokastiske variable. Antag at er en kontinuert stokastisk variabel med middelværdi µ og varians σ. Da gælder E [ a b] ae[ ] b aµ b [ a b] a V[ ] aσ V Eksempel: Standardisering: µ E µ V σ σ

Uniform fordeling uniform [a,b] tæthed: f( 1/(b a for a b 0 ellers E( (a b/; V( (b a /1 Uniform [a, b] fordeling 1/(b-a f( Hele arealet under f( 1/(b a * (b a 1.00 Arealet under f( fra a 1 til b 1 P(a 1 b 1 (b 1 a 1 /(b a a a 1 b 1 b

Uniform fordeling - Eksempel uniform [0,5] tæthed: f( 1/5 for 0 5 0 ellers E( (0 5/; V( (5 0 /1 Uniform [a, b] fordeling f( Hele arealet under f( 1/(5-0 * (5 0 1.00 1/5 Arealet under f( fra 1 til 3 P(1 3 (3 1/(5 0 /5 0,4 0 1 3 5

Normal-fordelingen Normal-fordelingen er en vigtig fordeling, blandt andet fordi mange andre fordelingen, kan approksimeres til den. Desuden er mange teststørrelser normal-fordelte kommer senere i kurset Bland andre Carl F. Gauss (1777-1855 fandt frem til den, derfor kaldes den også den Gaussiske fordeling. Gaussfordeling Gauss 0.0 0. 0.4-4 - 0 4 Må ikke printes ;-

Normalfordelingen Dens kendetegn er: Klokkeformet og symmetrisk omkring dens middelværdi Middelværdi median toppunkt Den er karakteriseret ved en middelværdi µ og varians σ (eller standardafvigelsen σ. Notation: ~N(µ,σ betyder, at følger en normal fordeling med middelværdi μ og varians σ² Arealet under kurven indenfor zσ af middelværdien, er den samme for enhver normal fordeling - uanset middelværdi og standardafvigelse. Er uanset parametre værdier, defineret for alle (dvs kan antage værdier fra minus uendelig til plus uendelig

Tæthedsfunktionen for normal-fordelingen Tæthedsfunktionen for normal-fordelingen: f ( 1 πσ e ( µ σ for < < f ( 0. 4 0. 3 0. N o r m al-fordelingen : µ 0, σ 1 0. 1 hvor e,718818 og π 3, 1415965 0. 0-5 0 5

Eksempler på normal-fordelinger μ 0.0 μ 1.0 μ.0 Samme varians σ.0 σ 0.5 σ 1.0 Samme middelværdi.

Standardafvigelsen σ når ~N(μ,σ Cirka 68% af all observationer ligger indenfor en standard afvigelse fra middelværdien P( µ σ µ σ 68% Cirka 95% af alle observationer ligger indenfor to standard afvigelser fra middelværdien P( µ σ µ σ 95% Cirka 99.7% af alle observationer ligger indenfor 3 standard afvigelser fra middelværdien P( µ 3σ µ 3σ 99,7%

68% σ 95% σ 99,7% 3σ Arealet under kurven indenfor kσ af middelværdien, er den samme for enhver normal fordeling, uanset middelværdi og standard afvigelse.

Standard normalfordelingen Standard normalfordelingen, er normalfordelingen med middelværdi μ 0 og standard afvigelse σ 1, Z~N(0,1² 0. 4 Standard Normalfordeling f ( z 0. 3 0. σ1 { 0. 1 0. 0-5 - 4-3 - - 1 0 µ 0 Z 1 3 4 5 NB: En standard normalfordelt stokastisk variabel betegnes sædvanligvis Z.

Tabellen F(1.1 P(Z 1.1 F(z P(Z z Den kumulative fordelingsfunktion F( for standard normal fordelingen er tabellagt i Tabel 1 i Appendikset, side 837 for positive værdier af. Figuren viser P(Z 1.1 F(1.1

Find P(Z < 1.1 vha. Tabelopslag P(Z 1.1 F(1.1 0.8869 88,69% Bemærk: Standard normalfordelingen Er kun tabellagt for z 0.00 til 3.99. Tilsvarende tabelopslag i R: > pnorm(1.1 [1] 0.8868606

Find P(Z < -1.76 P(Z -1.76 P(Z 1.76 P(Z 1.76 P(Z 1.76 Vi kan ikke slå F(-1.76 op i tabellen Da standard normalfordelingen er symmetrisk omkring nul: P( Z 1.76 P( Z 1.76 Vi har også: P( Z 1.76 1 P( Z 1.76 1 F(1.76 1 0.9608 0.039 Dvs. P( Z 1.76 3.9% Tabelopslag

Find P(1 Z Der gælder P(Z P(1 Z P(1 Z P( Z F( F(1 P( Z 1 0.977 0.8413 0.1359 P(Z

Transformation til Standardnormal En lineær transformation af normalfordelt stokastisk variabel er stadig en normalfordelt stokastisk variabel. Lad ~N(µ,σ og definer Y a b, så gælder E[Y] ae[] b aµ b V[Y] a V[] a σ Y ~ N(aµ b, a σ Lad ~N(µ,σ og definer Z, så gælder σ E[Z] 0 V[Z] 1 Z ~ N(0,1 µ

Transformation: Eksempel Antag studerendes score til eksamen er normalfordelt med middelværdi 60 og standardafvigelse 15. Dvs. score ~ N(60,15 Spørgsmål: Hvor stor en andel af de studerende har en score under 95? P( 95? Ide: Transformer problemet til et, der vedrører en standard normal-fordelt stokastisk variabel. µ 95 µ 95 60 P( 95 P P Z σ σ 15 95 60 P Z P( Z.33 F(.33 0.9901 15 Dvs. 99.01% af de studerende har en score under 95.

Kumulative fordeling i R For dem der foretrækker kommando-linjen i R Antag ~ N(,3 Vi kan finde den kumulerede sandsynlighed F(7 P( 7 vha. kommandoen pnorm(7,mean,sd3 R har en standard rækkefølge til parametre, så man kan nøjes med at skrive pnorm(7,,3 Bemærk: Det er standardafvigelsen ikke variansen!