Statistik og Sandsynlighedsregning 2

Relaterede dokumenter
Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Statistik og Sandsynlighedsregning 2

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Uge 10 Teoretisk Statistik 1. marts 2004

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Produkt og marked - matematiske og statistiske metoder

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

MM501 forelæsningsslides

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Sandsynlighedsregning Oversigt over begreber og fordelinger

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Lidt om fordelinger, afledt af normalfordelingen

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Teoretisk Statistik, 16. februar Generel teori,repetition

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

MM501/MM503 forelæsningsslides

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Elementær sandsynlighedsregning

Betingning med en uafhængig variabel

Nanostatistik: Konfidensinterval

Note om Monte Carlo metoden

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

Tema. Dagens tema: Indfør centrale statistiske begreber.

Elementær sandsynlighedsregning

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Eksamen 2014/2015 Mål- og integralteori

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Kvantitative Metoder 1 - Forår 2007

Statistiske modeller

Reeksamen 2014/2015 Mål- og integralteori

StatDataN: Plot af data

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Hvorfor er normalfordelingen så normal?

Normalfordelingen og Stikprøvefordelinger

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Integration m.h.t. mål med tæthed

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Kapitel 4 Sandsynlighed og statistiske modeller

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

4 Oversigt over kapitel 4

Statistik og Sandsynlighedsregning 2

Integration m.h.t. mål med tæthed

Kvantitative Metoder 1 - Forår Dagens program

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Betingede sandsynligheder Aase D. Madsen

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

StatDataN: Middelværdi og varians

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Opgaver til kapitel 3

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

standard normalfordelingen på R 2.

Løsning til eksamen d.27 Maj 2010

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Nanostatistik: Opgavebesvarelser

Sandsynlighedsregning

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Løsning eksamen d. 15. december 2008

Module 1: Lineære modeller og lineær algebra

Transkript:

Statistik og Sandsynlighedsregning 2 Normalfordelingen og transformation af kontinuerte fordelinger Helle Sørensen Uge 7, mandag SaSt2 (Uge 7, mandag) Normalford. og transformation 1 / 16

Program Paretofordelingen, med fokus på eksistens af middelværdi/varians Normalfordelingen: tæthed, middelværdi, varians, lineær transformation Transformationssætningen: hvis X har tæthed p, hvad er så tætheden for Y = t(x )? SaSt2 (Uge 7, mandag) Normalford. og transformation 2 / 16

Eksempel: Paretofordelingen X er paretofordelt med parameter α > 0 hvis X har tæthed p(x) = αx (α+1), x > 1 Er p en overhovedet en sandsynlighedstæthed? n 1 [ α p(x)dx = α x α] n = 1 1 n α 1, n så integralet 1 p(x)dx eksisterer og er lig 1. For hvilke værdier af α har X middelværdi? Og hvad er så EX? n 1 xp(x)dx = α α 1 ( 1 n 1 α ) α α 1, 1 α < 0 α α 1 ( 1 n 1 α ), 1 α > 0 log(n), α = 1 X har middelværdi hvis og kun hvis α > 1, og så er EX = α/(α 1). SaSt2 (Uge 7, mandag) Normalford. og transformation 3 / 16

Paretofordelingen For hvilke værdier af α har fordelingen varians? Og hvad er variansen? Pointer: På tilsvarende ses at E(X 2 ) < hvis og kun hvis α > 2, og i så fald er E(X 2 ) = α α 2 Dermed bliver Var(X ) = E(X 2 ) (EX ) 2 = α ( ) α 2 α 2 α = α 1 (α 2)(α 1) 2 Der findes altså fordelinger uden middelværdi og varians Eksistens af varians stærkere end eksistens af middelværdi Hvordan viser det sig at middelværdi og varians ikke eksisterer? SaSt2 (Uge 7, mandag) Normalford. og transformation 4 / 16

Paretofordelingen Simulationer: træk n tilfældige tal fra paretofordelingen, og beregn empirisk middelværdi (gennemsnit) og empirisk varians, se side 103: x = 1 n n i=1 x i, s 2 = 1 n 1 n i=1 (x i x) 2 x og s 2 vil stabilisere sig omkring E(X ) og Var(X ) når n vokser hvis disse størrelser eksisterer. α antal obs. x s 2 100 1.49 0.39 3.5 1000 1.42 0.38 10000 1.40 0.37 100 2988 10 8 0.5 1000 4025 10 10 10000 17040 10 12 Stabilitet omkring E(X ) = 1.4 hhv. Var(X ) = 0.37 Eksplosion! SaSt2 (Uge 7, mandag) Normalford. og transformation 5 / 16

Normalfordelingen: hvad og hvorfor? Standardnormalfordelingen eller N(0, 1) er den kontinuerte fordeling på R med tæthed φ(x) = 1 e x2 /2, x R 2π Hvorfor er den så interessant? Mange pæne matematiske egenskaber kommer os til gode både når vi laver sandsynlighedsregning og statistik Forbavsende mange data kan beskrives vha. normalfordelingen Den centrale grænseværdisætning: summer af (næsten) hvad som helst er normalfordelt, når bare der er led nok i summen Lineære normalfordelingsmodeller: passer godt til mange data; eksakte fordelingsresultater for estimatorer, teststørrelser mm. SaSt2 (Uge 7, mandag) Normalford. og transformation 6 / 16

Standard normalfordelingen Tæthed Fordelingsfunktion Density (φ) 0.0 0.1 0.2 0.3 0.4 0.90 0.05 0.05 4 2 0 2 4 z Cdf (Φ) 0.0 0.2 0.4 0.6 0.8 1.0 4 2 0 2 4 z SaSt2 (Uge 7, mandag) Normalford. og transformation 7 / 16

Carl Friedriech Gauss, 1777 1855 SaSt2 (Uge 7, mandag) Normalford. og transformation 8 / 16

Normalfordelingen Husk: φ(x) = 1 2π e x2 /2, x R Er φ overhovedet en tæthed? φ ikke-negativ Er φ integrabel på (, )? Er integralet lig 1? Se opgave 6.1 i uge 8. Momenter: E( X k < for alle k N da K findes så x k e x2 /2 < Ke x2 /4, x R Hvad er middelværdien, E(X )? Hvad er variansen, Var(X )? E(X 3 ) = 0 og E(X 4 ) = 3: opgave 5.12 på onsdag SaSt2 (Uge 7, mandag) Normalford. og transformation 9 / 16

Fordelingsfunktion Fordelingsfunktionen kaldes Φ: x x Φ(x) = φ(y)dy = φ(y)dy Der findes ikke noget eksplicit udtryk for Φ. Funktionsværdier beregnes vha. computer, lommeregner eller slås op i tabeller. SaSt2 (Uge 7, mandag) Normalford. og transformation 10 / 16

Lineær transformation af standard normalfordelt X Antag at X er N(0,1)-fordelt, og definer Y = µ + σx Så er E(Y ) = µ + σe(x ) = µ, Var(Y ) = σ 2 Var(X ) = σ 2, sd(y ) = σ og vi siger at Y er normalfordelt med middelværdi µ og varians σ 2. Fordelingsfunktion for Y? Tæthed for Y? SaSt2 (Uge 7, mandag) Normalford. og transformation 11 / 16

Transformation af kontinuerte fordelinger Lige før: Hvis X er normalf. N(0,1), så er Y = µ + σx normalf. N(µ,σ 2 ). Mere generelt: Hvis X er kontinuert med tæthed p og t er så pæn at Y = t(x ) er kontinuert, hvad er så tætheden for Y? Løst argument: Husk følgende fortolkning af tætheden p for h lille: P(X [x,x + h]) p(x)h Ønsker en tilsvarende fortolkning for Y s tæthed q for δ lille: t(x + h) t(x) + t (x)h P(Y [y,y + δ]) q(y)δ Regn på P(Y [y,y + δ]) med y = t(x), δ = t (x)h og t voksende SaSt2 (Uge 7, mandag) Normalford. og transformation 12 / 16

Transformationssætningen Antagelser: 1. X koncentreret på interval I fra a til b, dvs. P(X I ) = 1. 2. X kontinuert med tæthed p der er kontinuert på (a,b). 3. t : I R kontinuert. Så er J = t(i ) et interval fra v = inf J til h = supj og Y = t(x ) er koncentreret på (v,h). 4. t kontinuert differentiabel med t (x) 0 for alle x (a,b). Så er t strengt monoton og desuden eksisterer den inverse t 1 : J I. Sætning 5.4.1 Y = t(x ) er kontinuert med tæthed q givet ved { p(t q(y) = 1 (y))/ t (t 1 (y)) y (v,h) 0 ellers NB. d dy t 1 (y) = 1/t (t 1 (y)), så q(y) = p(t 1 (y)) d dy t 1 (y) på (v,h) SaSt2 (Uge 7, mandag) Normalford. og transformation 13 / 16

Bevis Regn på Y s fordelingsfunktion F Y Argumentér for at F Y er kontinuert differentiabel på (v,h) Brug sætning 5.1.6 og slut at Y er kontinuert med tæthed F Y Regn på F Y. SaSt2 (Uge 7, mandag) Normalford. og transformation 14 / 16

Eksempler 1. X eksponentialfordelt med parameter 1. Definer Y = X 2. Er antagelserne opfyldt? Hvad er tætheden for Y? 2. X har tæthed p. Definer Y = a + bx for b 0. t(x) = a + bx opfylder betingelserne da t (x) = b 0. Invers funktion t 1 (y) = (y a)/b med afledet 1/b. Tætheden for Y : q(y) = 1 ( ) y a b p b SaSt2 (Uge 7, mandag) Normalford. og transformation 15 / 16

Resume Vigtige ting fra i dag: Normalfordelingenen: tæthed, fordelingsfunktion, middelværdi, varians, sammenhæng mellem N(0,1) og N(µ,σ 2 ). Transformationssætningen: I skal kunne bruge den! På onsdag: Lidt om fraktiler i normalfordelingen, bla. beregning i R Eksempel på at normalfordelingen kan være nyttig selvom data er meget langt fra at være normalfordelte Lidt mere om transformation Flerdimensionale kontinuerte fordelinger SaSt2 (Uge 7, mandag) Normalford. og transformation 16 / 16