Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Relaterede dokumenter
Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Estimation ved momentmetoden. Estimation af middelværdiparameter

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

antal gange krone sker i første n kast = n

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Stikprøvefordelinger og konfidensintervaller

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Motivation. En tegning

Diskrete og kontinuerte stokastiske variable

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Hovedpointer fra SaSt

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Den flerdimensionale normalfordeling

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Konfidens intervaller

Løsninger til kapitel 7

Program. Middelværdi af Y = t(x ) Transformationssætningen

9. Binomialfordelingen

Maja Tarp AARHUS UNIVERSITET

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Generelle lineære modeller

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Opsamling. Lidt om det hele..!

Sammenligning af to grupper

Statistiske Modeller 1: Notat 1

Vejledende besvarelser til opgaver i kapitel 15

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Supplement til Kreyszig

Introduktion til Statistik

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Skitse til notat om hvor de forskellige sandsynlighedsfordelinger kan tænkes at komme fra

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Teoretisk Statistik, 9. februar Beskrivende statistik

STATISTISKE GRUNDBEGREBER

Sandsynlighedsteori 1.2 og 2 Uge 5.

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

STATISTISKE GRUNDBEGREBER

STATISTIKNOTER Simple normalfordelingsmodeller

Kvantitative metoder 2

STATISTISKE GRUNDBEGREBER

Introduktion til uligheder

STATISTISKE GRUNDBEGREBER

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

x-klasserne Gammel Hellerup Gymnasium

Asymptotisk estimationsteori

Asymptotisk optimalitet af MLE

Introduktion til uligheder

Morten Frydenberg version dato:

Sandsynlighedsteori 1.2

Uge 40 I Teoretisk Statistik, 30. september 2003

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Supplerende noter II til MM04

Estimation og test i normalfordelingen

Lys og gitterligningen

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Vejledende opgavebesvarelser

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

GENEREL INTRODUKTION.

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

STATISTISK MODELLERING OG ANALYSE 19. DECEMBER 2008 ET MAT3-PROJEKT I BAYESIANSK INFERENS VEJLEDER: JAKOB G. RASMUSSEN GRUPPE: G4-115

DATV: Introduktion til optimering og operationsanalyse, Følsomhed af Knapsack Problemet

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

r n E[ X n ]/n! for alle r > 0 ifølge monoton konvergens, giver potensrækketeori, at ( ) er ækvivalent med, at ρ n E[ X n ]/n!

Produkt og marked - matematiske og statistiske metoder

Sandsynlighedsregning og statistisk

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Matematisk Modellering 1 Hjælpeark

Undersøgelse af numeriske modeller

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

Transkript:

Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet Defiitio: Normalfordelige E stokastisk variabel X med tæthedsfuktio f(x) = 1 ( ) (x µ) exp, x R, πσ σ siges at være ormalfordelt med middelværdi µ og varias σ, hvor µ og σ er reelle tal og σ > 0. Notatio: X N (µ, σ ). Klokkeformet symmetrisk tæthedsfuktio. σ µ 1/30 /30 Repetitio: Stadard Normalfordelige Sadsylighedsitervaller Defiitio: Stadard ormalfordelige Fordelige N (0,1) kaldes stadard ormalfordelig. Typisk oteres stadard ormal fordelte variable Z. Fordeligsfuktioe for e stadard ormalfordelt SV beteges Φ(z): Dvs: Hvis Z N (0,1) så gælder P (Z z) = Φ(z). Der fides ikke et lukket udtryk for fordeligsfuktioe Φ(z). f(z) Φ(z) z 3 1 0 1 3 Φ(z) 1.00 0.75 0.50 0.5 0 3 1 0 1 z 1 Lad X N (µ, σ ), dvs. Z = X µ σ N (0, 1). Fid sadsyligehde for at X ligger højst z stadardafvigelser fra middelværdie µ. Dvs. fid: p = P (µ zσ < X < µ + zσ) p =? µ zσ µ µ + zσ 3/30 4/30

Sadsylighedsitervaller Sadsylighedsitervaller: Eksempel Sadylighede for at X ligger højst z stadardafvigelser fra middelværdie µ er: p = P (µ zσ < X < µ + zσ) = P ( z < X µ < z) σ = P ( z < Z < z) P ( z Z z) z 0 z P (Z z) = 0 = P (Z < z) P (Z < z) = Φ(z) Φ( z) = Φ(z) (1 Φ(z)) = Φ(z) 1. z P (Z z) Bemærk: middelværdie µ og spredige σ idgår ikke! z 0 Atag X N (µ,σ ). Hvad er sadsyligehde for at X ligger højst stadardafvigelser fra middelværdie? p = P (µ σ < X < µ + σ) = Φ() 1 I ormalfordeligstabelle fider vi Φ() = 0,977. Dvs. p = 0,977 1 = 0,9544. Dvs. der 95,44% sadsylighed for at e ormalfordelt SV ligger idefor stadardafvigelser fra middelværdie. 95,44% µ σ µ µ + σ 5/30 6/30 Sadsylighedsitervaller: Eksempler Tæthedsfuktio Atag X N (µ,σ ). Givet e sadsylighed p fid z så P (µ zσ X µ + zσ) = p. Vi har set, at dette svarer til at løse p = Φ(z) 1. Isolerer vi Φ(z) får vi ). Φ(z) = p + 1 z = Φ 1 ( p + 1 99,9% 99% 95% Atag vi vil fide z, så itervallet ideholder X med 99% sadsylighed, dvs. p = 0,99. Da er z = Φ 1 ( 0,99+1 ) = Φ 1 (0,995). Fra Matlab får vi >> ormiv(0,995) as =.5758 Dvs. P (µ,58σ X µ +,58σ) = 0,99. 7/30 µ 3.9σ µ 1.96σ µ µ + 1.96σ µ + 3.9σ µ.58σ µ +.58σ 8/30

Uafhægige stokastiske variable Liearkombiatio Defiitio: Uafhægighed To stokastiske variable X 1 og X er uafhægige, hvis og ku hvis for alle x 1,x R. P (X 1 x 1 og X x ) = P (X 1 x 1)P (X x ) Geerelt: stokastiske variable X 1, X,..., X er uafhægige, hvis og ku hvis P (X 1 x 1 og X x og... og X x ) = for alle x 1,x,... x R. P (X 1 x 1)P (X x ) P (X x ) Sætig: Middelværdi af liearkombiatio Hvis X 1, X,..., X er stokastiske variable med edelig middelværdier E(X 1 ) = µ 1, E(X ) = µ,..., E(X ) = µ, og a 0, a 1,..., a R, så gælder E ( ) a 0 + a 1X 1 + + a X = a0 + a 1E(X 1) + + a E(X ) = a 0 + a 1µ 1 + + a µ Bemærk: Sætige kræver ikke at X 1, X,..., X er uafhægige! 9/30 10/30 Liearkombiatio Sum af uafhægige ormalfordelte SV Sætig: Varias af liearkombiatio af uafhægige SV Hvis X 1, X,..., X er uafhægige stokastiske variable med edelig variaser V(X 1) = σ 1, V(X ) = σ,..., V(X ) = σ, og a 0,a,..., a er reelle kostater, så gælder V ( a 0 + a 1X 1 + a X + + a X ) = a 1 V(X 1) + a V(X ) + + a V(X ) = a 1σ 1 + a σ + + a σ. 3 Sætig: Sum af uafhægige ormalfordelte SV Hvis X 1 og X er uafhægige stokastiske variable, hvor så er X 1 N (µ 1, σ 1) og X N (µ, σ ), X 1 + X N (µ 1 + µ, σ 1 + σ ). Geerelt: Hvis X 1, X,... X er uafhægige stokastiske variable, hvor så er X i N (µ i, σ i ) for i = 1,,...,, X 1 + X + + X N (µ 1 + µ + + µ, σ 1 + σ + + σ ). 11/30 Bemærk: E sum a ormalfordelte stokastiske variable er altid ormalfordelt uafhægighed eller ej. 1/30

Statistisk model Model for vikler I de fleste videskaber atages e model for det fæome som er uder observatio. Ofte bygger modelle på e række atagelser hvis påstade tidligere er vist valide. x 1x 3 x 5 x 4 Model for vikler i ladmålig: Vi atager at vikler i ladmålig er ormalfordelte med de sade vikel µ som middelværdi og spredig σ. Ydermere atages getage måleforsøg X 1,...,X af samme vikel at være uafhægige og idetisk fordelte (iid), X i N (µ,σ ), i = 1,...,. µ µ σ µ µ + σ 13/30 14/30 Observatioer Ved opmålig af e vikel foretages observatioer x 1,...,x som er realisatioer af de stokatiske variable X 1,...,X. Skematisk agives dette som, X 1... X x 1... x (X 1,...,X ) kaldes e stikprøve fra ormalfordelige N (µ,σ ). (x 1,...,x ) kaldes e observeret stikprøve fra ormalfordelige N (µ,σ ). 4 Eksempel Jf. eksempel fra otere observeres følgede 10 satser af e vikel. Sats x i Observatio 1 x 1 164.508 go x 164.509 go 3 x 3 164.511 go 4 x 4 164.507 go 5 x 5 164.510 go 6 x 6 164.511 go 7 x 7 164.517 go 8 x 8 164.510 go 9 x 9 164.514 go 10 x 10 164.513 go Dvs de observerede stikprøve, hvor = 10, er (x 1,x,...,x 1,x ) = (164.508,164.509,...,164.514,164.513). 15/30 16/30

Eksempel Histogram af observerede vikler Estimator og estimat Som estimator for µ avedes geemsittet X, der er defieret som Relativ frekves / Tæthedsfuktio 0 50 100 150 164.506 164.508 164.510 x 164.51 164.514 164.516 164.518 X = 1 X i = 1 (X 1 + X + + X ) i=1 Har vi observeret data ka vi estimere µ med x. Her udskiftes de stokatiske variable X i i X ud med de observerede xi, x = 1 x i = 1 (x 1 + x + + x ) i=1 Bemærk: X er e stokastisk variabel (e trasformatio af Xi ere), mes x er e realisatio af X, X 1... X X x 1... x x Observerede vikler 17/30 18/30 Eksempel - fortsat Egeskaber ved X Sætig: Middelværdi og varias for X For eksemplet ka vi estimere µ med x: x = 1 (164.508 + 164.509 + + 164.514 + 164.513) = 164.511 go 10 Atag (X 1,...,X ) er e stikprøve fra e fordelig med middelværdi µ og varias σ. Da gælder E( X) = µ og Var( X) = σ. 5 Hvis X i N (µ,σ ) gælder der ligeledes X N (µ, σ ). Estimatore X kaldes e cetral estimator for µ, idet E( X) = µ. Estimatet x kaldes et cetral estimat for µ. 19/30 0/30

Egeskaber for X: Bevis Vi har ataget at X 1,...,X er idbyrdes uafhægige og har samme middelværdi µ og samme varias σ : E(X i) = µ, V(X i) = σ i = 1,...,. Geemsittet af måliger beteges X ka skrives som Da gælder og V[ X] = V X = X1 + X +... + X = 1 X1 + 1 X +... + 1 X. E[ X] = 1 µ +... + 1 µ = 1 µ = µ. [ 1 X1 + 1 X +... + 1 ] X = ( 1 ) σ + ( 1 ) σ + + ( 1 ) σ Geemsit af uafhægige ormalfordelte SV Hvis X 1, X,... X er uafhægige idetiske fordelte stokastiske variable (i egelsk litteratur iid : Idepedet Idetically Distributed), hvor X i N (µ, σ ) for i = 1,,...,, så er Dvs. eller X 1 + X + + X = X = 1 i=1 X i N (µ, σ ). i=1 X i N ( µ, σ ) X µ σ/ N ( 0, 1 ). = 1 σ = 1 σ. 1/30 /30 Effekte af øget atal observatioer Kofidesiterval for µ Fordelige af geemsittet X for forskellige atal observatioer (). = 10 = 5 = Geemsittet x er et estimat for µ. Hvor præcist er dette estimat? Vores modelatagelse siger at (X 1,...,X ) er uafhægige og idetiske fordelte, X i N (µ,σ ) for i = 1,...,. Desude atages det her, at variase σ er kedt. Fra teorie om sadsylighedsitervaller har vi for hvert X i har: P (µ 1,96σ X i µ + 1,96σ) = 0,95. = 1 10.0 10.5 103.0 103.5 104.0 Bemærk: Jo større jo større sadsylighed for at X ligger tæt på µ. 6 Oveståede atagelser medfører, at X N (µ, σ ). Heraf følger, at for X gælder: P (µ 1,96 σ X µ + 1,96 σ ) = 0,95. 3/30 4/30

Kofidesiterval - fortsat Kofidesiterval - fortsat Sadyligehde for forrige slide ka u omskrives, så µ isoleres : P ( P ( P ( P ( µ 1.96 σ X µ + 1.96 σ ) = 0.95 X 1.96 σ µ X + 1.96 σ ) = 0.95 X + 1.96 σ µ X 1.96 σ ) = 0.95 X 1.96 σ µ X + 1.96 σ ) = 0.95 De sidste sadsylighed har følgede fortolkig: Sadsylighede for at X atager e værdi x så µ ligger i itervallet [ x 1.96 σ ; x + 1.96 σ ] er 0.95. Vi ka u defiere et kofidesiterval Defiitio: Kofidesiterval Atag x 1,...,x er e uafhægig stikpøve fra N (µ,σ ), og x er geemsittet af dee stikprøve. Da er et 95% kofidesiterval for µ givet ved x ± 1,96 σ. Fortolkig: Vi er 95% sikre på, at itervallet x ± 1,96 σ ideholder de sade middelværdi µ. Bemærk: Kofidesitervallet beytter estimatet x og ikke estimatore X. 5/30 6/30 Kofidesiterval - grafisk Kofidesiterval - fortolkig µ µ x + 1.96 σ x x 1.96 σ 7 Atag vi observerer de stokatiske variable k gage, dvs. vi får k observatiosrækker med tal. 1 : x 1,1, x 1,,..., x 1, x 1 : x,1, x,,..., x, x. k : x k,1, x k,,..., x k, x k Hermed fås k middelværdi estimater x 1,..., x k og k tilhørede kofidesitervaller. For k stor ka vi forvete at 95% af itervallere ideholder µ. 7/30 8/30

Eksempel Der foretages 0 gage 10 opmåliger af e lægde på 118.1 m. Det atages at der er e varias på observatioere på 0.0 m. Figure viser de 0 kofidesitervaller for hver forsøgsrække. Meter 118.05 118.10 118.15 118.0 118.5 118.30 118.35 Eksempel - fortsat Atag at vi kedte variase i vores eksempel med 10 observerede vikelmåliger. Det oplyses at σ = 0.00. Vi ka da bestemme et 95% kofidesiterval for µ, hvor x = 164.511 fra tidligere: [ 164.511 1.96 0.00 ; 164.511 + 1.96 0.00 ] = [164.5098 ; 164.51] 10 10 Per kostruktio ligger x altid midt i itervallet. Lægde på itervallet er et udtryk for øjagtighede, hvor et kortere iterval idikerer at µ er bedre estimeret ed et lægere. 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 Forsøgsrække 9/30 30/30 8