Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Størrelse: px
Starte visningen fra side:

Download "Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen"

Transkript

1 Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - [email protected] Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel, som vi tillægger sandsynligheder - vha. tætheds- eller fordelingsfunktion. Ex. ligelig fordelt stokastisk variabel på [a,b]: f(x) = Middelværdi Varians Spredning { b a x [a,b] 0 ellers σ = VarX = µ = EX = b a x F (x) = f(z)dz = b a x dx = (b + a)/ b a (x µ) b a dx = EX µ = σ = VarX = b a 0 x < a x b a x [a,b] x > b (b a) /37 /37 Definition: Normalfordelingen En stokastisk variabel X med tæthedsfunktion f(x) = ( ) (x µ) exp, x R, πσ σ Eksempel X N(,5). Beregn P (X ) samt x 0.3 = F (0,3): siges at være normalfordelt med middelværdi µ og varians σ, hvor µ og σ er reelle tal og σ > 0. Notation: X N (µ, σ ). Fordelingsfunktion x F (x) = ( exp πσ ) (z µ) σ dz >> normcdf(,,sqrt(5)) ans = >> norminv(0.3,,sqrt(5)) ans = pnorm(x,, sqrt(5)) har ikke lukket udtryk x Sandsynligheder og fraktiler udregnes mest bekvemt vha. computerprogram - f.eks. matlab. 3/37 4/37

2 Repetition: Standard-normalfordelingen Sandsynlighedsintervaller (Sætning 8) Definition: Standard-normalfordelingen Fordelingen N (0,) kaldes standard normalfordelingen. Typisk noteres standard-normal fordelte variable Z. Historisk set nyttig, da nok at tabellægge standardnormalfordelingen for at udregne sandsynligheder for alle andre normalfordelinger: X N (µ,σ ) Z = X µ σ N (0,) Lad X N (µ, σ ), dvs. Z = X µ σ N (0, ). Find sandsynligheden for at X ligger højst z standardafvigelser fra middelværdien µ. Dvs. find: p = P (µ zσ < X < µ + zσ) p =? µ zσ µ µ + zσ 5/37 6/37 Sandsynlighedsintervaller Sandsynlighedsintervaller: Eksempel Sandsynligheden for at X ligger højst z standardafvigelser fra middelværdien µ er: p = P (µ zσ < X < µ + zσ) = P ( z < X µ < z) σ = P ( z < Z < z) P ( z Z z) z 0 z P (Z z) = 0 = P (Z < z) P (Z < z) = Φ(z) Φ( z) = Φ(z) ( Φ(z)) = Φ(z). z P (Z z) z 0 Bemærk: middelværdien µ og spredningen σ indgår ikke! Spredning nyttig enhed for måling af usikkerhed. 7/37 Antag X N (µ,σ ). Hvad er sandsynligheden for at X ligger højst standardafvigelser fra middelværdien? p = P (µ σ < X < µ + σ) = Φ() Vha. matlab/ normalfordelingstabellen/ finder vi Φ() = 0,977. Dvs. p = 0,977 = 0,9544. Dvs. der er 95,44% sandsynlighed for at en normalfordelt SV ligger indenfor standardafvigelser fra middelværdien. 95,44% µ σ µ µ + σ 8/37

3 Sandsynlighedsintervaller: Eksempler Tæthedsfunktion Antag X N (µ,σ ). Givet en sandsynlighed p find z så P (µ zσ X µ + zσ) = p. Vi har set, at dette svarer til at løse p = Φ(z). Isolerer vi Φ(z) får vi ). Φ(z) = p + z = Φ ( p + 99,9% 99% 95% Antag vi vil finde z, så intervallet indeholder X med 99% sandsynlighed, dvs. p = 0,99. Da er z = Φ ( 0,99+ ) = Φ (0,995). Fra Matlab får vi >> norminv(0.995) ans =.5758 Dvs. P (µ,58σ X µ +,58σ) = 0,99. 9/37 µ 3.9σ µ.96σ µ µ +.96σ µ + 3.9σ µ.58σ µ +.58σ 0/37 Uafhængige stokastiske variable Linearkombination To stokastiske variable X og X uafhængige hvis viden om X s værdi ikke indvirker på sandsynlighedsfordelingen af X (og omvendt): P (X x X [a,b]) = P (X x ) Venstresiden læses som sandsynligheden for X x givet at X [a,b]. Gentagne målinger skal gerne være uafhængige: hvis eks. måling X er for stor ville det være uheldigt, hvis det medførte en forøget sandsynlighed for, at X også bliver for stor. (Definition 4 giver en stringent, men ikke helt intuitiv definition på uafhængighed) 3 Sætning: Middelværdi af linearkombination Hvis X, X,..., X n er stokastiske variable med middelværdier E(X ) = µ, E(X ) = µ,..., E(X n ) = µ n, og a 0, a,..., a n R, så gælder E ( ) a 0 + a X + + a nx n = a0 + a E(X ) + + a ne(x n) = a 0 + a µ + + a nµ n Bemærk: Sætningen kræver ikke at X, X,..., X n er uafhængige! /37 /37

4 Anvendelse: omskrivning af udtryk for varians Linearkombination Sætning: Varians af linearkombination af uafhængige SV Hvis X, X,..., X n er uafhængige stokastiske variable med varianser Definitionen på varians kan omskrives til σ = E(X µ) = E(X ) µ, Var(X ) = σ, Var(X ) = σ,..., Var(X n) = σn, og a 0,a,..., a n er reelle konstanter, så gælder Var ( ) a 0 + a X + a X + + a nx n = a Var(X ) + a Var(X ) + + a nvar(x n) = a σ + a σ + + a nσn. NB: vi skal senere se (lektion 5) at det faktisk er nok, at X,...,X n er ukorrelerede. 3/37 4/37 Sum af normalfordelte SV Sætning: Sum af normalfordelte SV Hvis X, X,... X n er normalfordelte stokastiske variable, X i N (µ i, σi ) for i =,,...,n, og a 0,...,a n er konstanter, så er summen a 0 + a X + a X + + a n X n normalfordelt. Fra de foregående resultater fås at summen har middelværdi 4 Statistisk model Model for vinkler i landmåling: Vi antager, at vinkler i landmåling er normalfordelte med den sande vinkel µ som middelværdi og spredning σ. Ydermere antages n gentagne målinger X,...,X n af samme vinkel at være uafhængige og identisk fordelte (iid), X i N (µ,σ ), i =,...,n. a 0 + a µ + a µ + + a n µ n og hvis X, X,... X n er uafhængige (eller blot ukorrelerede) er variansen af summen µ σ µ µ + σ a σ + a σ + + a nσ n 5/37 6/37

5 Model for vinkler Observationer x x 3 x 5 x 4 Ved opmåling af en vinkel foretages n observationer x,...,x n som er realisationer af de stokastiske variable X,...,X n. Skematisk angives dette som, X... X n x... x n µ X,...,X n kaldes en stikprøve fra normalfordelingen N (µ,σ ). x,...,x n kaldes en observeret stikprøve fra normalfordelingen N (µ,σ ). 7/37 8/37 Eksempel Eksempel Jf. eksempel fra noterne observeres følgende 0 satser af en vinkel. Histogram af observerede vinkler Sats x i Observation x gon x gon 3 x gon 4 x gon 5 x gon 6 x gon 7 x gon 8 x gon 9 x gon 0 x gon Dvs den observerede stikprøve, hvor n = 0, er x,x,...,x n,x n = ,64.509,...,64.54, Relativ frekvens / Tæthedsfunktion x /37 Observerede vinkler 0/37

6 Estimator og estimat Eksempel - fortsat Som estimator for µ anvendes gennemsnittet X, der er defineret som X = n X i = n n (X + X + + X n ) i= Har vi observeret data kan vi estimere µ med x. Her udskiftes de stokastiske variable X i i X ud med de observerede xi, x = n n x i = n (x + x + + x n ) i= For eksemplet kan vi estimere µ med x: x = ( ) = 64.5 gon 0 Bemærk: X er en stokastisk variabel (en transformation af Xi erne), mens x er en realisation af X, X... X n X x... x n x /37 /37 Egenskaber ved X Sætning: Middelværdi og varians for X Antag X,...,X n er uafhængige stokastiske variable med fælles middelværdi µ og varians σ. Da gælder E( X) = µ og Var( X) = σ n. Hvis X i N (µ,σ ) gælder der ligeledes X N (µ, σ n ). Estimatoren X kaldes en central estimator for µ, idet E( X) = µ. 6 Egenskaber for X: Bevis Vi har antaget at X,...,X n er indbyrdes uafhængige og har samme middelværdi µ og samme varians σ : E(X i) = µ, Var(X i) = σ i =,...,n. Bemærk n Xi har middelværdi µ og varians σ. Dermed har n n middelværdi og varians X = n X + n X + + n Xn n µ + n µ + + n µ = n n µ = µ n σ + n σ + + n σ = n n σ = n σ Estimatet x kaldes et centralt estimat for µ. Bemærk: stort n giver lille varians/stor præcision! 3/37 Hvis yderligere de enkelte X i er normalfordelte gælder n Xi N( n µ, n σ ) og dermed er også X normalfordelt. (husk, sum af normalfordelte er selv normalfordelt). 4/37

7 Effekten af øget antal observationer Konfidensinterval for µ Fordelingen af gennemsnittet X for forskellige antal observationer (n). n = 0 n = 5 n = Gennemsnittet x er et estimat for µ. Hvor præcist er dette estimat? Vores modelantagelse siger at X,...,X n er uafhængige og identiske fordelte, X i N (µ,σ ) for i =,...,n. Desuden antages det her, at variansen σ er kendt. Fra teorien om sandsynlighedsintervaller har vi for X N (µ,σ ): P (µ,96σ X µ +,96σ) = 0,95. n = Bemærk: Jo større n jo større sandsynlighed for at X ligger tæt på µ. Ovenstående antagelser medfører, at X N (µ, σ n ). Heraf følger, at for X gælder: P (µ,96 σ n X µ +,96 σ n ) = 0,95. 5/37 6/37 Konfidensinterval - fortsat Sandsynligheden for forrige slide kan nu omskrives, så µ isoleres : P ( P ( P ( P ( µ.96 σ n X µ +.96 σ n ) = 0.95 X.96 σ n µ X +.96 σ n ) = 0.95 X +.96 σ n µ X.96 σ n ) = 0.95 X.96 σ n µ X +.96 σ n ) = 0.95 Konfidensinterval - fortsat Vi kan nu definere et konfidensinterval Definition: Konfidensinterval Antag X,...,X n er en stikprøve af uafhænige observationer fra N (µ,σ ), og X er gennemsnittet af denne stikprøve. Da er et 95% konfidensinterval for µ givet ved X ±,96 σ n. Den sidste sandsynlighed har følgende fortolkning: eller Sandsynligheden for at X antager en værdi x så µ ligger i intervallet [ x.96 σ n ; x +.96 σ n ] er Der er 95% sandsynlighed for at det stokastiske interval [ X.96 σ n ; X +.96 n σ ] indeholder µ. 7/37 7 Fortolkning: Vi er 95% sikre på, at intervallet X ±,96 σ n indeholder den sande middelværdi µ. Omvendt: for en given konkret realisation x ±,96 σ n vil der være sandsynlighed enten 0 eller for at µ er i intervallet. Konfidensintervallet har forskellig fortolkning før og og efter data er observeret! 8/37

8 Konfidensinterval - grafisk Konfidensinterval - fortolkning µ x +.96 σ n x x.96 σ n Antag vi observerer de n stokastiske variable k gange, dvs. vi får k observationsrækker med n tal. : x,, x,,..., x,n x : x,, x,,..., x,n x. k : x k,, x k,,..., x k,n x k µ Hermed fås k middelværdi estimater x,..., x k og k tilhørende konfidensintervaller. For k stor kan vi forvente at 95% af intervallerne indeholder µ. 9/37 30/37 Eksempel Praktisk brug af konfidensinterval Der foretages 0 gange 0 opmålinger af en længde på 8. m. Det antages, at der er en varians på observationerne på 0.0 m. Figuren viser de 0 konfidensintervaller for hver forsøgsrække. Meter In praktisk brug vil vi ofte agere, som at den sande middelværdi er en af værdierne i 95% konfidensintervallet. Det kan meget vel være forkert for et givet observeret konfidensinterval. Men i det lange løb tager vi kun fejl i 5% af tilfældene. Vil vi have større sikkerhed kan vi benytte f.eks. 99% konfidensintervaller (skift faktoren.96 ud med.58) Forsøgsrække 3/37 3/37

9 Eksempel - fortsat Ikke normalfordelte data - er alt tabt? Magisk resultat (centrale grænseværdisætning, CLT) Antag at vi kendte variansen i vores eksempel med 0 observerede vinkelmålinger. Det oplyses at σ = Vi kan da bestemme et 95% konfidensinterval for µ, hvor x = 64.5 fra tidligere: [ ; ] = [ ; 64.5] 0 0 Per konstruktion ligger x altid midt i intervallet. Længden på intervallet er et udtryk for nøjagtigheden (kort interval=høj præcision) Centrale grænseværdisætning Hvis X,...,X n er uafhængige stokastiske variable med samme middelværdi µ og varians σ så gælder når n stor X N(µ, σ n ) Vores konstruktion af konfidensinterval benyttede blot, at X N(µ, σ n ) Dvs. selv for ikke-normalfordelte målinger vil konfidensintervallet stadig give god mening. 33/37 34/37 Illustration af CLT Histogram af første stikprøve n = 00 n=00 : x,, x,,..., x,n x : x,, x,,..., x,n x. k : x k,, x k,,..., x k,n x k hvor x i,j realisationer af Gamma-fordelte stokastiske variable. 9 Frequency /37 Observationer langt fra normalfordelte! 36/37

10 Histogram af 500 gennemsnit x,... x 500 n = 5 n = 0 Histogram of barx Histogram of barx Frequency Frequency barx n = 30 n = 00 barx Histogram of barx Histogram of barx Frequency Frequency barx barx Gennemsnit af mange observationer er normalfordelt! 37/37 0

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset

Læs mere

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering Landmålingens fejlteori Lektion 3 Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition: Middelværdi og

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen Vægte motiverende eksempel Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@mathaaudk Institut for Matematiske Fag Aalborg Universitet Højdeforskellen mellem punkterne P

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf13 Institut for Matematiske Fag Aalborg Universitet 1/1 Vægtet

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning Fejlforplantning Landmålingens fejlteori Lektion 5 Fejlforplantning - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf13 Landmåling involverer ofte bestemmelse af størrelser som ikke kan

Læs mere

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n. Simple fejlforplantningslov Landmålingens fejlteori Lektion 6 Den generelle fejlforplantningslov Antag X, X,, X n er n uafhængige stokastiske variable, hvor Var(X )σ,, Var(X n )σ n Lad Y g(x, X,, X n ),

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Landmålingens fejlteori - Lektion 5 - Fejlforplantning Landmålingens fejlteori Lektion 5 Fejlforplantning - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/30 Fejlforplantning Landmåling involverer ofte bestemmelse af størrelser som ikke

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Uge 10 Teoretisk Statistik 1. marts 2004

Uge 10 Teoretisk Statistik 1. marts 2004 1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +

Læs mere

hvor a og b er konstanter. Ved middelværdidannelse fås videre

hvor a og b er konstanter. Ved middelværdidannelse fås videre Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Normalfordelingen og transformation af kontinuerte fordelinger Helle Sørensen Uge 7, mandag SaSt2 (Uge 7, mandag) Normalford. og transformation 1 / 16 Program Paretofordelingen,

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Karakteristiske funktioner og Den Centrale Grænseværdisætning E6 efterår 1999 Notat 10 Jørgen Larsen 20. oktober 1999 Karakteristiske funktioner og Den Centrale Grænseværdisætning Karakteristiske funktioner som er nære slægtninge til Fourier-transformationen) er

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik [email protected] Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Statistik. Hjemmeside:  kkb. Statistik - lektion 1 p.1/22 Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: [email protected]

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.1

Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.1 Noter i fejlteori Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen Version 1.1 April 2013 2 Indhold 1 Motivation 3 2 Det matematiske fundament 5 2.1 Lidt sandsynlighedsregning......................

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1

Læs mere

Eksamen 2014/2015 Mål- og integralteori

Eksamen 2014/2015 Mål- og integralteori Eksamen 4/5 Mål- og integralteori Københavns Universitet Institut for Matematiske Fag Formalia Eksamensopgaven består af 4 opgaver med ialt spørgsmål Ved bedømmelsen indgår de spørgsmål med samme vægt

Læs mere

Løsninger til kapitel 6

Løsninger til kapitel 6 Opgave 6.1 a) 180 200 P ( X < 180) = Φ = Φ( = 0, 1587 b) 220 200 P ( X > 220) = Φ = Φ(1) = 0, 8413 c) 200 200 P ( X > 200) = 1 X < 200) = 1 Φ = ) = 1 0,5 = 0, 5 d) P ( X = 230) = 0 e) 180 200 P ( X 180)

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed... Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: [email protected] Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

Teoretisk Statistik, 16. februar Generel teori,repetition

Teoretisk Statistik, 16. februar Generel teori,repetition 1 Uge 8 Teoretisk Statistik, 16. februar 2004 1. Generel teori, repetition 2. Diskret udfaldsrum punktssh. 3. Fordelingsfunktionen 4. Tæthed 5. Transformationer 6. Diskrete vs. Kontinuerte stokastiske

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere