Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
|
|
|
- Christine Frank
- 9 år siden
- Visninger:
Transkript
1 Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - [email protected] Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel, som vi tillægger sandsynligheder - vha. tætheds- eller fordelingsfunktion. Ex. ligelig fordelt stokastisk variabel på [a,b]: f(x) = Middelværdi Varians Spredning { b a x [a,b] 0 ellers σ = VarX = µ = EX = b a x F (x) = f(z)dz = b a x dx = (b + a)/ b a (x µ) b a dx = EX µ = σ = VarX = b a 0 x < a x b a x [a,b] x > b (b a) /37 /37 Definition: Normalfordelingen En stokastisk variabel X med tæthedsfunktion f(x) = ( ) (x µ) exp, x R, πσ σ Eksempel X N(,5). Beregn P (X ) samt x 0.3 = F (0,3): siges at være normalfordelt med middelværdi µ og varians σ, hvor µ og σ er reelle tal og σ > 0. Notation: X N (µ, σ ). Fordelingsfunktion x F (x) = ( exp πσ ) (z µ) σ dz >> normcdf(,,sqrt(5)) ans = >> norminv(0.3,,sqrt(5)) ans = pnorm(x,, sqrt(5)) har ikke lukket udtryk x Sandsynligheder og fraktiler udregnes mest bekvemt vha. computerprogram - f.eks. matlab. 3/37 4/37
2 Repetition: Standard-normalfordelingen Sandsynlighedsintervaller (Sætning 8) Definition: Standard-normalfordelingen Fordelingen N (0,) kaldes standard normalfordelingen. Typisk noteres standard-normal fordelte variable Z. Historisk set nyttig, da nok at tabellægge standardnormalfordelingen for at udregne sandsynligheder for alle andre normalfordelinger: X N (µ,σ ) Z = X µ σ N (0,) Lad X N (µ, σ ), dvs. Z = X µ σ N (0, ). Find sandsynligheden for at X ligger højst z standardafvigelser fra middelværdien µ. Dvs. find: p = P (µ zσ < X < µ + zσ) p =? µ zσ µ µ + zσ 5/37 6/37 Sandsynlighedsintervaller Sandsynlighedsintervaller: Eksempel Sandsynligheden for at X ligger højst z standardafvigelser fra middelværdien µ er: p = P (µ zσ < X < µ + zσ) = P ( z < X µ < z) σ = P ( z < Z < z) P ( z Z z) z 0 z P (Z z) = 0 = P (Z < z) P (Z < z) = Φ(z) Φ( z) = Φ(z) ( Φ(z)) = Φ(z). z P (Z z) z 0 Bemærk: middelværdien µ og spredningen σ indgår ikke! Spredning nyttig enhed for måling af usikkerhed. 7/37 Antag X N (µ,σ ). Hvad er sandsynligheden for at X ligger højst standardafvigelser fra middelværdien? p = P (µ σ < X < µ + σ) = Φ() Vha. matlab/ normalfordelingstabellen/ finder vi Φ() = 0,977. Dvs. p = 0,977 = 0,9544. Dvs. der er 95,44% sandsynlighed for at en normalfordelt SV ligger indenfor standardafvigelser fra middelværdien. 95,44% µ σ µ µ + σ 8/37
3 Sandsynlighedsintervaller: Eksempler Tæthedsfunktion Antag X N (µ,σ ). Givet en sandsynlighed p find z så P (µ zσ X µ + zσ) = p. Vi har set, at dette svarer til at løse p = Φ(z). Isolerer vi Φ(z) får vi ). Φ(z) = p + z = Φ ( p + 99,9% 99% 95% Antag vi vil finde z, så intervallet indeholder X med 99% sandsynlighed, dvs. p = 0,99. Da er z = Φ ( 0,99+ ) = Φ (0,995). Fra Matlab får vi >> norminv(0.995) ans =.5758 Dvs. P (µ,58σ X µ +,58σ) = 0,99. 9/37 µ 3.9σ µ.96σ µ µ +.96σ µ + 3.9σ µ.58σ µ +.58σ 0/37 Uafhængige stokastiske variable Linearkombination To stokastiske variable X og X uafhængige hvis viden om X s værdi ikke indvirker på sandsynlighedsfordelingen af X (og omvendt): P (X x X [a,b]) = P (X x ) Venstresiden læses som sandsynligheden for X x givet at X [a,b]. Gentagne målinger skal gerne være uafhængige: hvis eks. måling X er for stor ville det være uheldigt, hvis det medførte en forøget sandsynlighed for, at X også bliver for stor. (Definition 4 giver en stringent, men ikke helt intuitiv definition på uafhængighed) 3 Sætning: Middelværdi af linearkombination Hvis X, X,..., X n er stokastiske variable med middelværdier E(X ) = µ, E(X ) = µ,..., E(X n ) = µ n, og a 0, a,..., a n R, så gælder E ( ) a 0 + a X + + a nx n = a0 + a E(X ) + + a ne(x n) = a 0 + a µ + + a nµ n Bemærk: Sætningen kræver ikke at X, X,..., X n er uafhængige! /37 /37
4 Anvendelse: omskrivning af udtryk for varians Linearkombination Sætning: Varians af linearkombination af uafhængige SV Hvis X, X,..., X n er uafhængige stokastiske variable med varianser Definitionen på varians kan omskrives til σ = E(X µ) = E(X ) µ, Var(X ) = σ, Var(X ) = σ,..., Var(X n) = σn, og a 0,a,..., a n er reelle konstanter, så gælder Var ( ) a 0 + a X + a X + + a nx n = a Var(X ) + a Var(X ) + + a nvar(x n) = a σ + a σ + + a nσn. NB: vi skal senere se (lektion 5) at det faktisk er nok, at X,...,X n er ukorrelerede. 3/37 4/37 Sum af normalfordelte SV Sætning: Sum af normalfordelte SV Hvis X, X,... X n er normalfordelte stokastiske variable, X i N (µ i, σi ) for i =,,...,n, og a 0,...,a n er konstanter, så er summen a 0 + a X + a X + + a n X n normalfordelt. Fra de foregående resultater fås at summen har middelværdi 4 Statistisk model Model for vinkler i landmåling: Vi antager, at vinkler i landmåling er normalfordelte med den sande vinkel µ som middelværdi og spredning σ. Ydermere antages n gentagne målinger X,...,X n af samme vinkel at være uafhængige og identisk fordelte (iid), X i N (µ,σ ), i =,...,n. a 0 + a µ + a µ + + a n µ n og hvis X, X,... X n er uafhængige (eller blot ukorrelerede) er variansen af summen µ σ µ µ + σ a σ + a σ + + a nσ n 5/37 6/37
5 Model for vinkler Observationer x x 3 x 5 x 4 Ved opmåling af en vinkel foretages n observationer x,...,x n som er realisationer af de stokastiske variable X,...,X n. Skematisk angives dette som, X... X n x... x n µ X,...,X n kaldes en stikprøve fra normalfordelingen N (µ,σ ). x,...,x n kaldes en observeret stikprøve fra normalfordelingen N (µ,σ ). 7/37 8/37 Eksempel Eksempel Jf. eksempel fra noterne observeres følgende 0 satser af en vinkel. Histogram af observerede vinkler Sats x i Observation x gon x gon 3 x gon 4 x gon 5 x gon 6 x gon 7 x gon 8 x gon 9 x gon 0 x gon Dvs den observerede stikprøve, hvor n = 0, er x,x,...,x n,x n = ,64.509,...,64.54, Relativ frekvens / Tæthedsfunktion x /37 Observerede vinkler 0/37
6 Estimator og estimat Eksempel - fortsat Som estimator for µ anvendes gennemsnittet X, der er defineret som X = n X i = n n (X + X + + X n ) i= Har vi observeret data kan vi estimere µ med x. Her udskiftes de stokastiske variable X i i X ud med de observerede xi, x = n n x i = n (x + x + + x n ) i= For eksemplet kan vi estimere µ med x: x = ( ) = 64.5 gon 0 Bemærk: X er en stokastisk variabel (en transformation af Xi erne), mens x er en realisation af X, X... X n X x... x n x /37 /37 Egenskaber ved X Sætning: Middelværdi og varians for X Antag X,...,X n er uafhængige stokastiske variable med fælles middelværdi µ og varians σ. Da gælder E( X) = µ og Var( X) = σ n. Hvis X i N (µ,σ ) gælder der ligeledes X N (µ, σ n ). Estimatoren X kaldes en central estimator for µ, idet E( X) = µ. 6 Egenskaber for X: Bevis Vi har antaget at X,...,X n er indbyrdes uafhængige og har samme middelværdi µ og samme varians σ : E(X i) = µ, Var(X i) = σ i =,...,n. Bemærk n Xi har middelværdi µ og varians σ. Dermed har n n middelværdi og varians X = n X + n X + + n Xn n µ + n µ + + n µ = n n µ = µ n σ + n σ + + n σ = n n σ = n σ Estimatet x kaldes et centralt estimat for µ. Bemærk: stort n giver lille varians/stor præcision! 3/37 Hvis yderligere de enkelte X i er normalfordelte gælder n Xi N( n µ, n σ ) og dermed er også X normalfordelt. (husk, sum af normalfordelte er selv normalfordelt). 4/37
7 Effekten af øget antal observationer Konfidensinterval for µ Fordelingen af gennemsnittet X for forskellige antal observationer (n). n = 0 n = 5 n = Gennemsnittet x er et estimat for µ. Hvor præcist er dette estimat? Vores modelantagelse siger at X,...,X n er uafhængige og identiske fordelte, X i N (µ,σ ) for i =,...,n. Desuden antages det her, at variansen σ er kendt. Fra teorien om sandsynlighedsintervaller har vi for X N (µ,σ ): P (µ,96σ X µ +,96σ) = 0,95. n = Bemærk: Jo større n jo større sandsynlighed for at X ligger tæt på µ. Ovenstående antagelser medfører, at X N (µ, σ n ). Heraf følger, at for X gælder: P (µ,96 σ n X µ +,96 σ n ) = 0,95. 5/37 6/37 Konfidensinterval - fortsat Sandsynligheden for forrige slide kan nu omskrives, så µ isoleres : P ( P ( P ( P ( µ.96 σ n X µ +.96 σ n ) = 0.95 X.96 σ n µ X +.96 σ n ) = 0.95 X +.96 σ n µ X.96 σ n ) = 0.95 X.96 σ n µ X +.96 σ n ) = 0.95 Konfidensinterval - fortsat Vi kan nu definere et konfidensinterval Definition: Konfidensinterval Antag X,...,X n er en stikprøve af uafhænige observationer fra N (µ,σ ), og X er gennemsnittet af denne stikprøve. Da er et 95% konfidensinterval for µ givet ved X ±,96 σ n. Den sidste sandsynlighed har følgende fortolkning: eller Sandsynligheden for at X antager en værdi x så µ ligger i intervallet [ x.96 σ n ; x +.96 σ n ] er Der er 95% sandsynlighed for at det stokastiske interval [ X.96 σ n ; X +.96 n σ ] indeholder µ. 7/37 7 Fortolkning: Vi er 95% sikre på, at intervallet X ±,96 σ n indeholder den sande middelværdi µ. Omvendt: for en given konkret realisation x ±,96 σ n vil der være sandsynlighed enten 0 eller for at µ er i intervallet. Konfidensintervallet har forskellig fortolkning før og og efter data er observeret! 8/37
8 Konfidensinterval - grafisk Konfidensinterval - fortolkning µ x +.96 σ n x x.96 σ n Antag vi observerer de n stokastiske variable k gange, dvs. vi får k observationsrækker med n tal. : x,, x,,..., x,n x : x,, x,,..., x,n x. k : x k,, x k,,..., x k,n x k µ Hermed fås k middelværdi estimater x,..., x k og k tilhørende konfidensintervaller. For k stor kan vi forvente at 95% af intervallerne indeholder µ. 9/37 30/37 Eksempel Praktisk brug af konfidensinterval Der foretages 0 gange 0 opmålinger af en længde på 8. m. Det antages, at der er en varians på observationerne på 0.0 m. Figuren viser de 0 konfidensintervaller for hver forsøgsrække. Meter In praktisk brug vil vi ofte agere, som at den sande middelværdi er en af værdierne i 95% konfidensintervallet. Det kan meget vel være forkert for et givet observeret konfidensinterval. Men i det lange løb tager vi kun fejl i 5% af tilfældene. Vil vi have større sikkerhed kan vi benytte f.eks. 99% konfidensintervaller (skift faktoren.96 ud med.58) Forsøgsrække 3/37 3/37
9 Eksempel - fortsat Ikke normalfordelte data - er alt tabt? Magisk resultat (centrale grænseværdisætning, CLT) Antag at vi kendte variansen i vores eksempel med 0 observerede vinkelmålinger. Det oplyses at σ = Vi kan da bestemme et 95% konfidensinterval for µ, hvor x = 64.5 fra tidligere: [ ; ] = [ ; 64.5] 0 0 Per konstruktion ligger x altid midt i intervallet. Længden på intervallet er et udtryk for nøjagtigheden (kort interval=høj præcision) Centrale grænseværdisætning Hvis X,...,X n er uafhængige stokastiske variable med samme middelværdi µ og varians σ så gælder når n stor X N(µ, σ n ) Vores konstruktion af konfidensinterval benyttede blot, at X N(µ, σ n ) Dvs. selv for ikke-normalfordelte målinger vil konfidensintervallet stadig give god mening. 33/37 34/37 Illustration af CLT Histogram af første stikprøve n = 00 n=00 : x,, x,,..., x,n x : x,, x,,..., x,n x. k : x k,, x k,,..., x k,n x k hvor x i,j realisationer af Gamma-fordelte stokastiske variable. 9 Frequency /37 Observationer langt fra normalfordelte! 36/37
10 Histogram af 500 gennemsnit x,... x 500 n = 5 n = 0 Histogram of barx Histogram of barx Frequency Frequency barx n = 30 n = 00 barx Histogram of barx Histogram of barx Frequency Frequency barx barx Gennemsnit af mange observationer er normalfordelt! 37/37 0
Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:
Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable
Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:
1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable
Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet Kursusholder
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable
Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/41 Landmålingens fejlteori - lidt om kurset
Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering
Landmålingens fejlteori Lektion 3 Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition: Middelværdi og
Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl
Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske
Produkt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/
Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen
Vægte motiverende eksempel Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@mathaaudk Institut for Matematiske Fag Aalborg Universitet Højdeforskellen mellem punkterne P
Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18
Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)
Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl
Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf13 Institut for Matematiske Fag Aalborg Universitet 1/1 Vægtet
Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.
Repetitio: Normalfordelige Ladmåliges fejlteori Lektio Trasformatio af stokastiske variable - [email protected] http://people.math.aau.dk/ kkb/udervisig/lf13 Istitut for Matematiske Fag Aalborg Uiversitet
Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen
Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning
Fejlforplantning Landmålingens fejlteori Lektion 5 Fejlforplantning - [email protected] http://people.math.aau.dk/ kkb/undervisning/lf13 Landmåling involverer ofte bestemmelse af størrelser som ikke kan
Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.
Simple fejlforplantningslov Landmålingens fejlteori Lektion 6 Den generelle fejlforplantningslov Antag X, X,, X n er n uafhængige stokastiske variable, hvor Var(X )σ,, Var(X n )σ n Lad Y g(x, X,, X n ),
Kvantitative Metoder 1 - Forår 2007
Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte
Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Tema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Landmålingens fejlteori - Lektion 5 - Fejlforplantning
Landmålingens fejlteori Lektion 5 Fejlforplantning - [email protected] Institut for Matematiske Fag Aalborg Universitet 1/30 Fejlforplantning Landmåling involverer ofte bestemmelse af størrelser som ikke
Note om Monte Carlo metoden
Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at
Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen
Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager
Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger
Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:
Uge 10 Teoretisk Statistik 1. marts 2004
1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede
Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater
Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable
Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen
Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen Repetition Lov om total sandsynlighed Bayes sætning P( B A) = P(A) = P(AI B) + P(AI P( A B) P( B) P( A B) P( B) +
hvor a og b er konstanter. Ved middelværdidannelse fås videre
Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den
3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 / 22 Generalisering fra stikprøve til population Idé: Opstil en model for populationen
men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Normalfordelingen og transformation af kontinuerte fordelinger Helle Sørensen Uge 7, mandag SaSt2 (Uge 7, mandag) Normalford. og transformation 1 / 16 Program Paretofordelingen,
Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.
Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller
Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens
Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve
MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Statistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Normalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål
Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Opgaver til kapitel 3
Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer
Kapitel 4 Sandsynlighed og statistiske modeller
Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze [email protected] Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol
Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Karakteristiske funktioner og Den Centrale Grænseværdisætning
E6 efterår 1999 Notat 10 Jørgen Larsen 20. oktober 1999 Karakteristiske funktioner og Den Centrale Grænseværdisætning Karakteristiske funktioner som er nære slægtninge til Fourier-transformationen) er
Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm
Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik [email protected] Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation
Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22
Statistik Kursets omfang: 2 ECTS Inklusiv mini-projekt! Bog: Complete Business Statistics, AD Aczel & J. Sounderpandian Software: SPSS eller Excel?? Forelæser: Kasper K. Berthelsen E-mail: [email protected]
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder
Elementær sandsynlighedsregning
Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.
Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)
Noter i fejlteori. Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen. Version 1.1
Noter i fejlteori Kasper Klitgaard Berthelsen Poul Winding & Jens Møller Pedersen Version 1.1 April 2013 2 Indhold 1 Motivation 3 2 Det matematiske fundament 5 2.1 Lidt sandsynlighedsregning......................
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4
02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1
Eksamen 2014/2015 Mål- og integralteori
Eksamen 4/5 Mål- og integralteori Københavns Universitet Institut for Matematiske Fag Formalia Eksamensopgaven består af 4 opgaver med ialt spørgsmål Ved bedømmelsen indgår de spørgsmål med samme vægt
Løsninger til kapitel 6
Opgave 6.1 a) 180 200 P ( X < 180) = Φ = Φ( = 0, 1587 b) 220 200 P ( X > 220) = Φ = Φ(1) = 0, 8413 c) 200 200 P ( X > 200) = 1 X < 200) = 1 Φ = ) = 1 0,5 = 0, 5 d) P ( X = 230) = 0 e) 180 200 P ( X 180)
Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...
Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................
Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen
Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: [email protected] Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse
Teoretisk Statistik, 16. februar Generel teori,repetition
1 Uge 8 Teoretisk Statistik, 16. februar 2004 1. Generel teori, repetition 2. Diskret udfaldsrum punktssh. 3. Fordelingsfunktionen 4. Tæthed 5. Transformationer 6. Diskrete vs. Kontinuerte stokastiske
Statistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
