Uge 10 Teoretisk Statistik 1. marts 2004

Relaterede dokumenter
Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Teoretisk Statistik, 16. februar Generel teori,repetition

Produkt og marked - matematiske og statistiske metoder

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

StatDataN: Plot af data

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistik og Sandsynlighedsregning 2

Betingede sandsynligheder Aase D. Madsen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Tema. Dagens tema: Indfør centrale statistiske begreber.

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Statistik og Sandsynlighedsregning 2

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Lidt om fordelinger, afledt af normalfordelingen

Kvantitative Metoder 1 - Forår Dagens program

Kapitel 4 Sandsynlighed og statistiske modeller

Elementær sandsynlighedsregning

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Kvantitative Metoder 1 - Forår 2007

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Elementær sandsynlighedsregning

Opgaver til kapitel 3

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Kapitel 4 Sandsynlighed og statistiske modeller

Sandsynlighedsregning Oversigt over begreber og fordelinger

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Højde af kvinder 2 / 18

Kvantitative Metoder 1 - Forår Dagens program

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Løsninger til kapitel 6

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Kvantitative Metoder 1 - Forår 2007

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Statistiske modeller

Statistik og Sandsynlighedsregning 2

INSTITUT FOR MATEMATISKE FAG c

Normalfordelingen og Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

StatDataN: Middelværdi og varians

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Hvorfor er normalfordelingen så normal?

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

Statistik og Sandsynlighedsregning 2

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 16. december 2003 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning

StatDataN: Test af hypotese

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Kvantitative Metoder 1 - Forår 2007

4 Oversigt over kapitel 4

Definition. Definitioner

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Nanostatistik: Test af hypotese

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Transkript:

1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt over kapitel 3 u-fordelingen Man kan vise at x / e dx= π så 1 ϕ (x) = π e x / er tæthed for en fordeling på ú. Hvis U har denne tæthed er E[U] = 0, var[u] = 1 Den standardiserede normalfordeling, u-fordelingen eller normalfordelingen med middelværdi 0 og varians 1 eller N(0,1).

Normalfordelingen Lad U ~ N(0,1) og lad : ú og σ > 0 være konstanter. Sæt Så er E[X] = : og var[x] = σ. X = : + σu Fordelingen af X kaldes normalfordelingen med middelværdi : og varians σ eller N(:,σ ). () Normalfordelingen X = : + σu hvor U ~ N(0,1), dvs. har tæthed φ og fordelingsfunktion M. Fordelingsfunktion for X: Tæthed for X: x µ x µ F(x) = P(X x) = P U =Φ σ σ ( ) ( ) f x =F` x ϕ x-µ 1 1 = = σ σ πσ e ( x-µ ) σ

3 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt over kapitel 3 (3) Normalfordelingen N(0,1) : u / u 1 ϕ (u) = e, Φ (u) = ϕ(z)dz π Hvis U ~ N(0,1): E[U] = 0 og var[u] = 1. Hvis U ~N(0,1) og X = : + FU, så X ~N(:, F ): 1 (x µ ) x µ f(x) = exp F(x) =Φ πσ σ σ Hvis X ~N(:, σ ): E[X] = : og var [X] = σ.

4 Beregning af N-sandsynligheder Lad X ~ N(:, σ ) og lad a < b. Så er a µ X µ b µ b µ a µ P(a X b) = P =Φ Φ σ σ σ σ σ M-værdierne kan slås op i tabeller eller beregnes i f.eks. SAS. Lineær transformation af normalfordelingen Der gælder U ~ N(0,1) X = : + σu ~ N(:, σ ) X µ X~N( µσ, ) U = ~N(0,1) σ Dermed X ~ N(:,σ ) Y = a+bx ~ N(a+b:, b σ ) Klassen af normalfordelinger er lukket overfor lineære transformationer.

Vigtig egenskab for normalfordelingen 5 Sandsynligheden X µ P( k) = P(: - kf # X # : + kf) σ = P(- kf # X - : # kf) = P(- k # U # k) = M(k) - M(-k) afhænger ikke af : og F for noget k > 0. F. eks. P(: - F # X # : + F) = M (1) - M (-1) = 0.68 P(: - 1.96F # X # : + 1.96F) = M(1.96) M(-1.96) = 0.95 P(: -.576F # X # : +.576F) = M(.576) M(-.576) = 0.99 P(: - 3.9F # X # : + 3.9F) = M(3.9) M(-3.9) = 0.999

6 Grafisk kontrol af normalfordelingsantagelse Uafhængige observationer x 1,,x n af stokastisk variabel X. Spørgsmål: Kan X antages at være normalfordelt? (Og hvorfor er vi så interesserede i det?) Histogram med indlagt tæthed for N( x,s ): Histogrammet vil være en god approksimation til tæthedskurven,hvis X er normalfordelt (og n er tilstrækkelig stor). Normalfraktildiagram: Sammenligner de empiriske fraktiler for observationerne med fraktilerne i normalfordelingen. u p er en p-fraktil for N(0,1) hvis p = P(U # u p ) = M(u p ). Normalfraktildiagram Normalfraktildiagram: Sammenligner de empiriske fraktiler for n uafhængige obs. x 1,,x n med fraktilerne i normalfordelingen. Hvis X ~ N(:,F ) uformelt i 0.5 x µ p P( X x ) x n σ (i) 1 i = (i) =Φ (i) =µ+σφ Plot x (i) (y-aksen) mode p i -fraktilen M -1 (p i ) (x-aksen). Punkterne vil ligge omkring en ret linie, hvis X er normalfordlet (og n er tilstrækkelig stor). Grafisk estimation af : og F. (p ) i

7 Eksempel Kumulerede hyppigheder for 16 cementsækkes vægte. i = 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 x (i) 49. 49.8 49.8 49.9 50.0 50.0 50.0 50.1 50.1 50.1 50.1 50.1 50.1 50. 50.4 50.6 (i - ½)/n 0.031 0.156 0.19 0.406 0.781 0.844 0.906 0.969

8 Kommentarer Eksempler Kommentarer og eksempler Kig efter systematiske afvigelser! Transformer evt. data (f.eks. med log eller ). Vi vil gerne have N-fordelte obs. da de statistiske analyser så er lette at udføre. Pas på når antallet af observationer, n, ikke er stort. Index for produktionsværdi (opgave 1.6) Simulerede værdier (n lille/stor) Priser på skruenøgler En forbrugerorganisation ønsker at undersøge prisernes variation på værktøj. Med henblik herpå udtog man i uge, 1980 en tilfældig stikprøve på 100 isenkræmmere, værktøjsmagasiner, byggemarkeder, etc. fordelt over hele landet. I nedenstående tabel er anført de således indsamlede prisoplysninger på 6"-skruenøgler. Tabel 1: Fordelingen af prisen på 6"-skruenøgler for 1000 detailudsalg, uge, 1980. pris i kroner antal observerede priser (0,5] 103 (5,10] 6 (10,0] 154 (0,30] 16 (30,40] 185 (40,50] 116 (50,60] 9 (60,70] 41 (70,+ ] 31 Total 1000 a) Opstil en normalfordelingsmodel til beskrivelse af de observerede skruenøglepriser. Giv en fortolkning af modellens parametre. b) Afprøv modellens holdbarhed ved hjælp af et fraktildiagram og et histogram.

9

10 % 0 h 00 10 t j 5 10 0 30 40 50 60 70 Begreber fra kapitel 3 Punktsandsynlighed/tæthed, f diskret: f(x) = P(X = x) kontinuert: f(x) P(X ]x /, x + /]) Fordelingsfunktion, F F(x) = P(X # x) Sammenhæng mellem f og F: diskret: F(x) = f(z), f(x) = F(x) F(x 1) z x kontinuert: F(x) = x f(x)dx,f(x) = F'(x)

11 () Begreber fra kapitel 3 Middelværdi diskret: E[X] = kontinuert: [ ] Varians xs xf(x) E X = xf (x)dx Def. og regneregel: var[x] = E[(X (E[X]) ] = E[X ] (E[X]) diskret: [ ] = [ ] var X x f (x) (E X ) x S kontinuert: [ ] = [ ] var X x f (x)dx (E X ) Oversigt over diskrete fordelinger P S f E Var bin(n,p) {0,1,,n} n p x (1 p) n p hypgeo(n,m,n) Ps(λ) negbin(k,p) (del af) {0,1,,n} {0,1, } {0,1, } M N M x n x N n e x! x np np(1-p) M n N MN MN n n N N N 1 x λ λ λ λ x + k 1 p k (1 p) x k 1 Stikprøve med/uden tilbagelægning (bin/hypgeo) 1 p k p 1 p k p

1 Approks. af hypgeo (N,M,n) med bin(n,n/m) hvis N og M store. Approks. af bin (n,p) med Ps(λ) hvis n stor, p lille og np = λ Oversigt over kontinuerte fordelinger N(µ,σ ) Γ(",β) P S f E Var ú ]0, 1 (x µ) exp πσ σ β α x Γβ ( ) β 1 αx e µ σ Γ(1,") er lig eksponentialfordelingen med intensitet ". Hvis f = β N: Γ(β,1/) = P (f). β β α α