1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt over kapitel 3 u-fordelingen Man kan vise at x / e dx= π så 1 ϕ (x) = π e x / er tæthed for en fordeling på ú. Hvis U har denne tæthed er E[U] = 0, var[u] = 1 Den standardiserede normalfordeling, u-fordelingen eller normalfordelingen med middelværdi 0 og varians 1 eller N(0,1).
Normalfordelingen Lad U ~ N(0,1) og lad : ú og σ > 0 være konstanter. Sæt Så er E[X] = : og var[x] = σ. X = : + σu Fordelingen af X kaldes normalfordelingen med middelværdi : og varians σ eller N(:,σ ). () Normalfordelingen X = : + σu hvor U ~ N(0,1), dvs. har tæthed φ og fordelingsfunktion M. Fordelingsfunktion for X: Tæthed for X: x µ x µ F(x) = P(X x) = P U =Φ σ σ ( ) ( ) f x =F` x ϕ x-µ 1 1 = = σ σ πσ e ( x-µ ) σ
3 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt over kapitel 3 (3) Normalfordelingen N(0,1) : u / u 1 ϕ (u) = e, Φ (u) = ϕ(z)dz π Hvis U ~ N(0,1): E[U] = 0 og var[u] = 1. Hvis U ~N(0,1) og X = : + FU, så X ~N(:, F ): 1 (x µ ) x µ f(x) = exp F(x) =Φ πσ σ σ Hvis X ~N(:, σ ): E[X] = : og var [X] = σ.
4 Beregning af N-sandsynligheder Lad X ~ N(:, σ ) og lad a < b. Så er a µ X µ b µ b µ a µ P(a X b) = P =Φ Φ σ σ σ σ σ M-værdierne kan slås op i tabeller eller beregnes i f.eks. SAS. Lineær transformation af normalfordelingen Der gælder U ~ N(0,1) X = : + σu ~ N(:, σ ) X µ X~N( µσ, ) U = ~N(0,1) σ Dermed X ~ N(:,σ ) Y = a+bx ~ N(a+b:, b σ ) Klassen af normalfordelinger er lukket overfor lineære transformationer.
Vigtig egenskab for normalfordelingen 5 Sandsynligheden X µ P( k) = P(: - kf # X # : + kf) σ = P(- kf # X - : # kf) = P(- k # U # k) = M(k) - M(-k) afhænger ikke af : og F for noget k > 0. F. eks. P(: - F # X # : + F) = M (1) - M (-1) = 0.68 P(: - 1.96F # X # : + 1.96F) = M(1.96) M(-1.96) = 0.95 P(: -.576F # X # : +.576F) = M(.576) M(-.576) = 0.99 P(: - 3.9F # X # : + 3.9F) = M(3.9) M(-3.9) = 0.999
6 Grafisk kontrol af normalfordelingsantagelse Uafhængige observationer x 1,,x n af stokastisk variabel X. Spørgsmål: Kan X antages at være normalfordelt? (Og hvorfor er vi så interesserede i det?) Histogram med indlagt tæthed for N( x,s ): Histogrammet vil være en god approksimation til tæthedskurven,hvis X er normalfordelt (og n er tilstrækkelig stor). Normalfraktildiagram: Sammenligner de empiriske fraktiler for observationerne med fraktilerne i normalfordelingen. u p er en p-fraktil for N(0,1) hvis p = P(U # u p ) = M(u p ). Normalfraktildiagram Normalfraktildiagram: Sammenligner de empiriske fraktiler for n uafhængige obs. x 1,,x n med fraktilerne i normalfordelingen. Hvis X ~ N(:,F ) uformelt i 0.5 x µ p P( X x ) x n σ (i) 1 i = (i) =Φ (i) =µ+σφ Plot x (i) (y-aksen) mode p i -fraktilen M -1 (p i ) (x-aksen). Punkterne vil ligge omkring en ret linie, hvis X er normalfordlet (og n er tilstrækkelig stor). Grafisk estimation af : og F. (p ) i
7 Eksempel Kumulerede hyppigheder for 16 cementsækkes vægte. i = 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 x (i) 49. 49.8 49.8 49.9 50.0 50.0 50.0 50.1 50.1 50.1 50.1 50.1 50.1 50. 50.4 50.6 (i - ½)/n 0.031 0.156 0.19 0.406 0.781 0.844 0.906 0.969
8 Kommentarer Eksempler Kommentarer og eksempler Kig efter systematiske afvigelser! Transformer evt. data (f.eks. med log eller ). Vi vil gerne have N-fordelte obs. da de statistiske analyser så er lette at udføre. Pas på når antallet af observationer, n, ikke er stort. Index for produktionsværdi (opgave 1.6) Simulerede værdier (n lille/stor) Priser på skruenøgler En forbrugerorganisation ønsker at undersøge prisernes variation på værktøj. Med henblik herpå udtog man i uge, 1980 en tilfældig stikprøve på 100 isenkræmmere, værktøjsmagasiner, byggemarkeder, etc. fordelt over hele landet. I nedenstående tabel er anført de således indsamlede prisoplysninger på 6"-skruenøgler. Tabel 1: Fordelingen af prisen på 6"-skruenøgler for 1000 detailudsalg, uge, 1980. pris i kroner antal observerede priser (0,5] 103 (5,10] 6 (10,0] 154 (0,30] 16 (30,40] 185 (40,50] 116 (50,60] 9 (60,70] 41 (70,+ ] 31 Total 1000 a) Opstil en normalfordelingsmodel til beskrivelse af de observerede skruenøglepriser. Giv en fortolkning af modellens parametre. b) Afprøv modellens holdbarhed ved hjælp af et fraktildiagram og et histogram.
9
10 % 0 h 00 10 t j 5 10 0 30 40 50 60 70 Begreber fra kapitel 3 Punktsandsynlighed/tæthed, f diskret: f(x) = P(X = x) kontinuert: f(x) P(X ]x /, x + /]) Fordelingsfunktion, F F(x) = P(X # x) Sammenhæng mellem f og F: diskret: F(x) = f(z), f(x) = F(x) F(x 1) z x kontinuert: F(x) = x f(x)dx,f(x) = F'(x)
11 () Begreber fra kapitel 3 Middelværdi diskret: E[X] = kontinuert: [ ] Varians xs xf(x) E X = xf (x)dx Def. og regneregel: var[x] = E[(X (E[X]) ] = E[X ] (E[X]) diskret: [ ] = [ ] var X x f (x) (E X ) x S kontinuert: [ ] = [ ] var X x f (x)dx (E X ) Oversigt over diskrete fordelinger P S f E Var bin(n,p) {0,1,,n} n p x (1 p) n p hypgeo(n,m,n) Ps(λ) negbin(k,p) (del af) {0,1,,n} {0,1, } {0,1, } M N M x n x N n e x! x np np(1-p) M n N MN MN n n N N N 1 x λ λ λ λ x + k 1 p k (1 p) x k 1 Stikprøve med/uden tilbagelægning (bin/hypgeo) 1 p k p 1 p k p
1 Approks. af hypgeo (N,M,n) med bin(n,n/m) hvis N og M store. Approks. af bin (n,p) med Ps(λ) hvis n stor, p lille og np = λ Oversigt over kontinuerte fordelinger N(µ,σ ) Γ(",β) P S f E Var ú ]0, 1 (x µ) exp πσ σ β α x Γβ ( ) β 1 αx e µ σ Γ(1,") er lig eksponentialfordelingen med intensitet ". Hvis f = β N: Γ(β,1/) = P (f). β β α α