Teoretisk Statistik, 16. februar Generel teori,repetition

Relaterede dokumenter
Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Uge 10 Teoretisk Statistik 1. marts 2004

Statistik og Sandsynlighedsregning 2

Sandsynlighedsregning Oversigt over begreber og fordelinger

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsregning

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

INSTITUT FOR MATEMATISKE FAG c

StatDataN: Middelværdi og varians

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Susanne Ditlevsen Institut for Matematiske Fag susanne

Statistik og Sandsynlighedsregning 2

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Definition. Definitioner

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Nanostatistik: Stokastisk variabel

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

MM501 forelæsningsslides

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Opgaver i sandsynlighedsregning

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Teoretisk Statistik, 13 april, 2005

Repetition Stokastisk variabel

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Nanostatistik: Middelværdi og varians

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Sandsynlighedsregning Stokastisk variabel

Statistik og Sandsynlighedsregning 2

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Betingede sandsynligheder Aase D. Madsen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Kvantitative Metoder 1 - Efterår Dagens program

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Nanostatistik: Stokastisk variabel

Kvantitative Metoder 1 - Efterår Dagens program

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

MM501/MM503 forelæsningsslides

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Matematisk model for køsystem

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Løsning til prøveeksamen 1

Kvantitative Metoder 1 - Forår Dagens program

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Statistik og Sandsynlighedsregning 2

4 Oversigt over kapitel 4

Stokastiske processer og køteori

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 17. december 2015 Kursus nr : (navn) (underskrift) (bord nr)

Statistiske modeller

Kvantitative Metoder 1 - Forår 2007

Note om Monte Carlo metoden

Løsning til eksamen 16/

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Produkt og marked - matematiske og statistiske metoder

Kvantitative Metoder 1 - Forår Dagens program

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Kiosk-modellen (News vendor s model) og EOQ modellen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Hvad skal vi lave i dag?

Eksamen 2014/2015 Mål- og integralteori

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Kvantitative Metoder 1 - Forår Dagens program

StatDataN: Plot af data

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Produkt og marked - matematiske og statistiske metoder

3 Stokastiske variable 3.1 Diskrete variable

Transkript:

1 Uge 8 Teoretisk Statistik, 16. februar 2004 1. Generel teori, repetition 2. Diskret udfaldsrum punktssh. 3. Fordelingsfunktionen 4. Tæthed 5. Transformationer 6. Diskrete vs. Kontinuerte stokastiske variable 7. Middelværdi og varians Generel teori,repetition Udfaldsrum E med tilhørende sandsynlighed P, dvs. P(A) er veldefineret for (de fleste) delmængder A E. Stokastisk variabel X : E ú. Udfaldsrum for X: S = X(E) = {x x = X(e) for e E} Sandsynlighedsudsagn om X: P(X B) = P(X -1 (B)) = P({e E X(e) B}), B S eller ækvivalent hermed P(X = x) = P(B) = P({e X(e) = x B}), B S. (Eventuelt: S = E, X(e) = e)

2 Diskret udfaldsrum for X, repetition Tænk på S = {0,1,...,k} eller S = {0,1,2,...} = ù {0} Punktsandsynligheder, f(x) = P(X = x), x S Der gælder: f(x) 0, x S og f (x) = 1 Hvis S ={0,1,2,...} betyder x=0 x S f(x)=1 at k S = f(x)=f(0)+ +f(k) 1 for k. k x=0 (2) Diskret udfaldsrum for X, repetition Punktssh'erne bestemmer alle sandsynligheder om X: Fordelingsfunktion P(X B) = x B f (x), B S F(x)=P(X x) = P(X S ], x]) = f(z) x z S, z x Punktsandsynligheder kan bestemmes fra fordelingsfunktionen f(x) = P(X = x) = P(X # x) - P(X # x 1) = F(x) F(x - 1).

3 Relative hyppigheder vs. punktsandsynligheder Lad x 1,...,x n være observationer af en variabel med punktsandsynlighed f. Hvis n er stor, vil den relative hyppighed af observationer med værdi x være tæt på punktsandsynligheden P(X = x). Dette følger af Store Tals Lov (kapitel 7). Figur med relative hyppigheder vil ligne pindediagrammet. Eksempel: "Tilfældigt" tal mellem 0 og 1 E = S = [0,1]. X = tilfældigt tal mellem 0 og 1, dvs. alle tal skal have lige stor sandsynlighed for at blive trukket. Inddel f.eks. [0,1] i n lige store dele (n 0ù vilkårlig): P(X 0 [1/2-1/n, 12]) = 1/n For n 64 fås: P(X = 1/2) = 0. Tilsvarende... P(X = x) = 0, x 0 [0,1]

4 (2) Eksempel: "Tilfældigt" tal mellem 0 og 1 Punktsandsynlighederne P(X = x) er altså informationsløse. Vi må i stedet angive sandsynligheder for hele intervaller. For 0 # a # b 1: P(X 0[a,b]) = b - a = længden af intervallet Bemærk at P(X 0 [a,b]) = P(X 0]a, b[) = P(X 0]a,b]) = P(X 0 [a,b[) da P(X = a) = P(X = b) = 0. Fordelingsfunktionen Fastlægger sandsynligheder for intervaller på formen ] 4,x] F(x) = P(X 0] 4,x]) = P(X # x), x 0 ú For x 1 < x 2 har vi f.eks. P(X 0]x 1,x 2 ]) = F(x 2 ) - F(x 1 ) P(X >x) = 1 P(X # x) = 1 F(x) Faktisk kan alle ssh. om X beregnes ud fra fordelingsfunktionen.

5 Egenskaber ved fordelingsfunktionen F er ikke-aftagende F er højrekontinuert (F(x n ) F (x), hvis x n x) F(x) 6 0 hvis x 6 4 F(x) 6 1 hvis x 6 4. Desuden... P(X 0]x 1, x 2 ]) = F(x 2 ) - F(x 1 ) P(X > x) = 1 P(X # x) = 1 F(x) P(X = x) = P(X # x) P(X < x) = F (x) lim F(x ) x n x n Tæthed Hvis F er differentiabel defineres tætheden som f (x) = F' (x) og f(x) = 0 for x ó S. Egenskaber for f: = f(x) $ 0 for alle x f(x)dx= S - df(x), x S dx + f(x)dx=1.

6 (2) Tæthed Fra tæthed til fordelingsfunktionen (hvis inf S = a): Der gælder: F(x) = x f (y)dy = P(X 0]x 1,x 2 ]) = F(x 2 ) F(x 1 ) = x a f (y)dy P(X = x) = 0, da F er kontinuert. x x 2 1 f (y) dy Intuition: Sandsynligheden for at havne i et lille interval rundt om x er proportional med f(x). (3) Eksempel: Tilfældigt tal mellem 0 og 1 For 0 # a # b # 1: P(X 0 [a,b]) = b a P (X 0, x) = P([0,x]) = x, 1, x < 0 0 x 1 x > 1 0, x < 0 f(x) = F'(x) = 1, 0 x 1 0, x > 1 Den rektangulære fordeling (eller ligefordelingen) på [0,1].

7 Eksempel: Eksponentialfordelingen Udfaldsrum S = [0,4[. Intensitet 8 > 0 (konstant). Tæthed f(t) = 8e -8t, t 0 Fordelingsfunktion F(t) = λ t 0 e λs 1 ds = λ e λ λs t 0 = 1 e λt, t 0 Bruges f.eks. til beskrivelse af tiden indtil næste ankomst til en kø: P(næste kunde kommer før tid t) = 1 e - 8t. Transformationer Oprindelig variabel: X med fordeling givet ved f og F på S. Afbildning ϕ: S ú. Hvad er fordelingen af Y = ϕ(x), dvs. hvad er tætheds- /fordelingsfunktion for Y? Hvis ϕ er voksende (Tilsvarende formel for ϕ aftagende): G(y) = F(ϕ -1 (y)) g(y) = f(ϕ -1 (y))( ϕ -1 )'(y)

8 (2) Transformationer Vigtige transformationer: Y = a + bx (positions- og skalatransformation) Y = log(x) Y = F(X) er rektangulært fordelt på [0,1] Eksempler: 1 b a X er rektangulært fordelt på [a,b] Y = (X a) er rektangulært fordelt på [0,1], se nedenfor. T ~ exp (λ) bt ~ exp(λ/b). skalering af tiden, se AJKM ex. 3.5. Givet : X rekt [x 1,x 2 ]. 2 1 Nærmere om transformationer x- x1 F( x ) = x-x for x 1 x x 2. Idet X transformeres lineært ved Y= ax +b ønskes Y`s tæthedsfunktion g(y) udtrykt ved f(x). Fordelingsfunktionen for Y bliver G(y) = P( Y y) = P(aX+b y) = P(X (y-b)/a ) = ( y-b ) /a)-x1 x -x 2 1 for ax 1 +b < y < ax 2 +b

9 Ved differentiation fås da g(y) = 1/a(x 2 x 1 ) for ax 1 +b < y < ax 2 +b Indsæt x 1 = -b/a og x 2 = (1- b)/a, hvorved resultaterne i AJKM ex. 3.4 fremkommer: G(y) = y, g(y) = 1. Givet: X har fordelingsfunktion F(x), og skal transformeres med Y = F(X). Fordelingsfunktionen for Y bliver G(y) = P(Y y) = P(F(X) y) = P(X F -1 (y)) = F(F -1 ( y)) = y, hvor 0 y 1. Det medfører g(y) = 1, dvs. Y rekt [0,1]. Uge 8 Teoretisk Statistik, 16. februar 2004 1. Generel teori, repetition 2. Diskret udfaldsrum punktssh. 3. Fordelingsfunktionen 4. Tæthed 5. Transformationer 6. Diskrete vs. Kontinuerte stokastiske variable 7. Middelværdi og varians

10 Diskrete vs. kontinuerte stokastiske variable X diskret Punktsandsynlighed f: F(x) (0) x S f(x) = 1 f(x) = P(X = x) Fordelingsfunktion F: F(x) = P(X x) F(x) = z x f(z) F(x) = F(x) F(x 1) X kontinuert Tæthed f: F(x) (0) + f( x) dx=1 f(x))= P(X ] x - )/2, x+)/2]) Fordelingsfunktion F: F(x) = P(X x) P(X = x) = 0 hvis F kont. i x F(x) = + f(x) = F (x) f(x)dx Middelværdi og varians Teoretiske modstykker til gennemsnit og empirisk varians. Delvis kendt stof, så det vigtige er ikke formlerne i sig selv, men derimod at kunne forstå hvad størrelserne kan bruges til og hvornår Og hvad de ikke kan bruges til

11 Middelværdi for diskret variabel Gennemsnit som approksimation til middelværdi Der kan være problemer med eksistens, hvis udfaldsrummet ikke er endeligt. Definition: X diskret variabel med udfaldsrum S og sandsynlighedsfunktion f. Hvis x S x f(x) < så eksisterer middelværdien af X og er givet ved E[X] = x S xf(x) Middelværdi for kontinuert variabel Gennemsnit som approksimation til middelværdi Der kan være problemer med eksistens, hvis udfaldsrum ikke er begrænset. Definition: X kontinuert variabel med tæthed f. Hvis eksisterer middelværdien af X og er givet ved E[X] Altså integral i stedet for sum. = xf (x)dx + x f(x)dx < så

12 Middelværdi for transformeret stokastisk variabel Diskret/kontinuert variabel X med udfaldsrum S og punktsandsynlighed/tæthed f. Afbildning φ ú. Ny stokastisk variabel: Y = φ(x). Hvad er middelværdien af Y? Det diskrete tilfælde: Hvis S φ (x) f(x) < så har Y en middelværdi og E[Y] = S φ (x)f(x). Det kontinuerte tilfælde: Hvis så har Y en middelværdi og E[Y] = ϕ (x)f(x)dx. - ϕ (x) f(x)dx < Eksempel: kast med to mønter Kast med to mønter; X = antal krone. E[X] = 0 ¼ + 1 ½ + 2 ¼ = 1 (Kedeligt) spil: Jeg giver dig 12 kr. hvis ingen krone; ellers giver du mig 4 kr. Ny variabel: Y = min gevinst ved dette spil. Forventet gevinst E[Y] = (-12) ¼ + 4 ½ + 4 ¼ = 0 Kunne også beregnes via punktsandsynlighederne for Y.

13 Eksempel: Eksponentialfordelingen T ~ exp(λ), dvs. Så er og f(t) = λ e -λt, t 0 E[T] = I 0 4 t λe -λ dt = = 1/λ E[T 2 ] = I 0 4 t 2 λe -λt dt = = 2/λ 2 Varians Hvor langt ligger X "i middel" fra sin middelværdi? var[x] = E[(X E[X]) 2 ] = x S [ ] [ ] 2 2 (x E X ) f(x) (x E X ) f(x)dx var[x] er et teoretisk modstykke til empirisk varians: n 2 1 2 i i 1 s = (x x) var[x] n 1 = Problemer med eksistens hvis S ikke er endelig/begrænset.

14 (2) Varians X diskret variabel med udfaldsrum S og sandsynlighedsfunktion f. Hvis x S x 2 f(x) < 4 så eksisterer variansen af X: x S 2 2 2 2 var[x] = (x E[X]) f(x) = x f(x) (E[X]) = E[X ] (E[X]) x S 2 X kontinuert variabel med tæthed f. Hvis så eksisterer variansen af X: - 2 x f(x)dx < 2 2 2 2 var[x] = (x E[X]) f(x)dx = x f(x)dx (E[X]) = E[X ] (E[X]) 2 Regneregler (X diskret eller kontinuert) Middelværdi og varians for lineært transformeret variabel (a og b er konstante, reelle tal): Beregning af varians: E[a + bx] = a + be[x] var[a + bx] = b 2 var[x] var[x] = E[X 2 ] (E[X]) 2 hvor altså E[X 2 ] er lig 2 2 S xf(x)eller xf(x)dx.

15 Eksempel: Eksponentialfordelingen T ~ exp(λ). Vi så før at E[T] = 1/λ E[T 2 ] = 2(1/λ) 2 så var[t] =E[T 2 ] (E[T]) 2 = 2/λ 2 1/λ 2 = 1/λ 2. Teoretisk vs. empirisk fordeling Teoretisk fordeling af stokastisk variabel X er versus empirisk fordeling af observationer x 1,,x n. Teoretisk Sansynlighedsfunktion Tæthed Middelværdi Varians teoretiske fraktiler Empirisk Relative hyppigheder Histogram Genemsnit Empirisk varians (s 2 ) Empiriske fraktiler

16 Teoretiske fraktiler Empirisk p-fraktil (intuitivt): x p er en (empirisk) p-fraktil, hvis andelen p af observationer x 1,,x n er højst x p. Teoretisk p-fraktil (løst): x er en (teoretisk) p-fraktil, hvis P(X x p ) = p F(x p ) = p.