Nanostatistik: Stokastisk variabel

Relaterede dokumenter
Nanostatistik: Stokastisk variabel

StatDataN: Middelværdi og varians

Nanostatistik: Middelværdi og varians

Elementær sandsynlighedsregning

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Sandsynlighedsregning Stokastisk variabel

Nanostatistik: sandsynligheder Kursushjemmeside: kurser/nanostatistik/

Definition. Definitioner

Elementær sandsynlighedsregning

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Hvad skal vi lave i dag?

Statistik og Sandsynlighedsregning 2

Teoretisk Statistik, 16. februar Generel teori,repetition

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Sandsynlighedsregning

Hvad skal vi lave i dag?

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Sandsynlighedsregning

Opgaver i sandsynlighedsregning

INSTITUT FOR MATEMATISKE FAG c

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Nanostatistik: Opgaver

Susanne Ditlevsen Institut for Matematiske Fag susanne

4 Oversigt over kapitel 4

Kvantitative Metoder 1 - Efterår Dagens program

Repetition Stokastisk variabel

Hvad skal vi lave i dag?

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program

Produkt og marked - matematiske og statistiske metoder

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Statistik og Sandsynlighedsregning 2

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

StatDataN: Plot af data

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

3 Stokastiske variable 3.1 Diskrete variable

Kvantitative Metoder 1 - Efterår Dagens program

Sandsynlighedsregning Oversigt over begreber og fordelinger

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

MM501 forelæsningsslides

Sandsynligheder. Mængder Hændelser Sandsynligheder Regler for sandsynligheder

Teoretisk Statistik, 13 april, 2005

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning & Statistik

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Kvantitative Metoder 1 - Forår Dagens program

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg.

Produkt og marked - matematiske og statistiske metoder

Betingede sandsynligheder Aase D. Madsen

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

MM501/MM503 forelæsningsslides

Aarhus Universitet 5. februar Meddelelse 2

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsregning & Statistik

TØ-opgaver til uge 45

Noter til E6. Del 1: Sandsynlighedsregning. Jørgen Larsen

Løsning til prøveeksamen 1

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Statistik og Sandsynlighedsregning 2

Vejledende løsninger til opgaver i kapitel 6

Nanostatistik: Konfidensinterval

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

4 Stokastiske variabler

Kvantitative Metoder 1 - Forår Dagens program

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Nanostatistik: Test af hypotese

Eksamen 2014/2015 Mål- og integralteori

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Hvorfor er det lige at vi skal lære det her?

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Sandsynlighedsregning

t a l e n t c a m p d k Matematiske Metoder Anders Friis Anne Ryelund 25. oktober 2014 Slide 1/42

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Transkript:

Nanostatistik: Stokastisk variabel JLJ Nanostatistik: Stokastisk variabel p. 1/29

Repetition Ω: udfaldsrummet: alle de mulige udfald af et experiment P(A): ss for hændelsen A = frekvens i uafhængige gentagelser P(A B) = P(A) + P(B) når A og B er disjunkte hændelser Ex: Kaster en terning to gange. Ω = {(1, 1), (1, 2),..., (6, 5), (6, 6)} P(max =3 eller sum = 7) = P((1, 3), (2, 3), (3, 3), (3, 2), (3, 1) eller (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) = P(max =3) + P(sum = 7) Nanostatistik: Stokastisk variabel p. 2/29

Stokastisk variabel Udfald ω Ω: et meget kompliceret objekt Experiment: måle nogle få egenskaber ved ω Ex: Ω = alle danske mænd over 20 år experiment: vælge en tilfældig person og måle højden Stokastisk variabel X: en egenskab ved ω der angives ved et reelt tal (vi bruger store bogstaver for stokastiske variable) Formelt: X er en afbildning fra Ω ind i de reelle tal Diskret stokastisk variabel: X kan kun antage heltallige værdier Kontinuert stokastisk variabel: X kan antage alle mulige værdier Nanostatistik: Stokastisk variabel p. 3/29

Stokastisk variabel Ex1: Møntkast: X(pl) = 0, X(kr) = 1 Ex2: Terningekast: { X(m øjne) = m 0 hvis m er ulige Y (m øjne) = 1 hvis m er lige Ex3: Ω = alle mulige egetræer X(ω) = antallet af blade på træet ω (diskret) X(ω) = højden af træet ω (kontinuert) Nanostatistik: Stokastisk variabel p. 4/29

Diskret stokastisk variabel X(ω) = i fortæller os ikke direkte hvad ω er Ex2: Y = 1 hvis et lige antal øjne på terning Y = 1 fortæller os at vi har fået enten 2, 4 eller 6 øjne X(ω) = i ω Ω i = { ω X( ω) = i} ss for X = i: P(X=i) = frekvens af værdien i i uafhængige gentagelser = frekvens hvormed vi får hændelsen Ω i = P(Ω i ) Ex2: P(Y = 1) = P({2, 4, 6}) = 3 6 Ex3: Kaste terning 2 gange. X = øjne i kast 1 - øjne i kast 2 P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4 36 Nanostatistik: Stokastisk variabel p. 5/29

ss-funktion Notation: sandsynlighedsfunktionen f X (i) = P(X = i) Da f X (i) = P(X = i) har vi 0 f X (i) 1 f X (i) = 1 ( i f x(i) = i P(X = i) = i P(Ω i) = P(Ω) = 1) Notation: Den kumulerede ss-funktion = fordelingsfunktionen F X (x) = P(X x) = i x P(X = i) = i x f X(i) i Nanostatistik: Stokastisk variabel p. 6/29

ss-funktion Regneregel: Hvis B er en delmængde af A gælder der P(A \ B) = P(A) P(B) da A = B (A \ B) har vi P(A) = P(B) + P(A \ B) F X f X : f x (i) = P(X = i) = P(X i) P(X i 1) = F X (i) F X (i 1) Mere generelt: P(a < X b) = F X (b) F X (a) VIS PLOT Nanostatistik: Stokastisk variabel p. 7/29

eksempel Ex3: Kaste terning 2 gange. X = øjne i kast 1 - øjne i kast 2 P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4 36 f X (0) = P(X = 0) = 6 36 f X (1) = P(X = 1) = 5 36 = P(X = 1) = f X( 1) f X (2) = P(X = 2) = 4 36 = P(X = 2) = f X( 2). f X (5) = P(X = 5) = 1 36 = P(X = 5) = f X( 5) Vis Plot Nanostatistik: Stokastisk variabel p. 8/29

Simultan ss X og Y : to stokastisk variable defineret på samme udfaldsrum Ω X : Ω N Y : Ω N Ex: Ω = danske mænd over 20 år X = højde i hele cm, Y = vægt i hele kg Den simultane sandsynlighed er f X,Y (i,j) = P(X = i,y = j) = P({ω X(ω) = i og Y (ω) = j) Læses: ss for at X = i og Y = j, dvs ss for fællesmængden {ω X(ω) = i} {ω Y (ω) = j} Nanostatistik: Stokastisk variabel p. 9/29

Simultan ss Ex: Kaster to terninger Ω = {(i,j) 1 i,j 6} X = max af de to par øjne Y = summen af de to par øjne De mulige værdier af X er 1, 2, 3, 4, 5, 6 og de mulige værdier af Y er 2, 3,...,12. VIS PLOT Lav tabel på tavlen P(X = 3,Y = 5) = P({(2, 3), (3, 2)}) = 2 36 Nanostatistik: Stokastisk variabel p. 10/29

Marginal ss Fra P(X = i,y = j) til P(X = i): Da {ω X(ω) = i} = j {ω X(ω) = i,y (ω) = j} og disse mængder er disjunkte har vi P(X = i) = j P(X = i,y = j) Ex: Kast med to terninger: X = max, Y = sum P(X = 3) = P(X = 3,Y = 2) + P(X = 3,Y = 3) +P(X = 3,Y = 4) + + P(X = 3,Y = 12) = 2 36 + 2 36 + 1 36 VIS PLOT Nanostatistik: Stokastisk variabel p. 11/29

Betinget ss Ex: ss for flyulykke under start = antal ulykker / antal starter Køber billet hos Aeroflot: er det så den rigtige ss? Istedet: antal ulykker med Aeroflot / antal starter med Aeroflot Dette kaldes en betinget ss: jeg betinger med at det er et Aeroflot fly. P(Y = j X = i) læses: ss for at Y er j givet at X er i P(ulykke Aeroflot) = = = #(ulykker og Aerof lot) #starter #(starter og Aerof lot) #starter P(ulykke og Aeroflot) P(Aerof lot) #(ulykker og Aeroflot) #(starter og Aerof lot) Nanostatistik: Stokastisk variabel p. 12/29

Betinget ss Definition: P(X = i Y = j) = P(X=i,Y =j) P(Y =j) Ex: Kast med to terninger: X = max, Y = sum P(Y = 5 X = 3)? Givet X = 3 kan Y enten være 4, 5 eller 6: Vis plot der er 2 udfald der giver 4, to der giver 5 og 1 der giver 6, så P(Y = 5 X = 3) = 2 5 P(X = 3,Y = 5) = 2 36 P(X = 3) = 5 36 = 2 5 P(Y = 5 X = 3) = 2 36 5 36 Betinget ss = frekvens i den relevante delmængde af uafhængige gentagelser Nanostatistik: Stokastisk variabel p. 13/29

Betinget ss Trækker 2 kort fra et spil kort med 52 kort. Hvad er den betingede ss for at kort 2 er en ruder givet at kort 1 var en spar? Ω = {(i,j) 1 i,j 52,j i}, Ω = 52 51 alle udfald har samme ss antal udfald med kort 1 en spar og kort 2 en ruder = 13 13 antal udfald med kort 1 en spar = 13 51 betingede ss = 13 13 52 51 13 51 52 51 = 13 51 Nanostatistik: Stokastisk variabel p. 14/29

Betinget ss Skriver vi rundt på definitionen har vi Heraf følger P(X = i,y = j) = P(X = i Y = j)p(y = j) P(X = i) = j P(X = i,y = j) = j P(X = i Y = j)p(y = j) Nanostatistik: Stokastisk variabel p. 15/29

Uafhængighed X og Y er uafhængige: Viden om Y fortæller os ikke noget om X P(X = i Y = j) = P(X = i) for alle i,j Dette er ækvivalent med P(X = i,y = j) P(Y = j) = P(X = i) for alle i,j eller P(X = i,y = j) = P(X = i)p(y = j) for alle i,j Nanostatistik: Stokastisk variabel p. 16/29

Uafhængighed Ubevidst brug af dette: To uafhængige kast med en terning: Alle 36 muligheder har samme ss. Hver mulighed har ss 1 36 = 1 6 16 Ex: Kast med to terninger: X = max, Y = sum P(Y = 5) = P({(1, 4), (2, 3), (3, 2), (4, 1)}) = 4 36 = 1 9 = 5 45 P(Y = 5 X = 3) = 2 5 = 18 45 Altså er Y og X ikke uafhængige: viden om X giver os viden om Y Nanostatistik: Stokastisk variabel p. 17/29

Kontinuert stokastisk variabel Ex: registreret eet klik i geigertæller i tidsintervallet [0, T] Hvornår kom klikket? X er tidspunktet Alle tidspunkter i [0,T] er mulige, ingen er mere oplagte end andre [0,T/2] og [T/2,T] har samme ss 1 2. Halverer vi igen får vi 4 intervaller der er lige sandsynlige: X er uniformt fordelt på [0,T] P(X = x) = 0: alle intervaller af længe 1 n må have ss T/n Nanostatistik: Stokastisk variabel p. 18/29

Kontinuert stokastisk variabel Istedet beskriver vi X ved dens fordelingsfunktion F X (x) = P(X x) Ud fra denne kan vi finde ss for ethvert interval P(X (a,b]) = P(X b) P(X a) = F X (b) F X (a) Uniforme fordeling: P(a < X b) er proportional med intervallængden P(a < X b) = b a T F X (x) = P(X x) = 0 x 0 x T 0 x T 1 x > T Nanostatistik: Stokastisk variabel p. 19/29

Tæthed Hvis F X er differentiabel kaldes f X (x) = F X (x) for tætheden af X, og vi har P(X (a,b)) = F X (b) F X (a) = Tæthed intutitivt: b a f X (x)dx P(X [x ɛ 2,x + ɛ 2 ]) f X(x) ɛ for ɛ lille Nanostatistik: Stokastisk variabel p. 20/29

Tæthed EX: Uniforme fordeling på [0,T] f X (x) = { 1T 0 x T 0 ellers Nanostatistik: Stokastisk variabel p. 21/29

Simultan fordeling X og Y begge kontinuerte variable. Fordelingsfunktion F X,Y (x,y) = P(X x,y y) Udregning af P(a < X b,c < Y d): {a < X b,c < Y d} = {a < X b,y d} \ {a < X b,y c} = ({X b,y d} \ {X a,y d}) \ ({X b,y c} \ {X a,y c}) VIS PLOT Nanostatistik: Stokastisk variabel p. 22/29

Simultan fordeling Udregning af P(a < X b,c < Y d): P(a < X b,c < Y d) = [F(b,d) F(a,d)] [F(b,c) F(a,c)] = F(b,d) F(a,d) F(b,c) + F(a,c) Nanostatistik: Stokastisk variabel p. 23/29

Simultan tæthed f X,Y (x,y) = F X,Y (x,y) x y Intuitivt: P(a < X b,c < Y d) = b a d c f X,Y (u,v)dvdu P(X [x ɛ 2,x + ɛ 2 ],Y [y ɛ 2,y + ɛ 2 ]) f X,Y (x,y) ɛ 2 Nanostatistik: Stokastisk variabel p. 24/29

Marginal tæthed f X (x) = f Y (y) = P(a < X b) = b a f X,Y (x,y)dy f X,Y (x,y)dx f X (x)dx Nanostatistik: Stokastisk variabel p. 25/29

Betinget tæthed P(a < X b,c < Y d) = f X Y (x y) = f X,Y (x,y) f Y (y) d c ( b a f X Y (x y)dx ) f Y (y)dy Uafhængighed f X,Y (x,y) = f X (x) f Y (y) Nanostatistik: Stokastisk variabel p. 26/29

Eksempel Lad Ω = {(x,y) 0 x,y 1} være enhedskvadratet, og lad P være den uniforme fordeling, dvs P(A) er arealet af A Lad X være 1. koordinaten, Y 2. koordinaten, og lad U = X + Y Finde betingede tæthed for X givet U F U (u) = 1 2 u2 u < 1 1 1 2 (2 u)2 1 u 2, F X,U (x,u) ux 1 2 = x2 u < 1, 0 x u x 2 + (1 u)(1 x) + 1 2 (1 x)2 1 u 2, u 1 x 1 Nanostatistik: Stokastisk variabel p. 27/29

Eksempel f U (u) = f X,U (x,u) = f X U (x u) = u u < 1 (2 u) 1 u 2, 1 u < 1, 0 x u 1 1 u 2, u 1 x 1 1 u u < 1, 0 x u 1 2 u 1 u 2, u 1 x 1 Nanostatistik: Stokastisk variabel p. 28/29

Resume Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Sandsynlighedsfunktion (tæthed) og fordelingsfunktion To stokastiske variable: simultan sandsynlighed og betinget sandsynlighed Nanostatistik: Stokastisk variabel p. 29/29