Nanostatistik: Stokastisk variabel

Nanostatistik: Stokastisk variabel JLJ Nanostatistik: Stokastisk variabel p. 1/29

Repetition Ω: udfaldsrummet: alle de mulige udfald af et experiment P(A): ss for hændelsen A = frekvens i uafhængige gentagelser P(A B) = P(A) + P(B) når A og B er disjunkte hændelser Ex: Kaster en terning to gange. Ω = {(1, 1), (1, 2),..., (6, 5), (6, 6)} P(max =3 eller sum = 7) = P((1, 3), (2, 3), (3, 3), (3, 2), (3, 1) eller (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) = P(max =3) + P(sum = 7) Nanostatistik: Stokastisk variabel p. 2/29

Stokastisk variabel Udfald ω Ω: et meget kompliceret objekt Experiment: måle nogle få egenskaber ved ω Ex: Ω = alle danske mænd over 20 år experiment: vælge en tilfældig person og måle højden Stokastisk variabel X: en egenskab ved ω der angives ved et reelt tal (vi bruger store bogstaver for stokastiske variable) Formelt: X er en afbildning fra Ω ind i de reelle tal Diskret stokastisk variabel: X kan kun antage heltallige værdier Kontinuert stokastisk variabel: X kan antage alle mulige værdier Nanostatistik: Stokastisk variabel p. 3/29

Stokastisk variabel Ex1: Møntkast: X(pl) = 0, X(kr) = 1 Ex2: Terningekast: { X(m øjne) = m 0 hvis m er ulige Y (m øjne) = 1 hvis m er lige Ex3: Ω = alle mulige egetræer X(ω) = antallet af blade på træet ω (diskret) X(ω) = højden af træet ω (kontinuert) Nanostatistik: Stokastisk variabel p. 4/29

Diskret stokastisk variabel X(ω) = i fortæller os ikke direkte hvad ω er Ex2: Y = 1 hvis et lige antal øjne på terning Y = 1 fortæller os at vi har fået enten 2, 4 eller 6 øjne X(ω) = i ω Ω i = { ω X( ω) = i} ss for X = i: P(X=i) = frekvens af værdien i i uafhængige gentagelser = frekvens hvormed vi får hændelsen Ω i = P(Ω i ) Ex2: P(Y = 1) = P({2, 4, 6}) = 3 6 Ex3: Kaste terning 2 gange. X = øjne i kast 1 - øjne i kast 2 P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4 36 Nanostatistik: Stokastisk variabel p. 5/29

ss-funktion Notation: sandsynlighedsfunktionen f X (i) = P(X = i) Da f X (i) = P(X = i) har vi 0 f X (i) 1 f X (i) = 1 ( i f x(i) = i P(X = i) = i P(Ω i) = P(Ω) = 1) Notation: Den kumulerede ss-funktion = fordelingsfunktionen F X (x) = P(X x) = i x P(X = i) = i x f X(i) i Nanostatistik: Stokastisk variabel p. 6/29

ss-funktion Regneregel: Hvis B er en delmængde af A gælder der P(A \ B) = P(A) P(B) da A = B (A \ B) har vi P(A) = P(B) + P(A \ B) F X f X : f x (i) = P(X = i) = P(X i) P(X i 1) = F X (i) F X (i 1) Mere generelt: P(a < X b) = F X (b) F X (a) VIS PLOT Nanostatistik: Stokastisk variabel p. 7/29

eksempel Ex3: Kaste terning 2 gange. X = øjne i kast 1 - øjne i kast 2 P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4 36 f X (0) = P(X = 0) = 6 36 f X (1) = P(X = 1) = 5 36 = P(X = 1) = f X( 1) f X (2) = P(X = 2) = 4 36 = P(X = 2) = f X( 2). f X (5) = P(X = 5) = 1 36 = P(X = 5) = f X( 5) Vis Plot Nanostatistik: Stokastisk variabel p. 8/29

Simultan ss X og Y : to stokastisk variable defineret på samme udfaldsrum Ω X : Ω N Y : Ω N Ex: Ω = danske mænd over 20 år X = højde i hele cm, Y = vægt i hele kg Den simultane sandsynlighed er f X,Y (i,j) = P(X = i,y = j) = P({ω X(ω) = i og Y (ω) = j) Læses: ss for at X = i og Y = j, dvs ss for fællesmængden {ω X(ω) = i} {ω Y (ω) = j} Nanostatistik: Stokastisk variabel p. 9/29

Simultan ss Ex: Kaster to terninger Ω = {(i,j) 1 i,j 6} X = max af de to par øjne Y = summen af de to par øjne De mulige værdier af X er 1, 2, 3, 4, 5, 6 og de mulige værdier af Y er 2, 3,...,12. VIS PLOT Lav tabel på tavlen P(X = 3,Y = 5) = P({(2, 3), (3, 2)}) = 2 36 Nanostatistik: Stokastisk variabel p. 10/29

Marginal ss Fra P(X = i,y = j) til P(X = i): Da {ω X(ω) = i} = j {ω X(ω) = i,y (ω) = j} og disse mængder er disjunkte har vi P(X = i) = j P(X = i,y = j) Ex: Kast med to terninger: X = max, Y = sum P(X = 3) = P(X = 3,Y = 2) + P(X = 3,Y = 3) +P(X = 3,Y = 4) + + P(X = 3,Y = 12) = 2 36 + 2 36 + 1 36 VIS PLOT Nanostatistik: Stokastisk variabel p. 11/29

Betinget ss Ex: ss for flyulykke under start = antal ulykker / antal starter Køber billet hos Aeroflot: er det så den rigtige ss? Istedet: antal ulykker med Aeroflot / antal starter med Aeroflot Dette kaldes en betinget ss: jeg betinger med at det er et Aeroflot fly. P(Y = j X = i) læses: ss for at Y er j givet at X er i P(ulykke Aeroflot) = = = #(ulykker og Aerof lot) #starter #(starter og Aerof lot) #starter P(ulykke og Aeroflot) P(Aerof lot) #(ulykker og Aeroflot) #(starter og Aerof lot) Nanostatistik: Stokastisk variabel p. 12/29

Betinget ss Definition: P(X = i Y = j) = P(X=i,Y =j) P(Y =j) Ex: Kast med to terninger: X = max, Y = sum P(Y = 5 X = 3)? Givet X = 3 kan Y enten være 4, 5 eller 6: Vis plot der er 2 udfald der giver 4, to der giver 5 og 1 der giver 6, så P(Y = 5 X = 3) = 2 5 P(X = 3,Y = 5) = 2 36 P(X = 3) = 5 36 = 2 5 P(Y = 5 X = 3) = 2 36 5 36 Betinget ss = frekvens i den relevante delmængde af uafhængige gentagelser Nanostatistik: Stokastisk variabel p. 13/29

Betinget ss Trækker 2 kort fra et spil kort med 52 kort. Hvad er den betingede ss for at kort 2 er en ruder givet at kort 1 var en spar? Ω = {(i,j) 1 i,j 52,j i}, Ω = 52 51 alle udfald har samme ss antal udfald med kort 1 en spar og kort 2 en ruder = 13 13 antal udfald med kort 1 en spar = 13 51 betingede ss = 13 13 52 51 13 51 52 51 = 13 51 Nanostatistik: Stokastisk variabel p. 14/29

Betinget ss Skriver vi rundt på definitionen har vi Heraf følger P(X = i,y = j) = P(X = i Y = j)p(y = j) P(X = i) = j P(X = i,y = j) = j P(X = i Y = j)p(y = j) Nanostatistik: Stokastisk variabel p. 15/29

Uafhængighed X og Y er uafhængige: Viden om Y fortæller os ikke noget om X P(X = i Y = j) = P(X = i) for alle i,j Dette er ækvivalent med P(X = i,y = j) P(Y = j) = P(X = i) for alle i,j eller P(X = i,y = j) = P(X = i)p(y = j) for alle i,j Nanostatistik: Stokastisk variabel p. 16/29

Uafhængighed Ubevidst brug af dette: To uafhængige kast med en terning: Alle 36 muligheder har samme ss. Hver mulighed har ss 1 36 = 1 6 16 Ex: Kast med to terninger: X = max, Y = sum P(Y = 5) = P({(1, 4), (2, 3), (3, 2), (4, 1)}) = 4 36 = 1 9 = 5 45 P(Y = 5 X = 3) = 2 5 = 18 45 Altså er Y og X ikke uafhængige: viden om X giver os viden om Y Nanostatistik: Stokastisk variabel p. 17/29

Kontinuert stokastisk variabel Ex: registreret eet klik i geigertæller i tidsintervallet [0, T] Hvornår kom klikket? X er tidspunktet Alle tidspunkter i [0,T] er mulige, ingen er mere oplagte end andre [0,T/2] og [T/2,T] har samme ss 1 2. Halverer vi igen får vi 4 intervaller der er lige sandsynlige: X er uniformt fordelt på [0,T] P(X = x) = 0: alle intervaller af længe 1 n må have ss T/n Nanostatistik: Stokastisk variabel p. 18/29

Kontinuert stokastisk variabel Istedet beskriver vi X ved dens fordelingsfunktion F X (x) = P(X x) Ud fra denne kan vi finde ss for ethvert interval P(X (a,b]) = P(X b) P(X a) = F X (b) F X (a) Uniforme fordeling: P(a < X b) er proportional med intervallængden P(a < X b) = b a T F X (x) = P(X x) = 0 x 0 x T 0 x T 1 x > T Nanostatistik: Stokastisk variabel p. 19/29

Tæthed Hvis F X er differentiabel kaldes f X (x) = F X (x) for tætheden af X, og vi har P(X (a,b)) = F X (b) F X (a) = Tæthed intutitivt: b a f X (x)dx P(X [x ɛ 2,x + ɛ 2 ]) f X(x) ɛ for ɛ lille Nanostatistik: Stokastisk variabel p. 20/29

Tæthed EX: Uniforme fordeling på [0,T] f X (x) = { 1T 0 x T 0 ellers Nanostatistik: Stokastisk variabel p. 21/29

Simultan fordeling X og Y begge kontinuerte variable. Fordelingsfunktion F X,Y (x,y) = P(X x,y y) Udregning af P(a < X b,c < Y d): {a < X b,c < Y d} = {a < X b,y d} \ {a < X b,y c} = ({X b,y d} \ {X a,y d}) \ ({X b,y c} \ {X a,y c}) VIS PLOT Nanostatistik: Stokastisk variabel p. 22/29

Simultan fordeling Udregning af P(a < X b,c < Y d): P(a < X b,c < Y d) = [F(b,d) F(a,d)] [F(b,c) F(a,c)] = F(b,d) F(a,d) F(b,c) + F(a,c) Nanostatistik: Stokastisk variabel p. 23/29

Simultan tæthed f X,Y (x,y) = F X,Y (x,y) x y Intuitivt: P(a < X b,c < Y d) = b a d c f X,Y (u,v)dvdu P(X [x ɛ 2,x + ɛ 2 ],Y [y ɛ 2,y + ɛ 2 ]) f X,Y (x,y) ɛ 2 Nanostatistik: Stokastisk variabel p. 24/29

Marginal tæthed f X (x) = f Y (y) = P(a < X b) = b a f X,Y (x,y)dy f X,Y (x,y)dx f X (x)dx Nanostatistik: Stokastisk variabel p. 25/29

Betinget tæthed P(a < X b,c < Y d) = f X Y (x y) = f X,Y (x,y) f Y (y) d c ( b a f X Y (x y)dx ) f Y (y)dy Uafhængighed f X,Y (x,y) = f X (x) f Y (y) Nanostatistik: Stokastisk variabel p. 26/29

Eksempel Lad Ω = {(x,y) 0 x,y 1} være enhedskvadratet, og lad P være den uniforme fordeling, dvs P(A) er arealet af A Lad X være 1. koordinaten, Y 2. koordinaten, og lad U = X + Y Finde betingede tæthed for X givet U F U (u) = 1 2 u2 u < 1 1 1 2 (2 u)2 1 u 2, F X,U (x,u) ux 1 2 = x2 u < 1, 0 x u x 2 + (1 u)(1 x) + 1 2 (1 x)2 1 u 2, u 1 x 1 Nanostatistik: Stokastisk variabel p. 27/29

Eksempel f U (u) = f X,U (x,u) = f X U (x u) = u u < 1 (2 u) 1 u 2, 1 u < 1, 0 x u 1 1 u 2, u 1 x 1 1 u u < 1, 0 x u 1 2 u 1 u 2, u 1 x 1 Nanostatistik: Stokastisk variabel p. 28/29

Resume Stokastisk variabel: funktion fra udfaldsrum over i de hele tal eller over i de reelle tal Sandsynlighedsfunktion (tæthed) og fordelingsfunktion To stokastiske variable: simultan sandsynlighed og betinget sandsynlighed Nanostatistik: Stokastisk variabel p. 29/29