Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Relaterede dokumenter
Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Elementær sandsynlighedsregning

Sandsynlighedsregning Stokastisk variabel

Elementær sandsynlighedsregning

INSTITUT FOR MATEMATISKE FAG c

Sandsynlighedsregning

3 Stokastiske variable 3.1 Diskrete variable

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Kvantitative Metoder 1 - Efterår Dagens program

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Kvantitative Metoder 1 - Forår Dagens program

Produkt og marked - matematiske og statistiske metoder

Hvad skal vi lave i dag?

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Repetition Stokastisk variabel

Vejledende løsninger til opgaver i kapitel 6

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Nanostatistik: Stokastisk variabel

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Statistiske modeller

Definition. Definitioner

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

standard normalfordelingen på R 2.

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Nanostatistik: Stokastisk variabel

4 Oversigt over kapitel 4

Statistik og Sandsynlighedsregning 2

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Opgaver i sandsynlighedsregning

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

Kvantitative Metoder 1 - Forår 2007

Løsning til eksamen 16/

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Susanne Ditlevsen Institut for Matematiske Fag susanne

StatDataN: Middelværdi og varians

Oversigt over nyttige fordelinger

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Betingede sandsynligheder Aase D. Madsen

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

CIVILINGENIØREKSAMEN. Side 1 af 19 sider. Skriftlig prøve, den: 20. december 2006 Kursus nr : Kursus navn: Sandsynlighedsregning

Nanostatistik: Opgaver

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Kvantitative Metoder 1 - Forår 2007

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Betingning med en uafhængig variabel

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative metoder 2

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

Statistik og Sandsynlighedsregning 2

Matematik 3 SS. Københavns Universitet Naturvidenskabelig kandidateksamen, sommeren Opgaver til besvarelse i 3 timer fredag den 18. juni 1993.

Kvantitative Metoder 1 - Efterår Dagens program

Statistik og Sandsynlighedsregning 2

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Kvantitative Metoder 1 - Forår Dagens program

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvantitative metoder 2

Reeksamen 2014/2015 Mål- og integralteori

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder

Nanostatistik: Middelværdi og varians

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Sandsynlighedsregning Oversigt over begreber og fordelinger

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Transkript:

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk

Dagens emner Stokastiske variable: udfald identificeres med reelle tal Fordeling P(X = x) P(X = x) = Simultan(joint) fordeling P(X = x,y = y) x,y Marginal fordeling P X (X = x) = y x P(X = x,y = y) = P(X = x,y = y) Betinget fordeling P(Y = y X = x) = P(X=x,Y=y) P X (X=x) Uafhængighed P(Y = y,x = x) = P X (X = x)p Y (Y = y) Multinomialfordelingen Middelværdi E(X) = x P(X = x) Forventningsværdi mere generelt E(g(X)) = g(x) P(X = x) Linearitet E(aX +by +c) = ae(x)+be(y)+c

Stokastiske variable kap.3 Beskriver eksperimenter, hvor udfaldet kan karakteriseres ved et eller flere tal Gør det muligt at definere gennemsnit og andre beregninger Gør notation og formulering mere smidig 02405 forelæsning 3 3

Eksempel på anvendelse For binomialfordelingen indførte vi hændelserne S i for i succeser Hændelsen H i højst i successer blev skrevet som i j=0 S j Så P(H i ) = P ( i j=0s j ) = i j=0 P(S j) Hvorfor? Vi kunne ønske mere kompakt notation, færre symboler Den stokastiske variabel X betegner antallet af succeser Hvordan vil vi skrive hændelsen S 5 ved hjælp af X? Hvordan vil vi skrive hændelsen H 5 ved hjælp af X? En stokastisk variabel er et tal, der beskriver udfaldet af vores eksperiment. 02405 forelæsning 3 4

Fordele ved stokastiske variable Mange problemer formuleres mere enkelt Giver os mulighed for at danne nye stokastiske variable ved funktioner Knytter en forbindelse mellem udfaldsrummet og de reelle tal 02405 forelæsning 3 5

Vi lader den stokastiske variabel X betegne antallet af krone i tre kast med en retfærdig mønt, og definerer en ny stokastisk variabel Y = X. Spørgsmål Angiv sandsynligheden for P(Y = ). 8 2 4 3 3 8 4 2 5 5 8 6 Ved ikke 02405 forelæsning 3 6

Københavnske boliger 989 (antal) Antal beboere: 0 2 3 4 5 6 værelse 366 23554 2038 260 69 9 8 2 værelser 4874 73508 26670 3826 955 248 45 3 værelser 2408 393 29023 878 3735 925 565 4 værelser 343 230 4374 6487 4380 064 585 5 værelser 436 2877 4376 2487 977 538 264 6 værelser 442 553 2748 775 543 65 52 En bolig er således her karakteriseret ved to egenskaber størrelse og antal beboere 02405 forelæsning 3 7

Relative andele Antal beboere 0 2 3 4 5 6 værelse 0,0 0,085 0,007 0,00 0,000 0,000 0,000 2 værelser 0,07 0,264 0,096 0,04 0,003 0,00 0,00 3 værelser 0,009 0,2 0,04 0,032 0,03 0,003 0,002 4 værelser 0,005 0,044 0,052 0,023 0,06 0,004 0,002 5 værelser 0,002 0,00 0,06 0,009 0,007 0,002 0,00 6 værelser 0,002 0,006 0,00 0,006 0,006 0,002 0,002 02405 forelæsning 3 8

Histogram over bolighyppigheder 0.3 0.2 0. 0 2 3 4 5 6 2 3 4 5 6 7 02405 forelæsning 3 9

Flerdimensionale stokastiske variable Vi indfører nu symbolet X til at betegne antallet af værelser i en tilfældigt valgt bolig og Y til at betegne antallet af beboere i denne bolig. En bolig er således karakteriseret ved parret (X,Y) - en todimensional stokastisk variabel. Vi har P(X = x) = P X (x) til at beskrive antallet af værelser i en bolig Og P(Y = y) = P Y (y) til at beskrive antallet af beboere i en bolig. Som en ny ting får vi brug for P(x,y) = P(X = x,y = y) til at beskrive de samlede egenskaber ved en bolig. Den simultane fordeling 02405 forelæsning 3 0

Brug af den simultane fordeling Hvad er sandsynligheden for, at en tilfældigt valgt bolig har højst to værelser og højst 3 beboere? 2 x= 3 y=0 P(x,y) = 0,0+...0,04 = 0,4978 6 Hvad er sandsynligheden for, at en tilfældigt valgt bolig vil have x flere værelser end beboere? P(x,y) = 0,0+0,07+0,264+0,009+ +0,002 = 0,760 x= y=0 02405 forelæsning 3

Hvis vi kun interesserer os for antal beboere Antal beboere 0 2 3 4 5 6 værelse 0,0 0,085 0,007 0,00 0,000 0,000 0,000 2 værelser 0,07 0,264 0,096 0,04 0,003 0,00 0,00 3 værelser 0,009 0,2 0,04 0,032 0,03 0,003 0,002 4 værelser 0,005 0,044 0,052 0,023 0,06 0,004 0,002 5 værelser 0,002 0,00 0,06 0,009 0,007 0,002 0,00 6 værelser 0,002 0,006 0,00 0,006 0,006 0,002 0,002 Boliger i alt 0,045 0,520 0,284 0,085 0,045 0,02 0,007 Dvs. kun Y 02405 forelæsning 3 2

altså Y P(Y = y) = x P(X = x,y = y) = x P(x,y) 0.6 0.4 0.2 0 0 2 3 4 5 6 Den marginale fordeling af Y (P Y (y)) 02405 forelæsning 3 3

Hvis vi kun interesserer os for størrelsen I så fald interesserer vi os for X P(X = x) = y P(X = x,y = y) = y P(x,y) 0.4 0.3 0.2 0. 0 2 3 4 5 6 Den marginale fordeling af X (P X (x)) 02405 forelæsning 3 4

Antallet af beboere i en 3 værelses bolig Hvis vi ved, at en bolig har 3 værelser, betyder det så noget for fordelingen af antal beboere? Fra rækken med 3 værelses boliger i tabellerne har vi: Beboere: 0 2 3 4 5 6 Alle Antal: 2408 393 29023 878 3735 925 565 76630 Andel: 0,009 0,2 0,04 0,032 0,03 0,003 0,002 0,275 Andel af 3 værelses 0,03 0,407 0,379 0,5 0,049 0,02 0,007,000 Hvordan udtrykker vi dette symbolsk/matematisk? 02405 forelæsning 3 5

Betinget sandsynlighed/fordeling, P(Y = y X = x) = Den betingede fordeling. Konkret får vi P(Y = y,x = x) P(X = x) som i tabellen P(Y = y X = 3) = P(Y = y,x = 3) P(X = 3) = P(3,y) 0,275 02405 forelæsning 3 6

Beboere betinget af størrelse 0.9 0.9 0.9 0.8 0.8 0.8 0.7 0.7 0.7 0.6 0.6 0.6 0.5 0.5 0.5 0.4 0.4 0.4 0.3 0.3 0.3 0.2 0.2 0.2 0. 0. 0. 0 0 2 3 4 5 6 0 0 2 3 4 5 6 0 0 2 3 4 5 6 0.9 0.9 0.9 0.8 0.8 0.8 0.7 0.7 0.7 0.6 0.6 0.6 0.5 0.5 0.5 0.4 0.4 0.4 0.3 0.3 0.3 0.2 0.2 0.2 0. 0. 0. 0 0 2 3 4 5 6 0 0 2 3 4 5 6 0 0 2 3 4 5 6 02405 forelæsning 3 7

Uafhængige stokastiske variable Vi har set, hvordan den betingede fordeling fremkommer ved hjælp af betingede sandsynligheder. Nogle gange ved vi intuitivt (antagelse), at en størrelse (stokastisk variabel) ikke vekselvirker med en anden stokastisk variabel. Terningeeksempler Hvad er en naturlig definition på uafhængige stokastiske variable? Er X og Y uafhængige i boligeksemplet? 02405 forelæsning 3 8

Definition på uafhængige stokastiske variable X og Y er uafhængige hvis for alle x,y P(x,y) = P X (x)p Y (y) Giv et eksempel på uafhængige X og Y (gode kandidater) 02405 forelæsning 3 9

Opgave 3.2 Lad X og Y være resultatet (talværdi) fra to trækninger fra en æske med 4 sedler, med numrene,2,3 og 4. Angiv den marginale fordeling og simultane fordeling for X og Y. For Stikprøvetagning med tilbagelægning Stikprøvetagning uden tilbagelægning Beregn P(X Y) Er X og Y uafhængige? 02405 forelæsning 3 20

Med tilbagelægning får vi X\Y 2 3 4 6 2 6 3 6 4 6 6 6 6 6 6 6 6 6 6 6 6 6 P(X = i) = P(Y = i) = 4 = P X(i) = P Y (i) P(X Y) = 4 4 P(x,y) = P(x,y) x y x= y=x 4 y 4 = P(x,y) = y 6 = 0 6 = 5 8 y= x= y= 02405 forelæsning 3 2

Uden tilbagelægning får vi P(X = i) = 4 = P X(i) X\Y 2 3 4 0 2 2 2 2 0 2 3 2 4 2 2 2 2 0 2 2 0 2 P(Y = i) = 4 P ( x,i) = 4 = P Y(i) x= 02405 forelæsning 3 22

Uden tilbagelægning fortsat P(X Y) = x y P(x,y) = 4 4 P(x,y) x= y=x = 4 y= y x= P(x,y) = 4 (y ) 2 = 6 2 = 2 y= Kunne vi have indset dette direkte? 02405 forelæsning 3 23

Funktioner af stokastiske variable Fra boligeksemplet: Z : antal beboere pr. værelse Z = Y X Z 2 : antal værelser pr. beboer Z 2 = X Y = Z (uproblematisk?) 02405 forelæsning 3 24

Fordeling af værelser på antal boliger 0.4 0.3 0.2 0. 0 2 3 4 5 6 værelser: 2 3 4 5 6 andel: 0,04 0,396 0,275 0,45 0,046 0,033 02405 forelæsning 3 25

Enkel karakteristik af fordeling Spørgsmål 2 Hvilket af følgende tal ville du vælge til at karakterisere fordelingen af antal værelser i en bolig? 2 2 3 3 3.5 4 0,04+2 0,396+3 0,275+4 0,45+5 0,046+6 0,033 = 2,729 5 Noget andet 6 Ved ikke 02405 forelæsning 3 26

Middelværdi(forventning) p.62(63) Fordelingens tyngdepunkt E(X) = xp(x = x) alle x Gennemsnit af stort antal udfald, eksperimenter Beregningsmæssig bekvem 02405 forelæsning 3 27

Spørgsmål 3 Hvad er middelværdien/forventningsværdien ved kast med en terning? Alle værdier {,2,3,4,5,6} 2 3 3 3.5 4 4 5 4.5 6 Ved ikke 02405 forelæsning 3 28

Bemærk Middelværdien af X, E(X) behøver ikke at være en mulig værdi for X 02405 forelæsning 3 29

Skatteindtægt fra bolig Skatteindtægten fra en bolig afhænger af antallet af værelser kr. 2.500 pr. værelse. Plus et fast beløb - kr. 7.500 Hvad er den forventede skatteindtægt fra en bolig? 02405 forelæsning 3 30

Lineære funktioner af stokastiske variable E(aX +b) = ae(x)+b i Eksemplet får vi: Z : skatteindtægt fra bolig E(Z) = E(2.500 X +7.500) = 2.500 E(X)+7.500 = 4322,50 02405 forelæsning 3 3

Forventning af en funktion af en stokastisk variabel p.75 Lidt mere generelt får vi for en vilkårlig funktion g(x): E(g(X)) = g(x)p(x = x) alle x Af særlig interesse har vi g(x) = x k, så E(X k ) = x k P(X = x) alle x det k te moment af X 02405 forelæsning 3 32

Antag, at E(X 2 ) = 3, E(Y 2 ) = 4, E(XY) = 2. Spørgsmål 4 E[(X +Y) 2 ] findes til 7 2 9 3 4 3 5 5 6 Ved ikke 02405 forelæsning 3 33

Forventning af en funktion af flere stokastiske variable p.76 Generelt har vi: E(g(X,Y)) = alle (x,y) g(x,y)p(x = x,y = y) Additionsregel E(X +Y) = E(X)+E(Y) (altid) p.67. Multiplikationsregel, hvis X og Y er uafhængige p.77 E(XY) = E(X)E(Y) 02405 forelæsning 3 34

Relative andele af boliger Antal beboere 0 2 3 4 5 6 værelse 0,0 0,085 0,007 0,00 0,000 0,000 0,000 2 værelser 0,07 0,264 0,096 0,04 0,003 0,00 0,00 3 værelser 0,009 0,2 0,04 0,032 0,03 0,003 0,002 4 værelser 0,005 0,044 0,052 0,023 0,06 0,004 0,002 5 værelser 0,002 0,00 0,06 0,009 0,007 0,002 0,00 6 værelser 0,002 0,006 0,00 0,006 0,006 0,002 0,002 Hvordan ville I beregne den forventede værdi af antallet af beboere pr. værelse? 02405 forelæsning 3 35

Sammensætning/funktioner af stokastiske variable Først definerer vi X som antal værelser i en bolig, dernæst Y som antallet af beboere. Vi danner en ny variabel Z = Y X som antal beboere pr. værelse E(Z) = E(Y/X) = 6 x= 6 y=0 y x P(x,y) 02405 forelæsning 3 36

Nye begreber i afsnit 3., 3.2 Stokastisk variabel Fordeling/marginal fordeling Flerdimensional stokastisk variabel Simultan (eng.: joint) fordeling Betinget fordeling Uafhængige stokastiske variable Middelværdi/Forventning 02405 forelæsning 3 37

Afsnit 3. og 3.2 Stokastiske variable: udfald identificeres med relle tal Fordeling P(X = x) P(X = x) = Simultan(joint) fordeling P(X = x,y = y) x,y Marginal fordeling P X (X = x) = y x P(X = x,y = y) = P(X = x,y = y) Betinget fordeling P(Y = y X = x) = P(X=x,Y=y) P X (X=x) Uafhængighed P(Y = y,x = x) = P X (X = x)p Y (Y = y) Multinomialfordelingen Middelværdi E(X) = x P(X = x) Forventningsværdi mere generelt E(g(X)) = g(x) P(X = x) Linearitet E(aX +by +c) = ae(x)+be(y)+c