Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Relaterede dokumenter
Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 10. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Sandsynlighedsregning Stokastisk variabel

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Elementær sandsynlighedsregning

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Elementær sandsynlighedsregning

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

3 Stokastiske variable 3.1 Diskrete variable

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Opgaver i sandsynlighedsregning

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

CIVILINGENIØREKSAMEN. Side 1 af 19 sider. Skriftlig prøve, den: 20. december 2006 Kursus nr : Kursus navn: Sandsynlighedsregning

Kvantitative Metoder 1 - Efterår Dagens program

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

INSTITUT FOR MATEMATISKE FAG c

Kvantitative Metoder 1 - Forår Dagens program

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Nanostatistik: Opgaver

Sandsynlighedsregning Oversigt over begreber og fordelinger

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Sandsynlighedsregning

Hvad skal vi lave i dag?

Statistiske modeller

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Definition. Definitioner

Løsning til eksamen 16/

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Note om Monte Carlo metoden

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Hvad skal vi lave i dag?

4 Oversigt over kapitel 4

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

Løsninger til kapitel 5

Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Efterår Dagens program

Produkt og marked - matematiske og statistiske metoder

StatDataN: Middelværdi og varians

Produkt og marked - matematiske og statistiske metoder

Nanostatistik: Stokastisk variabel

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Simulering af stokastiske fænomener med Excel

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Kvantitative Metoder 1 - Forår 2007

Vejledende løsninger til opgaver i kapitel 6

Hvad skal vi lave i dag?

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Betingede sandsynligheder Aase D. Madsen

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : (navn) (underskrift) (bord nr)

Matematik 3 SS. Københavns Universitet Naturvidenskabelig kandidateksamen, sommeren Opgaver til besvarelse i 3 timer fredag den 18. juni 1993.

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

Teoretisk Statistik, 16. februar Generel teori,repetition

Kvantitative Metoder 1 - Efterår Dagens program

Nanostatistik: Stokastisk variabel


Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Simulering af stokastiske fænomener med Excel

Kønsproportion og familiemønstre.

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

4 Stokastiske variabler

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsregning & Statistik

Statistik og Sandsynlighedsregning 2

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Sandsynligheder. Mængder Hændelser Sandsynligheder Regler for sandsynligheder

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 24. maj 2012 Kursus nr : (navn) (underskrift) (bord nr)

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Løsning til prøveeksamen 1

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Transkript:

Sandsynlighedsregning 0. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner afsnit 6. og 6. Betingede diskrete fordelinger P(Y = y X = x) = P(X=x,Y=y) P(X=x) P(Y = y) = xp(x = x)p(y = y X = x) Betinget middelværdi (det diskrete tilfælde) E(Y X = x) = yyp(y = y X = x) E(Y X) en stokastisk variabel E(Y) = E X (E Y (Y X)) = xp(x = x)e(y X = x) E(g(X,Y) X = x) = E(g(x,Y) X = x) E(XY X) = XE(Y X) forelæsning 0 En virksomhed, der producerer elektriske pærer har afdelinger i to byer. Fabrikken i by A står for af produktionen. Resten produceres i by B, udaf disse er % defekte. Spørgsmål Hvor stor en andel af det samlede antal pærer der produceres af virksomheden fremstilles som intakte i by B? 00 98 00 00 4 99 00 5 Spørgsmålet kan ikke besvares pga. manglende oplysninger Spørgsmål Man får nu den yderligere oplysning at defektprocenten for pærer produceret i by A er 0.005 (altså er ud af 00 i gennemsnit defekt). Givet en pære er defekt, hvad er da sandsynligheden for, at den er produceret i by B. 0.0 0.0 +0.005 4 0 00 5 0 00 +0.005 forelæsning 0 forelæsning 0 4

Københavnske boliger 989 (antal) Antal beboere: 0 4 5 6 værelse 66 554 08 60 69 9 8 værelser 4874 7508 6670 86 955 48 45 værelser 408 9 90 878 75 95 565 4 værelser 4 0 474 6487 480 064 585 5 værelser 46 877 476 487 977 58 64 6 værelser 44 55 748 775 54 65 5 En bolig er således her karakteriseret ved to egenskaber størrelse - X og antal beboere - Y forelæsning 0 5 Relative andele Antal beboere 0 4 5 6 værelse 0,0 0,085 0,007 0,00 0,000 0,000 0,000 værelser 0,07 0,64 0,096 0,04 0,00 0,00 0,00 værelser 0,009 0, 0,04 0,0 0,0 0,00 0,00 4 værelser 0,005 0,044 0,05 0,0 0,06 0,004 0,00 5 værelser 0,00 0,00 0,06 0,009 0,007 0,00 0,00 6 værelser 0,00 0,006 0,00 0,006 0,006 0,00 0,00 Disse relative andele kan fortolkes som sandsynligheder, f.eks. P(X =,Y = 0) = 0,0 - for hvilket stokastisk eksperiment? forelæsning 0 6 Antallet af beboere i en værelses bolig Hvis nogen har valgt en tilfældig bolig, og fortæller os at den har tre værelser, hvilken sandsynlighedsfordeling vil vi så tillægge antallet af beboere? Fra rækken med værelses boliger i tabellerne har vi: Beboere: 0 4 5 6 Alle Antal: 408 9 90 878 75 95 565 7660 Andel: 0,009 0, 0,04 0,0 0,0 0,00 0,00 0,75 Andel af værelses 0,0 0,407 0,79 0,5 0,049 0,0 0,007,000 Når vi ved at boligen har værelser, normerer vi sandsynlighederne så de summerer til henover -værelsers boliger. Betinget sandsynlighed/fordeling Husk formlen for den betingede sandsynlighed af hændelsen Y = y, givet hændelsen X = x (kapitel ): P(Y = y X = x) = P(Y = y X = x) P(X = x) = P(Y = y,x = x) P(X = x) Betragter vi x som en fast parameter i dette udtryk og y som en variabel, er P(Y = y X = x) en sandsynlighedsfordeling for en stokastisk variabel (check det!). Vi kalder den Den betingede fordeling af Y givet X = x. Konkret får vi P(Y = y X = ) = som i tabellen P(Y = y,x = ) P(X = ) = P(X =,Y = y) 0,75

Betinget fordeling afsnit 6. For fastholdt værdi af X = x kan Y variere over hele eller dele af sit udfaldsrum. Vi kalder fordelingen af Y for fastholdt X = x for den betingede fordeling af Y givet X = x P(Y = y X = x) = Vi har den meget vigtige: P(Y = y) = x P(Y = y X = x) = x P(X = x,y = y) P(X = x) Reglen om gennemsnit af betingede fordelinger P(Y = y X = x)p(x = x) forelæsning 0 9 Opgave 6.. I en bestemt by har 0% af familierne ingen børn, 0 % har et barn, 40% har to børn, 0 % har tre børn og 0 % har fire børn. Antag, at der er 50% chance for, at det enkelte barn er en pige uafhængigt af antallet af børn i familien. Bestem sandsynlighedsfordelingen for antallet af piger i en familie. Vi definerer først relevante stokastiske variable:c antallet af børn i en familie, og G antallet af piger i en familie. I en familie med C = c børn finder vi ( P(G = i C = c) = c i ) i ( ) c i, i = 0,...c forelæsning 0 0 Vi fandt for en familie med C = c børn ( P(G = i C = c) = c i ) i ( ) c i, i = 0,...c Vi skal nu finde den ubetingede fordeling af antallet af piger G Vi benytter reglen om gennemsnittet af betingede sandsynligheder (boksen side 4 eller Chapter summary side 7). P(G = 0) = P(G = 0 C = 0)P(C = 0)+P(G = 0 C = )P(C = ) = ( ) 0 0 + + +P(G = 0 C = 4)P(C = 4) 4 = P(G = 0 C = c)p(c = c) c=0 ( ) 0 + ( ) 4 0 + ( ) 0 + ( ) 4 0 = 5 60 Det var for 0 piger. For de andre muligheder får vi: Det vil sige: P(G = 4) = 6 P(G = i) = 4 P(G = i C = j)p(c = j) j=0 0 = 60 P(G = ) = 8 5 + 4 6 P(G = ) = 7, P(G = ) = 5 80 Den generelle formel er: P(Y = y) = x P(Y = y X = x)p(x = x) forelæsning 0 0 = 0

Man kaster tre mønter. De mønter, der lander plat kastes igen. Lad X betegne antallet af krone efter første kast og Y betegne antallet af krone efter andet kast (0 X Y ). Spørgsmål Angiv den betingede fordeling f Y (y X = x) = P(Y = y X = x) af Y for X = x y!( y)! f Y (y X = x) =! f Y (y X = x) = ( x)! f Y (y X = x) = 4 x, (y x)!( y)! 4 f Y (y X = x) = (+x)! (y+x)!( y)! 5 f Y (y X = x) = (+x)! (y+x)!( y)! 8, y = x,..., forelæsning 0 x, y = x,..., y = x,..., x, y = x,..., 8, y = x,..., Uafhængighed og betingede fordelinger Hvis X og Y er uafhængige har vi og dermed P(X = x,y = y) = P(X = x) P(Y = y) P(Y = y X = x) = P(Y = y) Omvendt, hvis dette holder x,y, må X og Y være uafhængige. Altså: X og Y er uafhængige, hvis og kun hvis den betingede fordeling af Y givet X er identisk med den ubetingede fordeling af Y. Med andre ord: Hvis X ikke indeholder information of Y. forelæsning 0 4 Middelantallet af beboere i en treværelses bolig Beboere: 0 4 5 6 Alle Andele 0,0 0,407 0,79 0,5 0,049 0,0 0,007,000 Hvis vi ved at boligen er treværelses, beregner vi middelværdien i den betingede fordeling: Betinget middelværdi afsnit 6. E(Y X = x) = y yp(y = y X = x) E(Y X = ) = 0,0 0++ +6 0,007 =,808 forelæsning 0 5 Betinget middelværdi som stokastisk variabel Hvad er en stokastisk variabel? Vi kan tænke på den som en variabel hvis værdi fastlægges gennem et (stokastisk) eksperiment, vi ikke har udført endnu Her er sådan en konstruktion:. Vælg en tilfældig bolig.. Lad X være antallet af værelser i boligen.. Lad Z være det gennemsnitlige antal beboere blandt alle de boliger, der har X værelser. Vi ser at Z = E(Y X) er en stokastisk variabel. Vi bruger sandsynlighedsregning til at udtrykke, hvad vi ved om dens opførsel. I et eksperiment, hvor vi måler både X og Y, udtrykker den simultane fordeling, hvad vi ved om X s og Y s opførsel før eksperimentet.

Betingede forventningsværdier som stokastiske variable Z = E(Y X) er en stokastisk variabel. Den kan fastlægges uden at kende andet til realisationen (altså, hvilken bolig vi valgte) end X. Vi kan altså skrive Z = g(x) for en passende funktion g. I dette tilfælde er g(x) givet ved algoritmen: Tag det gennemsnitlige antal beboere blandt de boliger der har x værelser. forelæsning 0 7 Information og betingede fordelinger Lad X og Y være to stokastiske variable knyttet til samme eksperiment, og forestil jer en observatør der kun får adgang til X. For hende vil den realiserede værdi af Y være ukendt, både før (a priori) og efter (a posteriori) eksperimentet udføres. For hende vil Y a priori være fordelt efter den ubetingede fordeling P(Y = y). Den vigtigste størrelse i denne fordeling er forventningsværdien E(Y). Efter eksperimentet vil hun have adgang til informationen X = x. Derfor reviderer hun sin opfattelse af Y s fordeling til den betingede fordeling P(Y = y X = x). Den vigtigste størrelse i denne fordeling er den betingede forventningsværdi E(Y X = x). forelæsning 0 8 Hvad er fordelingen af Z = E(Y X)? For boligeksemplet finder vi: x 4 5 6 P(X = x) 0,04 0,96 0,75 0,45 0,046 0,0 E(Y X = x) 0,990,087,8079,49,49,6908 Dermed har vi direkte fordelingen af Z = E(Y X): z 0,990,087,8079,49,49,6908 P(Z = z) 0,04 0,96 0,75 0,45 0,046 0,0 Hvad er forventningsværdien af Z = E(Y X)? Man har E(Y) = E(Z) = E(E(Y X)) = x E(Y X = x)p(x = x) Intuitivt: Informationen X = x vil ændre observatørens forventningsværdi af Y, men ikke i middel. I behøver ikke forstå dette i dybden, men I skal kunne anvende ovenstående formel (opgave 6..4 træner dette). Den betingede middelværdi er et vigtigt begreb/redskab i anvendelserne (statistik, signalbehandling, billedbehandling) forelæsning 0 9 forelæsning 0 0

For boligeksemplet: Vi havde fordelingen af Z = E(Y X): z 0,990,087,8079,49,49,6908 P(Z = z) 0,04 0,96 0,75 0,45 0,046 0,0 hvoraf E(Y) = E(Z) = 0.990 0,04+.087 0,96+ +.6908 0,0 =.650 hvilket stemmer med hvad vi får direkte fra den marginale fordeling af Y. forelæsning 0 Lad X og X være antal øjne i to kast med en almindelig terning. Lad nu X betegne minimum og Y betegne maximum af X og X. Spørgsmål 4 E(Y X = 4) kan karakteriseres ved 4 4 +5 +6 4.5 4.5 4 4 +5 +6 5 4 5 +5 5 +6 5 forelæsning 0 Lad X og X være antal øjne i to kast med en almindelig terning. Lad nu X betegne minimum og Y betegne maximum af X og X. Spørgsmål 5 E(Y X) kan karakteriseres ved 7 med P = 6,4 med P = 6, 9 med P = 6,.5 5 med P = 6, med P = 6,6 med P = 6 4 med P = 6, 8 9 med P = 9 6, 7 med P = 7 6, 6 5 med P = 5 6, 7 med P = 6,6 med P = 6 4 6 i=x i 7 X 5 X+6 forelæsning 0 Afsnit 6. og 6. Betingede diskrete fordelinger P(Y = y X = x) = P(X=x,Y=y) P(X=x) P(Y = y) = xp(x = x)p(y = y X = x) Betinget middelværdi (det diskrete tilfælde) E(Y X = x) = yyp(y = y X = x) E(Y X) en stokastisk variabel E(Y) = E X (E Y (Y X)) = xp(x = x)e(y X = x) E(g(X,Y) X = x) = E(g(x,Y) X = x) E(XY X) = XE(Y X) forelæsning 0 4