Susanne Ditlevsen Institut for Matematiske Fag susanne

Relaterede dokumenter
Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning

Sandsynlighedsregning Oversigt over begreber og fordelinger

Estimation og konfidensintervaller

Ë Ö ØÐ Ñ Ò ÙØÓÑ ØØ ÓÖ Ó Ö Ò Ð Å½ µ ÁÒ Ø ØÙØ ÓÖ Å Ø Ñ Ø ² Ø ÐÓ ËÝ Ò ÍÒ Ú Ö Ø Ø ß Ç Ò ÍÒ Ú Ö Ø Ø Ä Ö Ò ½ º ÒÙ Ö ¾¼¼ ÐÐ Ú ÒÐ ÐÔ Ñ Ð Ö Ð Ö Ó ÒÓØ Ø Ö Øºµ Ñ

q 1 q 2 x 1 x 2. E(x, p, X, P) = 1 2M P x X.

Susanne Ditlevsen Institut for Matematiske Fag susanne

ÇÚ Ö Ø ½ ¾ ÀÝÔÓØ Ø Ø ¹ Ò Ö Ô Ø Ø ÓÒ ÀÝÔÓØ Ø Ø Ó ÓÒ Ò ÒØ ÖÚ ÐÐ Ö ËØÝÖ Ó Ø ÔÖ Ú Ø ÖÖ Ð ÀÝÔÓØ Ø Ø ÓÖ ØÓ ÒÒ Ñ Ò Ø ÑÔ Ð ½ Ò Ö Ð ÓÖÑÙÐ Ö Ò Å Ò Ø Ú Ö Ò Å Ù Ò

ÇÚ Ö Ø ½ ¾ ÃÓÒØ ÒÙ ÖØ ËØÓ Ø Ú Ö Ð Ó ÓÖ Ð Ò Ö ÌØ ÙÒ Ø ÓÒ ÓÖ Ð Ò ÙÒ Ø ÓÒ Å ÐÚÖ Ò ÓÒØ ÒÙ ÖØ ØÓ Ø Ú Ö Ð Î Ö Ò Ò ÓÒØ ÒÙ ÖØ ØÓ Ø Ú Ö Ð ÍÒ ÓÖÑ ÓÖ Ð Ò Ò ÑÔ Ð

Definition. Definitioner

INSTITUT FOR MATEMATISKE FAG c

ÌÖÝ Ø ÁÅÅ ÌÍ

deta = A = deta = a 11 deta 11 a 12 det A 12 + a 13 deta 13 deta = deta = 1(0 2) 5(0 0) + 0( 4 0) = 2 deta = a i,j deta i,j

½ Ë Ë ÔÐ Ý Ñ Ò Ö ÔÖÓ Ö ÑÑ Ö Ò µ ÔÖÓ Ö Ñ ÐÓ ÓÙØÔÙØ Ú Ò Ù Ö Ö ÔÖÓ Ù Ö ÖØ Ò ÐØ Ø Ó ÙÑ ÒØ Ö Ë Ë Æ Ä ËÌ Ñ ÒÙ» Ñ ¹ÓÖ ÒØ Ö Ø ÓÚ Ö Ý Ò Ò Ö Ú Ö Ó Ö Ö ÔÖÓ Ö ÑÑ


Statistik og Sandsynlighedsregning 2

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Teoretisk Statistik, 16. februar Generel teori,repetition

Statistik og Sandsynlighedsregning 2

ÇÚ Ö Ø ½ ÈÖ Ø ÁÒ ÓÖÑ Ø ÓÒ ¾ ÁÒØÖÓ Ù Ø ÓÒ Ø Ð ËØ Ø Ø ËÓ ØÛ Ö Ê Ö Ú Ò Ø Ø Ø Æ Ð Ø Ð Ö Ö Ñ Ø ÐÐ Ò Â Ò Ãº Å ÐÐ Ö Ñ ÑѺ ØÙº µ ÁÒØÖÓ Ù Ø ÓÒ Ø Ð ËØ Ø Ø ÓÖ Ð

ÇÚ Ö Ø ½ ¾ ÅÓØ Ú Ö Ò ÑÔ Ð Ø Ñ ØÓÖ ÓÖ Ú Ö Ò Ö χ 2 ¹ ÓÖ Ð Ò Ò ÃÓÒ Ò ÒØ ÖÚ Ð ÓÖ Ò Ú Ö Ò ÀÝÔÓØ Ø Ø Ú Ö Ò Ö Ì Ø Ò Ú Ö Ò Ì Ø ØÓ Ú Ö Ò Ö F ¹ ÓÖ Ð Ò Ò ÀÝÔÓØ Ø

Kvantitative Metoder 1 - Forår Dagens program

ËÓÑ ³ Ü ³ ÚÐ ÖÓÙÔº ËÓÑ ³ Ü ³ ÚÐ Ñ Ö Ò ÐÐ Ö Ú Ö Ú Ö Ö Ø Ó ÔÖÓ ÔÐÓØ Ø Ù ÖºÞ Ð ÞÓ ÔÐÓØ Ñ Ö Ò ÖÓÙÔ» Ü Ü ½ Ú Ü Ü ¾ Ö Ñ Ü ½ Ó Ø µ Ð Ð À µ Ú ÐÙ À ¾µ Ñ ÒÓÖ ÆÇ

ÁÒ ÓÐ ½ ÇÔÖ Ø Ò ÖÙÔÔ º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º ½º½ ÑÖ º º º º º º º º º º º º º º º º º º º º º º

Opgaver i sandsynlighedsregning

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Betingede sandsynligheder Aase D. Madsen

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Statistik og Sandsynlighedsregning 2

4 Oversigt over kapitel 4

Mat2SS Vejledende besvarelse uge 11

ÒØÖÓÔÝ Ó Ò Ò ÂÈ Ø ÐÐ Ñ ÓÑÔÖ ÓÒ Â Ò ÎÓ Ð Ò Ë ÔØ Ñ Ö ¼Ø ¾¼½½ ½» ½

Lad os som eksempel se på samtidigt kast med en terning og en mønt:

Kvantitative Metoder 1 - Efterår Dagens program

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Nanostatistik: Stokastisk variabel

Produkt og marked - matematiske og statistiske metoder

ÌÖ È Ö Ò ÓÖ Ó Ë Ð Ø ÓÒ ÌÖ È Ö Ò ÓÖ Ó Ë Ð Ø ÓÒ Ê Ò Ö Ï Ð ÐÑ ÍÒ Ú Ö ØØ Ë ÖÐ Ò Û Ð ÐÑ ºÙÒ ¹ º ½ º Þ Ñ Ö ¾¼¼

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

ÓÖÓÖ ØØ ÔÖÓ Ø Ö Ö ÙÐØ Ø Ø Ø Ñ Ö Ñ ÈÓ Ø ÒÑ Ö ÓÑ Ø ÐÓ ¹ Ð Ö Ò ÔÖÓ Ð Ñ ÓÖ Ô ÒØÖ ÆÓÖ ÐÐ Ò º Î Ð Ø Ø Ù Ö ÚÓÖ Ñ Ò ÔÖÓ Ø Ñ Ö Ñ Ò Ú Ö ÓÑ Ö ÓÖ ÚÓÖ Ú ÓÑÑ Ò ÚÖ Ø

{ } { } {( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )}

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

ÁÒ ØÖÙØ ÓÒ Ë Ø Ö Ø ØÙÖ ÁÒØÖÓ ÙØ ÓÒ ÁÒ ØÖÙØ ÓÒ Ë Ø ÁÒØ Ö ØÛ Ò Ó ØÛ Ö Ò Ö Û Ö Ú Ð ØÓ ÔÖÓ Ö ÑÑ Ö ËØ Ô ØÓ Ò ÁÒ ØÖÙØ ÓÒ Ë Ø ÓÖ Ú Ò Óѹ ÔÙØ Ö Û Ø Ø Ú Ð Ð ÐØ

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Nanostatistik: Stokastisk variabel

Landmålingens fejlteori - Sandsynlighedsregning - Lektion 1

JOB-SHOP- SKEDULERING OG TOGSKEDULERING Christian Sc hmidt L YNGBY 2002 EKSAMENSPR OJEKT NR. 34/02 IMM

Oversigt over nyttige fordelinger

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Repetition Stokastisk variabel

Hvad skal vi lave i dag?


Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

standard normalfordelingen på R 2.

Kvantitative Metoder 1 - Efterår Dagens program

w j p j 1 w j / p / = 1

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Produkt og marked - matematiske og statistiske metoder

¾

Kvantitative Metoder 1 - Efterår Dagens program

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Noter til E6. Del 1: Sandsynlighedsregning. Jørgen Larsen

Kvantitative Metoder 1 - Forår 2007

StatDataN: Middelværdi og varians

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

Statistiske modeller

Faggruppe Landmåling og faggruppe trafikstudier. Jakob Jakobsen c958320

Nogle anvendelser af programmel R, bl.a. til hypotesetest

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen


Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Kvantitative Metoder 1 - Forår Dagens program

Z[i] = {x + yi x, y Z}. x + yi (x + yi) (x + yi) = x 2 + y 2, α, β Z[i], p 2 = N(p) = N(α)N(β).

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Statistik og Sandsynlighedsregning 2

Ð ÓÖ ØÙ Ö Å Ø Ñ Ø ¹ ÓÒÓÑ Ó ËØ Ø Ø ½ º Ö Ò ÒÖº ½ Ó ØÓ Ö ¾¼¼

Note om Monte Carlo metoden

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

V e l k o m m e n T i l M a t e m a t i k s t u d i e t! P P α ) ν xν αν ϕ(xν ϕ P P αν αν M a t e m a t i s k R u s m a p p e

xi ; ˆσ 2 =, s/ n t(n 1)

Kombinatorik. Eksempel 2: En mand har 7 par bukser og 10 skjorter. Skal han både vælge en skjorte og et par bukser, så har han 10. 7=70 mulige valg.

Kvantitative Metoder 1 - Forår 2007

Transkript:

Statistik og Sandsynlighedsregning 1 Repetition MS kapitel 1 3 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Hvad er sandsynlighed? - beskriver systemer (fysiske, biologiske, sociale...), hvor der er et element af tilfældighed. Erfaringsmæssigt kan udfaldet af en enkelt, tilfældig hændelse ikke forudsiges... MEN enhver hændelse har en vis tendens til at indtræffe i det betragtede system. Sandsynligheden for en hændelse er et tal mellem 0 og 1, der kvantificerer denne tendens. 5. undervisningsuge, mandag 1 2 Sandsynligheden er en egenskab ved det studerede system. De kan ikke observeres direkte. Ò Ø ½¾ Í Ð Ò Ð Ö Ó Ò ÝÒÐ Ö ½¼¼ Ê Ð Ø Ú ÝÔÔ Sandsynligheden viser sig som frekvenser, hvormed forskellige hændelser optræder. Intuitivt kan sandsynlighed defineres: Vi udfører et forsøg N gange uafhængigt af hinanden. Vi tæller hvor mange gange hændelsen A indtræffer. Da er antal forsøg hvor A indtræffer P (A) = lim N N 3 n A /n ¼ ¼ ¼ ¼¾ ¼¼¼ ¼ ¾ ¼ ½¼¼ n ÙÖ ½½ Ã Ø Ñ Ø Ò Ø Ø Ê Ð Ø Ú ÝÔÔ ÓÖ Ò Ð Ò Ô Ò Ò Ó Ð Ù Ð ÖÙÑÑ Ø U Ö Ò Ð Ö Ó Ò ØÖ Ö Ò ÓÐ Ú Ð Ö Ó ÐØ ËÓÑ Ø Ò Ð Ö ÓÖ Ö Ð Ø ÓÒ Ö Ñ ÐÐ Ñ Ò Ð Ö ÒÝØØ ÒÓ Ð ÑÒ Ö Ð ¹ 4 Ø ÓÒ Ö ÀÚ A Ó B Ö Ò Ð Ö Ø Ò Ö Ð A B Ò Ð Ò Ø A Ó B Ò ØÖ Ö ÐÐ ÑÒ Òµ

Det endelige sandsynlighedsfelt SANDSYNLIGHEDSTEORETISK MODEL: Udfaldsrummet er en liste over de mulige udfald: E = {e 1,..., e k } k mulige udfald Sandsynlighedsfunktionen angiver sandsynligheden for hvert af de mulige udfald som opfylder at p : E [0, 1] p(e 1 ) + + p(e k ) = 1 p(e j ) kaldes punktsandsynligheden i e j En delmængde A af udfaldsrummet E kaldes en hændelse: A E Sandsynlighedsfelt Definition 1.3.2 Ved et sandsynlighedsfelt forstås en mængde E, som kaldes udfaldsrummet, en vis klasse E af delmængder af E, samt en funktion P fra E ind i intervallet [0, 1]. Elementerne i E skal mindst omfatte både E selv og den tomme mængde, mens funktionen P, som kaldes et sandsynlighedsmål, skal opfylde at P (E) = 1 P (A B) = P (A) + P (B) hvis A B = Elementerne i E kaldes hændelser. I dette kursus består E blot af alle delmængder af E. 5 6 Ò Ø ½¾ Í Ð Ò Ð Ö Ó Ò ÝÒÐ Ö U Í Ð ÖÙÑ A ÀÒ Ð Ö A Ó B B A B Í ÓÖ Ò Ð Ò Ð Ö Regneregler P er et sandsynlighedsmål på E, og A, B E er vilkårlige hændelser. A B ÐÐ Ò Ð Ò A B A B ÓÖ Ò Ò ¹ Ò Ð Ò A B A Ö Ò ¹ Ò Ð Ò A\B B 1. Hvis B A er og P (A \ B) = P (A) P (B) A B A Ñ Ö Ö B A B A ÃÓÑÔÐ Ñ ÒØÖ¹ Ò Ð Ò A c ÙÖ ½¾ ÓÖ ÐÐ Ö Ð Ø ÓÒ Ö Ñ ÐÐ Ñ Ò Ð Ö A Ó B ÑÔ Ð ½¾ Ã Ø Ñ Ò Ø ÖÒ Ò ÓÖ Ø Ø Ñ Ò Ø ÖÒ Ò Ö Ù ¹ Ð ÖÙÑÑ Ø {1, 2,..., 6} ÀÒ Ð ÖÒ 7 ÙÐ ÒØ Ð Ò Ó Ñ Ò Ø Ò Ö A = {1, 3, 5}, B = {5, 6}. ÓÖ ØÓ Ò Ð Ö Ö P (B) P (A) 8

Regneregler P er et sandsynlighedsmål på E, og A, B E er vilkårlige hændelser. Regneregler P er et sandsynlighedsmål på E, og A, B E er vilkårlige hændelser. 2. Sandsynligheden for den komplementære hændelse til B, dvs E \ B er givet ved P (E \ B) = 1 P (B) 3. P ( ) = 0 9 10 Regneregler P er et sandsynlighedsmål på E, og A, B E er vilkårlige hændelser. 4. Definition 1.4.1 Den betingede sandsynlighed af B givet A, som vi skriver P (B A), er defineret ved P (B A) = P (A B) P (A) P (A B) = P (A) + P (B) P (A B) og A B P (A B) P (A) + P (B) Bemærk: Regneregel 4 viser at i Definition 1.3.2 kræves en betingelse på A B. Denne forudsætter at P (A B) = 0, hvilket bl.a. er tilfældet når A B =. 11 12

ËØÒ Ò ½ Ý ³ ÓÖÑ Ðµ ÓÖ Ò Ð Ö A Ó B Ñ P(A) > 0 Ó P(B) 0 Ð Ö Ý ³ ÓÖÑ Ð P(A B) = P(B A)P(A). ½ P(B) Sætning 1.4.2 Lad A 1,..., A n være n hændelser, som opfylder, at P (A 1 A n 1 ) > 0. Da er P (A 1 A n ) = P (A 1 )P (A 2 A 1 )P (A 3 A 1 A 2 ) P (A n A 1 A n 1 ) A 1 A 2 Ò Ò Ö Ð Ö Ò Sætning 1.4.4 Ý ³ Lad ÓÖÑ Ð A 1,..., A Ý Ö n være indbyrdes Ô Ò Ð Ð Ò disjunkte hændelser, Ù Ð ÖÙÑÑ Ú Ò ÓÔ Ð Ò som opfylder, Ù Ð ÖÙÑÑ Ø at E = A 1 Ak n, ÙÒ Ø og at P (A i ) ÑÒ Ö > 0 for i = 1, A.. 1., n. A k Ó Ø Ð ÑÑ Ò Ù Ö For en Ð vilkårlig U hændelse ÙÖB½ gælder Î da, ÓÖ Ø ÐÐ Ö at Ó Ø Ú Ò Ö ÐÐ Ö Ö ÑÓ Ð ÓÖµ Ø Ò Ò ÝÒÐ Ö ÓÖ Ò Ò Ð B Ú Ø Ú Ö A i ³ ÖÒ n Ò Ö Ø Ú Ò Ø Ò P (B) Ò ÝÒÐ Ö = P (B A i )P (A i Ú ) Ò Ö Ò Ò Ø Ò Ò ÝÒÐ ÓÖ Ú ÖØ A i Ú Ø Ò Ð Ò B U B A 3 A 1 A 2 A 3 A k 13 ÙÖ ½ ÃÐ Ð Ò Ù Ð ÖÙÑÑ Ø U ÙÒ Ø Ò Ð Ö A 1 A ÀÒ Ð Ò B ØÖ Ø Ð Ú Ö Ò ÙÒ Ø Ò Ð Ö A 1 B A k B 14 Å Ò Ð ÓÖ Ø ÐÐ Ø Ñ Ò Ö Ó ÖÚ Ö Ø Ò Ð Ò B Ó ÖÒ Ø Ò Ö Ú ÚÓÖ Ò ÝÒÐ ÓÖ ÐÐ A i ³ Ö Ö Omvendingsformel Sætning 1.4.6 For vilkårlige hændelser A og B, som opfylder, at P (A) > 0 og P (B) > 0, gælder P (A B) = P (A) P (B) P (B A) Ø ÐÑ Ò Ð Ø ÑÔ Ð Ö ÒÓ Ø Ö Ò Ä A i ³ ÖÒ Ø Ò ÓÖ ÐÐ ÑÙÐ Ý ÓÑÑ Ó Ð B ÚÖ Ò Ò Ð Ö Ú Ö Ö Ø Ð Ø ÑØ ÝÑÔØÓÑ Ü Ö Ó Ù ÐØ Ø Ò Ò ÝÒÐ Ö P(B A i ) Ö ÐØ Ò ÝÒÐ ÖÒ ÓÖ ÝÑÔØÓÑ ÖÒ ÓÖ Ò Ú Ö Ñ Ý ÓÑÑ Ò A i Ó Ú Ò Ö Ø Ö P(A i B) ÓÖ ÓÖ ÐÐ Ý ÓÑÑ A i ËØÒ Ò Ò Ò Ò ÓÖ Ú Ö Ú Ö Ø Eksempel: Forsikring mod en bestemt type skade. ËØÒ Ò ½ Ý ³ ÓÖÑ Ðµ Ä A 1 A k ÚÖ Ô ÖÚ ÙÒ Ø Ò Ð ÓÑ Ø Ð ÑÑ Ò Ù Ö Ð Ù Ð ÖÙÑÑ Ø Ó ÓÑ ÓÔ ÝÐ Ö P(A i ) > 0 ÓÖ ÐÐ Tavlen. ÓÖ Ò Ú Ö Ò Ð B Ð Ö ÐÓÚ Ò ÓÑ ØÓØ Ð Ò ÝÒÐ P(B) = P(B A 1 )P(A 1 ) +... + P(B A k )P(A k ), ½ 15 16

ØÒ Ò ½ Ý ³ ÓÖÑ Ðµ ÓÖ Ò Ð Ö A Ó B Ñ P(A) > 0 Ó P(B) > Ð Ö Ý ³ ÓÖÑ Ð P(A B) = P(B A)P(A). ½ µ P(B) Bayes formel Ò Ö Ð Ö Ò Ý ³ ÓÖÑ Ð Ý Ö Ô Ò Ð Ð Ò Ù Ð ÖÙÑÑ Ø Sætning 1.4.7 Lad A 1,..., A n være indbyrdes disjunkte hændelser, Ò ÓÔ Ð Ò Ù Ð ÖÙÑÑ Ø k ÙÒ Ø ÑÒ Ö A som opfylder, at E = A 1 A n, og at P (A i ) > 0 for i = 1,.. 1 A., n. k ÓÑ ÑÑ Ò Ù Ö Ð U ÙÖ ½ Î ÓÖ Ø ÐÐ Ö Ó Ø Ú Ò Ö ÐÐ Ö Ö Ò For en hændelse B med P (B) > 0 gælder for ethvert k = 1,..., n, at Ð ÓÖµ Ø Ò Ò ÝÒÐ Ö ÓÖ Ò Ò Ð B Ú Ø Ú Ö A i ³ ÖÒ Ó Ö Ø Ú Ò Ø Ò P (B A k )P (A k ) P (A k B) Ò ÝÒÐ Ö = n Ú Ò Ö Ò Ò Ø Ò P (B A i)p (A i ) ÝÒÐ ÓÖ Ú ÖØ A i Ú Ø Ò Ð Ò B U B Stokastisk uafhængighed Definition 1.5.1 To hændelser A og B siges at være stokastisk uafhængige, hvis P (A B) = P (A)P (B) Ò Ø ½ Í Ò Ò Ð Ö Ó ÓÖ ½ B B c A A B A c P (A B) P (B) = P (A) P (U) A 1 A 2 A 3 A k ÙÖ ½ Í Ò Ò Ð Ö A B Ù Ö ÑÑ Ò Ð B ÓÑ A Ù Ö Ð Ù Ð ÖÙÑÑ Ø ÙÖ ½ ÃÐ Ð Ò Ù Ð ÖÙÑÑ Ø U ÙÒ Ø Ò Ð Ö A 1 A k Ò Ð Ò B ØÖ Ø Ð Ú Ö Ò ÙÒ Ø 17 Ò Ð Ö A 1 B A k B 18 Ù Ò Ø Ö Ó Ø ÑÑ ÓÖØ Ø Ö Ö ÓÑ Ò Ð ÓÖ Ø ÐÐ Ø Ñ Ò Ö Ó ÖÚ Ö Ø Ò Ð Ò B Ó ÖÒ Ø Ò Ö Ø ÚÓÖ Ò ÝÒÐ ÓÖ ÐÐ A i ³ Ö Ö ÐÑ Ò Ð Ø Eksempel: ÑÔ Ð Om Ö uafhængighed: ÒÓ Ø Ö Ò En mønt Ä kastesan i ³ ÖÒ gange. Tavlen. Ø Ò ÓÖ ÐÐ Ð Ý ÓÑÑ Ó Ð B ÚÖ Ò Ò Ð Ö Ú Ö Ö Ø Ð Ø ÑØ ÝÑÔØÓÑ Ö Ö Ó Ù ÐØ Ø Ò Ò ÝÒÐ Ö P(B A i ) Ö ÐØ Ò ÝÒÐ ¹ P(A og B) ÓÖ ÝÑÔØÓÑ ÖÒ ÓÖ Ò Ú Ö Ñ Ý ÓÑÑ Ò P(A) P(B) A i Ó Ú Ò Ö Ø Ö Ò A i B) ÓÖ ÓÖ ÐÐ Ý ÓÑÑ A i ËØÒ Ò Ò Ò Ò ÓÖ Ú Ö Ú Ö Ø 0.1 0.2 0.3 0.4 0.5 ØÒ Ò ½ Ý ³ ÓÖÑ Ðµ Ä A 1 A k ÚÖ Ô ÖÚ ÙÒ Ø Ò Ð Ö Ø Ð ÑÑ Ò Ù Ö Ð Ù Ð ÖÙÑÑ Ø Ó ÓÑ ÓÔ ÝÐ Ö P(A i ) > 0 ÓÖ ÐÐ i Ö Ò Ú Ö Ò Ð B Ð Ö ÐÓÚ Ò ÓÑ ØÓØ Ð Ò ÝÒÐ 2 3 4 5 6 7 8 n P(B) = P(B A 1 )P(A 1 ) +... + P(B A k )P(A k ), Ø Ò ÚÖ Ú Ò Ð Ø Ø Ò Ø Ø Ò Ð Ò Ò Ø ÓÒ ½¾ Ö Ø Ö Ñ Ð Ø Ñ Ø Ñ Ø ÑÓ ØÝ Ø Ð Ø Ñ Ò ÒØÙ Ø ÚØ ÓÖ ØÖ Ú Ù Ò ØØ Ö ÓÖ Ø ÐÐÙ ØÖ Ö Ø ÙÖ ½ ÚÓÖ Ù Ð ÖÙÑÑ Ø U Ö ÓÔ ÐØ Ð A Ó ÓÑÔÐ Ñ ÒØÖÑÒ Ò Ø Ð A Ó Ð B Ó ÓÑÔÐ Ñ ÒØÖÑÒ Ò Ø Ð B À Ö Ð Ñ Ò ÓÖ Ø ÐÐ Ø Ò ÝÒÐ ÖÒ ÓÖ ÑÒ ÖÒ ÙÖ Ò Ú Ö Ö Ø Ð Ö Ð ÖÒ Ø ÖÖ Ð Ö Ë Ò ÝÒÐ Ò Stokastisk ÓÖ Ò Ð Òuafhængighed A Ö ÖÚ A³ Ö Ð ÓÖ ÓÐ Ø Ð Ð Ù Ð ÖÙÑÑ Ø Ö Ð ØØ Ö Ø ÑÑ ÓÑ Ò Ö Ð Ø Ú Ò Ð A Ù Ö B³ Ö Ð ÐÐ Ö Definition Ö Ð Ø1.5.4 B c De ÓÖØÓÐ Ò Ò Ñ Ø n hændelser A 1,..., Ú Ö Ö A n (n Ø 2) Ø Ð siges Ø at være Ú ÒØ Ò Ñ Ò Ö Ó ÖÚ Ö Ø indbyrdes B stokastisk ÐÐ Ö B c uafhængige, Ö Ö ÑÑ hvis Ò ÝÒÐ der for enhver delmængde ÓÖ Ø A Ó Ö Ò ØÖÙ Ø Ø Ö Ð ÓÖ ÓÐ Ú Ö Ö Ø Ð Ò Ø ÓÒ ½¾ Ø Ú {i 1,..., i k } af {i,..., n} gælder at P(A B) = P(A) P(B) P(U), P (A i1 A ik ) = P (A i1 ) P (A ik ) Ö P(A B) = P(A)P(B) Ø P(U) = 1 Ö Ò Ò Ò Ð Ö ÙÒ ÓÖ Ò Ð Ö B Ñ P(B) > 0µ ½ µ 19 ÆÓØ ½ ËÓÑ ÙÖ Ò ÒØÝ Ö Ð Ö Ø Ø Ú A Ó B Ö Ù Ò Ö Ó A Ó B c Ù Ò ØØ Ö Ò Ò Ò ( ) P(A B c ) = P A\(A B) = P(A) P(A 20 B) ÓÑ ÒÖ A Ó B Ö Ù Ò Ò ÓÑ Ö Ú Ú Ö Ø Ð

Stokastiske variable En stokastisk variabel er en funktion fra udfaldsrummet ind i de reelle tal: X : E IR Stokastiske variable betegnes som regel med store bogstaver, f.eks X, Y eller Z. Det er en reel variabel der er tilfældig: vi kender ikke dens værdi på forhånd, men kun dens sandsynlighedsfordeling. For (næsten) enhver delmængde A af IR angives sandsynligheden for at X ligger i A: P X (A) = P (X A) Transformationssætningen for fordelinger X : stokastisk variabel t : funktion fra IR ind i IR Da er Y = t(x) også en stokastisk variabel, med en fordeling, der kan beregnes udfra fordelingen af X: P Y (A) = P X (t 1 (A)) hvor t 1 (A) betegner originalmængden af A. 21 22 t() = 2 A Fordelingsfunktion X: stokastisk variabel. Fordelingen kan også angives ved fordelingsfunktionen for X: F () = P (X ) = P X ((, ]) t 1 (A) for IR. Fordelingsfunktionen er en funktion fra R ind i [0, 1]: IR F [0, 1] Det er nok at specificere P (X A) for ethvert A = (, ], IR. 23 24

F() 0.0 0.2 0.4 0.6 0.8 1.0 Fordelingen af antal øjne ved kast med en terning 0 2 4 6 F() 0.0 0.2 0.4 0.6 0.8 1.0 Ligefordelingen 0.5 0.0 0.5 1.0 1.5 Generelle egenskaber ved fordelingsfunktioner F er en svagt voksende funktion fra 0 til 1 (ikke-aftagende). Derudover: og lim F () = 1 lim F () = 0 25 26 Fler-dimensionale stokastiske variable Ofte ønsker man at studere flere stokastiske variable på en gang: X i sædvanlig stokastisk variabel på samme udfaldsrum E for alle i = 1,..., n: X = (X 1,..., X n ) er en n-dimensional stokastisk vektor; en funktion fra E ind i IR n : E X Da alle X i -erne afhænger af det samme basale udfald e E kan der være sammenhænge mellem dem: IR n X(e) = (X 1 (e),..., X n (e)) Den simultane fordeling for den stokastiske vektor X = (X 1,..., X n ) defineres som sandsynlighedsmålet på IR n givet ved hvor A IR n. P X (A) = P ((X 1,..., X n ) A) De n fordelinger af de enkelte koordinater X 1,..., X n : P Xi (B) = P (X i B) ; B IR kaldes for de marginale fordelinger. De er ikke hele sandheden om X = (X 1,..., X n ). 27 28

Uafhængige stokastiske variable Definition 2.4.1 De stokastiske variable X 1,..., X n siges at være uafhængige hvis P (X 1 A 1,..., X n A n ) = P (X 1 A 1 ) P (X n A n ) for alle A 1,..., A n hvor hver A i er en delmængde af IR. Sætning 2.4.2 To stokastiske variable X 1 og X 2 er stokastisk uafhængige hvis og kun hvis det for ethvert par A 1 og A 2 af delmængder af IR med P (X 2 A 2 ) > 0 gælder, at P (X 1 A 1 X 2 A 2 ) = P (X 1 A 1 ) Sætning 2.4.3 Lad X 1,..., X n være uafhængige stokastiske variable. Da gælder følgende: 1. Hvis ϕ i, i = 1,..., n er funktioner fra IR ind i IR, er de stokastiske variable ϕ 1 (X 1 ),..., ϕ n (X n ) uafhængige. 2. Hvis k < n og ψ er en funktion fra IR n k ind i IR, er de stokastiske variable X 1,..., X k, ψ(x k+1,..., X n ) uafhængige. 3. Lad k og ψ være som i (2), og lad ϕ være en funktion fra IR k ind i IR. Da er de stokastiske variable ϕ(x 1,..., X k ) og ψ(x k+1,..., X n ) uafhængige. 29 30 Fordelinger på endelige mængder Binomialfordelingen Definition 3.2.1 Lad X 1, X 2,..., X n være uafhængige stokastiske variable med værdier i {0, 1}, som alle har samme fordeling givet ved Binomialfordelingens sandsynlighedsfunktion er ( ) n p() = p (1 p) n for {0, 1,..., n}. P (X i = 1) = p, P (X i = 0) = 1 p for et givet tal p mellem 0 og 1. Fordelingen af summen: S = X 1 + X 2 + + X n kaldes binomialfordelingen med antalsparameter n og sandsynlighedsparameter p. Bemærk at S {0, 1,..., n}. Punktsandsynligheder 0.0 0.1 0.2 0.3 0.4 Binomialfordelingen med n = 10 og p = 0.1 0 2 4 6 8 10 Punktsandsynligheder 0.00 0.02 0.04 0.06 0.08 Binomialfordelingen med n = 100 og p = 0.4 0 20 40 60 80 100 31 32

Polynomialfordelingen Beskriver n uafhængige forsøg med k mulige udfald. Bemærk at det er en generalisering af binomialfordelingen, hvor k = 2. Betragt n uafhængige stokastiske variable: X 1, X 2,..., X n, der antager værdier i mængden {1,..., k}. Antag at de alle har samme fordeling givet ved for j = 1,..., k og i = 1,..., n. P (X i = j) = p j Definer den stokastiske vektor (S 1,..., S k ) ved S j = # { i X i = j } for j = 1,..., k Fordelingen af (S 1,..., S k ) kaldes en polynomialfordeling af orden k med antalsparameter n og sandsynlighedsparametre p 1,..., p k. Den stokastiske vektor kan kun antage værdier i følgende delmængde af IN k 0: D k (n) = {(s 1,..., s k ) s i {0,..., n}, i = 1,..., k, s 1 + + s k = n } Tilsvarende ligger sandsynlighedsparametrene i følgende delmængde af [0, 1] k : k = {(p 1,..., p k ) p i [0, 1], i = 1,..., k, p 1 + + p k = 1 } For (s 1,..., s k ) D k (n) er P ((S 1,..., S k ) = (s 1,..., s k )) = ( n s 1,..., s k ) p s1 1 ps k k 33 34 Simultane og marginale sandsynlighedsfunktioner (X 1, X 2 ) : 2-dimensional stokastisk vektor Antag at X i er koncentreret på T i, i = 1, 2, hvor T i er endelige mængder: T 1 = {t 1,..., t n1 } og T 2 = {t 1,..., t n2 }. Antag at vi kun kender den simultane fordeling af (X 1, X 2 ): p( 1, 2 ) : T 1 T 2 [0, 1] De marginale fordelinger er da givet ved p 1 ( 1 ) = p( 1, 2 ) 2 T 2 p 2 ( 2 ) = p( 1, 2 ) 1 T 1 Transformationssætning (Sætning 3.4.2) Lad (X 1,..., X n ) være en stokastisk vektor koncentreret på den endelige mængde T IR n, og lad p( 1,..., n ) være sandsynlighedsfunktionen for den simultane fordeling af (X 1,..., X n ). Betragt en afbildning: ψ : T IR k Da er sandsynlighedsfunktionen for den stokastiske vektor Y = ψ(x 1,..., X n ) koncentreret på ψ(t ) og givet ved ( P (Y = y) = 1,..., n) ψ 1 ({y}) p( 1,..., n ) for y ψ(t ) 0 for y / ψ(t ) 35 36

Eksempel 3.4.3: Lad X være binomialfordelt med antalsparameter n og sandsynlighedsparameter p. Hvordan er Y = X/c fordelt? X Bin(n, p) T = {0, 1,..., n} ( ) n p() = p (1 p) n Y = X/c c > 0 Vi bruger transformationssætningen med ψ() = /c. Y er koncentreret på ψ(t ) = {0, 1 /c,..., n /c} for y ψ(t ), ellers er P Y (y) = 0. ψ 1 (y) = cy ( ) n P Y (y) = p cy (1 p) n cy cy Uafhængige stokastiske variable: Sætning 3.6.1 Antag, at (X 1,..., X n ) er en n-dimensional stokastisk vektor, hvor X i er koncentreret på den endelige mængde T i, i = 1,..., n. Definer T = T 1 T n, lad p : T [0, 1] være sandsynlighedsfunktionen for den simultane fordeling af (X 1,..., X n ), og lad p i : T i [0, 1], være sandsynlighedsfunktionen for den marginale fordeling af X i, i = 1,..., n. Da er de følgende tre udsagn ækvivalente: 1. X 1,..., X n er stokastisk uafhængige, 2. For alle ( 1,..., n ) T er p( 1,..., n ) = p 1 ( 1 ) p n ( n ) 3. Der findes n ikke-negative reelle funktioner g i, i = 1,..., n, så for alle ( 1,..., n ) T. p( 1,..., n ) = g 1 ( 1 ) g n ( n ) 37 38 Vigtig konsekvens: Vælg mængderne T i således at p i ( i ) > 0 for alle i T i. n = 2 Hvis X 1 og X 2 er uafhængige er p( 1, 2 ) = p 1 ( 1 )p 2 ( 2 ) for alle ( 1, 2 ) T 1 T 2. Da vil nødvendigvis også p( 1, 2 ) > 0 for alle ( 1, 2 ) T 1 T 2. Ergo: Hvis X 1 og X 2 er uafhængige, er den stokastiske vektor koncentreret på en produktmængde, med strengt positiv sandsynlighed på alle punkter i produktmængden. Hvis mængden {( 1, 2 ) p( 1, 2 ) > 0} ikke er en produktmængden, kan X 1 og X 2 ikke være uafhængige. Antag (X, Y ) ligefordelt på {(0, 1), (1, 0), (0, 1), ( 1, 0)}. E(X) = E(Y ) = (1 + ( 1) + 0 + 0) 1/4 = 0 P (XY = 0) = 1, så E(XY ) = 0 og Cov(X, y) = 0. 1 Y 1/4 1/4 1/4 1 1 X 1 1/4 De er IKKE uafhængige: P (X = 1, Y = 1) = 0 1 /4 1/4 = 1 /16 = P (X = 1)P (Y = 1). Andre argumenter: Ikke en produktmængde. 39 40

Middelværdi Definition 3.7.1 Lad X være en stokastisk variabel, der er koncentreret på den endelige mængde T = {a i : i = 1,... k} IR, og som har sandsynlighedsfunktion p. Da definerer vi middelværdien af X som E(X) = k a i p(a i ) E: kommer af det engelske epectation eller det tyske erwartungswert Middelværdi af en transformeret stokastisk variabel Sætning 3.7.3 Lad X være en n-dimensional stokastisk vektor, som er koncentreret på den endelige mængde T IR n, og som har sandsynlighedsfunktion p. Lad ψ være en funktion fra T ind i IR. Da har den stokastiske variable ψ(x) middelværdien E(ψ(X)) = ( 1,..., n) T ψ( 1,..., n ) p( 1,..., n ) Bemærk: Middelværdien er en egenskab ved fordelingen 41 42 Sætning 3.7.5: Lineær transformation. X er en stokastisk variabel på { 1,..., k } Lad a og b være vilkårlige reelle tal. Da er E(a + bx) = a + b E(X) Sætning 3.7.6: Lad (X 1, X 2 ) være en to-dimensional stokastisk vektor koncentreret på en endelig mængde, som opfylder, at X 1 X 2. Da er E(X 1 ) E(X 2 ) Specielt gælder for en stokastisk variabel X, at Sætning 3.7.7: Lad X 1, X 2,..., X n være stokastiske variable koncentreret på endelige mængder. Da er E(X 1 + X 2 + + X n ) = E(X 1 ) + E(X 2 ) + + E(X n ) Hvis ydermere X 1, X 2,..., X n er uafhængige, gælder at E(X 1 X 2 X n ) = E(X 1 ) E(X 2 ) E(X n ) E(X) E( X ) 43 44

Varians Definition 3.7.10 Lad X være en stokastisk variabel på en endelig mængde. Da defineres variansen af X som Beregning af variansen: Var(X) = E ( (X E(X)) 2) Var(X) = E(X 2 ) (E(X)) 2 Kvadratroden af variansen kaldes spredningen eller standardafvigelsen: Var(X) Sætning 3.7.12: For en stokastisk variabel X på en endelig mængde er Var(X) = 0 hvis og kun hvis der findes et reelt tal c, så P (X = c) = 1. Definition 3.7.13: En stokastisk variabel X siges at være udartet, hvis der findes et c IR, så P (X = c) = 1. Fordelingen af X kaldes da den udartede fordeling i punktet c Et naturligt mål for en fordelings bredde eller variation. 45 46 Kovarians Definition 3.8.1 For to stokastiske variable på endelige mængder defineres kovariansen mellem X og Y ved Cov(X, Y ) = E ((X E(X))(Y E(Y ))) Beregning af kovariansen: Cov(X, Y ) = E(XY ) E(X)E(Y ) Sætning 3.8.3 Hvis X og Y er uafhængige er Cov(X, Y ) = 0. Korrelation Definition 3.8.6 For to stokastiske variable X og Y, som opfylder at Var(X) > 0 og Var(Y ) > 0 defineres korrelationen mellem X og Y ved corr(x, Y ) = Cov(X, Y ) Var(X)Var(Y ) Korrelationen kan fortolkes som kovariansen mellem de to standardiserede variable X 0 = X E(X) Var(X) ; Y 0 = Y E(Y ) Var(Y ) Altid: 1 corr(x, Y ) 1. 47 48

Den empiriske fordeling Sætning 3.8.8 Lad X 1,..., X n være parvis ukorrelerede reelle stokastiske variable. Da er Var(X 1 + + X n ) = Var(X 1 ) + + Var(X n ) 1,..., n er givne observationer (reelle tal) Den empiriske fordeling af disse observationer: Fordelingen på mængden { 1,..., n } som fremkommer ved at tildele hver observation sandsynligheden 1 n. Den empiriske middelværdi ( = gennemsnittet): Lad X være en stokastisk variabel, hvis fordeling er den empiriske fordeling. E(X) = = 1 n ( 1 + + n ) Var(X) = 1 n n ( i ) 2 eller 1 n 1 n ( i ) 2 49 50 Den empiriske fordeling ( 1, y 1 ),..., ( n, y n ) er givne talpar. Den empiriske fordeling af disse observationer: Fordelingen på mængden bestående af de n givne talpar, som fremkommer ved at tildele hvert observationspar sandsynligheden 1 n. Den empiriske kovarians Lad (X, Y ) være en stokastisk vektor, hvis fordeling er den empiriske fordeling Cov(X, Y ) = 1 n ( i )(y i ȳ) n eller = 1 n 1 n ( i )(y i ȳ) Den empiriske korrelation n corr(x, Y ) = ( i )(y i ȳ) n ( i ) 2 n (y i ȳ). 2 51 52