INSTITUT FOR MATEMATISKE FAG c

Relaterede dokumenter
Elementær sandsynlighedsregning

Elementær sandsynlighedsregning

Sandsynlighedsregning Oversigt over begreber og fordelinger

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Repetition Stokastisk variabel

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Sandsynlighedsregning Stokastisk variabel

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Betingede sandsynligheder Aase D. Madsen

Løsning til eksamen 16/

Susanne Ditlevsen Institut for Matematiske Fag susanne

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Statistik og Sandsynlighedsregning 2

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Teoretisk Statistik, 16. februar Generel teori,repetition

3 Stokastiske variable 3.1 Diskrete variable

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Produkt og marked - matematiske og statistiske metoder

Kvantitative Metoder 1 - Forår 2007

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgaver i sandsynlighedsregning

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

standard normalfordelingen på R 2.

Opgaver til Matematisk Modellering 1

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Kvantitative Metoder 1 - Efterår Dagens program

Statistiske modeller

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Produkt og marked - matematiske og statistiske metoder

Sandsynlighedsregning

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Note om Monte Carlo metoden

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Uge 10 Teoretisk Statistik 1. marts 2004

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Sandsynlighedsregning

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Sandsynlighed og Statistik

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Transkript:

INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: bjh@math.aau.dk Dataanalyse Sandsynlighed og stokastiske variable Udfaldsrum S: mængden af alle mulige udfald for et eksperiment. Hændelse A: delmængde af S. Sandsynlighedsmål P: Afbilder hændelser ind i [0, 1]. Opfylder Det giver blandt andet følgende resultater Betinget sandsynlighed: A og B er uafhængige hvis Uafhængighed medfører 0 P(A) 1 P(A B) = P(A) + P(B), A B = P(S) = 1 P( ) = 0 P(A B) = P(A) + P(B) P(A B) P(A B) = P(A c ) = 1 P(A) P(A B), P(B) > 0 P(B) P(A B) = P(A)P(B). P(A B) = P(A) En klassedeling E 1, E 2,..., E k opfylder E i E j = og E 1 E 2 E k = S. Regel om total sandsynlighed Bayes formel: P(A) = k P(A E i )P(E i ). P(E j A) = P(A E j)p(e j ) P(A) = P(A E j )P(E j ) k P(A E i)p(e i ) Stokastisk variabel X : S R X diskret: X D = {x 1, x 2,..., x n,...} R X kontinuert: X C R (sammenhængende delmængder) 1

Diskret stokastisk variabel Sandsynlighedsfunktion p(x): p(x) = P(X = x), x D Fordelingsfunktion F (x): F (x) = P(X x) = p(y), x R y D;y x Middelværdi E[X] (massemidtpunkt for sandsynlighedsmassen) E[X] = x D xp(x) = µ X X siges at have endelig middelværdi, hvis E[X] = x D x p(x) <. Forventet værdi af funktion g(x): E[g(X)] = x D g(x)p(x) Variansen af X: Spredningen/standardafvigelsen for X: V ar(x) = E[(X µ X ) 2 ] = E[X 2 ] µ 2 X = σ 2 X σ X = V ar(x). Eksempel:Uniform fordeling (Terningkast). D = {1, 2, 3, 4, 5, 6}, p(x) = 1/6, x D. E[X] = 3/7, V ar(x) = 35/12 Eksempel: Binomialfordelingen n uafhængige forsøg. p er sandsynlighed for succes i et forsøg. X antal succeser. D = {0, 1,..., n}, ( nx ) p(x) = p x (1 p) n x E[X] = np, V ar(x) = np(1 p). Eksempel: Poisson fordeling Gennemsnitlig antal hændelser i vilkårligt område O er λ O. X er antal hændelser et givent område af størrelse 1. E[X] = λ, V ar(x) = λ p(x) = λx x! e λ Kontinuert stokastisk variabel X C R kan altid udvides til X R ved at sætte P(X C) = 0. For X kontinuert kan fordelingsfunktionen skrives som F (x) = hvor f(y) er tæthedsfunktion og opfylder: x f(y) y f(y)dy 2

Hvis X C sættes f(y) = 0, y C og så er f(y)dy = f(y)dy = 1 C f(y)dy = 1 Middelværdien givet ved og X har endelig middelværdi hvis P(X = x) = 0, x R E[X] = xf(x)dx = µ X E[X] = x f(x)dx <. og for generel funktion g(x): E[g(X)] = g(y)f(y)dy Eksempel: Uniform fordeling X [a, b], f(y) = c, y [a, b]: b a cdy = c(b a) c = 1/(b a) E[X] = b + a 2, V ar(x) = Eksempel: Normalfordelingen X N(µ, σ 2 ), hvis X R og tæthedsfunktionen er f(y) = 1 (y µ)2 e 2σ 2 2πσ 2 E[X] = µ, V ar(x) = σ 2 Flerdimensionelle fordelinger Diskrete variable (X, Y ) D = D X D Y R 2. Simultan sandsynlighedsfunktion p(x, y) = P(X = x, Y = y) = P(X = x Y = y), x D X, y D Y Marginale sandsynlighedsfunktioner p X (x) = P (X = x) = p(x, y), p Y (y) = p(x, y) y D Y x D X E[g(X, Y )] = g(x, y)p(x, y) (x,y) D Eksempelvis E[g(X)] = (x,y) D g(x)p(x, y) = g(x) p(x, y) = p X (x) x D x y D Y x D X som vi ved fra det en-dimensionelle. X og Y er uafhængige hvis p(x, y) = p X (x)p Y (y) for alle (x, y) D 3

Eksempel: Slag med to terninger X maximum øjne, Y summen af øjnene. D X = {1, 2, 3, 4, 5, 6}, D Y = {2, 3, 4,..., 11, 12} p(1, 2) = 1/36, p(1, y) = 0, y > 2 p(2, 2) = 0, p(2, 3) = 2/36, p(2, 4) = 1/36, p(2, y) = 0, y > 4 p(3, 2) = p(3, 3) = 0, p(3, 4) = 2/36, p(3, 5) = 2/36, p(3, 6) = 1/36, p(3, y) = 0, y > 6 Find selv resten. Er X og Y uafhængige? Kontinuerte variable (X, Y ) C R 2. Simultan fordelingsfunktion F (x, y) = P(X x, Y y) = (u,v) C:u x,v y f(u, v)dudv f(u, v) er den simultane tæthedsfunktion. Marginale tætheder findes ved f X (x) = f(x, v)dv, f Y (y) = v C x f(u, y)du u C y X og Y er uafhængige hvis tæthederne opfylder f(x, y) = f X (x)f Y (y). Eksempel: Lad f(u, v) = 4u 2, 0 u 1, 0 v x. Så ses, at geometriske overvejelser giver f X (x) = x 0 4x 2 dv = 4x 3, 0 x 1 X og Y er oplagt afhængige. f Y (y) = 1 Middelværdi for en funktion g(x, Y ) findes ved E[g(X, Y )] = Højere dimensioner y 4u 2 du = 4 3 (1 y3 ), 0 y 1 C g(u, v)f(u, v)dvdu Alt ovenstående kan udvides simpelt fra to dimensioner til n dimensioner, hvor vi ser på stokastiske vektor X 1, X 2,... X n. Hovedsætnigen for middelværdi er følgende: Sætning 1 Lad (X 1, X 2,..., X n ) være en stokastisk vektor med simultan ssh. fkt. p(x 1,..., x n ). Lad g : R n R. Så E[g(X 1,..., X n )] = g(x 1,..., x n )p(x 1,..., x n ) (x 1,...x n) og er endelig, hvis E[ g(x 1,..., X n ) ] <. Hvis (X 1, X 2,..., X n ) er kontinuert med tæthedsfunktion f(x 1,..., x n ) er den givet ved E[g(X 1,..., X n )] = g(x 1,..., x n )f(x 1,..., x n )dx 1 dx n R n 4

Middelværdi, varians og korrelation Regneregler for middelværdi P(X = c) = 1 medfører E[X] = c. E[1 A (X)] = P(X A), hvor 1 A (X) = 1, hvis X A og 0 ellers. X 1,..., X n stok. var. og a 1,..., a n reelle konstanter medfører n E[ a i X i ] = n a i E[X i ] X 1,..., X n uafhængige stok. var. E[X 1 X n ] = E[X 1 ] E[X n ] X 1 X 2 medfører E[X 1 ] E[X 2 ]. E[X] E[ X ]. Momenter Det k te moment for en stok. var. er E[X k ]. Det k te centrale moment er E[(X µ X ) k ], hvor µ X = E[X]. Varians Varians er navnet for det andet centrale moment, som beskriver hvor meget en stok variabel spreder sig omkring sin middelværdi V ar(x) = E[(X µ X ) 2 ] = E[X 2 ] µ 2 X σ 2 X hvoraf det ses at variansen er endelig hvis E[X 2 ] <. Spredningen eller standard afvigelsen er givet ved V ar(x) = σ X. Vi har følgende resultater: P(X = c) = 1 er ækvivalent med V ar(x) = 0. a, b reelle konstanter: V ar(a + bx) = b 2 V ar(x) X 1,..., X n uafhængige, så gælder V ar(x 1 ± X 2 ± ± X n ) = n V ar(x i ) Kovarians Kovariansen mellem to stokastiske variable X, Y er givet ved Cov(X, Y ) = E[(X µ X )(Y µ Y )] = E[XY ] µ X µ Y. Kovariansen er defineret, hvis begge variable har endelig varians. Vi har følgende regneregler: V ar(x 1 + + X n ) = n n i 1 V ar(x i ) + 2 Cov(X i, X j ). j=1 5

Cov(a + bx, c + dy ) = bdcov(x, Y ) Cov(X + Z, Y ) = Cov(X, Y ) + Cov(Z, Y ) Cov(X, Y ) = Cov(Y, X) X, Y uafhængige medfører Cov(X, Y ) = 0. Korrelation Korrelationen er en enhedsfri udgave af kovariansen, eller sagt på en anden måde kovariansen mellem de standardisered variable. Den er givet ved Corr(X, Y ) = Cov(X, Y ) V ar(x)v ar(y ). 1 Corr(X, Y ) 1 Corr(X, Y ) = ±1 medfører der eksisterer α, β, så X = α+βy, hvor sign(β) = sign(corr(x, Y )). Med venlig hilsen Bjarne Højgaard 6