INSTITUT FOR MATEMATISKE FAG c

Relaterede dokumenter
Elementær sandsynlighedsregning

Elementær sandsynlighedsregning

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsregning Oversigt over begreber og fordelinger

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Definition. Definitioner

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Repetition Stokastisk variabel

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Sandsynlighedsregning Stokastisk variabel

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Betingede sandsynligheder Aase D. Madsen

StatDataN: Middelværdi og varians

Løsning til eksamen 16/

Susanne Ditlevsen Institut for Matematiske Fag susanne

Statistik og Sandsynlighedsregning 2

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Forår Dagens program

Statistik og Sandsynlighedsregning 2

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Teoretisk Statistik, 16. februar Generel teori,repetition

Kvantitative Metoder 1 - Efterår Dagens program

3 Stokastiske variable 3.1 Diskrete variable

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Produkt og marked - matematiske og statistiske metoder

Kvantitative Metoder 1 - Forår 2007

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgaver i sandsynlighedsregning

Sandsynlighedsregning 8. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Kvantitative Metoder 1 - Forår Dagens program

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

standard normalfordelingen på R 2.

Hvorfor er det lige at vi skal lære det her?

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Opgaver til Matematisk Modellering 1

4 Oversigt over kapitel 4

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Kvantitative Metoder 1 - Efterår Dagens program

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Statistiske modeller

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Nanostatistik: Middelværdi og varians

Kvantitative Metoder 1 - Forår Dagens program

MM501 forelæsningsslides

Produkt og marked - matematiske og statistiske metoder

Kvantitative Metoder 1 - Forår 2007

Sandsynlighedsregning

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Note om Monte Carlo metoden

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Nanostatistik: Stokastisk variabel

Reeksamen 2014/2015 Mål- og integralteori

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : (navn) (underskrift) (bord nr)

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Uge 10 Teoretisk Statistik 1. marts 2004

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Kvantitative Metoder 1 - Efterår Dagens program

Hvad skal vi lave i dag?

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Sandsynlighedsregning

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Deskriptiv teori i flere dimensioner

Kvantitative Metoder 1 - Forår 2007

Sandsynlighed og Statistik

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Højde af kvinder 2 / 18

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Transkript:

INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: bjh@math.aau.dk Dataanalyse Sandsynlighed og stokastiske variable Udfaldsrum S: mængden af alle mulige udfald for et eksperiment. Hændelse A: delmængde af S. Sandsynlighedsmål P: Afbilder hændelser ind i [0, 1]. Opfylder Det giver blandt andet følgende resultater Betinget sandsynlighed: A og B er uafhængige hvis Uafhængighed medfører 0 P(A) 1 P(A B) = P(A) + P(B), A B = P(S) = 1 P( ) = 0 P(A B) = P(A) + P(B) P(A B) P(A B) = P(A c ) = 1 P(A) P(A B), P(B) > 0 P(B) P(A B) = P(A)P(B). P(A B) = P(A) En klassedeling E 1, E 2,..., E k opfylder E i E j = og E 1 E 2 E k = S. Regel om total sandsynlighed Bayes formel: P(A) = k P(A E i )P(E i ). P(E j A) = P(A E j)p(e j ) P(A) = P(A E j )P(E j ) k P(A E i)p(e i ) Stokastisk variabel X : S R X diskret: X D = {x 1, x 2,..., x n,...} R X kontinuert: X C R (sammenhængende delmængder) 1

Diskret stokastisk variabel Sandsynlighedsfunktion p(x): p(x) = P(X = x), x D Fordelingsfunktion F (x): F (x) = P(X x) = p(y), x R y D;y x Middelværdi E[X] (massemidtpunkt for sandsynlighedsmassen) E[X] = x D xp(x) = µ X X siges at have endelig middelværdi, hvis E[X] = x D x p(x) <. Forventet værdi af funktion g(x): E[g(X)] = x D g(x)p(x) Variansen af X: Spredningen/standardafvigelsen for X: V ar(x) = E[(X µ X ) 2 ] = E[X 2 ] µ 2 X = σ 2 X σ X = V ar(x). Eksempel:Uniform fordeling (Terningkast). D = {1, 2, 3, 4, 5, 6}, p(x) = 1/6, x D. E[X] = 3/7, V ar(x) = 35/12 Eksempel: Binomialfordelingen n uafhængige forsøg. p er sandsynlighed for succes i et forsøg. X antal succeser. D = {0, 1,..., n}, ( nx ) p(x) = p x (1 p) n x E[X] = np, V ar(x) = np(1 p). Eksempel: Poisson fordeling Gennemsnitlig antal hændelser i vilkårligt område O er λ O. X er antal hændelser et givent område af størrelse 1. E[X] = λ, V ar(x) = λ p(x) = λx x! e λ Kontinuert stokastisk variabel X C R kan altid udvides til X R ved at sætte P(X C) = 0. For X kontinuert kan fordelingsfunktionen skrives som F (x) = hvor f(y) er tæthedsfunktion og opfylder: x f(y) y f(y)dy 2

Hvis X C sættes f(y) = 0, y C og så er f(y)dy = f(y)dy = 1 C f(y)dy = 1 Middelværdien givet ved og X har endelig middelværdi hvis P(X = x) = 0, x R E[X] = xf(x)dx = µ X E[X] = x f(x)dx <. og for generel funktion g(x): E[g(X)] = g(y)f(y)dy Eksempel: Uniform fordeling X [a, b], f(y) = c, y [a, b]: b a cdy = c(b a) c = 1/(b a) E[X] = b + a 2, V ar(x) = Eksempel: Normalfordelingen X N(µ, σ 2 ), hvis X R og tæthedsfunktionen er f(y) = 1 (y µ)2 e 2σ 2 2πσ 2 E[X] = µ, V ar(x) = σ 2 Flerdimensionelle fordelinger Diskrete variable (X, Y ) D = D X D Y R 2. Simultan sandsynlighedsfunktion p(x, y) = P(X = x, Y = y) = P(X = x Y = y), x D X, y D Y Marginale sandsynlighedsfunktioner p X (x) = P (X = x) = p(x, y), p Y (y) = p(x, y) y D Y x D X E[g(X, Y )] = g(x, y)p(x, y) (x,y) D Eksempelvis E[g(X)] = (x,y) D g(x)p(x, y) = g(x) p(x, y) = p X (x) x D x y D Y x D X som vi ved fra det en-dimensionelle. X og Y er uafhængige hvis p(x, y) = p X (x)p Y (y) for alle (x, y) D 3

Eksempel: Slag med to terninger X maximum øjne, Y summen af øjnene. D X = {1, 2, 3, 4, 5, 6}, D Y = {2, 3, 4,..., 11, 12} p(1, 2) = 1/36, p(1, y) = 0, y > 2 p(2, 2) = 0, p(2, 3) = 2/36, p(2, 4) = 1/36, p(2, y) = 0, y > 4 p(3, 2) = p(3, 3) = 0, p(3, 4) = 2/36, p(3, 5) = 2/36, p(3, 6) = 1/36, p(3, y) = 0, y > 6 Find selv resten. Er X og Y uafhængige? Kontinuerte variable (X, Y ) C R 2. Simultan fordelingsfunktion F (x, y) = P(X x, Y y) = (u,v) C:u x,v y f(u, v)dudv f(u, v) er den simultane tæthedsfunktion. Marginale tætheder findes ved f X (x) = f(x, v)dv, f Y (y) = v C x f(u, y)du u C y X og Y er uafhængige hvis tæthederne opfylder f(x, y) = f X (x)f Y (y). Eksempel: Lad f(u, v) = 4u 2, 0 u 1, 0 v x. Så ses, at geometriske overvejelser giver f X (x) = x 0 4x 2 dv = 4x 3, 0 x 1 X og Y er oplagt afhængige. f Y (y) = 1 Middelværdi for en funktion g(x, Y ) findes ved E[g(X, Y )] = Højere dimensioner y 4u 2 du = 4 3 (1 y3 ), 0 y 1 C g(u, v)f(u, v)dvdu Alt ovenstående kan udvides simpelt fra to dimensioner til n dimensioner, hvor vi ser på stokastiske vektor X 1, X 2,... X n. Hovedsætnigen for middelværdi er følgende: Sætning 1 Lad (X 1, X 2,..., X n ) være en stokastisk vektor med simultan ssh. fkt. p(x 1,..., x n ). Lad g : R n R. Så E[g(X 1,..., X n )] = g(x 1,..., x n )p(x 1,..., x n ) (x 1,...x n) og er endelig, hvis E[ g(x 1,..., X n ) ] <. Hvis (X 1, X 2,..., X n ) er kontinuert med tæthedsfunktion f(x 1,..., x n ) er den givet ved E[g(X 1,..., X n )] = g(x 1,..., x n )f(x 1,..., x n )dx 1 dx n R n 4

Middelværdi, varians og korrelation Regneregler for middelværdi P(X = c) = 1 medfører E[X] = c. E[1 A (X)] = P(X A), hvor 1 A (X) = 1, hvis X A og 0 ellers. X 1,..., X n stok. var. og a 1,..., a n reelle konstanter medfører n E[ a i X i ] = n a i E[X i ] X 1,..., X n uafhængige stok. var. E[X 1 X n ] = E[X 1 ] E[X n ] X 1 X 2 medfører E[X 1 ] E[X 2 ]. E[X] E[ X ]. Momenter Det k te moment for en stok. var. er E[X k ]. Det k te centrale moment er E[(X µ X ) k ], hvor µ X = E[X]. Varians Varians er navnet for det andet centrale moment, som beskriver hvor meget en stok variabel spreder sig omkring sin middelværdi V ar(x) = E[(X µ X ) 2 ] = E[X 2 ] µ 2 X σ 2 X hvoraf det ses at variansen er endelig hvis E[X 2 ] <. Spredningen eller standard afvigelsen er givet ved V ar(x) = σ X. Vi har følgende resultater: P(X = c) = 1 er ækvivalent med V ar(x) = 0. a, b reelle konstanter: V ar(a + bx) = b 2 V ar(x) X 1,..., X n uafhængige, så gælder V ar(x 1 ± X 2 ± ± X n ) = n V ar(x i ) Kovarians Kovariansen mellem to stokastiske variable X, Y er givet ved Cov(X, Y ) = E[(X µ X )(Y µ Y )] = E[XY ] µ X µ Y. Kovariansen er defineret, hvis begge variable har endelig varians. Vi har følgende regneregler: V ar(x 1 + + X n ) = n n i 1 V ar(x i ) + 2 Cov(X i, X j ). j=1 5

Cov(a + bx, c + dy ) = bdcov(x, Y ) Cov(X + Z, Y ) = Cov(X, Y ) + Cov(Z, Y ) Cov(X, Y ) = Cov(Y, X) X, Y uafhængige medfører Cov(X, Y ) = 0. Korrelation Korrelationen er en enhedsfri udgave af kovariansen, eller sagt på en anden måde kovariansen mellem de standardisered variable. Den er givet ved Corr(X, Y ) = Cov(X, Y ) V ar(x)v ar(y ). 1 Corr(X, Y ) 1 Corr(X, Y ) = ±1 medfører der eksisterer α, β, så X = α+βy, hvor sign(β) = sign(corr(x, Y )). Med venlig hilsen Bjarne Højgaard 6