Kvantitative Metoder 1 - Forår 2007

Relaterede dokumenter
Kvantitative Metoder 1 - Forår 2007

Oversigt over nyttige fordelinger

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår 2007

Definition. Definitioner

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Kvantitative Metoder 1 - Forår Dagens program

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvantitative Metoder 1 - Efterår Dagens program

Elementær sandsynlighedsregning

Nanostatistik: Opgavebesvarelser

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Vejledende løsninger til opgaver i kapitel 6

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Elementær sandsynlighedsregning

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Produkt og marked - matematiske og statistiske metoder

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Produkt og marked - matematiske og statistiske metoder

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Kvantitative Metoder 1 - Forår Dagens program

Note om Monte Carlo metoden

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Kvantitative Metoder 1 - Forår Dagens program

Diskrete fordelinger. Fire vigtige diskrete fordelinger: 1. Uniform fordeling (diskret) 2. Binomial fordeling. 3. Hyper-geometrisk fordeling

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Løsninger til kapitel 6

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Løsninger til kapitel 5

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Kvantitative Metoder 1 - Forår 2007

Normalfordelingen og Stikprøvefordelinger

02402 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel 4

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Efterår Dagens program

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Sandsynlighedsregning

Statistik. Hjemmeside: kkb. Statistik - lektion 1 p.1/22

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Kvantitative Metoder 1 - Efterår Dagens program

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

INSTITUT FOR MATEMATISKE FAG c

Højde af kvinder 2 / 18

4 Oversigt over kapitel 4

Uge 10 Teoretisk Statistik 1. marts 2004

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Dagens program. Afsnit Diskrete stokastiske variable Sandsynlighedsfunktioner Simultane fordelinger Betingede sandsynligheder

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136


Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Statistiske modeller

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Hvorfor er normalfordelingen så normal?

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Hvad skal vi lave i dag?

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Sandsynlighedsregning Oversigt over begreber og fordelinger

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Kapitel 4 Sandsynlighed og statistiske modeller

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Forelæsning 1: Intro og beskrivende statistik

Estimation og usikkerhed

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kvantitative Metoder 1 - Efterår Dagens program

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Kvantitative Metoder 1 - Forår Dagens program

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Kapitel 4 Sandsynlighed og statistiske modeller

Statistik viden eller tilfældighed

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Løsning til eksaminen d. 29. maj 2009

Transkript:

Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1

Bernoulli fordeling Kvantitative Metoder 1 - Forår 2007 Eksempler: I et spil er sandsynligheden for at vinde 2/3. Blandt de stemmeberettigede i DK er der 36.6%, der stemmer på V eller C. I en population har andelen p et bestemt karakteristika. X stokastisk variabel med følgende fordeling ½ 1 med ssh. p X = 0 med ssh. (1 p) X er en Bernoulli variabel med sandsynlighedsparameter p. Dette skrives som X Ber(p). Ofte kaldes hændelsen (X =1)for "succes" og hændelsen (X =0)for "fiasko". 2

Vi har at: p = P (X =1)=P ( succes ) Og dermed at: P ( fiasko )=P (X =0)=1 p (= q i bogen) Fordelingen af X : x f (x) 0 1 p 1 p Middelværdien af X : E (X) =1 p +0 (1 p) =p = P (X =1) AndetmomentafX : E (X 2 )=1 2 p +0 2 (1 p) =p Variansen af X : Var (X) =E (X 2 ) E (X) 2 = p p 2 = p (1 p) 3

Sandsynlighedsfunktionen for en Bernoulli variabel X med sandsynlighedsparameter p skrives ofte som: f (x p) =p x (1 p) 1 x hvor x =0eller 1 Eksempel 1: Tilfældig udvælgelse Blandt de stemmeberettigede i DK stemmer andelen p på V eller C. Vi udvælger en tilfældig person blandt de stemmeberettigede. Beskrivelse af ekseperimentet: Stokastisk variabel X : ½ 1 hvis personen stemmer på V eller C X = 0 ellers Dvs. P (X =1)=p og dermed P (X =0)=1 p. 4

Hvis p = 0.366 er middelværdi, varians og spredning E (X) = p =0.366 Var (X) = (1 p) =0.366 0.634 = 0.22824 p p Var (X) = p (1 p) = 0.22824 0.4777 5

Figur 1: Variansen af X som er lig med p (1 p) som en funktion af p 6

Vi udvælger en tilfældig stikprøve bestående af n personer ud af populationen bestående af de stemmeberettigede. Vi gør det med tilbagelægning. Beskrivelse af ekseperimentet: Stokastiske variabler X 1,..., X n hvor for i =1,..., n ½ 1 hvis den i te person stemmer på V eller C X i = 0 ellers Dvs. P (X i =1)=p og dermed P (X i =0)=1 p. X 1,..., X n er uafhængige. Kort: X 1,..., X n uafhængige stokastiske variabler, der er identisk fordelte med X i Ber(p). Meget kort: X i iid Ber(p). Dette kaldes en Bernoulli proces. 7

Vigtig egenskab: Ingen hukommelse Vi udvælger 100 personer tilfældigt. Af de første 3 personer vi udvalgte, stemmer den første og den tredje på V eller C. Hvad er sandsynligheden for, at person nr. 4 stemmer på V eller C : P (X 4 =1 X 1 =1,X 2 =0,X 3 =1) = P (X 4 =1,X 1 =1,X 2 =0,X 3 =1) P (X 1 =1,X 2 =0,X 3 =1) = P (X 4 =1)P (X 1 =1)P (X 2 =0)P (X 3 =1) P (X 1 =1)P (X 2 =0)P (X 3 =1) = P (X 4 =1) = p 8

Binomial fordeling Kvantitative Metoder 1 - Forår 2007 Vi er ofte kun interessede i det samlede antal succeser i uafhængige gentagelser af et Bernoulli eksperiment. Eksempler: I et spil er sandsynligheden for at vinde 2/3. Vi spiller spillet 100 gange. Hvor mange gange vinder vi? Blandt de stemmeberettigede i DK vil vi undersøge, hvor mange % der stemmer på V eller C. Vi udtager en tilfældig stikprøve på 1000 personer med tilbagelægning. Hvor mange af disse stemmer på V eller C? I en population har andelen p et bestemt karakteristika. Vi udtager tilfældig stikprøve på n individer med tilbagelægning. Hvor mange af disse har dette karakteriska? 9

Beskrivelse af eksperimentet: X 1,..., X n uafhængige og X i Ber(p) Stokastisk variabel X der angiver antallet af succes: X = X 1 +... + X n X har sandsynlighedsfunktionen ³ n f (x p) = p x x (1 p) n x hvor x =0, 1,..., n X er binomialfordelt med antalsparameter n og sandsynlighedsparameter p. Dette skrives som X Bin(n, p) Middelværdien af X : E (X) =E (X 1 +... + X n )=E (X 1 )+... + E (X n )=np Variansen af X : Var (X) =Var(X 1 +... + X n )=Var(X 1 )+... +Var(X n )=np (1 p) Spredningen af X : σ X = p Var (X) = p np (1 p) 10

Eksempel 2: Jeg deltager i et spil, hvor sandsynligheden for at vinde er 50%. Jeg spiller spillet 10 gange. Hvor mange gange kan jeg forvente at vinde? X : Antal gange jeg vinder X Bin(10, 0.5) Forventede antal gevinster: E (X) =10 0.5 =5 Spredning: p Var (X) = p 10 0.5 (1 0.5) = 2.5 1.5811 Hvad er sandsynligheden for, at jeg vinder 5 gange, (Tabel bogen s. 648-649): µ µ 10 10 P (X =5)= 0.5 5 0.5 5 = 0.5 10 = 10! 5 5 5!5! 0.510 0.2461 11

Hvad er sandsynligheden for, at jeg vinder 7 gange, (Tabel bogen s. 648-649): µ µ 10 10 P (X =7)= 0.5 7 0.5 3 = 0.5 10 = 10! 7 7 7!3! 0.510 0.1172 Hvad er sandsynligheden for, at jeg vinder mindst 7 gange, (Tabel bogen s. 650-651): 10X 10X µ 10 P (X 7) = P (X = x) = (0.5) x (0.5) 10 x 0.1719 x x=7 x=7 12

Figur 2: Sandsynlighedsfunktionen for X Bin(10, 0.5) 13

Hvad hvis sandsynligheden for at vinde er 2/3. X : Antal gange jeg vinder X Bin(10, 2/3) Forventede antal gevinster: E (X) = 10 2/3 = 20/3 6.67 Spredning: p Var (X) = p 10 2/3 1/3 = p 20/9 1.4907 Hvad er sandsynligheden for, at jeg vinder 5 gange: µ 10 P (X =5)= (2/3) 5 (1/3) 5 = 10! 5 5!5! (2/3)5 (1/3) 5 0.1366 14

Hvad er sandsynligheden for, at jeg vinder 7 gange: µ 10 P (X =7)= (2/3) 7 (1/3) 3 = 10! 7 7!3! (2/3)7 (1/3) 3 0.2601 Hvad er sandsynligheden for, at jeg vinder mindst 7 gange: 10X 10X µ 10 P (X 7) = P (X = x) = (2/3) x (1/3) 10 x 0.5593 x x=7 x=7 15

Figur 3: Sandsynlighedsfunktionen for X Bin(10, 2/3) 16

Egenskab ved binomialfordelinger: Hvis X 1 Bin(n 1,p) og X 2 Bin(n 2,p) og X 1 og X 2 er uafhængige, da gælder at Y = X 1 + X 2 Bin (n 1 + n 2,p) 17

Store Tals Lov Andelen (frekvensen) af succes i n uafhængige Bernoulli eksperimenter. X : Antal succes X Bin(n, p) Y = X/n Der gælder: Bemærk: E (Y ) = E (X/n) = 1 n E (X) = 1 n np = p Var (Y ) = Var(X/n) = 1 n Var (X) = 1 2 n 2np (1 p) = 1 p (1 p) n I gennemsnit er andelen af succes lig med sandsynligheden for succes Variansen og dermed spredningen på andelen af succes er mindre, jo større antallet af gentagelser n er 18

Eksempel 3, (se Lec4): Jeg spiller et spil n gange uafhængigt af hinanden. Sandsynligheden for at vinde i det enkelte spil er 2/3. X : Antal gange jeg vinder, X Bin(n, 2/3) 100 gentagelser: Hvor stor en andel af spillene forventer jeg at vinde: E (X/100) = 2/3 Hvad er spredningen på andelen af vundne spil: p Var (X/100) = p 1/100 2/3 1/3 0.0471 Hvad er sandsynligheden for at andelen af vundne spil er højst 60%: 60X µ 100 P (X/100 0.60) = P (X 60) = (2/3) x (1/3) 100 x 0.0966 x x=0 19

1000 gentagelser: Hvor stor en andel af spillene forventer jeg at vinde: E (X/1000) = 2/3 Hvad er spredningen på andelen af vundne spil: p Var (X/1000) = p 1/1000 2/3 1/3 0.0149 Hvad er sandsynligheden for at andelen af vundne spil er højst 60%: X600 µ 1000 P (X/1000 0.60) = P (X 600) = (2/3) x (1/3) 1000 x 0.0000 x x=0 20

Figur 4: Sandsynlighedsfunktionen for fordelingen af andelen af gevinster når spillet spilles 100 gange 21

Figur 5: Sandsynlighedsfunktionen for fordelingen af andelen af gevinster når spillet spilles 1000 gange 22

Loven om gennemsnit (Store Tals Lov): X 1,..., X n uafhængige med X i Ber(p). Da vil gennemsnittet af X i erne - som er det samme som andelen af succes i n uafhængige Bernoulli eksperimenter - konvergere mod sandsynligheden for succes p, når antallet af gentagelser n konvergerer mod uendeligt. 23

Figur 6: Andelen af vundne spil som en funktion af antal spillede spil 24

Figur 7: Histogram for fordelingen af frekvensen af gevinster når spillet spilles 100 gange baseret på 10000 gentagelser 25

Figur 8: Histogram for fordelingen af frekvensen af gevinster når spillet spilles 1000 gange baseret på 10000 gentagelser 26

1 Opsummering Eksempler på diskrete fordelinger: Kvantitative Metoder 1 - Forår 2007 - Bernoulli fordeling - Binomialfordeling: Uafhængige gentagelser af Bernoulli eksperimenter - Beskrivelse af stikprøveudvægelse i population med interesse for bestemt karakteriska Store Tals Lov: - Gennemsnit af uafhængige identiske fordelte stokastiske variable - Andelen af succes i uafhængige gentagelser af et Bernoulli eksperiment er tæt på sandsynligheden for succes, når antallet af gentagelser er stort 27

Næste gang Onsdag gennemgåes: Afsnit 4.3-4.6, 4.8 Eksempler på diskrete fordelinger Bemærk: Afsnit 4.9 er ikke pensum Husk: - At lave opgaver og SAS-øvelser 28