Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Relaterede dokumenter
Oversigt over nyttige fordelinger

Uge 10 Teoretisk Statistik 1. marts 2004

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007

Sandsynlighedsregning

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Vejledende løsninger til opgaver i kapitel 6

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Elementær sandsynlighedsregning

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Sandsynlighedsregning Oversigt over begreber og fordelinger

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Elementær sandsynlighedsregning

Løsninger til kapitel 5

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Efterår Dagens program

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Diskrete fordelinger. Fire vigtige diskrete fordelinger: 1. Uniform fordeling (diskret) 2. Binomial fordeling. 3. Hyper-geometrisk fordeling

Definition. Definitioner

Kvantitative Metoder 1 - Forår 2007

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.


Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Tema. Dagens tema: Indfør centrale statistiske begreber.

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

Matematisk model for køsystem

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Teoretisk Statistik, 16. februar Generel teori,repetition

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Konfidensintervaller og Hypotesetest

StatDataN: Test af hypotese

Om hypoteseprøvning (1)

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Vejledende besvarelser til opgaver i kapitel 14

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

02402 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel 4

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Forelæsning 9: Inferens for andele (kapitel 10)

Hvad skal vi lave i dag?

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Produkt og marked - matematiske og statistiske metoder

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Hvad skal vi lave i dag?

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Statistik og Sandsynlighedsregning 2

Sandsynlighedsteori

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kapitel 4 Sandsynlighed og statistiske modeller

J E T T E V E S T E R G A A R D

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

INSTITUT FOR MATEMATISKE FAG c

Nanostatistik: Test af hypotese

Note til styrkefunktionen

Sandsynlighedsregning 2. forelæsning Bo Friis Nielsen

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Kapitel 4 Sandsynlighed og statistiske modeller

Stokastiske processer og køteori

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

Basal statistik. 6. februar 2007

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Løsning til eksamen 16/

Fordelinger. En oversigt over de vigtigste sandsynlighedsteoretiske fordelinger Anden udgave. Udvidet version. Ulrich Fahrenberg

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: PQ. juli 200Z Kursus nr : (navn) (underskrift) (bord nr)

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Note om Monte Carlo metoden

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 18. august 2016 Kursus nr : (navn) (underskrift) (bord nr)

Basal statistik. 6. februar 2007

Transkript:

Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. 1 hvis succes (ssh. p) X= X1+ + Xn hvorxi = ellers (ssh.1 p) Eksempler: Færdighedsprøve med n spørgsmål. Succes hvis korrekt svar. X = antal rigtige. Forbrugerklager over n varer. Succes hvis der klages. X = antal klager.

(2) Binomialfordelingen Sandsynlighedsfunktion: n n P(X = ) = p (1 p), =,...,n hvor binomialkoefficienten n n! =!(n )! er antal måder man kan udtage elementer blandt n. Middelværdi, E[X] = np; varians var [X] = np( 1 p). Den hypergeometriske fordeling Stikprøve uden tilbagelægning Population bestående af N personer M af disse har særlig egenskab Stikprøve bestående af n personer udtaget uden tilbagelægning (eller på en gang) Lad X være antallet personer blandt de n med den særlige egenskab => X ~ hypgeo(n,m,n).

(2) Den hypergeometriske fordeling Eksempler: X = antal personer der ville stemme på liste A i meningsmåling af størrelse n X = antal røde bolde taget af kasse med røde og sorte bolde. X = antal rigtige i LOTTO (3) Den hypergeometriske fordeling Udfaldsrum givet ved:, n, M, n- N M Punktsandsynligheder ( ) f = P(X= ) = M N M n N n (Husk at n k Middelværdi, er antal måder man kan vælge k elementer ud af n). M EX n ; N [ ] = Varians, [ ] MN MN n var X = n. N N N 1

Eksempel: LOTTO Spil af en enkelt LOTTO-række: N = 36, M =, n =. X = antal rigtige. 29 1 P(X = ) = = =.12 36 83468 29 6 1 P(X = 6) = =.24 36 29 P(X = ) = =.19 36 Eksempel: meningsmåling Antal vælgere, N = 3 Stikprøvestørrelse, n=12 M = antal vælgere der vil stemme liste A. M ukendt. X = antal vælgere i stikprøven der vil stemme liste A. X observeres til 35. Interesseret i M eller p = M/N. Kender kun X. Estimat for p : pˆ = X / n =.29. (Mˆ = 1916). Hvor godt/sikkert er dette estimat? (Kapitel 15)

(2) Eksempel : meningsmåling Antal organisationsmedlemmer, N = 4 Stikprøvestørrelse, n = 2. Strejke? Antagelse M > N/2 = 2 (<=> flertal for strejke) X = = 3, antallet i stikprøven der stemmer for strejke Vurdering : P(X 3 4, M> 2, 2) < P(X 3 4, 2, 2) = 3 = 2 2 2 =.13 4 2 Denne ssh. er så lille at antagelsen må anses for at være forkert. Dvs. vi kan herved komme til at forkaste en sand antagelse (type 1-fejl). Alternativt kunne vi acceptere antagelsen, men så kunne vi derved komme til at undlade at forkaste en forkert antagelse (type 2-fejl). Kun disse to muligheder for fejlslutning foreligger.

Binomial vs. hypergeometrisk Uden tilbagelægning: X ~ hypgeo(n,m,n) Med tilbagelægning: X ~ bin(n,m/n) Varians i hypergeo. mindre end varians i den tilsvarende binom. Endvidere: Hvis N er meget stor (og M tilsvarende stor) så ligner hypergeometriske fordeling binomialfordelingen. Der gælder: M N M n ) n p (1 p) N n n for N hvis M/N p (stikprøvestørrelsen n er konstant). Poissonfordelingen Eksponentialrækken (for λ > ): = λ = λ e.derfor er! f() = λ e! en punktsandsynlighed på {,1,2, }. Hvis X har punktsandsynlighed f siges X at være Poissonfordelt med parameter λ; X ~ Ps(λ). Middelværdi, E[X] = λ; varians, var[x] = λ. λ

(2) Poissonfordelingen Poissonfordelingen er god til at beskrive antal gange en hændelse med meget lille sandsynlighed indtræffer i et stort antal forsøg. Begrundelse: n p (1 p) e λ λ! for n, p således at np λ. (Varians i Poissonfordelingen er λ; varians i binomial er np(1-p); næsten ens for p lille). Den negative binomialfordeling Sandsynlighedsfunktion (for fast k N, p ],1[ ): + k 1 f p (1 p) k 1 k ( ) = Hvis X har punktsandsynlighed f siges X at være negativt binomialfordelt med parametre p og k. Beskriver antal fiaskoer før k'te succes bedre end Poissonford. i situationer med relativt stor ssh. i og relativt tung hale. For k = 1 kaldes f() for kvotientfordelingen eller den geometriske fordeling: f () p(1 p),1,2,... = =

Gammafordelingen, '($,") Udfaldsrum S=],4 [, parametre ",$ >. Tæthed Her er '-funktionen givet ved β α f() = e Γβ ( ) β 1 α så f ()d = 1. Γ = y 1 (y) e d Gammafordeling med formparameter $ og skalaparameter ". (2) Gammafordelingen '-funktionen er defineret på ], 4[ og opfylder: Γ (1) = 1, Γ (1/ 2) = π Γ (y + 1), = y Γ (y), y > Γ (n + 1) = n!, n N 3 1 Γ (n + 1/2) = (n 1/2) π, n N 2 2

(3) Gammafordelingen Hvis X ~ '($,") og c > så er cx ~ '($,c/"). Hvis X ~ '($,") så er [ ] =,varx [ ] = 2 EX β α Specielle Gammafordelinger: '(1,") er lig eksponentialfordelingen med intensitet ". Hvis f = 2$ N: '($,1/2) = P 2 (f) P 2 -fordelingen med f frihedsgrader. β α