I dag. Binomialfordelingen Sandsynlighedsregning og statistik. Eksempel: cornflakessmagning. Binomialfordelingen

Relaterede dokumenter
Kursus Introduktion til Statistik. Oversigt, Inferens for gennemsnit (One-sample setup)

Program. Konfidensinterval og hypotesetest en enkelt normalfordelt stikprøve. Eksempel: hjerneceller hos marsvin. Eksempel: hjerneceller hos marsvin

6.7 Capital Asset Pricing Modellen

Program. Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte. χ 2 -fordelingen

Geometrisk nivellement. Landmålingens fejlteori - Lektion 7 - Repetition - Fejlforplantning ved geometrisk nivellement. Modellen.

Statistik og Sandsynlighedsregning 1. IH kapitel 6

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Susanne Ditlevsen Institut for Matematiske Fag susanne

Afdækning af nyankomne elevers sprog og erfaringer

Estimation og konfidensintervaller

Samtaleark. Del 1: Elevens sprog. Spørgsmål til eleven. Noter og observationer under samtalen. Angiv elevens stærkeste sprog:

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Selkirk Rex i Danmark

Estimation og test i normalfordelingen

Kvantitative Metoder 1 - Forår Dagens program

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Hjemmeopgave 1 Makroøkonomi, 1. årsprøve, foråret 2005 Vejledende besvarelse

Faldmaskine. Esben Bork Hansen Amanda Larssen Martin Sven Qvistgaard Christensen. 23. november 2008

Definition. Definitioner

Statistik og Sandsynlighedsregning 2

Brugerundersøgelse 2013 Plejebolig

Vejledende løsninger til opgaver i kapitel 6

Kombinant. En kombinant er en afbildning. hvor (Y, K) er endnu et målbart rum. Typisk taler vi om reelle kombinanter, hvor Y = R.

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Nanostatistik: Konfidensinterval

Matematisk modellering og numeriske metoder

Kvantitative Metoder 1 - Forår 2007

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Kvantitative Metoder 1 - Efterår Dagens program

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

Statistiske modeller

BRUGERUNDERSØGELSE 2014 PLEJEBOLIG. Dr. Ingrids Hjem. Sundheds- og Omsorgsforvaltningen - Brugerundersøgelse 2014: Plejebolig 1

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Elementær sandsynlighedsregning

Fag: Fysik - Matematik - IT Elever: Andreas Bergström, Mads Paludan, Jakob Poulsgærd & Mathias Elmhauge Petersen. Det skrå kast

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Termodynamik - Statistisk fysik - Termodynamiske relationer - Fri energi - Entropi

Sandsynlighedsregning 3. forelæsning Bo Friis Nielsen

StatDataN: Test af hypotese

Mat2SS Vejledende besvarelse uge 11

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Markedskortet 2.0. Carsten Stig Poulsen, Institut for Erhvervsstudier, Aalborg Universitet

Statistik og Sandsynlighedsregning 2

Nanostatistik: Test af hypotese

Statistik og Sandsynlighedsregning 2

Elementær sandsynlighedsregning

Om hypoteseprøvning (1)

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Estimation. Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat.

Statistik og Sandsynlighedsregning 2

Nanostatistik: Opgavebesvarelser

Dansk Økonomi, forår 2018

DANSK SNAPS DESTILLERIET BRAUNSTEIN

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Kvantitative Metoder 1 - Forår 2007

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

BRUGERUNDERSØGELSE 2015 PLEJEBOLIG LANGGADEHUS

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Estimation ved momentmetoden. Estimation af middelværdiparameter

Kvantitative Metoder 1 - Forår Dagens program

Kapitel 4 Sandsynlighed og statistiske modeller

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

midt nyt Missionen lykkedes i det store og hele

Oversigt over nyttige fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Produkt og marked - matematiske og statistiske metoder

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Lidt om fordelinger, afledt af normalfordelingen

STATISTIKNOTER Simple binomialfordelingsmodeller

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program

4 Oversigt over kapitel 4

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Nanostatistik: Opgaver

INSTITUT FOR MATEMATISKE FAG c

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Uge 10 Teoretisk Statistik 1. marts 2004

Må vi lege doktor? En folder til forældre om seksuel udvikling blandt børn i alderen 0-6 år

Løsning eksamen d. 15. december 2008

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Bilag 16 Licensbetingelser mv.

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

Basal statistik. 6. februar 2007

Statistik og Sandsynlighedsregning 2

Tema. Dagens tema: Indfør centrale statistiske begreber.

Undervisningsbeskrivelse

En ny mellemfristet holdbarhedsindikator

Transkript:

I dag Binomialfordelingen Sandynlighedregning og tatitik Helle Sørenen Binomialfordelingen! Sandynlighedregning: definition og andynlighedfunktion Sandynlighedregning v. tatitik Statitik: tatitik model likelihoodfunktion og makimum likelihood etimation fordeling af etimator nogle meget konkrete ekempler SaSt (Uge 2, tirdag) Binomialfordelingen 1 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 2 / 21 Ekempel: cornflakemagning Binomialfordelingen Ekperiment: 20 tilfældige peroner bliver bedt om at mage på to typer cornflake (D og K) og udpege den de yne mager bedt. Hvor mange foretrækker produkt K? Andel i befolkningen der foretrækker produkt K betegne p. Hvordan kan vi bekrive dette i termer af andynlighedregning? Lad X 1,...,X n være uafhængige og identik fordelte tokatike variable med værdier i {0,1}, med for et p [0,1]. P(X i = 1) = p, Definer deuden S = X 1 +... + X n. P(X i = 0) = 1 p Fordelingen af S kalde binomialfordelingen med antalparameter n og andynlighedparameter p. Hvad er de mulige værdier for S? Hvad er andynlighedfunktionen, dv. hvad er P(S = )? SaSt (Uge 2, tirdag) Binomialfordelingen 3 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 4 / 21

Binomialandynligheder mm. Binomialfordelinger Vi får: P(S = ) = ( ) n p (1 p) n, {0,...,n} Har allerede fundet middelværdi og varian i binomialfordelingen: Middelværdi: E(S) = np Varian: Var(S) = np(1 p) Ekempler: Hvi S bin(20,0.5), hvad er å P(S = 7), E(S) og Var(S)? Hvad ker der hvi p ændre? Hvad ker der hvi n ændre? bin(20, 0.5) 0 5 10 15 20 0.20 bin(20, 0.8) 0 5 10 15 20 SaSt (Uge 2, tirdag) Binomialfordelingen 5 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 6 / 21 Binomialfordelinger Binomialformlen bin(20, 0.8) 0 5 10 15 20 0.00 0.04 0.08 0.12 bin(50, 0.8) 0 10 20 30 40 50 Sandynlighederne ummerer til 1: n =0 ( n Mere generelt gælder binomialformlen: (x + y) n = n k=0 ) p (1 p) n = 1 ( n k ) x k y n k, Hvad iger bimomialformlen for n = 2 og n = 3? x,y R Bevie enten ved induktion efter n eller ved kombinatorike argumenter SaSt (Uge 2, tirdag) Binomialfordelingen 7 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 8 / 21

Sandynlighedregning og tatitik Lidt om noterne Antag at X bin(n,p). Sandynlighedregning: Hvi vi kender p å bekriver ( ) n f p (x) = P(X = x) = p x (1 p) n x x andynlighederne for de forkellige udfald af X. Statitik: Vi har en obervation x af X men vi kender ikke p. Vi kal ige noget om p udfra obervationen x. Hvad er mon vore bedte gæt på p, baeret på obervationen x? Dette kal formaliere: tatitik model, likelihoodfunktion, etimat/etimator. Hvilke egenkaber har etimatoren ˆp? Fordeling, middelværdi, varian? En introduktion til Statitik af Suanne Ditleven og Helle Sørenen. Er tatitik vært? Statitik er anderlede, det er ikke bare matematik Faktik er matematikken i bogen ret enkel givet at andynlighedregningen er på plad. Det være(?) ligger narere i at fortå begreberne og hvad de kal gøre godt for. Huk dette når I læer! Vi har helt bevidt krevet meget tekt rundt om ætningerne. Praktike ting vedr. noterne: Der mangler tadig et kapitel om lineær regreion Opgaver kommer ved iden af (på Abalon og evt. ved forelæninger) Vi vil meget gerne have feedback, incl. trykfejl SaSt (Uge 2, tirdag) Binomialfordelingen 9 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 10 / 21 Statitik model Likelihoodfunktion og makimum likelihood etimat Data, x: antal gange en given hændele er indtruffet i n uafhængige gentageler af et forøg. Statitik model: Bekrivele af den uikkerhed der er forbundet med dataindamlingen. Bekrivele af de mulige fordelinger x kan komme fra. To marginalt forkellige bekriveler: x realiation af tokatik variabel X, der er bin(n,p)-fordelt, hvor p Θ er en ukendt parameter. Udfaldrum E = {0,1,...,n} amt familien/mængden P = {bin(n,p) p Θ} af fordelinger på E. Huk: x er oberveret (kendt tal), men p er ukendt. Parameterområde, Θ: mulige værdier for p. Ofte [0, 1], men ommetider en ægte delmængde. Før: hvi p er kendt å angiver f p (x) = P(X = x) andynligheden for at obervere x. Funktion af x for kendt p. Nu: Opfat funktionen om funktion af p for kendt x: ( ) n L x (p) = f p (x) = p x (1 p) n x x Funktionen L x : Θ [0,1] kalde for likelihoodfunktionen. Tror mere på værdier af p der gør obervationen x meget andynlig end på værdier af p der gør obervationen knapt å andynlig. Find værdi af p der gør vore obervation met andynlig: L x (ˆp) L x (p), p Θ ˆp: makimum likelihood etimatet (makimalieringetimatet, MLE) for p. SaSt (Uge 2, tirdag) Binomialfordelingen 11 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 12 / 21

MLE Hvordan er likelihoodfunktionen ud? Ønker altå at finde ˆp å For n = 20 og x = 7: L 7 logl 7 L x (ˆp) L x (p), p Θ Sætning 1.2: Hvi parameterområdet er [0, 1] å er ML etimatet entydigt betemt og givet ved ˆp = x/n. Bevi: Binomialkoefficienten uden betydning for max-problemet Tilfældene x = 0 og x = n Tilfældene x = 1,2,...,n 1 L(p) p log L(p) 50 40 30 20 10 0 p SaSt (Uge 2, tirdag) Binomialfordelingen 13 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 14 / 21 Etimat og etimator Fordeling af ML etimatoren Etimatet er et tal, beregnet udfra obervationen x: ˆp = ˆp(x) = x/n Etimatet er en realiation af etimatoren, om er en tokatik variabel: ˆp = ˆp(X ) = X /n Skriver ommetider ˆp for både etimat og etimator... Vigtig pointe: Etimatoren ˆp = ˆp(X ) er en tokatik variabel og har derfor en fordeling, en middelværdi og en varian. Fordeling af ˆp = X /n: Hvad er de mulige værdier for ˆp? Hvad er andynlighedfunktionen for ˆp? Alternativ formulering: hvad er fordelingen af nˆp? Hvad er middelværdien, E(ˆp)? Central etimator. Hvad er varianen, Var(ˆp)? Hvad ker der når n voker? Huk at andynligheden p tadig er ukendt. Vi taler derfor ogå om den etimerede fordeling af ˆp (eller nˆp). SaSt (Uge 2, tirdag) Binomialfordelingen 15 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 16 / 21

Fordeling af ML etimatoren Fordeling af ML etimatoren Sand: bin(20, 0.5) Sand: bin(20, 0.8) Sand: bin(20, 0.8) Sand: bin(50, 0.8) 0.20 0.20 0.00 0.04 0.08 0.12 SaSt (Uge 2, tirdag) Binomialfordelingen 17 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 18 / 21 Ekempel: cornflake Ekempel: Pepi og Coca-cola Ønker at vide hvor tor en andel p af befolkningen der foretrækker cornflake type K fremfor type D. Ekperiment: 20 tilfældige peroner bliver bedt om at mage på de to typer og udpege den de yne mager bedt. Så har vi: 12 foretrækker produkt K Obervation x = 12. Stat. model: X bin(20,p) hvor p [0,1] er ukendt. Etimat ˆp = 12/20 = 0.6. Etimator ˆp = X /20 opfylder at 20ˆp bin(20, p). Vil underøge om en given peron kan mage forkel på Pepi og Coca-cola. Peronen får erveret to gla med Pepi hhv. Coca-cola og kal udpege det med Pepi. Gentager forøget 20 gange, og oberverer antallet gange peronen vælger det rigtige gla. Antag at vi får obervationen x = 15. Under hvilke omtændigheder kan binomialfordelingen bruge til at bekrive ekperimentet? Antag det betingelerne er opfyldt... Stat. model: X bin(20, p). Hvad er det naturlige parameterområde? Etimat? Hvi p = 1/2, å er P(ˆp 0.75) = 0.02. Hvad iger det om peronen evne til at mage forkel? Antag i tedet at x = 8. Hvad er etimatet å? SaSt (Uge 2, tirdag) Binomialfordelingen 19 / 21 SaSt (Uge 2, tirdag) Binomialfordelingen 20 / 21

Reumé Konkret: Definition og andynlighedfunktion for binomialfordelingen Statitik model baeret på binomialfordelingen Makimum likelihood etimation i binomialfordelingen, herunder likelihoodfuktionen og fordeling af etimator Begyndende fornemmele for Fredag:... hvad en tatitik model er... hvad det vil ige at etimere en parameter... at en etimator er en tokatik variabel, med en fordeling der er intereant at tudere Konfideninterval i binomialfordelingmodellen Modeller med endeligt udfaldrum, lidt mere generelt Lidt intro til R SaSt (Uge 2, tirdag) Binomialfordelingen 21 / 21