Binomialfordelingen: april 09 GJ

Relaterede dokumenter
Sandsynlighedsregning og statistik med binomialfordelingen

Binomialfordelingen. Erik Vestergaard

Lineær regressionsanalyse8

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

2. Sandsynlighedsregning

Tabsberegninger i Elsam-sagen

Ugeseddel 8. Gruppearbejde:

TALTEORI Følger og den kinesiske restklassesætning.

EKSAMEN I MATEMATIK-STATISTIK, 27. JANUAR 2006, KL 9-13

Økonometri 1 Efterår 2006 Ugeseddel 9

Udvikling af en metode til effektvurdering af Miljøstyrelsens Kemikalieinspektions tilsyn og kontrol

BEVISER TIL KAPITEL 7

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Fysik 3. Indhold. 1. Sandsynlighedsteori

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

FRIE ABELSKE GRUPPER. Hvis X er delmængde af en abelsk gruppe, har vi idet vi som sædvanligt i en abelsk gruppe bruger additiv notation at:

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Statistik Lektion 15 Mere Lineær Regression. Modelkontrol Prædiktion Multipel Lineære Regression

Forberedelse til den obligatoriske selvvalgte opgave

Scorer FCK "for mange" mål i det sidste kvarter?

Statistik II Lektion 4 Generelle Lineære Modeller. Simpel Lineær Regression Multipel Lineær Regression Flersidet Variansanalyse (ANOVA)

Økonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1

TEORETISKE MÅL FOR EMNET:

Inertimoment for arealer

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

Kvantitative metoder 2

Morten Frydenberg Biostatistik version dato:

Antag X 1,..., X n stokastiske variable med fælles middelværdi µ og varians σ 2. Hvis µ er ukendt estimeres σ 2 ved 1/36.

Fagblok 4b: Regnskab og finansiering 2. del Hjemmeopgave kl til kl

Økonometri lektion 7 Multipel Lineær Regression. Testbaseret Modelkontrol

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

Kvalitet af indsendte måledata

DLU med CES-nytte. Resumé:

Noter til fysik 3: Statistisk fysik

NOTAT: Benchmarking: Roskilde Kommunes serviceudgifter i regnskab 2013

Statikstik II 4. Lektion. Generelle Lineære Modeller

TO-BE BRUGERREJSE // Personligt tillæg

NOTAT:Benchmarking: Roskilde Kommunes serviceudgifter i regnskab 2014

Bilag 6: Økonometriske

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

χ 2 -fordelte variable

Kvantitative metoder 2

Statistisk mekanik 13 Side 1 af 9 Faseomdannelse. Faseligevægt

Beregning af strukturel arbejdsstyrke

Fra små sjove opgaver til åbne opgaver med stor dybde

Induktionsbevis og sum af række side 1/7

Kvantitative metoder 2 Forår 2007 Ugeseddel 10

Men tilbage til regression og Chi-i-anden. test. Begge begreber refererer til normalfordelingen med middelværdi μ og spredning σ.

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Note til Generel Ligevægt

Økonometri 1 Efterår 2006 Ugeseddel 13

Indtjening, konkurrencesituation og produktudvikling i danske virksomheder

Kvantemekanik 2 Side 1 af 11 Schrödingerligningen. Bølgefunktionen

Spørgsmål 1 (5 %) Bestem sandsynligheden for at batteriet kan anvendes i mere end 5 timer.

Stadig ligeløn blandt dimittender

BLÅ MEMOSERIE. Memo nr Marts Optimal adgangsregulering til de videregående uddannelser og elevers valg af fag i gymnasiet.

Regressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder

Statikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller

FTF dokumentation nr Viden i praksis. Hovedorganisation for offentligt og privat ansatte

Kvantemekanik 2 Side 1 af 11 Schrödingerligningen. Bølgefunktionen

SERVICE BLUEPRINTS KY selvbetjening 2013

Introduktion Online Rapport Din skridt-for-skridt guide til den nye Online Rapport (OLR) Online Rapport

Referat fra Bestyrelsesmøde Mandag den 08.oktober kl i Holmsland Idræts- og Kulturcenter

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelsøgning Modelkontrol

G Skriverens Kryptologi

Logistisk regression. Logistisk regression. Probit model Fortolkning udfra latent variabel. Odds/Odds ratio

Samarbejdet mellem jobcentre og a-kasser inden for FTFområdet

Kreditrisiko efter IRBmetoden

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelkontrol

Kvantitative metoder 2 Forår 2007 Ugeseddel 9

Miljø- og Fødevareudvalget MOF Alm.del Bilag 16 Offentligt

Motivationseffekten af aktivering

Nøglebegreber: Objektivfunktion, vægtning af residualer, optimeringsalgoritmer, parameterusikkerhed og korrelation, vurdering af kalibreringsresultat.

Analytisk modellering af 2D Halbach permanente magneter

Udviklingen i de kommunale udligningsordninger

Handleplan for Myndighed (Handicap og Socialpsykiatri)

KENDETEGN FOTKEEVENTYRETS. i faøíii"n. riwalisøring. Içannibalismz. a9ergãrg ffe barn til volçsøn. for ryllølsø. åøt bernløse ægtepãx.

Løsninger til kapitel 12

Stadig ligeløn blandt dimittender

Landbrugets efterspørgsel efter Kunstgødning. Angelo Andersen

Brugen af R^2 i gymnasiet

Fra patient til patient: Tidlig prostatakræft hvad nu? Aktiv overvågning, operation, bestråling?

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

IKKE-KONTINUERTE (DISKRETE) STOKASTISKE VARIABLE MIDDELVÆRDI, VARIANS, SPREDNING FORDELINGER: HYPERGEOMETRISK, BINOMIAL, POISSON

Hvorfor n-1 i stikprøvevariansen?

Europaudvalget EUU alm. del Bilag 365 Offentligt

Import af biobrændsler, er det nødvendigt?

Luftfartens vilkår i Skandinavien

BESKÆFTIGELSES- OG LØNSTATISTIK FOR KVINDER

Fastlæggelse af strukturel arbejdsstyrke

1. Beskrivelse af opgaver inden for øvrig folkeskolevirksomhed

Referat fra Bestyrelsesmøde

Støbning af plade. Køreplan Matematik 1 - FORÅR 2005

Økonometri 1. Avancerede Paneldata Metoder I 24.november F18: Avancerede Paneldata Metoder I 1

4. KLASSE UNDERVISNINGSPLAN MATEMATIK

Elementær Matematik. Sandsynlighedsregning

Marco Goli, Ph.D, & Shahamak Rezaei. Den Sociale Højskole København & Roskilde Universitetscenter

FOLKEMØDE-ARRANGØR SÅDAN!

Transkript:

Bnomalfordelngen: aprl 09 GJ Spm A 14: Sandsynlghedsregnng og statstk. Efter en kort ntrodukton af grundlæggende begreber sandsynlghedsregnng og statstk skal du skal ntroducere bnomalfordelngsmodellen og udvkle formlen for hvordan bnomalsandsynlgheder udregnes. Specelt Notatet om bnomalfordelngen med henvsnnger Sandsynlghedsregnng og statstk Bemærknng: 1 sandsynlghedsregnng 2 - Deskrptv statstk: Bnomalfordelng Bemærknng: Dette er helt centralt spørgsmålet. I bogen forklares hvordan man kommer frem tl bnomalsandsynlghederne mens formlen for bnomalkvotenten kke forklares. Nedenfor er gvet en folklarng/et bevs på begge dele. Tekst: Du kan godt nøjes med det der står nedenfor (Du kan fnde en anden måde at forklare nogle af de samme tng bogen II 158 II-arbejdsbog 130-133. Du behøver kke benytte bogen) Defnton af bnomalfordelng Udføres et basseksperment med sandsynlgheden p for succes og sandsynlgheden 1-p for fasko. Lad X tælle antal succes er, når v udfører bassekspermentet n gange. V sger at X er bnomalfordelt med antalsparamenter n og sandsynlghedsparameter p. V skrver X~b(n,. I sandsynlghedsregnng opstller man matematske modeller for hvordan et tænkt eksperment vl falde ud. Det er altså en teoretsk tlgang, der bygger på vden om ekspermentet. Udfaldsrum det v kan få Sandsynlgheder for udfald V skelner mellem et endelgt udfaldsrum som bnomalfordelngen, hvor v har n forskellge mulgheder og så den anden type som fx normalfordelngen, hvor der er uendelg mange mulgheder (fx elevernes højde en en klasse) Udfald, sandsynlghed, hændelser, regneregler for hændelser uafhængge hændelser I deskrptv statstk observerer man hvordan et konkret eksperment faktsk forløb. Observatonssætter repræsenterer hvad v så, og kke hvad v tænkte. Observatonssæt det v faktsk observerede Frekvenser Hvs der er mange gentagelser af observatoner vl man regne på observatonssættet som det er (fx antal 6 ere ved 4 kast med en terneng). Hvs der er få eller ngen gentagelser (fx skatteplgtge ndkomst for gymnaselærerne på FG) vl man gruppere observatonerne ntervaller. For kke-grupperede observatonssæt: observatonshyppghed, observatonsfrekvens og pndedagram kvartlsæt, medan mddeltal boxplot For grupperede observatoner: nterval-hyppghed, nterval-frekvens, hstogram kumuleret frekvens, sumkurve, kvartlsæt, medan Defnton af bnomalkvotent Antallet af r-delmængder af en n-mængde kaldes Knr (, ) Formel tl bestemmelse af bnomalsandsynlghed Sandsynlgheden for at få netop succeser når v udfører det samme basseksperment n gange kan bestemmes ved følgende formel: n P( succes er) = P(X=) = Kn (, ) p (1 hvor p angver sandsynlgheden for succes bassekspermentet, der er det eksperment de gentages alt n gange. Formel tl bestemmelse af bnomalkvotent Antallet af måder v kan udvælge en r-delmængde af en n-mængde beregnes ved følgende formel: K(n,r) er altså en brøk hvor der for oven står de r første tal rækken n (n-1) (n-2) og for neden står de r sdste tal ganget sammen. Lad os bevse formlen for bnomalsandsynlghed ud fra et par konkrete problem. Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 1/9 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 2/9

1 - Eksperment 1 antal 6 ere 3 kast med ternng V kaster en ternng 3 gange og tæller antal 6 ere. Bassekspermentet er at kaste en ternng en gang og se om det blver en 6 er. Sandsynlghedsparameteren er altså p=1/6 og antalsparameteren er n=3 Lad os beskrve ved SSF hvs v får succes (dvs 6 er 1. og 2. kast, mens v får fasko (dvs kke-6 er) 3. kast. P(SSF) = eller 1 1 5 6 6 6 p (1 hvs p betegner sandsynlgheden for succes bassekspermentet. V kan udregne sandsynlgheden for to succeser ved P(X=2) = P(2 succeser) = P(SSF)+P(SFS)+P(FSS) = 3p (1 Bemærk at tallet 3angver hvor mange måder v kan fordele vores sucess er og fasko er på. V skal dette tlfælde vælge 2 ud af de tre pladser {1. plads, 2. plads, 3. plads}. V skal altså vælge en 2-delmængde ud af en 3-mængde, og det kan v gøre på K(3,2) måder. Det er dette tlfælde klart, at det kan gøres på 3 måder. Hvs v skulle beregne det ud fra formlen vlle det gve 3! 3 2 1 K (3, 2) = = = 3 2! (3 2)! (2 1) (1) Eller 32 K (3, 2) = = 3 21 Skal v lave en oversgt over alle de mulgheder, så kan v få 0, 1, 2 eller 3 succeser dette eksperment. Sandsynlghederne er 2 - Eksperment 2 antal 6 ere 5 kast med ternng V starter med at bestemme sandsynlgheden for at få to succes er dette eksperment. Det kunne være ved at de to første var 6 ere og de sdste 3 kast vste kke-6 ere, eller det kunne være det første og det 5. kast der var 6 ere. Opskrver v samtlge mulgheder får v P(X=2) = P(2 succes er) = P(SSFFF) + P(SFSFF) + P(SFFSF) + P(SFFFS) + P(FSSFF) + 2 3 P(FSFSF) + P(FSFFS) + P(FFSSF) + P(FFSFS) + P(FFFSS) = 10 p (1 Igen ser v at tallet 10 angver hvor mange måder v kan fordele vores succes er på. V skal dette tlfælde vælge 2 ud af de 5 pladser {1. plads, 2. plads, 3. plads, 4. plads, 5. plads}. V skal altså vælge en 2-delmængde ud af en 5-mængde, og det kan v gøre på K(5,2) måder. V har set, at dette åbenbart kan gøres på10 måder. Hvs v skulle beregne det ud fra formlen vlle det gve 54 K (5, 2) = = 10 21 3 - En generel argumentaton for formlen V beregner sandsynlgheden for succeser en bnomalfordelng med X~b(n, ved n P( succes er) = P(X=) = Kn (, ) p (1 ford v har Kn (, ) forskellge måder at arrangere vores succes er og faskoer på, så der netop er succes er (v skal udvælge af de n pladser tl vores succes er). Hvert af dsse n udfald med succeser har sandsynlgheden (1 ) p p ford v, når v sger at v vl have netop succes er samtdg sger, at v skal have netop (n-) faskoer. 3 0 3 P(X=0) = P(0 succeser) = P(FFF) = (1 = 1 p (1 1 2 P(X=1) = P(1 succeser) = P(SFF)+P(FSF)+P(FFS) = 3p (1 P(X=2) = P(2 succeser) = P(SSF)+P(SFS)+P(FSS) = 3p (1 P(X=3) = P(3 succeser) = P(SSS) = p 3 = 1 p 3 (1 0 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 3/9 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 4/9

Bnomalkvotent Bemærknng: Der argumenteres kke for formlen bogen. Nedenfor gves nogle konkrete eksempler på hvorfor formlen passer. Når man har forstået det, kan man faktsk godt forklare formlen generelt. Det er tlstrækkelgt, at forklare det ud fra et taleksempel. Antallet af måder v kan udvælge en r-delmængde af en n-mængde beregnes ved følgende formel: Tekst: Det står nedenfor. 1 - Ordnede delmængder og (kke-ordnede) delmængder: V har det foregående talt om antallet af 3-delmængder. Nu ndfører v begrebet antal ordnede 3-delmængder. I de ordnede 3-delmængder skelner v mellem rækkefølgen. Fordelen ved at betragte de ordnede delmængder er, at de er lettere at regne på. Antallet af ordnede 3-delmængder af en 7-mængde er kke så svært at bestemme. V skal udfylde tre pladser med elementer fra mængden {a,b,c,d,e,f,g}: På første plads er der 7 mulgheder. Anden plads kan udfyldes på 6 måder når 1. plads er udfyldt og 3. plads på 5. måder. Antallet at ordnede 3-delmængder af en 7-mængde er 7654321 7! 765 = = 4321 (7 3)! Tlsvarende er antal ordnede 4-delmængde af en 6-delmængde 654321 6! 6543 = = 21 (6 4)! n! V kan altså udvælge en ordnet r-delmængde af en n-mængde på n (n 1)... (n r)! = måder 2 - Udregnng af K(4,3) Betragter v mængden {a,b,c,d} så har v alt 4 3 2 = 24 eller 4! (4 3)! = 24 forskellge ordnede 3-delmængder af {a,b,c,d}. V kan skrve dsse 24 ordnede delmængder op: abc acb bac bca cab cba abd adb bad bda dab dba acd adc cad cda dac dca bcd bdc cbd cdb dbc dcb Men ser v ovenfor, så er de første 6 ordnede delmængder forskellge rækkefølger af den samme delmængde. Hver delmængde kan ordnes på 3 2 1 måder. Hvs hver delmængde forekommer 3! forskellge ordnnger, så kan v beregne antal delmængder K(4,3) ved 4! (4 3)! 4! 432 24 K(4,3) = = = = = 4 3! 3! (4 3)! 3 2 1 6 Der er alt 4 forskellge 3-delmængder af {a,b,c,d} :abc abd acd bcd 3 Udregnng af K(7,4) Hvs v vl bestemme K(7,4) så udregner v først antal ordnede 4-delmængden af en 7- mængde. De kan vælges på 7! 7654 = måder (7 4)! Hver 4-delmængde kan ordnes på 4! eller 4 3 2 1 forskellge måder. 7! Antal 4-delmængder af 7-mængde blver dermed K(7,4)= (7 4)! 4! 4 - Formelt argument for bnomalkofcenter: V kan udtage en ordnet r-delmængde af en n-mængde på n! n (n 1) (n 2)... (n r)! = måder Hver r-delmængde kan ordnes på r! forskellge måder. Derfor blver antallet af forskellge r- delmængder (kke-ordnede) af en n-mængde Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 5/9 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 6/9

Bnomalfordelngen nærmer sg normalfordelngen når n er stor Tekst: II-arbejdbog 134-137, II 174-181) Bnomalfordelngen opfører sg når n blver stor nok som en Normalfordelng Når n blver stor en B(n, fordelng, så opfører den sg som en N( n p, n p (1 )- fordelng. Du skal vde at normalfordelngen er en klokkeformet kontnuert fordelng, men ellers behøver du kke vde ret meget mere om den. B(100, 0.22) N(22, 4.14) 0.09 0.08 0.07 0.06 0.04 0.03 0.02 0.01-10 10 20 30 40 50 60 0.09 0.08 0.07 0.06 0.04 0.03 0.02 0.01-10 10 20 30 40 50 60 Bnomalfordelngstest og krtsk mængde Bemærknng: Dette område er meget specelt og kun aktuelt hvs du har arbejdet med det tdlgere. Tekst: Du kan benytte nedenstående tekst. Du kan supplere med lærerbogen II-162+165-174 1 Krtsk mængde Hvs v har en hypotese om at andelen af socaldemokrater 22% og v spørger 100 mennesker så vl v forvente at omkrng 22 af de spurgte vl være socaldemokrater. Hvs der er mange flere eller meget færre der sger de er socaldemokrater forkaster v vores hypotese og konkluderer at andelen er ændret. De tal der gver anlednng tl at forkaste hypotesen om at andelen uændret er på 22% kaldes den krtske mængde. Ofte vælger man at sge at hvs en observaton er så stor, at den lgger de 2½% største eller hvs en observaton er så llle, at den lgger de 2½% mndste, så vl v forkaste hypotesen. 2 Krtsk mængde beregnet med TI Hvs vores hypotese er at antal personer ud af 100 udspurgte, der svarer de er socaldemokrater er b(100, 0.22)-fordelt, så vser det sg at vores krtske mængde for denne hypotese blver {0,1,2, 12,13} U {30,31,32, } b(100,0.22) V kan med TI udregne fx P(X 14) = bnomcdf 100, 0.22, 14.030452911 Her ser v at sandsynlgheden for at få 14 eller et antal der er endnu mndre er ca 3%. V befnder os altså kke den krtske mængde. Ud fra bnomcdf 100, 0.22, 13.01602022 ses at 13 er grænsen for den krtske mængde. Hvs v får 13 eller et mndre tal er v under de 2½% mndste observatoner. Det kan være ford v bare var uheldge, men v vælger at tro, at det snarere skyldes at opbaknngen tl socaldemokratet er faldet. I den anden ende ser v at v skal op på 30 eller flere for at nå op de øverste 2½% 1 - bnomcdf 100, 0.22, 30.023164253 1 - bnomcdf 100, 0.22, 29.038554343 krtsk mængde 20 40 60 80 100 krtsk mængde Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 7/9 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 8/9

3 - Krtsk mængde bestemt ud fra mddelværd og sprednng Mddelværden er den gennemsntlge værd for en stokastsk varabel. Den kaldes normalt E(X). Hvs X~b(n, så er mddelværden: E(X) = n p Sprednngen er et slags mål for den gennemsntlge afvgelse fra mddelværden. Den beregnes ved σ(x) = n p (1 og det er kke lge tl at forstå! Man kan som tommelfnger regel få et godt bud på grænserne for den krtske mængde ved at beregne E(X) ± 2 σ (X) Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 9/9