Bnomalfordelngen: aprl 09 GJ Spm A 14: Sandsynlghedsregnng og statstk. Efter en kort ntrodukton af grundlæggende begreber sandsynlghedsregnng og statstk skal du skal ntroducere bnomalfordelngsmodellen og udvkle formlen for hvordan bnomalsandsynlgheder udregnes. Specelt Notatet om bnomalfordelngen med henvsnnger Sandsynlghedsregnng og statstk Bemærknng: 1 sandsynlghedsregnng 2 - Deskrptv statstk: Bnomalfordelng Bemærknng: Dette er helt centralt spørgsmålet. I bogen forklares hvordan man kommer frem tl bnomalsandsynlghederne mens formlen for bnomalkvotenten kke forklares. Nedenfor er gvet en folklarng/et bevs på begge dele. Tekst: Du kan godt nøjes med det der står nedenfor (Du kan fnde en anden måde at forklare nogle af de samme tng bogen II 158 II-arbejdsbog 130-133. Du behøver kke benytte bogen) Defnton af bnomalfordelng Udføres et basseksperment med sandsynlgheden p for succes og sandsynlgheden 1-p for fasko. Lad X tælle antal succes er, når v udfører bassekspermentet n gange. V sger at X er bnomalfordelt med antalsparamenter n og sandsynlghedsparameter p. V skrver X~b(n,. I sandsynlghedsregnng opstller man matematske modeller for hvordan et tænkt eksperment vl falde ud. Det er altså en teoretsk tlgang, der bygger på vden om ekspermentet. Udfaldsrum det v kan få Sandsynlgheder for udfald V skelner mellem et endelgt udfaldsrum som bnomalfordelngen, hvor v har n forskellge mulgheder og så den anden type som fx normalfordelngen, hvor der er uendelg mange mulgheder (fx elevernes højde en en klasse) Udfald, sandsynlghed, hændelser, regneregler for hændelser uafhængge hændelser I deskrptv statstk observerer man hvordan et konkret eksperment faktsk forløb. Observatonssætter repræsenterer hvad v så, og kke hvad v tænkte. Observatonssæt det v faktsk observerede Frekvenser Hvs der er mange gentagelser af observatoner vl man regne på observatonssættet som det er (fx antal 6 ere ved 4 kast med en terneng). Hvs der er få eller ngen gentagelser (fx skatteplgtge ndkomst for gymnaselærerne på FG) vl man gruppere observatonerne ntervaller. For kke-grupperede observatonssæt: observatonshyppghed, observatonsfrekvens og pndedagram kvartlsæt, medan mddeltal boxplot For grupperede observatoner: nterval-hyppghed, nterval-frekvens, hstogram kumuleret frekvens, sumkurve, kvartlsæt, medan Defnton af bnomalkvotent Antallet af r-delmængder af en n-mængde kaldes Knr (, ) Formel tl bestemmelse af bnomalsandsynlghed Sandsynlgheden for at få netop succeser når v udfører det samme basseksperment n gange kan bestemmes ved følgende formel: n P( succes er) = P(X=) = Kn (, ) p (1 hvor p angver sandsynlgheden for succes bassekspermentet, der er det eksperment de gentages alt n gange. Formel tl bestemmelse af bnomalkvotent Antallet af måder v kan udvælge en r-delmængde af en n-mængde beregnes ved følgende formel: K(n,r) er altså en brøk hvor der for oven står de r første tal rækken n (n-1) (n-2) og for neden står de r sdste tal ganget sammen. Lad os bevse formlen for bnomalsandsynlghed ud fra et par konkrete problem. Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 1/9 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 2/9
1 - Eksperment 1 antal 6 ere 3 kast med ternng V kaster en ternng 3 gange og tæller antal 6 ere. Bassekspermentet er at kaste en ternng en gang og se om det blver en 6 er. Sandsynlghedsparameteren er altså p=1/6 og antalsparameteren er n=3 Lad os beskrve ved SSF hvs v får succes (dvs 6 er 1. og 2. kast, mens v får fasko (dvs kke-6 er) 3. kast. P(SSF) = eller 1 1 5 6 6 6 p (1 hvs p betegner sandsynlgheden for succes bassekspermentet. V kan udregne sandsynlgheden for to succeser ved P(X=2) = P(2 succeser) = P(SSF)+P(SFS)+P(FSS) = 3p (1 Bemærk at tallet 3angver hvor mange måder v kan fordele vores sucess er og fasko er på. V skal dette tlfælde vælge 2 ud af de tre pladser {1. plads, 2. plads, 3. plads}. V skal altså vælge en 2-delmængde ud af en 3-mængde, og det kan v gøre på K(3,2) måder. Det er dette tlfælde klart, at det kan gøres på 3 måder. Hvs v skulle beregne det ud fra formlen vlle det gve 3! 3 2 1 K (3, 2) = = = 3 2! (3 2)! (2 1) (1) Eller 32 K (3, 2) = = 3 21 Skal v lave en oversgt over alle de mulgheder, så kan v få 0, 1, 2 eller 3 succeser dette eksperment. Sandsynlghederne er 2 - Eksperment 2 antal 6 ere 5 kast med ternng V starter med at bestemme sandsynlgheden for at få to succes er dette eksperment. Det kunne være ved at de to første var 6 ere og de sdste 3 kast vste kke-6 ere, eller det kunne være det første og det 5. kast der var 6 ere. Opskrver v samtlge mulgheder får v P(X=2) = P(2 succes er) = P(SSFFF) + P(SFSFF) + P(SFFSF) + P(SFFFS) + P(FSSFF) + 2 3 P(FSFSF) + P(FSFFS) + P(FFSSF) + P(FFSFS) + P(FFFSS) = 10 p (1 Igen ser v at tallet 10 angver hvor mange måder v kan fordele vores succes er på. V skal dette tlfælde vælge 2 ud af de 5 pladser {1. plads, 2. plads, 3. plads, 4. plads, 5. plads}. V skal altså vælge en 2-delmængde ud af en 5-mængde, og det kan v gøre på K(5,2) måder. V har set, at dette åbenbart kan gøres på10 måder. Hvs v skulle beregne det ud fra formlen vlle det gve 54 K (5, 2) = = 10 21 3 - En generel argumentaton for formlen V beregner sandsynlgheden for succeser en bnomalfordelng med X~b(n, ved n P( succes er) = P(X=) = Kn (, ) p (1 ford v har Kn (, ) forskellge måder at arrangere vores succes er og faskoer på, så der netop er succes er (v skal udvælge af de n pladser tl vores succes er). Hvert af dsse n udfald med succeser har sandsynlgheden (1 ) p p ford v, når v sger at v vl have netop succes er samtdg sger, at v skal have netop (n-) faskoer. 3 0 3 P(X=0) = P(0 succeser) = P(FFF) = (1 = 1 p (1 1 2 P(X=1) = P(1 succeser) = P(SFF)+P(FSF)+P(FFS) = 3p (1 P(X=2) = P(2 succeser) = P(SSF)+P(SFS)+P(FSS) = 3p (1 P(X=3) = P(3 succeser) = P(SSS) = p 3 = 1 p 3 (1 0 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 3/9 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 4/9
Bnomalkvotent Bemærknng: Der argumenteres kke for formlen bogen. Nedenfor gves nogle konkrete eksempler på hvorfor formlen passer. Når man har forstået det, kan man faktsk godt forklare formlen generelt. Det er tlstrækkelgt, at forklare det ud fra et taleksempel. Antallet af måder v kan udvælge en r-delmængde af en n-mængde beregnes ved følgende formel: Tekst: Det står nedenfor. 1 - Ordnede delmængder og (kke-ordnede) delmængder: V har det foregående talt om antallet af 3-delmængder. Nu ndfører v begrebet antal ordnede 3-delmængder. I de ordnede 3-delmængder skelner v mellem rækkefølgen. Fordelen ved at betragte de ordnede delmængder er, at de er lettere at regne på. Antallet af ordnede 3-delmængder af en 7-mængde er kke så svært at bestemme. V skal udfylde tre pladser med elementer fra mængden {a,b,c,d,e,f,g}: På første plads er der 7 mulgheder. Anden plads kan udfyldes på 6 måder når 1. plads er udfyldt og 3. plads på 5. måder. Antallet at ordnede 3-delmængder af en 7-mængde er 7654321 7! 765 = = 4321 (7 3)! Tlsvarende er antal ordnede 4-delmængde af en 6-delmængde 654321 6! 6543 = = 21 (6 4)! n! V kan altså udvælge en ordnet r-delmængde af en n-mængde på n (n 1)... (n r)! = måder 2 - Udregnng af K(4,3) Betragter v mængden {a,b,c,d} så har v alt 4 3 2 = 24 eller 4! (4 3)! = 24 forskellge ordnede 3-delmængder af {a,b,c,d}. V kan skrve dsse 24 ordnede delmængder op: abc acb bac bca cab cba abd adb bad bda dab dba acd adc cad cda dac dca bcd bdc cbd cdb dbc dcb Men ser v ovenfor, så er de første 6 ordnede delmængder forskellge rækkefølger af den samme delmængde. Hver delmængde kan ordnes på 3 2 1 måder. Hvs hver delmængde forekommer 3! forskellge ordnnger, så kan v beregne antal delmængder K(4,3) ved 4! (4 3)! 4! 432 24 K(4,3) = = = = = 4 3! 3! (4 3)! 3 2 1 6 Der er alt 4 forskellge 3-delmængder af {a,b,c,d} :abc abd acd bcd 3 Udregnng af K(7,4) Hvs v vl bestemme K(7,4) så udregner v først antal ordnede 4-delmængden af en 7- mængde. De kan vælges på 7! 7654 = måder (7 4)! Hver 4-delmængde kan ordnes på 4! eller 4 3 2 1 forskellge måder. 7! Antal 4-delmængder af 7-mængde blver dermed K(7,4)= (7 4)! 4! 4 - Formelt argument for bnomalkofcenter: V kan udtage en ordnet r-delmængde af en n-mængde på n! n (n 1) (n 2)... (n r)! = måder Hver r-delmængde kan ordnes på r! forskellge måder. Derfor blver antallet af forskellge r- delmængder (kke-ordnede) af en n-mængde Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 5/9 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 6/9
Bnomalfordelngen nærmer sg normalfordelngen når n er stor Tekst: II-arbejdbog 134-137, II 174-181) Bnomalfordelngen opfører sg når n blver stor nok som en Normalfordelng Når n blver stor en B(n, fordelng, så opfører den sg som en N( n p, n p (1 )- fordelng. Du skal vde at normalfordelngen er en klokkeformet kontnuert fordelng, men ellers behøver du kke vde ret meget mere om den. B(100, 0.22) N(22, 4.14) 0.09 0.08 0.07 0.06 0.04 0.03 0.02 0.01-10 10 20 30 40 50 60 0.09 0.08 0.07 0.06 0.04 0.03 0.02 0.01-10 10 20 30 40 50 60 Bnomalfordelngstest og krtsk mængde Bemærknng: Dette område er meget specelt og kun aktuelt hvs du har arbejdet med det tdlgere. Tekst: Du kan benytte nedenstående tekst. Du kan supplere med lærerbogen II-162+165-174 1 Krtsk mængde Hvs v har en hypotese om at andelen af socaldemokrater 22% og v spørger 100 mennesker så vl v forvente at omkrng 22 af de spurgte vl være socaldemokrater. Hvs der er mange flere eller meget færre der sger de er socaldemokrater forkaster v vores hypotese og konkluderer at andelen er ændret. De tal der gver anlednng tl at forkaste hypotesen om at andelen uændret er på 22% kaldes den krtske mængde. Ofte vælger man at sge at hvs en observaton er så stor, at den lgger de 2½% største eller hvs en observaton er så llle, at den lgger de 2½% mndste, så vl v forkaste hypotesen. 2 Krtsk mængde beregnet med TI Hvs vores hypotese er at antal personer ud af 100 udspurgte, der svarer de er socaldemokrater er b(100, 0.22)-fordelt, så vser det sg at vores krtske mængde for denne hypotese blver {0,1,2, 12,13} U {30,31,32, } b(100,0.22) V kan med TI udregne fx P(X 14) = bnomcdf 100, 0.22, 14.030452911 Her ser v at sandsynlgheden for at få 14 eller et antal der er endnu mndre er ca 3%. V befnder os altså kke den krtske mængde. Ud fra bnomcdf 100, 0.22, 13.01602022 ses at 13 er grænsen for den krtske mængde. Hvs v får 13 eller et mndre tal er v under de 2½% mndste observatoner. Det kan være ford v bare var uheldge, men v vælger at tro, at det snarere skyldes at opbaknngen tl socaldemokratet er faldet. I den anden ende ser v at v skal op på 30 eller flere for at nå op de øverste 2½% 1 - bnomcdf 100, 0.22, 30.023164253 1 - bnomcdf 100, 0.22, 29.038554343 krtsk mængde 20 40 60 80 100 krtsk mængde Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 7/9 Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 8/9
3 - Krtsk mængde bestemt ud fra mddelværd og sprednng Mddelværden er den gennemsntlge værd for en stokastsk varabel. Den kaldes normalt E(X). Hvs X~b(n, så er mddelværden: E(X) = n p Sprednngen er et slags mål for den gennemsntlge afvgelse fra mddelværden. Den beregnes ved σ(x) = n p (1 og det er kke lge tl at forstå! Man kan som tommelfnger regel få et godt bud på grænserne for den krtske mængde ved at beregne E(X) ± 2 σ (X) Bnomalfordelngen noter tl eksamensspørgsmål GJ sde 9/9