Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Relaterede dokumenter
Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Definition. Definitioner

Produkt og marked - matematiske og statistiske metoder

Kapitel 4 Sandsynlighed og statistiske modeller

Kvantitative Metoder 1 - Forår 2007

Binomialfordelingen. Binomialfordelingen. Binomialfordelingen

Kapitel 4 Sandsynlighed og statistiske modeller

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Note til styrkefunktionen

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Personlig stemmeafgivning

Vejledende løsninger til opgaver i kapitel 6

Statistik viden eller tilfældighed

Note om Monte Carlo metoden

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

En oversigt over udvalgte kontinuerte sandsynlighedsfordelinger

Kvantitative Metoder 1 - Forår 2007

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Efterår Dagens program

Nanostatistik: Opgavebesvarelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Elementær sandsynlighedsregning

Løsninger til kapitel 6

Elementær sandsynlighedsregning

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Preben Blæsild og Jens Ledet Jensen

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger

Dagens program. Praktisk information: Husk evalueringer af kurset

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

StatDataN: Test af hypotese

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Kapitel 7 Forskelle mellem centraltendenser

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Nanostatistik: Opgaver

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Vejledende besvarelser til opgaver i kapitel 14

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Produkt og marked - matematiske og statistiske metoder

Kvantitative Metoder 1 - Forår Dagens program

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Nanostatistik: Test af hypotese

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Hvad skal vi lave i dag?

Om hypoteseprøvning (1)

Konfidensintervaller og Hypotesetest

Estimation og konfidensintervaller

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Sandsynlighedsregning

Statistiske modeller

Uge 10 Teoretisk Statistik 1. marts 2004

Normalfordelingen. Erik Vestergaard

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Opgaver til kapitel 3

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Susanne Ditlevsen Institut for Matematiske Fag susanne

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Modul 2: Sandsynlighedsmodeller og diskrete stokastiske variable

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

J E T T E V E S T E R G A A R D

Schweynoch, Se eventuelt

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Kvantitative Metoder 1 - Efterår Dagens program

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Statistik Lektion 2. Betinget sandsynlighed Bayes regel Diskrete stokastiske variable Middelværdi og varians for diskret SV Binomialfordelingen

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Løsning eksamen d. 15. december 2008

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Løsninger til kapitel 5

Hvad er meningen? Et forløb om opinionsundersøgelser

for gymnasiet og hf 2016 Karsten Juul

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Kvantitative Metoder 1 - Forår Dagens program

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Løsning til prøveeksamen 1

Oversigt over nyttige fordelinger


Transkript:

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man kan vise, at en binomialfordelt stokastisk variabel med parametre n og p kan tilnærmes med en normalfordeling med samme middelværdi og spredning, dvs. np og n p( p ). Ved beregning af forkastelsesområderne (se kapitel 8) for binomialfordelingen kan man ofte bruge følgende approksimation til normalfordelingen. Sætning - approksimation med normalfordelingen Hvis X er en binomialfordelt stokastisk variabel med parametre p og n, da vil følgende to sandsynligheder være omtrent lige store for vilkårlige a og b mellem 0 og n : Og: P a X b P a 2 n p b 2 n p Z n p p n p p Hvor Z er standardiseret normalfordelt N(0,), se side 54-55 i Statistik. Approksimationen er gyldig for store værdier af n. Man kan nogenlunde stole på approksimationen, hvis følgende to betingelser er opfyldt: og: () n 30 n p p (2) 9 Betingelse () sikrer, at vi undgår situationer, hvor binomialfordelingen er meget skæv og derfor ikke kan approksimeres ved en normalfordeling. Sætningen ovenfor kan også formuleres sådan, at binomialfordelingen og normalfordelingen ligner hinanden for store værdier af n. For at se dette omskriver vi udtrykket i sætningen til:

P a Z n p p n p b 2 2 I formlen ovenfor genkender vi de to udtryk np og np p for middelværdi og spredning i binomialfordelingen. Det er disse værdier, vi tilnærmer til normalfordelingens parametre og. Dette resultat var allerede opdaget af de Moivre i 733 (se kapitel 8, afsnit 2). Den halve, som indgår i formlen, er der for at gøre approksimationen bedre. Man lægger 0,5 til/trækker 0,5 i siderne, idet binomialfordelingen er en diskret fordeling, mens normalfordelingen er en kontinuert fordeling. Det kaldes kontinuitetskorrektionen. Fra normalfordelingen (kapitel 7, side 54-55) ved vi, at hvis X er normalfordelt med parametrene,, da er Z X normalfordelt med parametrene 0,. Heraf ses, at hvis Z er standardnormalfordelt, da er n p p. np U Z np p np normalfordelt med parametre np og Sætningen udtrykker altså, at binomialfordelingen ligner normalfordelingen med parametre og n p p, når betingelserne () og (2) er opfyldt. Man kan illustrere at de to fordelinger ligner hinanden ved at tegne deres frekvensfordelinger. F.eks. for n = 5 og p = 0.5. Sammenligning af binomialfordelingen og normalfordelingen for n 5 og p 0,5. Øvelse Beregn hvilke værdier der er anvendt for normalfordelingens parametre. Vi illustrerer anvendelsen af sætning med nogle eksempler.

Eksempel : Møntkast Da det er besværligt at udregne binomialfordelingen, når antalsparameteren n er stor, vil vi bruge approksimationen til normalfordelingen. Vi tænker på eksperimentet, hvor vi kaster en mønt 00 gange, og den stokastiske variabel U tæller antallet af krone. Så hvis vi sætter n 00 og p, finder vi: np 00 50 og np p 00 25 5. Vi ønsker at finde sandsynligheden P 45 antal krone 55 at benytte binomialfordelingen, men bruger approksimationen. 2 2 2. Men vi vil ikke beregne værdien ved 2 Vi skal finde det interval, der svarer til mindst 45 antal krone og højst 55 antal krone, og inkluderer derfor intervallet 44,5-45,5, som ligger lige langt fra 45, og 54,5-55,5, som også ligger lige langt fra 55, altså en halv til hver side af de to tal 45 og 55. Derfor bliver opgaven ved hjælp af P 44,5 antal krone 55,5. normalfordelingen at finde Til sidst omskriver vi til den kendte transformation (se kapitel 7): 45 2 50 55 2 50 P Z P(, Z,) (,) (,) 0,7287 5 5 Dvs. sandsynligheden for at få mellem 45 og 55 gange krone er 72,87 %. Den eksakte værdi kan beregnes med Maple:

Med fire betydende cifre fås samme resultat. Eksempel 2 Ved en opinionsundersøgelse per telefon skal vi udvælge 0 % af en befolkning tilfældigt. Vi vedtager at vælge alle, hvis telefonnummer ender med tallet 3. Man vælger tilfældigt 50 numre i telefonbogen og finder 9, der ender på et tretal. Vi skal her teste hypotesen p 0, og n 50. Ved brug af et CAS-værktøj finder vi, at x = og x = 0 med en vis tilnærmelse afgrænser de to 2,5 % - haler i en binomialfordeling med p 0, og n 50. Da x = 9 falder inden for disse to grænser, kan vi ikke afvise, at proceduren faktisk giver os ca. 0 % af populationen. Plot i GeoGebra af binomialfordelingen med p 0, og n 50. Det blå område (x = til 9) svarer til 97 %.

Øvelse Check selv efter med sandsynlighedslommeregneren i GeoGebra at intervallet x = til 9 er det rigtige interval, idet det forkastelsesområdet (det ikke-blå) skal være så tæt på 5 % som muligt, men ikke større end 5 %. I Maple ser plottet således ud: Det grønne er acceptområdet, det røde er forkastelsesområdet. Vi vil nu beregne grænserne ved brug af sætning ovenfor. Opgaven er altså at finde forkastelsesområdet for hypotesen p 0,, når n 50. Eller anderledes sagt at bestemme to tal a og b, så vi har: P X a 0,025 P X b 0,025 og a 0,5 np Der gælder PX a 0,025, hvor er standardnormalfordelingen (se kapitel np p 7). For -fordelingen ved vi imidlertid, at -,96 afgrænser de nederste 2,5 % af fordelingen.,96 0,025, følger heraf at: Da På samme måde finder vi, at: a 0,5np,96 np p eller a np np p 0,5,96 b 0,5 np PX b np p 0,025

Men da,96 afgrænser de øverste 2,5 % af -fordelingen følger heraf, at: b np 0,5,96 np p. Ved at indsætte vores værdier, finder vi det kritiske område, som indeholder x-værdier mindre end a eller større end eller lig med eller lig med 5 0,5,96 4,5 0,34 b 5 0,5,96 4,5 9.66. En sammenligning med den første del af eksemplet viser at approksimationen til normalfordeling er meget nøjagtig. Der fik vi a og b 0. Eksempel 3: Folketingsvalg Ved et folketingsvalg stemmer 7,8 % af vælgerne på et bestemt parti. En opinionsundersøgelse baseret på.500 personer viser senere, at 20,6 % ville stemme på partiet, hvis der var valg den næste dag. Er fremgangen på 2,8 % en reel fremgang? En måde at besvare dette spørgsmål på, er at teste hypotesen p 0,78 i en binomialfordeling med n 500. Antal personer, der påstår, at de vil stemme på partiet, kan nemlig opfattes som heldige forsøg i en serie på.500 forsøg, hvor chancen for et heldigt forsøg er lig med procentdelen af vælgere, der faktisk ville stemme på partiet ved et forstående valg. Med n 500 og p 0,78 bliver de to grænser lig med: a 500 0,78 0,5,96 500 0,78 0,822 237,463 b 500 0,78 0,5,96 500 0,78 0,822 296,537 Vi må altså afvise hypotesen p 0,78, hvis x 296,5. Den observerede procentdel 20,6 % af.500 personer svarer til x 500 0,206 309, og vi må forkaste hypotesen. Det observerede procenttal tyder således på, at partiet har haft en vis fremgang siden valget. Opgaver Opgave Sammenlign de eksakte sandsynligheder for PX a, når a = 3, 4, 5, 6 og 7, med normalfordelingens approksimation, når X er binomialfordelt med n 30 og p 0,5.