Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Størrelse: px
Starte visningen fra side:

Download "Teoretisk Statistik, 2. december 2003. Sammenligning af poissonfordelinger"

Transkript

1 Uge 49 I Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte test for sammenligning af to binomialford. Multinomialfordelingen som betinget poissonfordeling Givet: stikprøve x 1,,x I af I uafhængige observationer Model: X i ~ Ps(λ i ) i = 1,,I. Hypotesen H 0 : λ i = α i λ overfor H 1 : λ i α i λ i = 1,,I, hvor α i er givne konstanter med α i = 1, ønskes afprøvet. Sætning : hvis X 1,,X I er uafhængige stok. var. og X i ~ Ps(λ i ) i = 1,,I vil (X 1,,X I X. = x.) ~ Mult(x., λ 1 / λ.,, λ I / λ.), 1

2 hvor I i λ=. λ, x. = x, X. = X I I i= 1 i i= 1 i i= 1 Den betingede fordeling er altså en multinomialfordeling med kendte sandsynlighedsparametre p i = λ i / λ.= α i i = 1,,I. Vi får derfor videre at H 0 kan afprøves med Q-teststørrelsen. (16.39) Q = I i= 1 (Xi x. αi) x. α i 2 som i medfør af sætning 16.1 approximativt er χ 2 (I 1) -fordelt. Test i diskrete fordelinger Nulhypotesen er H 0 : θ = θ 0, hvor θ er parameter i den diskrete stokastiske variabel X s punktsandsynlighed f(x θ). Antag en observation x foretages, og at x stor medfører θ stor. Da haves 2

3 Alternativ Signifikanssandsynlighed H 1 : θ > θ 0 p= P(X x H 0) = f(z θ0) z x H 1 : θ < θ 0 p= P(X x H 0) = f(z θ0) z x H 1 : θ θ 0 p= 2 min{ f(z θ0), f(z θ0)} z x z x Eksakt test for sammenligning af to poissonfordelinger Sætning 16.3 for I = 2 : Hvis X i ~ Ps(λ i ) i = 1,2 samt X 1 og X 2 stok. uafh. er (X 1 X 1 + X 2 = x. ) ~ bin(n = x., p = λ 1 /(λ 1 + λ 2 ) ). Med brug af denne sætning kan nedenstående hypotese testes. H 0 : λ 1 = k λ 2 mod H 1 : λ 1 k λ 2 med α = 0.05 hvor k er en positiv konstant. Under H 0 haves (X 1 X 1 + X 2 = x. ) ~ bin(n = x., p = λ 1 /(λ 1 + λ 2 ) =k/(1+ k) ). Dvs. p = 2 min{ f (z x.,k /(1 + k)), f (z x.,k /(1 + k))}. z x z x 1 1 I praksis benyttes ofte normalfordelingsapproximationen X1 x.k/(1+ k) U= x.k /(1 + k) 2 a N(0,1), 3

4 ud fra hvilken signifikanssandsynligheden kan beregnes. Dette test kan forudsat k = 1 også udføres som et approximativt test, hvor teststørrelsen fremkommer fra (16.39) for I = 2. Er den alternative hypotese énsidet, kan testet derimod kun udføres som et eksakt test. Eksempel Antallet af kunder i en bestemt butik antages at være Poissonfordelt. I tabellen nedenfor er vist antal kunder torsdag og lørdag i de angivne tidsrum i to uger. Vi ønsker at teste a) om det forventede antal kunder er forskelligt fra den ene torsdag til den anden. b) om det forventede antal kunder torsdag og lørdag afviger fra hinanden. Torsdag Lørdag antal kunder ---- Tidsrum 1. uge til uge til

5 Ad a) Lad X i være antal kunder i butikken i i'te uge i de angivne tidsrum i=1,2. Desuden antag at X i ~ Ps(λ i T i ) i = 1,2 samt at X 1 og X 2 er stok. uafh. T 1 og T 2 er tidsperioder af hhv. 1 time og 1.5 times længde. Under disse forudsætninger skal hypotesen H 0 : λ 1 = λ 2 = λ testes overfor H 1 : λ 1 λ 2 med α = Under H 0 haves (X 1 X 1 + X 2 = 34) ~ bin( n = 34, p = T 1 /(T 1 + T 2 ) = 0.4) dvs. den eksakte signifikanssandsynlighed bliver p = 2 P(X 1 12 n = 34, p = 0.4) = = 0.71 > α = H 0 kan altså ikke forkastes. Der er således ikke signifikant forskel på antal kunder de to torsdage. Der er i øvrigt heller ikke signifikant forskel på antal kunder de to lørdage, idet p bliver p = 2 P(X 1 17 n = 42, p = 0.4) = = 0.82 > α = Ad b) Lad nu Y T betegne det samlede antal kunder i butikken i tidsperioden i hver af de to uger om torsdagen og lad Y L betegne det samme antal blot om lørdagen. Antag endvidere at Y T og Y L er stok. uafh. Vi har da Y T ~ Ps(λ T (T 1 + T 2 )) Y L ~ Ps(λ L (T 1 + T 2 )) og videre at 5

6 (Y T Y T + Y L = 76) ~ bin( n = 76, p = 0.5). Hypotesen H 0 : λ T = λ L = λ overfor H 1 : λ T λ L med α = 0.05, at antallet af kunder torsdage og lørdage er ens, kan ikke forkastes, idet p = 2 P(Y T 34 n = 76, p = 0.5) = = 0.42 > α = Teoretisk Statistik, 2. december 2003 Sammenligning af poissonfordelinger o Generel teori o Sammenligning af to poissonfordelinger o Eksempel Opsummering om multinomialfordelinger Fishers eksakte test for sammenligning af to binomialford. o Eksempel 6

7 Opsummering af multinomialfordelingen Bruges til beskrivelse af antal observationer i et givet antal forskellige kategorier. Spørgeskemaundersøgelser, meningsmålinger mm Kontrol af diskrete fordelinger Kontrol af kontinuerte fordelinger Sammenligning af poissonfordelinger betinget test Kontingenstabeller (kap. 17). Hypergeometrisk fordeling som betinget binomialford. Fishers eksakte test Givet: x 1, x 2, hvor X i ~ bin(n i, p i ) i = 1,2 samt X 1 og X 2 stokastisk uafhængige. H 0 : p 1 = p 2 mod H 1 : p 1 p 2 med α = Under H 0 haves, jfr. sætning 16.4 (X 1 X 1 +X 2 = x.) ~ hyperg(x., n 1, n), hvor n = n 1 +n 2. Dvs. p 2 min{ f(z x.,n,n), f(z x.,n,n)}. = z x 1 z x

8 Dette er det berømte test, der kaldes Fishers eksakte test for sammenligning af to binomialfordelinger. I praksis benyttes ofte normalfordelingsapproximationen U = X n x./n 1 1 n (x./n)(1 x./n)(n /(n 1)) 1 2 ud fra hvilken signifikanssandsynligheden kan beregnes. Teststørrelsen kan omskrives således at det fremgår, at der er tale om sammenligning af relative hyppigheder : X1 n1x./ n nx1 n1x. U = = n (x./ n)(1 x./ n)(n /(n 1)) (x./n)(1 x./n)(n n n /(n 1)) (n1+ n 2)X1 n 1(X1+ X 2) X 1/n1 X 2/ n2 = = (x./ n)(1 x./ n)(n n n /(n 1)) (x./ n)(1 x./ n)(n / n n (n 1)) = X/n X/n (x./n)(1 x./n)(1/n + 1/n )(n/(n 1)) 1 2 8

9 Eksempel Et forsikringsselskab har gennem en længere periode opkrævet den samme forsikringspræmie for to vognmærker A og B. Imidlertid har selskabet i det sidst forløbne år fået en mistanke om, at vognmærke B udgør en dårligere risiko end vognmærke A og har i den anledning foretaget en undersøgelse af skadeforløbet hos 100 biler af mærket A og 150 biler af mærket B. Undersøgelsen er foretaget på den måde, at de i alt 250 bilers skadeforløb er blevet fulgt i en periode på 6 måneder. Ved udløbet af undersøgelsesperioden viste det sig, at 15 af de 100 biler af mærket A havde haft skader, mens 35 af de 150 biler af mærket B havde haft skader. Giver undersøgelsens resultat selskabet "rimelig sikkerhed" for rigtigheden af dets formodning om, at biler af mærket B udgør en dårligere risikogruppe end biler af mærket A? Datamateriale: Bilmærke Antal biler Antal skadede biler A 100 = n 1 15 = x 1 B 150 = n 2 35 = x 2 I alt 250 = n 50 = x. 9

10 Model: to binomialfordelinger med sandsynlighedsparametre p 1 og p 2. Vi ønsker at teste H 0 : p 1 = p 2 mod H 1 : p 1 p 2 med α = 0.05 Fisher's eksakte test benyttes, dvs. vi beregner signifikanssandsynligheden p som P = P(X 1 15 x. = 50) Φ ( ) =Φ ( ) =Φ( 1.45) = / Den er større end α = 0.05, hvorfor H 0 ikke kan forkastes. Biler af mærke B udgør altså ikke en dårligere risikogruppe end biler af mærke A. Havde signifikansniveauet være 10% ville konklusionen blive den modsatte. 10

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Lær nemt! Statistik - Kompendium

Lær nemt! Statistik - Kompendium David Brink Lær nemt! Statistik - Kompendium Ventus wwwventusdk Lær nemt! Statistik - Kompendium 005 David Brink Nielsen og Ventus Download kompendiet gratis på wwwventusdk ISBN 87-7681-01-7 Ventus Falkoner

Læs mere

IMFUFA TEKST NR 435 2004. TEKSTER fra ROSKILDE UNIVERSITETSCENTER BASISSTATISTIK. Jørgen Larsen 2004, 2005

IMFUFA TEKST NR 435 2004. TEKSTER fra ROSKILDE UNIVERSITETSCENTER BASISSTATISTIK. Jørgen Larsen 2004, 2005 TEKST NR 435 2004 BASISSTATISTIK Jørgen Larsen 2004, 2005 TEKSTER fra IMFUFA INSTITUT ROSKILDE UNIVERSITETSCENTER FOR STUDIET AF MATEMATIK OG FYSIK SAMT DERES FUNKTIONER I UNDERVISNING, FORSKNING OG ANVENDELSER

Læs mere

χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF)... 2 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)...

χ 2 test Formål med noten... 2 Goodness of fit metoden (GOF)... 2 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... χ Indhold Formål med noten... Goodness of fit metoden (GOF)... 1) Eksempel 1 er stikprøven repræsentativ for køn? (1 frihedsgrad)... ) χ -fordelingerne (fordelingsfunktionernes egenskaber)... 6 3) χ -

Læs mere

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.

Læs mere

Spørgeskemaundersøgelser og databehandling

Spørgeskemaundersøgelser og databehandling DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag

Læs mere

STATISTIKNOTER Simple binomialfordelingsmodeller

STATISTIKNOTER Simple binomialfordelingsmodeller STATISTIKNOTER Simple binomialfordelingsmodeller Jørgen Larsen IMFUFA Roskilde Universitetscenter Februar 1999 IMFUFA, Roskilde Universitetscenter, Postboks 260, DK-4000 Roskilde. Jørgen Larsen: STATISTIKNOTER:

Læs mere

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp. Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes

Læs mere

IDRÆTSSTATISTIK BIND 2

IDRÆTSSTATISTIK BIND 2 IDRÆTSSTATISTIK BIND 2 ii Det Naturvidenskabelige Fakultet Aarhus Universitet Reprocenter Preben Blæsild og Jørgen Granfeldt 2001 ISBN 87-87436-07-8 Bd.2 iii Forord Denne bog er skrevet til brug i et statistikkursus

Læs mere

Matematik B. Højere handelseksamen

Matematik B. Højere handelseksamen Matematik B Højere handelseksamen hh123-mat/b-17122012 Mandag den 17. december 2012 kl. 9.00-13.00 Prøven består af to delprøver. Delprøven uden hjælpemidler består af opgave 1 til 5 med i alt 5 spørgsmål.

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10.b 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring

matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring matx.dk Undersøgelsesdesign Statistik Dennis Pipenbring 7. april 2011 Indhold 1 Undersøgelsesdesign 5 1.1 Kausalitet............................. 5 1.2 Validitet og bias......................... 6 1.3

Læs mere

Statistik for ankomstprocesser

Statistik for ankomstprocesser Statistik for ankomstprocesser Anders Gorst-Rasmussen 20. september 2006 Resumé Denne note er en kortfattet gennemgang af grundlæggende statistiske værktøjer, man kunne tænke sig brugt til at vurdere rimeligheden

Læs mere

IDRÆTSSTATISTIK BIND 1

IDRÆTSSTATISTIK BIND 1 IDRÆTSSTATISTIK BIND 1 ii Det Naturvidenskabelige Fakultet Aarhus Universitet Reprocenter Preben Blæsild og Jørgen Granfeldt 2001 ISBN 87-87436-05-1 Bd.1 iii Forord Denne bog er skrevet til brug i et statistikkursus

Læs mere

Simpsons Paradoks. Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser. Inge Henningsen

Simpsons Paradoks. Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser. Inge Henningsen Simpsons Paradoks Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser Afdeling for Anvendt Matematik og Statistik Københavns Universitet 1 Simpsons Paradoks -Et emnearbejde om årsag og sammenhæng

Læs mere

Proposition I Hvis jeg har samme chance for at få a eller b, er det for mig lige så meget værd som a + b

Proposition I Hvis jeg har samme chance for at få a eller b, er det for mig lige så meget værd som a + b vil have samme chance for at få eller 7 skilling i et retmæssigt spil, som det senere vil blive vist. Proposition I Hvis jeg har samme chance for at få a eller b, er det for mig lige så meget værd som

Læs mere

VIDEREGÅENDE STATISTIK

VIDEREGÅENDE STATISTIK MOGENS ODDERSHEDE LARSEN VIDEREGÅENDE STATISTIK herunder kvalitetskontrol Udgave 10a 015 FORORD Denne lærebog kan læses på baggrund af en statistisk viden svarende til lærebogen M. Oddershede Larsen :

Læs mere

KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM

KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM KURSUSMATERIALE TIL DET NYE STATISTIKPENSUM Det foreliggende udkast til kursusmateriale er lagt ud til orientering for kollegerne med henblik på at indhente kommentarer til materialet. Sammen med Susanne

Læs mere

CHAUFFØR OG LAGERARBEJDERES LEDIGHED

CHAUFFØR OG LAGERARBEJDERES LEDIGHED CHAUFFØR OG LAGERARBEJDERES LEDIGHED OG BRANCHESKIFT Resume Det primære formål i denne analyse er at undersøge de chauffører og lagerarbejderes ledighed og beskæftigelse i forhold til de u. I analysen

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

INTRODUKTION TIL KRITISK STATISTIK. på 1. semester i Metodefaget.

INTRODUKTION TIL KRITISK STATISTIK. på 1. semester i Metodefaget. INTRODUKTION TIL KRITISK STATISTIK på 1. semester i Metodefaget. Merete Watt Boolsen 2004 2 INDLEDNING I studieordning 2000 for faget Introducerende metode og videnskabsteori kan man se, at det blandt

Læs mere

Løsningsforslag til Stokastik 1.-10. klasse

Løsningsforslag til Stokastik 1.-10. klasse 1 Løsningsforslag til Stokastik 1.-10. klasse Bemærk, at vi benytter betegnelsen øvelser som en meget bred betegnelse. Derfor er der også nogle af vores øvelser, der nærmer sig kategorien undersøgelser,

Læs mere

HANDICAP OG BESKÆFTIGELSE I 2014

HANDICAP OG BESKÆFTIGELSE I 2014 HANDICAP OG BESKÆFTIGELSE I 2014 REGIONALE FORSKELLE 15:20 MALENE RODE LARSEN JAN HØGELUND 15:20 HANDICAP OG BESKÆFTIGELSE I 2014 REGIONALE FORSKELLE MALENE RODE LARSEN JAN HØGELUND KØBENHAVN 2015 SFI

Læs mere

En håndbog om tælling af biblioteksbesøg i de danske folkebiblioteker

En håndbog om tælling af biblioteksbesøg i de danske folkebiblioteker En håndbog om tælling af biblioteksbesøg i de danske folkebiblioteker Udarbejdet af DIOS A/S December 2001 INDHOLDSFORTEGNELSE REGISTRERING AF ANTAL BIBLIOTEKSBESØG...1 BAGGRUNDEN FOR METODENS UDVIKLING...1

Læs mere

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik. Epidemiologi og biostatistik. Uge, tirsdag. Erik Parner, Institut for Biostatistik. Generelt om statistik Dataanalysen - Deskriptiv statistik - Statistisk inferens Sammenligning af to grupper med kontinuerte

Læs mere

F I N N H. K R I S T I A N S E N KUGLE SIMULATIONER MÅLSCORE I HÅNDBOLD G Y L D E N D A L

F I N N H. K R I S T I A N S E N KUGLE SIMULATIONER MÅLSCORE I HÅNDBOLD G Y L D E N D A L RÆSONNEMENT & 1BE V I S F I N N H. K R I S T I A N S E N GNING 2 EGNEARK KUGLE 5 MÅLING SIMULATIONER 3 G Y L D E N D A L MÅLSCORE I HÅNDBOLD Faglige mål: Håndtere simple modeller til beskrivelse af sammenhænge

Læs mere

Sandsynlighedregning

Sandsynlighedregning MOGENS ODDERSHEDE LARSEN Sandsynlighedregning + = - P(A B) = P(A) + P(B) P(A B). 1. udgave 2007 FORORD Dette notat giver en kort gennemgang af de grundlæggende begreber i sandsynlighedsregning. Det forudsættes,

Læs mere

Introduktion til teoretisk statistik og nogle af dens anvendelser

Introduktion til teoretisk statistik og nogle af dens anvendelser Bent Willum Hansen Introduktion til teoretisk statistik og nogle af dens anvendelser 60 50 40 30 20 S2 10 S1 0 1 2 3 4 BEWIstat 5 6 EMNEOPDELTE OPGAVESAMLING Beskrivende statistik...2 Sandsynlighedsregning...3

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere