9. Binomialfordelingen



Relaterede dokumenter
hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Løsninger til kapitel 7

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Sammenligning af to grupper

Maja Tarp AARHUS UNIVERSITET

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Stikprøvefordelinger og konfidensintervaller

Estimation ved momentmetoden. Estimation af middelværdiparameter

Vejledende besvarelser til opgaver i kapitel 15

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Konfidens intervaller

Motivation. En tegning

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Elementær Matematik. Polynomier

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Modul 14: Goodness-of-fit test og krydstabelanalyse

Vejledende opgavebesvarelser

Lys og gitterligningen

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Teoretisk Statistik, 9. februar Beskrivende statistik

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Claus Munk. kap. 1-3

Dagens forelæsning. Claus Munk. kap Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Matematisk Modellering 1 Hjælpeark

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Renteformlen. Erik Vestergaard

STATISTISKE GRUNDBEGREBER

Den flerdimensionale normalfordeling

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Estimation og test i normalfordelingen

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

Sandsynlighedsregning i biologi

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Projekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN

STATISTIK x-klasserne Gammel Hellerup Gymnasium

STATISTIKNOTER Simple normalfordelingsmodeller

Projekt 1.3 Brydningsloven

STATISTISKE GRUNDBEGREBER

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

x-klasserne Gammel Hellerup Gymnasium

Kvadratisk 0-1 programmering. David Pisinger

Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros

StudyGuide til Matematik B.

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Sprednings problemer. David Pisinger

Rettevejledning til HJEMMEOPGAVE 1 Makro 1, 2. årsprøve, foråret 2007 Peter Birch Sørensen

Sandsynlighedsregning

og Fermats lille sætning

TEKST NR TEKSTER fra IMFUFA

6 Populære fordelinger

Kapitel 8 Chi-i-anden (χ 2 ) prøven

GENEREL INTRODUKTION.

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Transkript:

9. Biomialfordelige 9.. Gekedelse Hvert forsøg ka ku resultere i to mulige udfald; succes og fiasko. I modsætig til poissofordelige er atallet af forsøg edeligt. 9.. Model X : Stokastisk variabel, der agiver atal elemeter i stikprøve, der besidder de øskede egeskab A. X ~ b(, p), hvor: : Stikprøves størrelse / atal forsøg. p: Sadsylighede for at observere egeskabe A ved et ekelforsøg. Forudsætiger:. Et forsøg udføres gage.. Hver gag forsøget udføres, registreres om e hædelse A idtræffer eller ej. 3. Udfaldee af de ekelte forsøg er uafhægige. 4. Sadsylighede for hædelse A er p i alle forsøg, dvs. kostat. 9.3. Forvetig og varias Forvetig: E( X) p Varias : var( X) σ p ( p) Stadardafvigelse: σ p ( p) Aderse m. fl. s. 5, Overø m.fl. s. 73, Newbold s. 6, Løborg s. 34 Eksempel: I 999 blev e udersøgelse af HA-studeredes beståelsesprocet på. år. Fra studieævets side er ma iteresseret i, at ca. 75% af e årgag består til eksame på. år. Udersøgelse omfattede 55 elever meldte sig til eksame, hvoraf 47 bestod. COMPLET A/S - Side 39 - KOMPENDIUM I STATISTIK

Spørgsmål:. Opstil e model til beskrivelse af det foreliggede materiale og diskutér kort modelles forudsætiger. Uder forudsætig af, at studieævets dumpeprocet er gældede, øskes de æste to spørgsmål besvaret.. Hvor mage studerede bør ma forvete vil bestå til eksame, år der er 6 HAstuderede på årgage? 3. Fid stadardafvigelse på atal beståede. Svar:. Ma er iteresseret i hvor mage, der består til eksame. Da ma tæller atallet ud af e stikprøve, og da ma ete består eller dumper eksame, må der her være tale om e biomialfordelig. Lad X betege atal beståede til eksame. Da må der gælde: X ~ b(,p ) Der ka være problemer med forudsætigere 3 (p kostat) og 4 (de studerede er uafhægige). p er ku kostat, hvis de har haft samme uderviser, lærebøger osv., og de er ku uafhægige, hvis de ikke syder til eksame. Hvis stikprøve er tilfældigt udtaget, ka ma atage forudsætigere for opfyldte.. E (X) p 6,75 45 dvs. ma bør forvete, at der er 45 ud af 6, der består, hvis beståelsesprocete sættes til 75%. 3. Var (X) p ( p) 6,75 (,75), 5 og dermed s (X) Var(X),5,67 9.4. Sadsylighedsberegig Sadsylighede for et givet atal observatioer med egeskabe A bestemmes vha. følgede formel: ( ) p ( p) P X Formle ka bereges i Ecel vha. fuktioe BINOMDIST(; ; p; FALSE) Aderse m. fl. s. 3, Overø m.fl. s. 73, Newbold s. 58, Løborg s. 3 COMPLET A/S - Side 4 - KOMPENDIUM I STATISTIK

9.5. Regeregler for sadsyligheder ( X a) P( X a) P( X a ) ( X < a) P( X a ) ( X a) P( X a ) ( X > a) P( X a) ( a < X < b) P( X b ) P( X a) ( a < X b) P( X b) P( X a) ( a X < b) P( X b ) P( X a ) ( a X b) P( X b) P( X a ) P P P P P P P P (a, b hele tal, hvor a < b ) 9.6. Tabelopslag af biomialfordelige i Erlag S Oveståede formel i afsit 9.4 er som regel ikke ødvedig at avede til at bestemme sadsylighede for e give hædelse, da ma ka slå dee op i Erlag S. Biomialfordelige er tabelført for - på side 8-3. Tabeller fides også i Overø m.fl. s. 46-436 og Newbold s. 89-833. Det skal dog bemærkes, at ma ikke direkte ka bestemme puktsadsyligheder, me ku itervalhædelser som X 5 eller X 3. Tabelopslag af biomialfordelige foretages emmest ved at geemføre følgede tri:. Fid tabelle for det rigtige atal observatioer ().. Tabelle skal aflæses ud fra øverste vestre hjøre eller ederste højre hjøre, jvf. edeståede tabel. 3. Fid p. 4. Fid j (j atal observatioer med egeskabe A ). COMPLET A/S - Side 4 - KOMPENDIUM I STATISTIK

j / p,5,,5 /6,,5,3 /3,35,4,45,5 j/p 3 4,3585,6,388,7358,397,756,945,6769,449,984,867,6477,9974,9568,898,6,34,387,5665,7687,5,3,8,69,43,76,6,93,355,44,5,7,696,448,375,3,33,76,64,55,,,,,5,,,36,9,444,6,49,8,5,89,,,,3,59 9 8 7 6 5 6 7 8 9,9997,9887,937,,9976,978,,9996,994,,9999,9987,,,9998,898,969,9887,997,9994,84,67,464,933,7858,68,9679,898,773,99,959,8867,9974,986,95,97,4793,665,895,98,454,56,553,466,5,99,6,459,5,764,5956,443,878,7553,7,577,36 5 4 3 4,,,,,,,,,,,,,,,,9999,,,,,9994,996,989,9999,999,9949,,9998,9987,,,9997,,964,987,9468 5 6 7 8 9,,,,,,,,,,,,,, Eksempler: Ud fra et samlebåd udvælges produkter, som skal udersøges for defekter. Erfarigsmæssigt ved ma, at % af produktere har defekter. Spørgsmål:. Opstil sadsylighedsfordelig.. Bereg sadsylighede for følgede hædelser: højst defekte, midst 5 defekte og etop 4 defekte. Svar: X ~ b(, p) b(,,) P(X ),6 BINOMDIST(; ;,; TRUE) P(X 5) - P(X 4) -,696,374 - BINOMDIST(4; ;,; TRUE) P(X 4) P(X 4) - P(X 3),696 -,44,8 BINOMDIST(4; ;,; FALSE) COMPLET A/S - Side 4 - KOMPENDIUM I STATISTIK

9.7. Estimatio Estimatet på adele / sadsylighed: pˆ pˆ ( pˆ) Estimatet på stadardafvigelse til estimatet på adele: s(pˆ) pˆ ( pˆ) Estimatet på variase til estimatet på adele: Vâr (pˆ) Aderse m. fl. s. 63-64, Overø m.fl. s. 65, Newbold s. 34-35 Eksempel: I 999 blev e udersøgelse af HA-studeredes beståelsesprocet på. år. Fra studieævets side er ma iteresseret i, at ca. 75% af e årgag består til eksame på. år. Udersøgelse omfattede 55 elever meldte sig til eksame, hvoraf 47 bestod. Spørgsmål: Puktestimér modelles parameter og bestem stadardafvigelse herpå. Svar: Puktestimat (eller bare estimat) for p: pˆ Ved idsættelse får ma: 47 pˆ,7554 55 pˆ ( pˆ),7554 (,7554) s (pˆ),83 55 (Aderse m.fl. s. 63-64, Overø m.fl. s. 65, Newbold s. 35) 9.8. Kofidesiterval i biomialfordelige Et kofidesiterval for parametere p ka opfattes som et itervalestimat, idet itervallet består af alle parameterværdier, der udviser e rimelig grad af overesstemmelse med data. Ma siger, at itervallet med e sikkerhed på - omslutter de sade parameterværdi. COMPLET A/S - Side 43 - KOMPENDIUM I STATISTIK

(-)-kofidesiterval for p: pˆ ± u / s (p) p ± u / eller p ± u / Vâr (p) hvor u / er e Dee kaldes i Newbold for z. p( p) -fraktil i de stadardiserede ormalfordelig. Fraktile ka bereges i Ecel vha. fuktioe NORMSINV( ). Aderse m.fl. s. 6, Overø m.fl. s. 98, Newbold s. 747, Løborg s. 6 Et kofidesiterval for p med kofideskoefficiet - betyder, at p vil være i dette iterval med - sadsylighed eller i (-) af gagee. Eksempel: I e rudspørge bladt 43 studerede på hadelshøjskole i Købehav har ma spurgt respodetere, om de er tilfredse med made i katie. 7 svarede ja, mes reste svarede ej. Spørgsmål: Opstil e model for data, og opstil et 95%-kofidesiterval for adele af tilfredse elever: Svar: X{atal persoer der svarer ja til at made er tilfredsstillede, i e stikprøve på 43 persoer} X ~ b 43,p, obs: 7. ( ) 7 pˆ,395 43 Et 95%-kofidesiterval: pˆ ( pˆ ),395(,395) pˆ ± u /,395 ±,96 [,488 ;,54] 43 dvs. med 95% sikkerhed ligger tilfredshedsadele mellem 4,88% og 54,%. COMPLET A/S - Side 44 - KOMPENDIUM I STATISTIK

Nødvedig stikprøvestørrelse,, for at få e kofidesiterval med bredde L (L er øvre græse mius edre græse) 4 p ( p) L ( u ) -/ Aderse m.fl. s., Newbold s. 36, Løborg s. 389 Eksempel: Med udgagspukt i førævte stikprøve bladt katiekudere, hvor stor skal stikprøve være, hvis oveævte iterval højst må have lægde,? Svar: Ved idsættelse får ma: u 4 L,96 pˆ ( pˆ) 4,,395 (,395) 367, Da stikprøvestørrelse skal være heltallig, rudes der altid op, dvs. ma får, at stikprøve skal være på midst 368 kuder. De beyttede formel har et idbygget problem. Ma øsker at fide e passede stikprøvestørrelse, før ma går ud og foretager stikprøveudtagelse. For at berege de passede stikprøvestørrelse, skal ma kede estimatet på adele, me det keder ma først efter, ma har foretaget stikprøveudtagelse. Da ma ka vise, at formle atager sit maksimum for pˆ,5, beytter ma i praksis ofte dee værdi. I oveævte tilfælde ville det give e stikprøvestørrelse på 384,6 dvs. 385. (-)-kofidesiterval for forskelle mellem to populatiosadele p og p y p p y ± u / s (p p y ) p p y ± u / Newbold s. 3 p p p y p y + y COMPLET A/S - Side 45 - KOMPENDIUM I STATISTIK

Eksempel: I forbidelse med udersøgelse i forrige opgave mht. katiekvalite registreredes samtidigt respodeteres kø. Bladt de 43 adspurgte var de 9 kvider og 4 mæd. af kvidere var tilfredse med kvalitete, mes ku 7 mæd sytes kvalitete var god ok. Spørgsmål:. Opstil e model til beskrivelse af det udvidede materiale.. Opstil et 95%-kofidesiterval for forskelle i kvalitetsbedømmelse mellem de to kø. Svar:. Da ma stadig tæller atallet ud af e stikprøve, og da ma ete er tilfreds eller ej, må der her være tale om to biomialfordeliger. Lad X i betege atal persoer som svarede ja til spørgsmålet om de var tilfredse med katies kvalitet, hvor i ka atage værdiere og. Da må der gælde: Xi ~ b( i,pi ) Idekset i idikerer, at der ka være forskel på værdiere, dvs. hverke stikprøvestørrelsere eller tilfredshedsprocetere behøver at være es. Ma må atage, at de to stikprøver er uafhægige af hiade.. Puktestimatet (eller bare estimatet) for p og p : (dvs tilfredshedsprocetere for hhv. kvider og mæd) pˆ pˆ 9 7 4,563,97 (-)-kofidesiterval for forskelle i adelee: Ved idsættelse får ma:,5363 ( 5363),97 (,97) (,563,97) ± u,5 + 9 4,346 ±,96,473,346 ±,887 [,54;,533] dvs. med 95% sikkerhed ligger de sade forskel i tilfredshedsadelee for de to kø mellem ca. -5% og ca. 5%. Bemærk specielt at itervallet ideholder værdie, hvilket betyder, at der ikke er oge sigifikat forskel i tilfredshedsadelee. COMPLET A/S - Side 46 - KOMPENDIUM I STATISTIK

9.9. Test i e biomialfordelig Ved test i e biomialfordelig ka ma ete berege sigifikassadsylighede direkte eller berege e teststørrelse, som derefter ete ka beyttes til at berege sigifikassadsylighede eller sammeliges med e kritisk værdi. Test vedr. p s størrelse ved beregig af sigifikassadsylighede : p p tal H ( ) H : p ( ) ( p 5 og p ( p) 5) eksakt p > P( X ) p p < P( X ) p Aderse m.fl. s., Overø m.fl. s. 84, Løborg s. approksimativt,5 p Φ p p +,5 p Φ p ( ) p mi, p mi(, ) ( ) ( ) I oveståede kasse ka det eksakte ku beyttes, hvis de pågældede biomialfordelig ka bereges ete ved at fide de i Erlag S (og det ka ma ku, hvis ) eller beytte Ecel eller lommereger. Ellers må ma øjes med de approksimative teststørrelse, som ku bør avedes, hvis p 5 og (- p) 5. I praksis vil det oftest være de approksimative test, ma aveder. Ved H : p po skal ma berege både og, og deræst tage det midste af de tal, og gage med to. Der gælder følgede: er midst,år > p er midst,år < p COMPLET A/S - Side 47 - KOMPENDIUM I STATISTIK

Test vedr. p s størrelse ved beregig af teststørrelse U : p p tal H ( ) pˆ p teststørrelse: U N(, ) p ( p ) H : teststørrelse: sigifikassadsylighed : kritisk værdi: Φ u p > p u ( ) p < p u Φ( u ) p u Φ( u ) p Overø m.fl. s. 84, Newbold s. 348 u u u / Eksempel: I e rudspørge bladt 43 studerede på Hadelshøjskole i Købehav har ma spurgt respodetere, om de er tilfredse med made i katie. 7 svarede ja, mes reste svarede ej. Spørgsmål: Persoalet i katie påstår, at midst halvdele af de studerede er tilfredse med katie. Ka ma på baggrud af udersøgelse afvise påstade? Svar: H : p,5 ( ikke afvise) ( afvise) H : p <,5 Da e biomalfordelig med 43 ikke fides i Erlag S (se selv efter!), må vi ete berege sigifikassadsylighede i Ecel eller beytte et approksimativt test. Da pˆ 7 5 og ( pˆ ) 43(,395) 6 5, er det OK at beytte de approksimative test: Sigifikassadsylighede: ( X 7) P BINOMDIST(7; 43;,5; TRUE), eller approksimativt +,5 p Φ p 7,5 43,5 + Φ Φ ( p ) 43,5(,5 ) (,), COMPLET A/S - Side 48 - KOMPENDIUM I STATISTIK

Formle ka bereges i Ecel vha. fuktioe NORMSDIST(-,). Da sigifikassadsylighede er større ed, 5 ka H accepteres, dvs. at katiepersoalets påstad ikke ka afvises. Eller ved beregig af teststørrelse: Teststørrelse: Ved idsættelse får ma: u p pˆ p ( p ),3953,5,5 (,5) 43,373 De observerede værdi beyttes ete til at berege sigifikassadsylighede eller til at sammelige med de kritiske værdi. Sigifikassadsylighed: ( u ) Φ da H : p < p ( u ) Φ(,373) Φ(,373), 849 Φ. Formle ka bereges i Ecel vha. fuktioe NORMSDIST(-,373) Alterativt ka ma sammelige med de kritiske værdi: Kritisk værdi: u 95 u,,645 da H er ekeltsidet, og,5 Fraktile ka bereges i Ecel vha. fuktioe NORMSINV(,95). Koklusio: Da de umeriske værdi af de observerede værdi af teststørrelse er midre ed de kritiske værdi, eller da sigifikassadsylighede er større ed iveauet, ka H accepteres, dvs. katiepersoalet ka have ret i deres påstad. COMPLET A/S - Side 49 - KOMPENDIUM I STATISTIK

9.. Bestemmelse af de kritiske værdi i biomialfordelige De kritiske værdi i biomialfordelige er de ekstreme observatiosværdier for de stokastiske variable X i, for hvilke H etop forkastes. Kritiske værdier C / og C -/ i e tosidet test (H : p p ) Det største C /, hvor P( X C / p p ) / C / CRITBINOM(; p; /) i Ecel Det midste C /, hvor P( X C / p p ) / C -/ CRITBINOM(; p; - /) + i Ecel Aderse m.fl. s. Kritiske værdi C - i e ekeltsidet test (H : p > p ) Det midste C - hvor P( X C p ) p C - CRITBINOM(; p; - ) + i Ecel Aderse m.fl. s. Kritiske værdi C i e ekeltsidet test (H : p < p ) Det største C hvor P ( X C p p ) C CRITBINOM(; p; ) i Ecel Aderse m.fl. s. 9.. Testes styrke i biomialfordelige Styrkefuktioe Styrkefuktioe η ( p ) for teste agiver sadsylighede for at observere e værdi af teststørrelse i forkastelsesområdet, dvs. sadsylighede for at forkaste H -hypotese. Dee sadsylighed afhæger af hvilke værdi af p, der avedes ved beregige, dvs. styrkefuktioe er e fuktio af p. Styrkefuktioe for e test af H : p p mod alterativet H : p > p ( ) C p η p P(X C ) Φ p ( ), hvor p C - fides i oveståede kasser eller approksimativt vha. formle: C p + u p ( ) p Aderse m.fl. s. -4, Overø m.fl. s. 79 COMPLET A/S - Side 5 - KOMPENDIUM I STATISTIK

Styrkefuktioe for e test af H : p p mod alterativet H : p < p ( ) C p η p P(X C ) Φ p ( ), hvor p C fides i oveståede kasser eller approksimativt vha. formle: C p u p ( ) p Aderse m.fl. s. -4, Overø m.fl. s. 79 Styrkefuktioe for e test af H : p p mod alterativet H : p p ( ) C / p C / p η p P(X C / ) + P(X C / ) Φ + Φ ( ) ( ), hvor p p p p C / og C -/ fides i oveståede kasser eller approksimativt vha. formlere: C p u p ( ) ( ) / / p C / p + u / p p Aderse m.fl. s. -4, Overø m.fl. s. 79 Eksempel: I e rudspørge bladt 43 studerede på Hadelshøjskole i Købehav har ma spurgt respodetere, om de er tilfredse med made i katie. 7 svarede ja, mes reste svarede ej. Det atages u, at de ægte p p, 4, dvs. at i virkelighede er ku 4% af de studerede tilfredse med katie. Spørgsmål: Hvad er testes styrke, givet, 5? Svar: Da alterativet i oveståede test er <, skal de midterste formel beyttes: C CRITBINOM(; p; ) CRITBINOM(43;,5;,5) 5 eller approksimativt C C,5 p u,95 p ( p ) 43,5,645 43,5(,5 ) 6, Styrke bereges til: p η,4 P(X C ) P(X 5) BINOMDIST(5;43;,4;TRUE), ( ) ( ) 33 η eller approksimativt C p 6, 43,4 (p ) (,4) η η Φ Φ Φ p( p) 43,4(.4) (,34), 3669 COMPLET A/S - Side 5 - KOMPENDIUM I STATISTIK

Formle ka bereges i Ecel vha. fuktioe NORMSDIST(-,34). Dvs. at sadsylighede for at forkaste de forkerte H -hypotese (de er forkert: hypotese siger, at p, 5, me ifølge opgavetekste er de i virkelighede ku p, 4 ) er 3,3% eller approksimativt 36,69%. COMPLET A/S - Side 5 - KOMPENDIUM I STATISTIK

9.. Sammeligig af to biomialfordeliger H : p p pˆ pˆ teststørrelse: u pˆ ( pˆ ) + + pˆ pˆ pˆ +, hvor Hvis stikprøvestørrelse er stor, dvs. over 3, ka ma ligeledes avede: u pˆ ( pˆ pˆ pˆ ) pˆ + ( pˆ ) H : teststørrelse: sigifikassadsylighed : kritisk værdi: Φ u u p > p u ( ) p < p u Φ( u ) p u Φ( u ) p Aderse m.fl. s. 3, Newbold s. 36 u u / Eksempel: I forbidelse med udersøgelse omkrig katiekvalite registreredes samtidigt respodeteres kø. Bladt de 43 adspurgte var de 9 kvider og 4 mæd. af kvidere var tilfredse med kvalitete, mes ku 7 mæd sytes kvalitete var god ok. Spørgsmål: Udersøg om tilfredshedsadele er forskellig for kvider og mæd. Svar: Det er ige et spørgsmål, ma har lyst til at besvare med ja eller ej, og det vil sige, at ma skal teste: Hypotese: H : p p H : p p tilfredshedsadele er es tilfredshedsadele er forskellig. COMPLET A/S - Side 53 - KOMPENDIUM I STATISTIK

Teststørrelse: Ved idsættelse får ma:,563,97,346 u,563 hvor,5,3953 (,3953) ( + ) 9 4 + 7 pˆ,3953 9 + 4 Kritisk værdi: u u, 975,96 da hypotese er dobbeltsidet, og,5 Fraktile ka bereges i Ecel vha. fuktioe NORMSINV(,975). Dee skal forstås både som,96 og +,96. De observerede værdi må ikke ligge ude for dette iterval, hvis hypotese ikke skal forkastes. Koklusio: Da de umeriske værdi af de observerede værdi af teststørrelse er midre ed de kritiske værdi, ka hypotese ikke forkastes, dvs. tilfredshedsadele for de to kø er ikke sigifikat forskellige. Sigifikassadsylighed: Ma ka fide sigifikassadsylighede vha. de observerede værdi. Da hypotese er dobbeltsidet, får ma: Φ(,563 ) Φ(,563),5938,87 Formle ka bereges i Ecel vha. fuktioe NORMSDIST(-,563). Koklusio: Da sigifikassadsylighede er større ed sigifikasiveauet,5, ka hypotese ikke forkastes, og ma får (heldigvis) samme koklusio som før. COMPLET A/S - Side 54 - KOMPENDIUM I STATISTIK

9.3. Sammeligig af to eller flere biomialfordeliger Disse tests løses som homogeitetstests i e kotigestabel vha. teststørrelse Q (se side 6). H : p p... pi teststørrelse: q i j ij I J i j forv i j i ij j I J ( obsij forv ij ) ij er observatioe i de ij te celle, og J I i ij, j ij, j i I J i j ij, hvor H : teststørrelse: sigifikassadsylighed : kritisk værdi: i, j : p i p j P( Q q Q ~ χ ( I J )) χ I J q ( )( ) (( )( )) Aderse m.fl. s. 338, Overø m.fl. s., Newbold s. 47, Løborg s. 38. Eksempel: De før ævte udersøgelse omkrig katiekvalite fadt sted i 994. I de følgede år registreredes på ligede måde tilfredshedsgrade. Udersøgelse strak sig over fire år, og de observerede data ser således ud: 994 995 996 997 Tilfredse 7 5 5 Utilfredse 6 6 7 3 SUM 43 5 38 57 Spørgsmål: Fra katies side er ma meget iteresserede i, om tilfredshedsgrade har udvist e stigede tedes. Udersøg om det er rimeligt at atage, at tilfredshedsgrade har foradret sig over åree. Svar: Det er et spørgsmål, ma har lyst til at besvare med ja eller ej, og det vil sige, at ma skal teste: COMPLET A/S - Side 55 - KOMPENDIUM I STATISTIK

Hypotese: H : p p p 3 p 4 dvs. tilfredshedsgrade er kostat H : tilfredshedsgrade har foradret sig. Teststørrelse: I virkelighede er det u bare at bruge formle i oveståede kasse til at berege e teststørrelse (kaldet q), me for at holde styr på de mage mellemregiger, laver ma typisk tre hjælpetabeller, kaldet Observeret, Forvetet og q-led. Observeret tabelle: Her idsættes blot de observerede værdier fra opgave, og der summeres vadret og lodret: 994 995 996 997 SUM Tilfredse 7 5 5 88 Utilfredse 6 6 7 3 SUM 43 5 38 57 89 Forvetet tabelle: Her overføres summere fra de oveståede tabel, og idmade i tabelle bereges som Søjlesum Rækkesum / Totalsum. Eksempelvis i første celle (tilfredse/994): 88 43, 89 994 995 996 997 SUM Tilfredse, 3,75 7,69 6,54 88 Utilfredse,98 7,5,3 3,46 SUM 43 5 38 57 89 q-led tabelle Her beytter vi formle: q - led ( obs - forv). forv Eksempelvis i første celle (tilfredse/994): ( 7, ),, 46 994 995 996 997 SUM Tilfredse,46,7,6,9,4 Utilfredse,4,6,54,8,8 SUM,86,3,6,7,3 COMPLET A/S - Side 56 - KOMPENDIUM I STATISTIK

Teststørrelse Teststørrelse q er u blot summe af elemetere i q-led tabelle (deraf avet), dvs. q,3 Kritiske værdi: De kritiske værdi bliver χ (( I )( J ) ) χ (( )( 4 ) ) χ ( 3) 7, 8,5,95. Dee ka også fides i Ecel vha. fuktioe CHIINV(; (I-)(J-)) CHIINV(,5; (-)(4-)) 7,847. Koklusio: Da de observerede værdi af teststørrelse er midre ed de kritiske værdi, bliver H ikke forkastet på et, 5 iveau. Dvs., at ma ka atage, at tilfredshedsgrade har været kostat, og at udsvigee skyldtes tilfældigheder. Sigifikassadsylighed: P Q q Q ~ χ I ( (( )( J ) )) P Q q Q ~ χ (( I )( J ) ) ( ) I tabelle på side 38 uder 3 frihedsgrader ka ma aflæse, at de observerede værdi,3 ligger mellem 5%-fraktile (,) og 5%-fraktile (,37). Dette må betyde, at sigifikassadsylighede ligger mellem - 5% 5% og - 5% 75%. Sigifikassadsylighede ka fides i Ecel vha. fuktioe CHIDIST(q; (I-)(J-)) CHIDIST(,3; (-)(4-)),587. COMPLET A/S - Side 57 - KOMPENDIUM I STATISTIK

X {atal gage hædelse?? idtræffer ud af mulige}, dvs. X, og X er et helt tal. X~ b (,p ) p er kedt p er ukedt, (tal) opgives Biomialford ssh. regig: (side 4) a la: P(X ) tal Ubekedt: - tal (de typiske) - - Hvis vi skal fide tal > (side 6) ormalfordelig, hvor: µ p σ p ( p ) p ( p ) σ (+ korrektio på,5) Estimatio (side 45) pˆ ( ) s pˆ pˆ ( pˆ ) 95% KI (side 46) pˆ ±,96 ( ) s pˆ biomialford p påstået Test i bio (side 49) H: p tal H: p?? tal sigi. ssh: Test i bio (side 53) H: p p H: p?? p sigi. ssh: Altid via ormalford. Biomialford > Normalfordelig, COMPLET A/S - Side 58 - KOMPENDIUM I STATISTIK