Vejledende besvarelser til opgaver i kapitel 15

Relaterede dokumenter
hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Uge 40 I Teoretisk Statistik, 30. september 2003

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Løsninger til kapitel 7

Test i polynomialfordelingen

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Generelle lineære modeller

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

TEKST NR TEKSTER fra IMFUFA

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

6 Populære fordelinger

9. Binomialfordelingen

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Maja Tarp AARHUS UNIVERSITET

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Stikprøvefordelinger og konfidensintervaller

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Sammenligning af to grupper

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

antal gange krone sker i første n kast = n

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Motivation. En tegning

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Bilag 5: DEA-modellen Bilaget indeholder en teknisk beskrivelse af DEA-modellen

Estimation og test i normalfordelingen

Vejledende opgavebesvarelser

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Modul 14: Goodness-of-fit test og krydstabelanalyse

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Den flerdimensionale normalfordeling

Pearsons formel for χ 2 test. Den teoretiske forklaring

Elementær Matematik. Polynomier

Renteformlen. Erik Vestergaard

Asymptotisk optimalitet af MLE

Estimation ved momentmetoden. Estimation af middelværdiparameter

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Diskrete og kontinuerte stokastiske variable

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Opsamling. Lidt om det hele..!

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Matematisk Modellering 1 Hjælpeark

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Om Følger og Rækker. Nyttige Grænseværdier. Nyttige Rækker. Carsten Lunde Petersen. lim. lim = 0. lim (1 + x n n )n = e x. n n n.

Teoretisk Statistik, 9. februar Beskrivende statistik

STATISTIKNOTER Simple normalfordelingsmodeller

Kvantitative metoder 2

Undersøgelse af numeriske modeller

Konfidens intervaller

Morten Frydenberg version dato:

Uge 37 opgaver. Opgave 1. Svar : Starter med at definere sup (M) og inf (M) :

Statistik Lektion 8. Test for ens varians

Projekt 3.2 Anlægsøkonomien i Storebæltsforbindelsen. Indhold. Hvad er matematik? 1 ISBN

DATV: Introduktion til optimering og operationsanalyse, Følsomhed af Knapsack Problemet

Sandsynlighedsteori 1.2 og 2 Uge 5.

Variansanalyse. på normalfordelte observationer af Jens Friis

Skitse til notat om hvor de forskellige sandsynlighedsfordelinger kan tænkes at komme fra

Blisterpakninger i det daglige arbejde

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Sandsynlighedsregning i biologi

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Lys og gitterligningen

Introduktion til uligheder

Viden Om Vind oftere, stop i tide

Sandsynlighedsregning

BEVISER TIL KAPITEL 7

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Hovedpointer fra SaSt

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

x-klasserne Gammel Hellerup Gymnasium

Teoretisk Statistik, 18. november Stikprøveteori: hvor er vi, og hvor skal vi hen? Proportional allokering Optimal allokering

STATISTIK x-klasserne Gammel Hellerup Gymnasium

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

STATISTISKE GRUNDBEGREBER

Supplement til Kreyszig

Beregning af prisindeks for ejendomssalg

Introduktion til Statistik

STATISTISKE GRUNDBEGREBER

Transkript:

Vejledede besvarelser til opgaver i apitel 5 Opgave a) De teststatistier, ma aveder til at teste om to middelværdier er es, består af et estimat på forselle mellem middelværdiere,, divideret med et udtry for stadardafvigelse af dee estimerede forsel. Hvis forselle er stor i forhold til stadardafvigelse atager teststatistie e stor værdi. Vi seler mellem e ræe forsellige tilfælde afhægigt af fordelige af elemetere i stiprøve (ormalfordelte elemeter, Beroullifordelte elemeter og det geerelle tilfælde) og om variasere er edte eller uedte. De forsellige tilfælde er listet i tabelle på side 86-87 samme med fordeligere af teststatistiere. b) De poolede variasestimator avedes, år ma a atage, at variasere af elemetere i de to stiprøver er es. I stedet for at berege to estimater på variasere et estimat for hver stiprøve bereges da et samlet estimat. c) Ituitioe er grudlæggede de samme som i a). Forselle er imidlertid, at uder ulhypotese er ie alee de to adele es, me også de to variaser es, idet variase er e futio af adele. Dermed sal ma avede de poolede variasestimator. Teste a u avedes ved store stiprøvestørrelser, idet teststatistie u er asymptotis ormalfordelt. d) Variasaalyse a bruges til at teste om flere ed to middelværdier er es. TR giver et mål for hvor meget de eelte stiprøvers geemsit afviger afviger fra det samlede geemsit. E måler variase for de eelte stiprøver. Teststatistie, F, er da stor, hvis TR er stor i forhold til E et teg på at der er større varias mellem stiprøvere ed ide for stiprøvere. Uder ulhypotese er teststatistie F-fordelt med K- og - K frihedsgrader, hvor K er atallet af middelværdier og er de samlede stiprøvestørrelse. e) Teststatistie sammeholder (dividerer) et estimat på variase med værdie uder ulhypotese. Hvis dee brø er meget stor/lille er det bevis mod ulhypotese. Uder ulhypotese er teststatistie χ -fordelt med - frihedsgrader (fordelige er esat hvis elemetere i stiprøve er ormalfordelte). f) Ved e test af om to variaser er es, dividerer ma de to estimater på variase med hiade. Hvis dee brø er meget stor/lille, er det bevis mod ulhypotese. De resulterede teststisti er F fordelt med - og - frihedsgrader, forudsat at elemetere i stiprøvere er ormalfordelte. Opgave a) Da variasere er edte, er de relevate teststatisti: Z / /

b) Hvis elemetere i stiprøvere er ormalfordelte er teststatistie esat stadardormalfordelt, mes de u er approsimativt stadardormalfordelt ved større stiprøvestørrelser, hvis de ie er ormalfordelte. c) Værdie af teststatistie er:,,95 Z,74 / / 0,6 / 50 0,6 / 70 og P-værdie for dee dobbeltsidede test er: P - værdi,74,74 0,0409 0, 088 d) Nulhypotese a derfor u forastes ved et 0% sigifiasiveau. e) Hvis variasere er uedte, og atages ie at være es, er de relevate teststatisti / / f) Hvis elemetere i stiprøvere er ormalfordelte beteges teststatistie med T og er da esat t-fordelt med + - frihedsgrader. g) Er de ie ormalfordelte, beteges teststatistie med Z og er da approsimativt stadardormalfordelt ved store stiprøvestørrelser. h) I tilfældet fra f) fides de ritise værdier som,5%- og 97,5%-fratilere fra t-fordelige med 50-70- =8 frihedsgrader. Disse er i prasis lig med,5%- og 97,5%-fratilere fra stadardormalfordelige, dvs. -,96 og,96. I tilfældet fra g) er de ritise værdier,5%- og 97,5%-fratilere fra stadardormalfordelige, dvs. -,96 og,96. På grud af det store atal observatioer er der altså ige forsel på de ritise værdier i dette tilfælde. i) Værdie af teststatistie er:,,95,75 / / 0,57 / 50 0,6/ 70 og P-værdie for dee dobbeltsidede test er i begge tilfælde givet ved stadardormalfordelige på grud af det store atal observatioer: P - værdi,75,75 0,040 0, 080 j) Heller ie her a vi foraste ulhypotese ved et 5% sigifiasiveau. Ved sigifiasiveauer større ed 8,0% a ulhypotese forastes. Opgave a) Nulhypotese er: H 0 : μ = μ, og alterativhypotese er: H : μ μ. b) Til at teste hypotese fra a) avedes følgede teststatisti (hvis vi ie atager at elemetere i stiprøvere er ormalfordelte):

Z / / c) Dee er approsimativt stadardormalfordelt uder H 0 ved store stiprøvestørrelser (havde elemetere været ormalfordelte havde de været esat t-fordelt med 5 + 0 - = 5 frihedsgrader). d) Værdie af teststatistie er: 67,7 44,4 Z / / 0,8 / 5 78,0 / 0 og P-værdie for dee dobbeltsidede test er: P - værdi,66 0,009 0, 0078 e) De ritise værdier er,5%- og 97,5%-fratilere fra stadardormalfordelige, dvs. -,96 og,96. H 0 a derfor sagtes forastes. f) For at afgøre, om det er rimeligt at avede de poolede variasestimator a ma teste om variasere er es. Dette forudsætter dog i pricippet, at elemetere er ormalfordelte.,66 g) Nulhypotese og alterativhypotese er: H 0 : σ = σ og H : σ σ. h) Teststatistie er: F som er F-fordelt med ( -, -) = (5-, 0-) = (4, 9) frihedsgrader uder H 0. i) De ritise værdier ved et 5% sigifiasiveau fides som,5% fratile og 97,5% fratile fra F-fordelige med (4, 9) frihedsgrader, mes de ritise værdier ved et 0% sigifiasiveau fides som 5% fratile og 95% fratile fra F-fordelige med (4, 9) frihedsgrader. Disse er heholdsvis: 5% sigifiasiveau: 0,45 og,5 0% sigifiasiveau: 0,5 og,90 j) Værdie af teststatistie bliver: 0,8 F 0,57 78,0 Dvs. ulhypotese a ie forastes på hvere et 5% eller et 0% iveau, og bae a derfor avede de poolede variasestimator. ) Teststatistie bliver: Z / / p hvor p som er approsimativt stadardormalfordelt uder H 0. Idsættes værdier fås:

p og: Z 40,8 978,0 p 5 0 67,7 44,4 / / 49,8 / 5 / 0 med P-værdi: P - værdi,60 0,0047 0, H 0 må derfor stadig forastes. 0094 6409,7 49,8,60 Opgave 4 a) Hvis persoere er udtruet tilfældigt med tilbagelægig bladt alle meeser i Damar. I prasis er det dog sjældet tilfældet, idet mage udersøgelser foregår ved at rige til fol eller ligede og u é gag til de samme perso. Dermed træes der u bladt dem der har telefo og der træes ude tilbagelægig. b) Elemetere i stiprøvere er Beroullifordelte og stiprøvestørrelsere er store. Dermed a vi avede teste for om to middelværdier (adele) er es fra semaet på side 87. Teststatistie: p p p p p Z hvor p p p p p Er approsimativt stadardormalfordelt uder ulhypotese om, at de to adele er es. De relevate ulhypotese er: H 0 : p = p, mes alterativhypotese er ete H : p p eller H : p > p, hvis ma specifit øser at teste om modstade har været faldede. c) Teststatistie udreges til: p p p 957 0,74 00,7 p 0,797 og 957 0 p p 0,74 0,7 Z p p p p 0,797 ( 0,797) 957 med tilhørede P-værdi (ved e dobbeltsidet test): P - værdi,00,00 0,587 0, 74 0,00 og ulhypotese a derfor ie forastes. Ved e eeltsidet test, H : p > p, ville P- værdie blive: P - værdi,00 0,84 0, 587 og heller ie her ville ma foraste H 0. d) Ma a altså ie oludere, at der er set e ædrig i modstade mod relamer for alohol.

Opgave 5 a) tiprøve er udtruet fra populatioe af mulige fremtidige atieurser for virsomhedere i medicialidustrie e superpopulatio. At stirpøve er simple tilfældig ræver her: i) at ursere er uafhægige fra år til år (måse ie helt realistis); ii) at ursere for de forsellige virsomheder er uafhægige. b) Hu sal avede teste af e varias fra side 79. Ete må hu atage, at elemetere i stiprøve er ormalfordelte i hvilet tilfælde teststatistie: Y 0 er esat χ -fordelt eller hu må atage, at stiprøve er tilstræelig stor til at de approsimative χ -fordelig af teststatistie holder. c) Nulhypotese er: H 0 : σ = 0, mes alterativhypotese er: H : σ < 0. Der er altså tale om e eeltsidet test, fordi hu øser at teste om variase er midre ed 0. d) De ritise værdi ved et 5% sigifiasiveau fides da som 5% fratile fra χ- fordelige med = 50 = 49 frihedsgrader. Dee er,9 ( i tabel 4 bag i boge fides u 5% fratile ved 50 frihedsgrader som er 4,8). e) Værdie af teststatistie udreges til: 86,8 Y 50 4, 5 0 0 som er større ed de ritise værdi. Dermed a ulhypotese ie forastes (værdie sulle være midre ed de ritise værdi ved dee eeltsidede test). f) Hu sal avede teste af e forsel på to variaser fra bose side 9. Hu er ødt til at atage, at de to stiprøver er uafhægige og simpelt tilfældigt udvalgte, og at elemetere i stiprøvere er ormalfordelte. Teststatistie er: F som er F-fordelt med ( -, -) frihedsgrader uder H 0. g) Nulhypotese er: H 0 : σ = σ, mes alterativhypotese er: H : σ σ. h) De ritise værdier ved et 0% sigifiasiveau fides som 5% og 95% fratilere fra F- fordelige med (49, 4) frihedsgrader. Disse er: 0,6 og,65 (fra Excel). i) Teststatistie bereges til: 86,8 F 0,608 4,7 Hu a altså lige aurate foraste H 0. Havde teste derimod været eeltsidet, havde hu sullet avede 0% fratile som de ritise værdi, og hu ville derfor ie have uet foraste H 0.

Opgave 6 a) Da ma sal teste om flere middelværdier er es avedes variasaalyse fra bose side 6. b) Teste forudsætter, at elemetere i de tre stiprøver er ormalfordelte, og at stiprøvere er simpelt tilfældigt udvalgt. c) Nulhypotese og alterativhypotese er: H : 0 H :Midst é er ie som de adre d) Teststatistie er: TR / K F E / K som er F-fordelt med (K-, -K) frihedsgrader uder H 0, hvor K er atal middelværdier, vi tester, og er det samlede atal observatioer. Ved e test på et 5% sigifiasiveau fides de ritise værdi derfor som 95% fratile fra F-fordelige med (-, 95+5+08-) = (, 5) frihedsgrader, som er,0. e) Værdie af teststatistie udreges til: TR E,,05 95 4,5,05 5,44,05 /,95 4,5 5,4408,05 95 5 08 94,97 4 4,07 4,5 978,7 TR K 6,/ F,96 E / K 978,7 / 5 og dermed a H 0 afvises, idet de ritise værdi er,0. 08 6,