Vejledende løsninger kapitel 9 opgaver



Relaterede dokumenter
Vejledende løsninger kapitel 8 opgaver

Bilag 1: Skanparametre Cerebrum Axial

Løsninger til kapitel 14

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 11: Kapitel 11: Regressionsanalyse

Løsninger til kapitel 15. størrelsen i kvadratmeter, X. en dummy-variabel, som indikerer om der er havudsigt eller ej, så er modellen

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Kapitel 11 Lineær regression

Konfidensintervaller og Hypotesetest

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Tema. Dagens tema: Indfør centrale statistiske begreber.

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Vejledende besvarelser til opgaver i kapitel 14

1 Multipel lineær regression

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

1 Multipel lineær regression

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Flemmings Maplekursus 1. Løsning af ligninger

MAT A HHX FACITLISTE TIL KAPITEL 8. Øvelser. Øvelse 1 Graf tegnes med CAS. Øvelse 2. Bedste rette linie: Øvelse 3. Øvelse 4.

Statistik II 1. Lektion. Analyse af kontingenstabeller

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Løsning til eksamen d.27 Maj 2010

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Multipel Lineær Regression

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Statistik II 4. Lektion. Logistisk regression

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Løsning til opgave 7, 9, 10 og 11C Matematik B Sommer 2014

Perspektiver i Matematik-Økonomi: Linær regression

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Kvantitative metoder 2

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Appendiks Økonometrisk teori... II

Eksamen i Statistik for biokemikere. Blok

1 Hb SS Hb Sβ Hb SC = , (s = )

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Opgaver i lineær regression

c) For, er, hvorefter. Forklar.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Personlig stemmeafgivning

2 Logaritme- og eksponentialfunktion 6

Kapitel , altså 360. Hvad er matematik? 1 ISBN

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Peter Harremoës Matematik A med hjælpemidler 15. december 2016 = 25 = x = = 10 2 =

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Analysenavn: D-Bilirubin NPU: 17194

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Statistisk modellering og regressionsanalyse

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Peter Harremoës Mat A eksamen med hjælpemidler 21. april 2014

Module 3: Statistiske modeller

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

Modul 11: Simpel lineær regression

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Løsning eksamen d. 15. december 2008

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Module 4: Ensidig variansanalyse

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Modul 12: Regression og korrelation

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

SUPPLERENDE AKTIVITETER GYMNASIEAKTIVITETER

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Vejledning til GYM17 Copyright Adept Nordic 2013

Transkript:

KAPITEL 9 OPGAVE 1 a) Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H 1 : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Ny metode Gammel metode Sum Antal enheder med fejl 11 6 17 Antal enheder uden fejl 212 191 403 Sum 223 197 420 Forventede værdier Ny metode Gammel metode Sum Antal enheder med fejl 9,03 7,97 17 Antal enheder uden fejl 213,97 189,03 403 Sum 223 197 420 Bidrag til teststørrelsen Side 1

Ny metode Gammel metode Sum Antal enheder med fejl 0,43 0,49 0,92 Antal enheder uden fejl 0,02 0,02 0,04 Sum 0,45 0,51 0,96 Resultat Frihedsgrader 1 Teststørrelse 0,96 p-værdi 0,327430787 H 0 accepteres b) Nej Side 2

OPGAVE 2 a) Estimeret andel 0,05 Nedre grænse 0,039321 Øvre grænse 0,060679 b) Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H 1 : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Overskred hastighed Overskred ikke hastighed Sum Sønderjylland 80 920 1000 Flensborg 35 815 850 Sum 115 1735 1850 Forventede værdier Overskred hastighed Overskred ikke hastighed Sum Sønderjylland 62,16 937,84 1000 Flensborg 52,84 797,16 850 Sum 115 1735 1850 Side 3

Bidrag til teststørrelsen Overskred hastighed Overskred ikke hastighed Sum Sønderjylland 5,12 0,34 5,46 Flensborg 6,02 0,40 6,42 Sum 11,14 0,74 11,88 Resultat Frihedsgrader 1 Teststørrelse 11,88 p-værdi 0,000567675 H 0 forkastes, dvs. der er forskel. Andelen er mindst i Flensborg Side 4

OPGAVE 3 Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H A : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Søjle 1 Søjle 2 Søjle 3 Sum Række 1 114 32 18 164 Række 2 12 226 102 340 Række 3 10 132 146 288 Sum 136 390 266 792 Forventede værdier Søjle 1 Søjle 2 Søjle 3 Sum Række 1 28,16 80,76 55,08 164 Række 2 58,38 167,42 114,19 340 Række 3 49,45 141,82 96,73 288 Sum 136 390 266 792 Bidrag til teststørrelsen Søjle 1 Søjle 2 Søjle 3 Sum Række 1 261,64 29,44 24,96 316,04 Side 5

Række 2 36,85 20,49 1,30 58,65 Række 3 31,48 0,68 25,10 57,26 Sum 329,97 50,61 51,36 431,94 Resultat Frihedsgrader 4 Teststørrelse 431,94 p-værdi 3,47726E-92 H 0 forkastes, dvs. rygning har indflydelse Side 6

OPGAVE 4 Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H A : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Højst 3 rammer Mellem 4 og 9 rammer Over 9 rammer Sum Over 50 km fra grænsen 20 15 10 45 Under 50 km fra grænsen 10 5 3 18 Sum 30 20 13 63 Forventede værdier Højst 3 rammer Mellem 4 og 9 rammer Over 9 rammer Sum Over 50 km fra grænsen 21,43 14,29 9,29 45 Under 50 km fra grænsen 8,57 5,71 3,71 18 Sum 30 20 13 63 Bidrag til teststørrelsen Højst 3 Mellem 4 og 9 Over 9 Sum Side 7

rammer rammer rammer Over 50 km fra grænsen 0,10 0,04 0,05 0,19 Under 50 km fra grænsen 0,24 0,09 0,14 0,46 Sum 0,33 0,13 0,19 0,65 Resultat Frihedsgrader 2 Teststørrelse 0,65 p-værdi 0,722295814 Der er ingen sammenhæng Side 8

OPGAVE 5 Denne opgave skal løses ved at finde oplysninger på www.dst.dk a) Her skal eleverne finde ud af, hvor mange personer, der er i 9. klasse evt. 10 klasse i 2009 0g 2010 for at få andelene, der har påbegyndt en gymnasial uddannelse i de to år. b) Som i sp. a, hvor der skal findes ud af antallet af mænd og kvinder i de to år i 9. og 10. klasse c) Som i sp. b Side 9

OPGAVE 6 Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H A : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier BYGGA KONKURRENTER Sum 18-25 20 2 22 26-33 54 8 62 34-41 57 13 70 42-49 40 15 55 50-60 16 8 24 0VER 60 13 4 17 Sum 200 50 250 Forventede værdier BYGGA KONKURRENTER Sum 18-25 17,60 4,40 22 26-33 49,60 12,40 62 34-41 56,00 14,00 70 Side 10

42-49 44,00 11,00 55 50-60 19,20 4,80 24 0VER 60 13,60 3,40 17 Sum 200 50 250 Bidrag til teststørrelsen BYGGA KONKURRENTER Sum 18-25 0,33 1,31 1,64 26-33 0,39 1,56 1,95 34-41 0,02 0,07 0,09 42-49 0,36 1,45 1,82 50-60 0,53 2,13 2,67 0VER 60 0,03 0,11 0,13 Sum 1,66 6,64 8,29 Resultat Frihedsgrader 5 Der er ingen forskel i aldersfordelingen Teststørrelse 8,29 p-værdi 0,140736484 OPGAVE 7 Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H A : Der er afhængighed (sammenhæng) i kontingenstabellen Side 11

Observerede værdier A B C Sum Københavnere 48 16 36 100 Sønderjyder 20 23 32 75 Sum 68 39 68 175 Forventede værdier A B C Sum Københavnere 38,86 22,29 38,86 100 Sønderjyder 29,14 16,71 29,14 75 Sum 68 39 68 175 Bidrag til teststørrelsen A B C Sum Københavnere 2,15 1,77 0,21 4,13 Sønderjyder 2,87 2,36 0,28 5,51 Sum 5,02 4,14 0,49 9,65 Resultat Frihedsgrader 2 Teststørrelse 9,65 p-værdi 0,008040387 Der er ingen forskel. Side 12

OPGAVE 8 a) Udarbejd en afbildning af y = livvidde og x = legemshøjde 85 80 Livvidde i cm 75 70 65 y = 0,424 x + 0,627 R 2 = 0,474 60 150 160 170 180 190 200 Legemshøjde i cm Det ser rimeligt ud, at lave en ret linje. R 2 er dog under 50 % Test for hældning Hypoteser (tosidet test) H 0 : a = a 0 = 0 H 1 : a 0 Input Stikprøvestørrelse 9 Side 13

Hældning 0,424401 Standardfejl 0,168912 Nul-værdi 0 Resultat Teststørrelse 2,512553 p-værdi 0,040246 Hældningskoefficienten er forskellig fra 0, da p værdien er under 0,05 b) se grafen c) a = 0,424 betyder, at for hver 1 cm højden stiger, vil livvidden øges med 0,424 cm Side 14

OPGAVE 9 a) r 2 = 0,281354 y = 0,275862 + 0,862069x b) r 2 = 0,42496 y = 0,966555 + 0,73913x c) r 2 = 0,411261 y = 0-0,44318 + 0,046023x d) stil (sp. b) har størst forklaringsgrad (der er dog ikke stor forskel i forhold til modellen i sp. c holdbarhed) OPGAVE 10 a) Komfort: Hypoteser (tosidet test) H 0 : a = 0 H1 a 0 Input Stikprøvestørrelse 13 Hældning 0,862069 Standardfejl 0,41541 Nul-værdi 0 Resultat Teststørrelse 2,075226 p-værdi 0,062209 Side 15

Der er ingen lineær sammenhæng Stil: Test for hældning Hypoteser (tosidet test) H 0 : b = b 0 H A : b b 0 Input Stikprøvestørrelse 13 Hældning 0,73913 Standardfejl 0,258426 Nul-værdi 0 Resultat Teststørrelse 2,860127 p-værdi 0,015513 Der er lineær sammenhæng Holdbarhed Test for hældning Hypoteser (tosidet test) H 0 : a = 0 Side 16

H 1 : a 0 Input Stikprøvestørrelse 13 Hældning 0,946023 Standardfejl 0,341278 Nul-værdi 0 Resultat Teststørrelse 2,772 p-værdi 0,018162 Der er lineær sammenhæng c) Det har stil, som dermed også har den største r 2 Side 17

OPGAVE 11 a) 250 maksimalpuls 200 150 100 50 0 0 20 40 60 80 personens alder b) Y = 227,760483 1,03511X a = - 1,03511 betyder at hvis personen bliver et år ældre falder pulsen med 1,03511 c) 196,71079 d) 155,30639 (Her extrapoleres) OPGAVE 12 RESUMEOUTPUT Regressionsstatistik Multipel R 0,887967 R-kvadreret 0,788486 Justeret R-kvadreret 0,762046 Standardfejl 7,213541 Side 18

Observationer 10 ANAVA fg SK MK F Signifikans F Regression 1 1551,819 1551,819 29,8225 0,000601 Residual 8 416,2813 52,03517 I alt 9 1968,1 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring 182,3174 25,85024 7,052832 0,000107 122,7066 241,9281 y = personens maksimale puls -0,76174 0,139488-5,461 0,000601-1,0834-0,44008 OPGAVE 13 a) RESUMEOUTPUT Regressionsstatistik Multipel R 0,99681535 R-kvadreret 0,993640842 Justeret R- kvadreret 0,99236901 Standardfejl 0,348875745 Observationer 7 ANAVA fg SK MK F Signifikans F Side 19

Regression 1 95,09143 95,09143 781,2676 1,1E-06 Residual 5 0,608571 0,121714 I alt 6 95,7 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring 29,98571429 0,607857 49,33023 6,47E-08 28,42317 31,54826 km/time - 0,184285714 0,006593-27,9512 1,1E-06-0,20123-0,16734 b) 6,028571 c) 108,4496 OPGAVE 14 Både ud fra konfidensintervallet for hældningen og p værdien forkastes H 0, dvs. der er lineær sammenhæng. Side 20

OPGAVE 15 RESUMEOUTPUT Regressionsstatistik Multipel R 0,819299 R-kvadreret 0,671251 Justeret R- kvadreret 0,643856 Standardfejl 2,069666 Observationer 14 ANAVA fg SK MK F Signifikans F Regression 1 104,9549 104,9549 24,50205 0,000336 Residual 12 51,4022 4,283517 I alt 13 156,3571 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring -1,41076 2,132886-0,66143 0,520834-6,05792 3,236402 Antal stk. 0,260019 0,05253 4,949955 0,000336 0,145567 0,374472 a) a = 0,26 er grænseomkostninger eller variable enhedsomkostninger b = - 1,1076 har ingen fortolkning her b) R- kvadreret 0,671251 Side 21

c) x = 65 stk 15,4905 x = 45 stk 10,29011 OPGAVE 16 Udfra konfidensintervallet kan gromk godt være 300, da a = 0,3 er indeholdt i konfidensintervallet. Side 22

OPGAVE 17 RESUMEOUTPUT Regressionsstatistik Multipel R 0,951456 R-kvadreret 0,905268 Justeret R- kvadreret 0,891735 Standardfejl 95,08084 Observationer 9 ANAVA fg SK MK F Signifikans F Regression 1 604735 604735 66,892752 7,913E-05 Residual 7 63282,57 9040,366 I alt 8 668017,6 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring 412,5817 76,24858 5,411009 0,0009967 232,2825 592,881 x 1,325913 0,162116 8,178799 7,913E-05 0,9425698 1,709256 b) hvis antallet af solgte billetter 10 dage før stiger med 1, vil det endelige antal solgte billetter stige med 1,32 c) se udskriften d) 1340,721 dvs. 1341 Side 23

OPGAVE 18 Ud fra kondidensintervallet i opgave 17 accepteres hypotesen Side 24