KAPITEL 9 OPGAVE 1 a) Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H 1 : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Ny metode Gammel metode Sum Antal enheder med fejl 11 6 17 Antal enheder uden fejl 212 191 403 Sum 223 197 420 Forventede værdier Ny metode Gammel metode Sum Antal enheder med fejl 9,03 7,97 17 Antal enheder uden fejl 213,97 189,03 403 Sum 223 197 420 Bidrag til teststørrelsen Side 1
Ny metode Gammel metode Sum Antal enheder med fejl 0,43 0,49 0,92 Antal enheder uden fejl 0,02 0,02 0,04 Sum 0,45 0,51 0,96 Resultat Frihedsgrader 1 Teststørrelse 0,96 p-værdi 0,327430787 H 0 accepteres b) Nej Side 2
OPGAVE 2 a) Estimeret andel 0,05 Nedre grænse 0,039321 Øvre grænse 0,060679 b) Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H 1 : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Overskred hastighed Overskred ikke hastighed Sum Sønderjylland 80 920 1000 Flensborg 35 815 850 Sum 115 1735 1850 Forventede værdier Overskred hastighed Overskred ikke hastighed Sum Sønderjylland 62,16 937,84 1000 Flensborg 52,84 797,16 850 Sum 115 1735 1850 Side 3
Bidrag til teststørrelsen Overskred hastighed Overskred ikke hastighed Sum Sønderjylland 5,12 0,34 5,46 Flensborg 6,02 0,40 6,42 Sum 11,14 0,74 11,88 Resultat Frihedsgrader 1 Teststørrelse 11,88 p-værdi 0,000567675 H 0 forkastes, dvs. der er forskel. Andelen er mindst i Flensborg Side 4
OPGAVE 3 Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H A : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Søjle 1 Søjle 2 Søjle 3 Sum Række 1 114 32 18 164 Række 2 12 226 102 340 Række 3 10 132 146 288 Sum 136 390 266 792 Forventede værdier Søjle 1 Søjle 2 Søjle 3 Sum Række 1 28,16 80,76 55,08 164 Række 2 58,38 167,42 114,19 340 Række 3 49,45 141,82 96,73 288 Sum 136 390 266 792 Bidrag til teststørrelsen Søjle 1 Søjle 2 Søjle 3 Sum Række 1 261,64 29,44 24,96 316,04 Side 5
Række 2 36,85 20,49 1,30 58,65 Række 3 31,48 0,68 25,10 57,26 Sum 329,97 50,61 51,36 431,94 Resultat Frihedsgrader 4 Teststørrelse 431,94 p-værdi 3,47726E-92 H 0 forkastes, dvs. rygning har indflydelse Side 6
OPGAVE 4 Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H A : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Højst 3 rammer Mellem 4 og 9 rammer Over 9 rammer Sum Over 50 km fra grænsen 20 15 10 45 Under 50 km fra grænsen 10 5 3 18 Sum 30 20 13 63 Forventede værdier Højst 3 rammer Mellem 4 og 9 rammer Over 9 rammer Sum Over 50 km fra grænsen 21,43 14,29 9,29 45 Under 50 km fra grænsen 8,57 5,71 3,71 18 Sum 30 20 13 63 Bidrag til teststørrelsen Højst 3 Mellem 4 og 9 Over 9 Sum Side 7
rammer rammer rammer Over 50 km fra grænsen 0,10 0,04 0,05 0,19 Under 50 km fra grænsen 0,24 0,09 0,14 0,46 Sum 0,33 0,13 0,19 0,65 Resultat Frihedsgrader 2 Teststørrelse 0,65 p-værdi 0,722295814 Der er ingen sammenhæng Side 8
OPGAVE 5 Denne opgave skal løses ved at finde oplysninger på www.dst.dk a) Her skal eleverne finde ud af, hvor mange personer, der er i 9. klasse evt. 10 klasse i 2009 0g 2010 for at få andelene, der har påbegyndt en gymnasial uddannelse i de to år. b) Som i sp. a, hvor der skal findes ud af antallet af mænd og kvinder i de to år i 9. og 10. klasse c) Som i sp. b Side 9
OPGAVE 6 Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H A : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier BYGGA KONKURRENTER Sum 18-25 20 2 22 26-33 54 8 62 34-41 57 13 70 42-49 40 15 55 50-60 16 8 24 0VER 60 13 4 17 Sum 200 50 250 Forventede værdier BYGGA KONKURRENTER Sum 18-25 17,60 4,40 22 26-33 49,60 12,40 62 34-41 56,00 14,00 70 Side 10
42-49 44,00 11,00 55 50-60 19,20 4,80 24 0VER 60 13,60 3,40 17 Sum 200 50 250 Bidrag til teststørrelsen BYGGA KONKURRENTER Sum 18-25 0,33 1,31 1,64 26-33 0,39 1,56 1,95 34-41 0,02 0,07 0,09 42-49 0,36 1,45 1,82 50-60 0,53 2,13 2,67 0VER 60 0,03 0,11 0,13 Sum 1,66 6,64 8,29 Resultat Frihedsgrader 5 Der er ingen forskel i aldersfordelingen Teststørrelse 8,29 p-værdi 0,140736484 OPGAVE 7 Goodness-of-fit test for uafhængighed i kontingenstabel Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H A : Der er afhængighed (sammenhæng) i kontingenstabellen Side 11
Observerede værdier A B C Sum Københavnere 48 16 36 100 Sønderjyder 20 23 32 75 Sum 68 39 68 175 Forventede værdier A B C Sum Københavnere 38,86 22,29 38,86 100 Sønderjyder 29,14 16,71 29,14 75 Sum 68 39 68 175 Bidrag til teststørrelsen A B C Sum Københavnere 2,15 1,77 0,21 4,13 Sønderjyder 2,87 2,36 0,28 5,51 Sum 5,02 4,14 0,49 9,65 Resultat Frihedsgrader 2 Teststørrelse 9,65 p-værdi 0,008040387 Der er ingen forskel. Side 12
OPGAVE 8 a) Udarbejd en afbildning af y = livvidde og x = legemshøjde 85 80 Livvidde i cm 75 70 65 y = 0,424 x + 0,627 R 2 = 0,474 60 150 160 170 180 190 200 Legemshøjde i cm Det ser rimeligt ud, at lave en ret linje. R 2 er dog under 50 % Test for hældning Hypoteser (tosidet test) H 0 : a = a 0 = 0 H 1 : a 0 Input Stikprøvestørrelse 9 Side 13
Hældning 0,424401 Standardfejl 0,168912 Nul-værdi 0 Resultat Teststørrelse 2,512553 p-værdi 0,040246 Hældningskoefficienten er forskellig fra 0, da p værdien er under 0,05 b) se grafen c) a = 0,424 betyder, at for hver 1 cm højden stiger, vil livvidden øges med 0,424 cm Side 14
OPGAVE 9 a) r 2 = 0,281354 y = 0,275862 + 0,862069x b) r 2 = 0,42496 y = 0,966555 + 0,73913x c) r 2 = 0,411261 y = 0-0,44318 + 0,046023x d) stil (sp. b) har størst forklaringsgrad (der er dog ikke stor forskel i forhold til modellen i sp. c holdbarhed) OPGAVE 10 a) Komfort: Hypoteser (tosidet test) H 0 : a = 0 H1 a 0 Input Stikprøvestørrelse 13 Hældning 0,862069 Standardfejl 0,41541 Nul-værdi 0 Resultat Teststørrelse 2,075226 p-værdi 0,062209 Side 15
Der er ingen lineær sammenhæng Stil: Test for hældning Hypoteser (tosidet test) H 0 : b = b 0 H A : b b 0 Input Stikprøvestørrelse 13 Hældning 0,73913 Standardfejl 0,258426 Nul-værdi 0 Resultat Teststørrelse 2,860127 p-værdi 0,015513 Der er lineær sammenhæng Holdbarhed Test for hældning Hypoteser (tosidet test) H 0 : a = 0 Side 16
H 1 : a 0 Input Stikprøvestørrelse 13 Hældning 0,946023 Standardfejl 0,341278 Nul-værdi 0 Resultat Teststørrelse 2,772 p-værdi 0,018162 Der er lineær sammenhæng c) Det har stil, som dermed også har den største r 2 Side 17
OPGAVE 11 a) 250 maksimalpuls 200 150 100 50 0 0 20 40 60 80 personens alder b) Y = 227,760483 1,03511X a = - 1,03511 betyder at hvis personen bliver et år ældre falder pulsen med 1,03511 c) 196,71079 d) 155,30639 (Her extrapoleres) OPGAVE 12 RESUMEOUTPUT Regressionsstatistik Multipel R 0,887967 R-kvadreret 0,788486 Justeret R-kvadreret 0,762046 Standardfejl 7,213541 Side 18
Observationer 10 ANAVA fg SK MK F Signifikans F Regression 1 1551,819 1551,819 29,8225 0,000601 Residual 8 416,2813 52,03517 I alt 9 1968,1 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring 182,3174 25,85024 7,052832 0,000107 122,7066 241,9281 y = personens maksimale puls -0,76174 0,139488-5,461 0,000601-1,0834-0,44008 OPGAVE 13 a) RESUMEOUTPUT Regressionsstatistik Multipel R 0,99681535 R-kvadreret 0,993640842 Justeret R- kvadreret 0,99236901 Standardfejl 0,348875745 Observationer 7 ANAVA fg SK MK F Signifikans F Side 19
Regression 1 95,09143 95,09143 781,2676 1,1E-06 Residual 5 0,608571 0,121714 I alt 6 95,7 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring 29,98571429 0,607857 49,33023 6,47E-08 28,42317 31,54826 km/time - 0,184285714 0,006593-27,9512 1,1E-06-0,20123-0,16734 b) 6,028571 c) 108,4496 OPGAVE 14 Både ud fra konfidensintervallet for hældningen og p værdien forkastes H 0, dvs. der er lineær sammenhæng. Side 20
OPGAVE 15 RESUMEOUTPUT Regressionsstatistik Multipel R 0,819299 R-kvadreret 0,671251 Justeret R- kvadreret 0,643856 Standardfejl 2,069666 Observationer 14 ANAVA fg SK MK F Signifikans F Regression 1 104,9549 104,9549 24,50205 0,000336 Residual 12 51,4022 4,283517 I alt 13 156,3571 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring -1,41076 2,132886-0,66143 0,520834-6,05792 3,236402 Antal stk. 0,260019 0,05253 4,949955 0,000336 0,145567 0,374472 a) a = 0,26 er grænseomkostninger eller variable enhedsomkostninger b = - 1,1076 har ingen fortolkning her b) R- kvadreret 0,671251 Side 21
c) x = 65 stk 15,4905 x = 45 stk 10,29011 OPGAVE 16 Udfra konfidensintervallet kan gromk godt være 300, da a = 0,3 er indeholdt i konfidensintervallet. Side 22
OPGAVE 17 RESUMEOUTPUT Regressionsstatistik Multipel R 0,951456 R-kvadreret 0,905268 Justeret R- kvadreret 0,891735 Standardfejl 95,08084 Observationer 9 ANAVA fg SK MK F Signifikans F Regression 1 604735 604735 66,892752 7,913E-05 Residual 7 63282,57 9040,366 I alt 8 668017,6 Koefficienter Standardfejl t-stat P-værdi Nedre 95% Øvre 95% Skæring 412,5817 76,24858 5,411009 0,0009967 232,2825 592,881 x 1,325913 0,162116 8,178799 7,913E-05 0,9425698 1,709256 b) hvis antallet af solgte billetter 10 dage før stiger med 1, vil det endelige antal solgte billetter stige med 1,32 c) se udskriften d) 1340,721 dvs. 1341 Side 23
OPGAVE 18 Ud fra kondidensintervallet i opgave 17 accepteres hypotesen Side 24