(studienummer) (underskrift) (bord nr)

Relaterede dokumenter
Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

(studienummer) (underskrift) (bord nr)

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

(studienummer) (underskrift) (bord nr)

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Forelæsning 11: Kapitel 11: Regressionsanalyse

(studienummer) (underskrift) (bord nr)

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Løsning eksamen d. 15. december 2008

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

(studienummer) (underskrift) (bord nr)

Løsning til eksamen d.27 Maj 2010

(studienummer) (underskrift) (bord nr)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Klasseøvelser dag 2 Opgave 1

Løsning til eksaminen d. 14. december 2009

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Danmarks Tekniske Universitet Side?? af 20 sider

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Danmarks Tekniske Universitet Side 1 af 19 sider

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Normalfordelingen. Statistik og Sandsynlighedsregning 2

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

1 Hb SS Hb Sβ Hb SC = , (s = )

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Opgavebesvarelse, brain weight

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Konfidensintervaller og Hypotesetest

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

(studienummer) (underskrift) (bord nr)

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Eksamen i Statistik for biokemikere. Blok

1 Regressionsproblemet 2

Reeksamen i Statistik for Biokemikere 6. april 2009

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

En Introduktion til SAS. Kapitel 5.

Opgaver til kapitel 3

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Løsning til eksaminen d. 29. maj 2009

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Appendiks Økonometrisk teori... II

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

Tema. Dagens tema: Indfør centrale statistiske begreber.

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Multipel Lineær Regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget?

Kapitel 12 Variansanalyse

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Test nr. 6 af centrale elementer 02402

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Anvendt Statistik Lektion 8. Multipel Lineær Regression

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Multiple choice opgaver

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Vejledende løsninger kapitel 8 opgaver

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Transkript:

Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 11 opgaver. Besvarelserne af multiple choice spørgsmålene anføres ved at udfylde skemaet på forsiden (denne side), med numrene på de svarmuligheder, du mener er de korrekte. Et forkert svar kan rettes ved at sværte det forkerte svar over og anføre det rigtige i stedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end ét nummer ved et spørgsmål, betragtes spørgsmålet som ubesvaret. Kladde, mellemregninger eller andet tillægges ingen betydning, kun svarene i tabellen tæller. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. Ubesvarede spørgsmål eller et 6-tal (svarende til ved ikke ) giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Opgave I.1 I.2 I.3 I.4 II.1 II.2 II.3 II.4 II.5 III.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 2 5 2 5 1 4 5 3 4 2 Opgave III.2 III.3 IV.1 IV.2 V.1 V.2 V.3 VI.1 VI.2 VI.3 Spørgsmål (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar 5 1 1 4 5 1 3 5 2 2 Opgave VII.1 VII.2 VIII.1 VIII.2 VIII.3 IX.1 IX.2 X.1 XI.1 XI.2 Spørgsmål (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar 5 1 3 2 4(3) 4 1 4 (1) 3 4 Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 22; blad lige om og se, at den er der. Fortsæt på side 2 1

Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I Et firma overvejer at lave en reklamekampagne for forskellige typer kiks, der har et særlig højt indhold af fiber, og derfor menes velegnet som slankeprodukt. Desværre viser det sig, at kiksene kan medføre ubehag, blandt andet sure opstød. I et indledende forsøg har man undersøgt tre forskellige typer kiks, bran, fibo og gum. For hver type af kiks har 50 forsøgspersoner svaret på, hvorvidt man fik sure opstød efter at have spist kiksen. I alt 150 personer indgik i undersøgelsen. Resultaterne fra forsøget er givet i nedenstående tabel (hvor eksempelvis de 50 forsøgspersoner for bran fordelte sig med 3, der havde høj grad, 9 der havde middel, 16 der havde lav og 22 der havde ingen grad af opstød): Antal Grad af opstød personer høj middel lav ingen I alt bran 3 9 16 22 50 fibo 4 7 16 23 50 gum 19 12 10 9 50 I alt 26 28 42 54 150 Spørgsmål I.1 (1): Betragt alene tallene for bran. Andelen af personer i populationen, som slet ikke får sure opstød af bran kaldes nu p. 95% konfidensintervallet for p bliver: 1 0.5 ± 1.96 0.5 0.5/50 2 0.44 ± 1.96 0.44 0.56/50 3 50/4 ± 1.96 ((3 12.5) 2 + (9 12.5) 2 + (16 12.5) 2 + (22 12.5) 2 )/50 4 50/4 ± t 0.025 (49) ((3 12.5) 2 + (9 12.5) 2 + (16 12.5) 2 + (22 12.5) 2 )/50 5 0.44 ± t 0.05 (49) 0.44 0.56/50 Fortsæt på side 3 2

Spørgsmål I.2 (2): Betragt alene tallene for gum. Andelen af personer i populationen, som slet ikke får sure opstød af gum kaldes nu p. Med udgangspunkt i det bedste gæt på p i det foreliggende materiale, hvor mange personer skal man omtrent undersøge, hvis man i en ny undersøgelse ønske at kende p med en præcision svarende til et 99%-konfidensinterval på plus/minus 4%-point? 1 112 personer 2 835 personer 3 600 personer 4 423 personer 5 612 personer Spørgsmål I.3 (3): Betragt hele talmaterialet. Den kritiske værdi for det relevante test (på niveau α = 0.05) for hypotesen om, at der ingen forskel er mellem de tre typer af kiks på fordelingen af personer hen over de fire svarkategorier, er: 1 F 0.05 (2, 6) = 5.14 2 χ 2 0.05 (6) = 12.592 3 F 0.05 (2, 3) = 9.55 4 χ 2 0.05 (1) = 3.841 5 z 0.025 = 1.960 Fortsæt på side 4 3

Betragt følgende akkumulerede tabel: Antal Grad af opstød personer høj, middel eller lav ingen I alt bran/fibo 55 45 100 gum 41 9 50 I alt 96 54 150 Spørgsmål I.4 (4) Andelen af personer i populationen, som slet ikke får sure opstød af bran eller fibo kaldes nu p 1. Andelen af personer i populationen, som slet ikke får sure opstød af gum kaldes p 2. Vi ønsker at teste hypotesen: p 1 = p 2. Hvilken af følgende teststørrelser er et relevant test for dette? 1 (45 + 55 + 41 + 9) 2 /(96 + 54 + 100 + 50 + 150) 2 (55 45)2 50 + (41 9)2 25 + (96 54)2 75 + (100 50)2 75 3 (55 45) 2 + (41 9) 2 + (100 50) 2 + (96 54) 2 4 45 54 9 54 54 96 96 150 ( 1 96 + 1 54 ) 5 45 100 9 50 54 150 96 150 ( 1 100 + 1 50 ) Fortsæt på side 5 4

Opgave II I et idrætsstudie ønsker man at undersøge, om der er en forskel i energiforbrug for forskellige typer af træning. I studiet har man (for en enkelt person) målt energiforbruget for 10 løbeture af 30 minutter og 10 cykelture af 30 minutter. Målingerne, angivet i kcal, er givet i nedenstående tabel: Løbeture Cykelture 314 294 340 317 331 317 333 310 329 327 322 300 332 293 330 321 338 307 325 304 Følgende R-kode blev kørt: x1=c(314,340,331,333,329,322,332,330,338,325) x2=c(294,317,317,310,327,300,293,321,307,304) var(x1) var(x2) t.test(x1,x2,var.equal=t) t.test(x1,x2,var.equal=t,pair=t,mu=20) med følgende resultater: Fortsæt på side 6 5

> var(x1) [1] 57.82222 > var(x2) [1] 132 > t.test(x1,x2,var.equal=t) Two Sample t-test data: x1 and x2 t = 4.6823, df = 18, p-value = 0.0001855 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 11.24658 29.55342 sample estimates: mean of x mean of y 329.4 309.0 > t.test(x1,x2,var.equal=t,pair=t,mu=20) Paired t-test data: x1 and x2 t = 0.1209, df = 9, p-value = 0.9064 alternative hypothesis: true difference in means is not equal to 20 95 percent confidence interval: 12.91852 27.88148 sample estimates: mean of the differences 20.4 Spørgsmål II.1 (5): Hvad er det mest rigtige svar på spørgsmålet: Er der forskel i middelenergiforbrug mellem de to typer af aktiviteter? (Både konklusion og argument skal være passende) 1 Ja, der er forskel, idet den relevante P-værdi er omkring 0.0002 2 Nej, der er ikke forskel, idet den relevante P-værdi er omkring 0.0002 3 Ja, der er forskel, idet den relevante P-værdi er omkring 0.91 4 Nej, der er ikke forskel, idet den relevante P-værdi er omkring 0.09 5 Ja, der er forskel, idet 20.4 er større end 20 Fortsæt på side 7 6

Spørgsmål II.2 (6): Vi ønsker at teste hypotesen (på niveau α = 0.10) om, at varianserne i de to grupper er ens. Hvad er den relevante teststørrelse, her kaldet Q, og tilhørende kritiske værdi? 1 Q = 20.4 2 (132+57.82)/2 med kritisk værdi: 1.962 2 Q = 20.4 94.91/10 med kritisk værdi: 1.96 3 Q = 4 Q = 132 57.82 132 57.82 med kritisk værdi: 3.841 med kritisk værdi: 3.18 5 Q = 57.82 132 med kritisk værdi: 4.85 Betragt i resten af opgaven kun data for cykelturene. Spørgsmål II.3 (7): Hvad er henholdsvis nedre kvartil, median og øvre kvartil for disse data? (Det antages, at lærebogens definitioner anvendes. Disse adskiller sig en anelse fra R s definitioner.) 1 77, 232, 309 2 293, 308.5, 327 3 286, 309, 332 4 298, 309, 320 5 300, 308.5, 317 Fortsæt på side 8 7

Spørgsmål II.4 (8): Kald det sande middelenergiforbrug ved cykeltturene for µ. Et 99%- konfidensinterval for µ er: 1 0 ± 309 132/9 2 309 ± 1.96 132/10 3 309 ± 3.250 132/10 4 309 ± 2.326 132/9 5 309 ± 2.821 132/10 Spørgsmål II.5 (9): Et nyt studie i energiforbrug ved cykelture planlægges. Der ønskes et 95%-konfidensinterval for µ med en samlet bredde på 8kCal. Hvor mange cykelture skal omtrent foretages for at opnå denne præcision? 1 Omtrent 62 2 Omtrent 90 3 Omtrent 1046 4 Omtrent 32 5 Omtrent 3 Fortsæt på side 9 8

Opgave III Biler bliver crash testet ved Euro NCAP. I nedenstående tabel ses resultaterne for 18 biler, 6 inden for hver af tre biltyper. Tallet angiver en rating, som egentlig er en procent, men som her betragtes som en kvantitativ måling. Supermini Lille familie Stor familie 78 85 84 74 84 77 76 76 79 71 80 81 74 74 70 68 84 79 Gennemsnit 73.50 80.50 78.33 Varians 12.70 21.50 22.27 Det oplyses at 3 6 (y ij ȳ) 2 = 436.44 og i=1 j=1 3 6 (y ij ȳ i ) 2 = 282.33, i=1 j=1 hvor y ij er målingen for den j te bil inden for den i te type, i = 1, 2, 3 og j = 1,..., 6. Den sædvanlige model for denne situation tænkes anvendt. Spørgsmål III.1 (10): Estimatet for variansen σ 2 bliver: 1 436.44/18 2 282.33/15 3 (436.44 282.33)/15 4 (436.44 282.33)/18 5 282.33/3 Fortsæt på side 10 9

Spørgsmål III.2 (11): Vi ønsker at teste for forskel i middelrating på biltyperne. Den relevante teststørrelse kaldes nu Q. Det mest korrekte formulerede resultat af dette test er: 1 Ja, der er forskel idet Q = 1.55 med en P-værdi over 0.05 2 Nej, der er ikke forskel idet Q = 1.29 med en P-værdi over 0.05 3 Nej, der er ikke forskel idet Q = 1.55 med en P-værdi over 0.05 4 Ja, der er forskel idet Q = 4.1 med en P-værdi under 0.001 5 Ja, der er forskel idet Q = 4.1 med en P-værdi under 0.05 Spørgsmål III.3 (12): Det bedste 95% konfidensinterval for forskellen mellem typerne Lille familie og Supermini er givet ved: 1 7 ± 2.131 6.274 2 7 ± 1.96 6.274 3 7 ± 2.101 3.425 4 7 ± 2.101 8.082 5 7 ± 1.96 3.425 Fortsæt på side 11 10

Opgave IV I et forsøg fik man følgende 20 målinger: 4.3 3.1 1.9 4.9 4.9 3.8 6.4 3.1 1.8 1.3 3.7 2.8 6.8 2.1 9.1 6.2 1.9 4.1 1.7 6.5 med gennemsnit x = 4.02 mm og spredning s = 2.121 mm. Spørgsmål IV.1 (13): Vi ønsker at teste hypotesen H 0 : σ 2 = 4 mod H 1 : σ 2 > 4 på et 5% signifikansniveau. Hvad bliver resultatet? (Både resultat og argument skal være i orden) 1 Accepter H 0 idet (19 2.121 2 )/4 < 30.144 2 Accepter H 0 idet 2.121 2 /4 < 30.144 3 Forkast H 0 idet 4 2 2.121 2 > 34.170 4 Forkast H 0 idet 4 2 2.121 2 > 32.852 5 Forkast H 0 idet 2.121 2 > 4 Spørgsmål IV.2 (14): I fortsættelse af undersøgelsen af σ vil man gerne konstruere et 99% konfidensinterval for spredningen σ. Dette interval bliver 1 19 2.121 32.852 < σ < 19 2.121 8.907 2 19 2.121 8.907 < σ < 19 2.121 32.852 3 20 2.121 2 8.907 < σ < 20 2.121 2 32.852 4 19 2.121 38.582 < σ < 19 2.121 6.844 5 19 2.1212 38.582 < σ < 19 2.121 6.844 Fortsæt på side 12 11

Opgave V Man ønsker at vurdere, om der er en sammenhæng mellem årlige atmosfæriske CO 2 -målinger og årlige globale gennemsnitstemperaturer. Følgende resultater for 10 år haves: 1 2 3 4 5 6 7 8 9 10 CO 2 (ppm) 314 317 320 326 331 339 346 354 361 369 Temp (Celcius) 13.90 14.00 13.90 14.10 14.00 14.30 14.10 14.50 14.50 14.40 Det oplyses, at middelværdi og spredning for temperatur-målingerne, x, er estimeret til: x = 14.17 s x = 0.23594 Middelværdi og spredning for CO 2 -målingerne, y, er estimeret til: ȳ = 337.7 s y = 19.276 Videre er (xi x)(y i y) = (13.90 14.17)(314 337.7) +... + (14.40 14.17)(369 337.7) = 36.51 I det følgende antages observationerne at kunne beskrives ved følgende model: y i = α + βx i + ɛ i hvor y i og x i er i te måling af henholdsvis CO 2 og temperatur. Leddet ɛ i er den tilfældige afvigelse for i te observation fra α + βx i. Afvigelserne ɛ i antages at have middelværdi 0 og varians σ 2. Et plot af data sammen med den bedste rette linie er: co2 320 330 340 350 360 370 13.9 14.0 14.1 14.2 14.3 14.4 14.5 temp Fortsæt på side 13 12

Spørgsmål V.1 (15): Estimatet for β bliver: 1 19.276 9 0.23594 2 = 38.47 2 19.2762 9 0.23594 2 = 741.6 3 337.7 14.17 = 23.83 4 337.7 9 0.23594 = 159.0 5 36.51 9 0.23594 2 = 72.87 Spørgsmål V.2 (16): 95% konfidensintervallet for hældningskoefficienten bliver: 1 ˆβ ( ) 1 ± 2.306 9 19.276 2 8 36.512 9 0.23594 2 9 2 0.235944 2 ˆβ ( ) 1 ± 2.228 10 9 19.276 2 36.512 9 0.23594 2 3 ˆβ ( ) 1 ± 2.306 19.276 2 10 0.23594 2 4 ˆβ ± 2.228 0.23594/10 5 ˆβ ± 2.262 19.276/10 Spørgsmål V.3 (17): Hvor stor en del af variationen i CO 2 -målingerne kan forklares af temperatur-forskellene? 1 Omtrent 20% 2 Omtrent 50% 3 Omtrent 80% 4 Omtrent 90% 5 100% Fortsæt på side 14 13

Opgave VI Der foreligger data for tre forskellige metoder til at bestemme nogle personers reaktionshastighed på: (angivet i milisekunder) Metode 1 2 3 Person 1 105 112 115 Person 2 116 120 124 Person 3 156 158 164 Person 4 75 81 86 Person 5 66 71 72 Person 6 96 101 104 De samme 6 personer er altså blevet testet med alle tre metoder. En kørsel i R gav følgende output: (hvor 3 tal dog er erstattet af bogstaverne A, B og C.) > anova(lm(y~metode+person)) Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) Metode A 218.1 109.06 71.642 1.182e-06 *** Person B 15157.8 3031.56 1991.533 1.191e-14 *** Residuals C 15.2 1.52 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Spørgsmål VI.1 (18): Hvad er A, B og C? 1 A = 6, B = 3 og C = 15 2 A = 3, B = 6 og C = 18 3 A = 5, B = 2 og C = 10 4 A = 3, B = 5 og C = 15 5 A = 2, B = 5 og C = 10 Fortsæt på side 15 14

Spørgsmål VI.2 (19): Konklusionerne vedrørende mulige forskelle på personer og metoder kan kort opsummeres som: 1 Der er kun forskel på personer, ikke på metoder idet Person P-værdien er meget mindre en Metode P-værdien 2 Der er forskel på både personer og metoder, idet begge P-værdier er meget små 3 Der er kun forskel på metoder, ikke på personer idet Person P-værdien er meget mindre en Metode P-værdien 4 Der er ingen statistiske forskelle i datamaterialet, idet begge P-værdier er meget små og spredningen stor 5 Der er ingen statistiske forskelle i datamaterialet, idet spredningen er langt større end 0.05 Spørgsmål VI.3 (20): Antag, at kun metode 1 og 2 var blevet undersøgt, men nu med 12 personer, hvor alle 12 blev testet med begge metoder. Hvad ville det mest relevante test (blandt de angivne muligheder) være for hypotesen om ingen metodeforskel? 1 Et uafhængigt t-test med 22 frihedsgrader 2 Et parret t-test med 11 frihedsgrader 3 Et χ 2 -test med 1 frihedsgrad 4 Et F-test med frihedsgraderne 12 og 22 5 Et ensidet z-test. Fortsæt på side 16 15

Opgave VII En trick-terning er konstrueret så den har følgende sandsynligheder for de 6 mulige udfald: 1 er 2 er 3 er 4 er 5 er 6 er 0.1 0.1 0.1 0.2 0.2 0.3 Lad X være det tilfældige udfald af et enkelt kast med terningen. Kald middelværdien for X, µ og kald variansen for X, σ 2. Spørgsmål VII.1 (21): Lad nu Y være det samlede antal øjne i 50 kast med denne terning. Hvad er middelværdi og varians for Y? 1 E(Y ) = 50µ og V ar(y ) = 2500σ 2 2 E(Y ) = µ og V ar(y ) = σ 2 3 E(Y ) = 50 og V ar(y ) = σ 2 4 E(Y ) = µ og V ar(y ) = σ 2 /50 5 E(Y ) = 50µ og V ar(y ) = 50σ 2 Spørgsmål VII.2 (22): Hvad er µ og σ 2? 1 µ = 4.2 og σ 2 = 2.76 2 µ = 0.1667 og σ 2 = 0.00667 3 µ = 3.5 og σ 2 = 3.5 4 µ = 4.2 og σ 2 = 3.5 5 µ = 3.5 og σ 2 = 1/6 Fortsæt på side 17 16

Opgave VIII Otte forskellige fladskærms TV-apparater blev kvalitetsvurderet. I nedenstående tabel ses sammenhørende værdier for pris (i kr) og kvalitet (på en skala fra 0 til 100) 1 2 3 4 5 6 7 8 Pris (Kr) 11500 9000 12500 13500 10000 8500 7500 13500 Kvalitet 74 73 70 66 63 62 52 68 En kørsel i R gav følgende output: > summary(lm(tvpris~tvkval)) Call: lm(formula = tvpris ~ tvkval) Residuals: Min 1Q Median 3Q Max -2995.8-953.4-444.9 1377.1 2750.0 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -995.8 7449.6-0.134 0.898 tvkval 178.0 112.3 1.585 0.164 Residual standard error: 2113 on 6 degrees of freedom Multiple R-squared: 0.295, Adjusted R-squared: 0.1776 F-statistic: 2.511 on 1 and 6 DF, p-value: 0.1641 Spørgsmål VIII.1 (23): Korrelationskoefficienten mellem pris og kvalitet er: 1 r = 0.295 2 r = 0.54 3 r = 0.54 4 r = 0.295 5 r = 178.0 Fortsæt på side 18 17

Spørgsmål VIII.2 (24): Kan man statistisk påvise en sammenhæng mellem pris og kvalitet? (Både resultat og argument skal være i orden) 1 Nej, idet den relevante P-værdi er 0.898 2 Nej, idet den relevante P-værdi er 0.164 3 Ja, idet den relevante P-værdi er 0.1776 4 Nej, idet den relevante P-værdi er 0.295 5 Nej, idet afskæringen med y-aksen er 995.8 Spørgsmål VIII.3 (25): Hvad bør et tilsvarende fladskærms-tv med en kvalitet på 72 omtrent koste ifølge den estimerede model? 1 112.3 72 995.8 = 7090 2 9000 2500 = 6500 3 ȳ = 10750 4 178 72 995.8 = 11820 5 Ingen af ovenstående Fortsæt på side 19 18

Opgave IX I følgende tabel ses antallet af såkaldte challenges i en tennisturnering, der bruger det elektroniske instant replay system Hawk-Eye, opgjort efter køn af tennisspilleren og om den var berettiget eller ej: (Foklaring: En challenge af spilleren giver mulighed for øjeblikkeligt at se, om dommernes vurdering af en bold (inde/ude) er korrekt eller ej) Berettiget Ja Nej Kvinder 135 252 Mænd 209 295 Spørgsmål IX.1 (26): Et relevant test for om der er forskel på succes-sandsynligheden for kvinder og mænd er givet ved: (success er her defineret som en berettiget challenge, som altså igen betyder at spilleren fik påpeget en fejlagtig dommerkendelse) 1 (209 194.6)2 194.6 + (295 309.4)2 309.4 2 (135 149.4) 2 + (252 237.6) 2 3 (135 209) 2 + (252 295) 2 4 (135 149.4)2 149.4 + (252 237.6)2 237.6 + (209 194.6)2 194.6 + (295 309.4)2 309.4 5 135 209 252 295 Spørgsmål er: IX.2 (27): Et 95% konfidensinterval for kønsforskellen i succes-sandsynlighederne 1 0.066 ± 0.064 2 0.066 ± 0.054 3 0.066 ± 0.059 4 0.066 ± 0.050 5 0.066 ± 1.96 Fortsæt på side 20 19

Opgave X I en undersøgelse af holdninger til global opvarmning fik man følgende svar fra 1106 personer: Menneskeskabt Naturlig årsager Ved ikke/intet svar Kvinder 330 178 54 Mænd 340 152 52 Spørgsmål X.1 (28): Vi ønsker at teste hypotesen (på niveau α = 0.05) om, at der ikke er forskel på de to køns holdninger til den globale opvarmning. Hvad er den kritiske værdi for den relevante teststørrelse? 1 χ 2 0.05 (1) = 3.841 2 F 0.05 (1, 3) = 10.13 3 F 0.05 (2, 6) = 5.14 4 χ 2 0.05 (2) = 5.991 5 z 0.025 = 1.96 Fortsæt på side 21 20

Opgave XI Herunder ses et plot af fem sammenhørende (x,y)-værdier samt den bedste rette linie: y 6 7 8 9 10 1 2 3 4 5 I det følgende antages observationerne at kunne beskrives ved følgende model: x y i = α + βx i + ɛ i Leddet ɛ i er den tilfældige afvigelse for i te observation fra α + βx i. Afvigelserne ɛ i antages at have middelværdi 0 og varians σ 2 Spørgsmål XI.1 (29): Kun et sæt af følgende mulige estimater for de tre ukendte parametre i modellen kan være det rigtige. Hvilket er det? 1 ˆα = 0, ˆβ = 1 og ˆσ = 0.9 2 ˆα = 0, ˆβ = 1 og ˆσ = 2.5 3 ˆα = 4, ˆβ = 1 og ˆσ = 0.9 4 ˆα = 4, ˆβ = 1 og ˆσ = 2.5 5 ˆα = 1, ˆβ = 4 og ˆσ = 0 Fortsæt på side 22 21

Spørgsmål XI.2 (30): Den bedste rette linie ŷ i = a + bx i er den linie, der 1 gør 5 i=1 (y i a bx i ) mindst mulig 2 gør (b β) 2 + (a α) 2 størst mulig 3 gør 5 i=1 (y i ȳ) 2 mindst mulig 4 gør 5 i=1 (y i a bx i ) 2 mindst mulig 5 gør 5 i=1 (x i a by i ) 2 mindst mulig Slut på opgavesættet. 22