(studienummer) (underskrift) (bord nr)



Relaterede dokumenter
(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

(studienummer) (underskrift) (bord nr)

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Appendiks Økonometrisk teori... II

Løsning eksamen d. 15. december 2008

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Løsning til eksamen d.27 Maj 2010

(studienummer) (underskrift) (bord nr)

Forelæsning 11: Kapitel 11: Regressionsanalyse

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Konfidensintervaller og Hypotesetest

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

Side 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december Kursus navn og nr: Introduktion til Statistik, 02402

Klasseøvelser dag 2 Opgave 1

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Danmarks Tekniske Universitet Side 1 af 19 sider

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Eksamen i Statistik for biokemikere. Blok

(studienummer) (underskrift) (bord nr)

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Løsning til eksaminen d. 14. december 2009

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Multiple choice opgaver

Vejledende besvarelser til opgaver i kapitel 14

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Forelæsning 11: Envejs variansanalyse, ANOVA

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

To-sidet varians analyse

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

Danmarks Tekniske Universitet Side?? af 20 sider

Test nr. 4 af centrale elementer 02402

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Kapitel 7 Forskelle mellem centraltendenser

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Forelæsning 9: Inferens for andele (kapitel 10)

Vejledende løsninger kapitel 8 opgaver

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Skriftlig eksamen Science statistik- ST501

Kapitel 12 Variansanalyse

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Besvarelser til øvelsesopgaver i uge 6

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Test nr. 5 af centrale elementer 02402

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Personlig stemmeafgivning

Kapitel 12 Variansanalyse

Reeksamen i Statistik for Biokemikere 6. april 2009

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Epidemiologi og Biostatistik

(studienummer) (underskrift) (bord nr)

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Tema. Dagens tema: Indfør centrale statistiske begreber.

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

1 Hb SS Hb Sβ Hb SC = , (s = )

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Test nr. 6 af centrale elementer 02402

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Reeksamen i Statistik for biokemikere. Blok

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget?

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

MPH specialmodul Epidemiologi og Biostatistik

Løsninger til kapitel 9

Kapitel 11 Lineær regression

β 2 : forskel i skæring polymer 1 og 2. β 3 forskel i skæring polymer 1 og 3.

Transkript:

Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 10 opgaver. Besvarelserne af multiple choice spørgsmålene anføres ved at udfylde skemaet på forsiden (denne side), med numrene på de svarmuligheder, du mener er de korrekte. Et forkert svar kan rettes ved at sværte det forkerte svar over og anføre det rigtige i stedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end ét nummer ved et spørgsmål, betragtes spørgsmålet som ubesvaret. Kladde, mellemregninger eller andet tillægges ingen betydning, kun svarene i tabellen tæller. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. Ubesvarede spørgsmål eller et 6-tal (svarende til ved ikke ) giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Opgave I.1 I.2 I.3 I.4 II.1 II.2 II.3 III.1 III.2 III.3 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 2 1 1 5 4 5 4 1 3 Opgave III.4 III.5 III.6 IV.1 IV.2 IV.3 V.1 V.2 VI.1 VII.1 Spørgsmål (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar 5 1 5 2 2 3 4 3 5 1 Opgave VII.2 VII.3 VIII.1 VIII.2 VIII.3 IX.1 IX.2 X.1 X.2 X.3 Spørgsmål (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar 5 4 5 3 3 1 5 2 4 2 Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 20; blad lige om og se, at den er der. Fortsæt på side 2 1

Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I Følgende data er målinger af albumin i blod fra en gruppe af personer, bestående af 7 mænd og 8 kvinder. Endvidere er anført spredning og gennemsnit for mændene og kvinderne hver for sig: Albumin i blodprøver Gennemsnit Spredning Mænd 38 36 37 41 37 43 41 x 1 =39.0 s 1 =2.6458 Kvinder 45 39 41 44 47 46 44 42 x 2 =43.5 s 2 =2.6726 Spørgsmål I.1 (1): Det sædvanlige test på niveauα= 10% for, at antagelsen om samme varians i de to grupper er rimelig, er givet ved følgende teststørrelse og tilhørende kritisk værdi: 1 Teststørrelse: 2.6726 2 /5 2. Kritisk værdi: χ 2 0.05 (13) = 5.892 2 Teststørrelse: 2.6726/2.6458. Kritisk værdi: χ 2 0.05 (1) = 3.841 3 Teststørrelse: 2.6726/2.6458. Kritisk værdi: F 0.05 (8, 7) = 3.73 4 Teststørrelse: 2.6726 2 /2.6458 2. Kritisk værdi: F 0.05 (8, 7) = 3.73 5 Teststørrelse: 2.6726 2 /2.6458 2. Kritisk værdi: F 0.05 (7, 6) = 4.21 Spørgsmål I.2 (2): Man antager, at albuminindholdet i blod med god tilnærmelse er normalfordelt med en vis varians, σ 2, som er fælles for mændene og kvinderne i undersøgelsen. Der synes at være en vis systematisk middelforskel på indholdet af albumin hos mænd i forhold til indholdet hos kvinder. Angiv et 95% konfidensinterval for denne forskel: 1 4.5 ± 2.16 (1/15)(2.6458 2 +2.6726 2 )/2 2 4.5 ± 2.16 (1/7+1/8)(6 2.6458 2 +7 2.6726 2 )/13 3 4.5 ± 1.96 (1/7+1/8)(2.6458 2 +2.6726 2 )/2 4 4.5 ± 2.13 (1/7+1/8)(2.6458 2 +2.6726 2 )/2 5 4.5 ± 2.13 2.6458 2 /7+2.6726 2 /8 Fortsæt på side 3 2

Spørgsmål I.3 (3): Antag at kvindepopulationen, som stikprøven på 8 kvinder repræsenterer, består af 100000 kvinder. Med udgangspunkt i den estimerede fordeling for kvinderne, hvor mange kvinder i populationen vil man forvente har et albuminindhold i blodet på 48 eller derover? 1 Ca. 4611 2 Ingen 3 De fleste 4 Ca. 33 5 Ca. 100000/8 = 12500 Spørgsmål I.4 (4): I en ny undersøgelse af albuminindholdet hos mænd vil man gerne have et 99% konfidensinterval med en bredde på plus/minus 1. Hvor mange mænd skal man omtrent undersøge? (Antag at σ =2.65 er kendt) 1 n =2.576 2 2.65 2 47 2 n =[2.576 2 2.65 2 ]/2 23 3 n = 1 4 [2.5762 2.65 2 ] 12 4 n =[2.576 2.65]/0.1 68 5 n =[2.576 2 2.65 2 ]/0.1 466 Fortsæt på side 4 3

Opgave II Man ved, at CO 2 er af betydning for mikrobiel vækst. Små mængder kan stimulere vækst for nogle organismer, medens høje koncentrationer kan hæmme væksten. Følgende data er fra en foreløbig undersøgelse af effekten af CO 2 på væksten af Pseudomonas fragi, som er en organisme, som bl.a. er kendt for at ødelægge fødevarer. Den målte værdi er procentuel forøgelse af cellemængde efter en times vækst ved stuetemperatur i et bestemt vækstmedium baseret på et blodpræparat. Data er vist i følgende tabel: Følgende Splus kommando: anova(lm(x~treatm)) Indhold af CO 2 Lavt ca 30% Meget højt 50.8 45.3 31.6 44.3 41.1 27.2 48.5 32.8 23.3 49.5 37.5 30.1 48.6 40.4 19.8 56.3 34.2 21.4 gav følgende output, hvor 2 tal dog mangler (A og B): Analysis of Variance Table Response: x Df Sum Sq Mean Sq F value Pr(>F) treatm 2 1745.91 872.96 43.566 5.649e-07 *** Residuals A B 20.04 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Spørgsmål II.1 (5): Angiv det korrekte tal for B: 1 16 20.04 = 320.64 2 1745.91 872.96 = 872.95 3 1745.91/18 = 97.00 4 43.566/16 = 2.72 5 15 20.04 = 300.6 Fortsæt på side 5 4

Spørgsmål II.2 (6): Den kritiske værdi på niveauα= 1% for det sædvanlige hypotesetest i denne situation er givet ved: 1 F 0.01 (3, 16) = 5.29 2 F 0.01 (2, 16) = 6.23 3 z 0.005 =2.576 4 F 0.01 (2, 15) = 6.36 5 z 0.01 =2.326 Spørgsmål II.3 (7): Konklusionen vedrørende en eventuel forskel på de tre grupper, og det mest korrekte argument herfor, er givet ved: 1 Der findes mindst en signifikant gruppeforskel, idet P-værdien er større end 5% 2 Grupperne er ikke signifikant forskellige, idet P-værdien er særdeles lille 3 Grupperne er påvist ens, idet P-værdien er særdeles lille 4 Grupperne har forskellige varianser, idet P-værdien er mindre end 1% 5 Der findes mindst en signifikant gruppeforskel, idet P-værdien er særdeles lille Fortsæt på side 6 5

Opgave III Følgene data stammer fra et kalibreringseksperiment med et flourescensspektrometer med stoffet fluorescein (som er et stærkt fluorescerende stof). For de anførte koncentrationer er spektrometrets visning aflæst: Fluoresceinkonc., picogram/ml 0 3 6 9 12 15 18 Spektrometervisning 2.3 4.8 8.7 12.3 18.2 21.1 24.4 Kaldes visningerne y i og koncentrationerne x i er x =9.0 i (x i x) 2 /6=42.00 i (x i x)(y i y) = 325.20 y=13.1143 i (y i y) 2 /6=70.5381 Man ønsker at estimere en model af formen y i = α+β x i +ɛ i,hvorɛ i er en tilfældig afvigelse med middelværdi 0 (nul) og varians σ 2. Spørgsmål III.1 (8): Ved den sædvanlige estimeringsmetode finder man: (a er estimat for α og b er estimat for β) 1 a =0ogb=1.46 2 a = 56.57 og b =7.74 3 a =7.74 og b = 56.57 4 a =1.50 og b =1.29 5 a =13.11 og b =9.0 6 Ved ikke Spørgsmål III.2 (9): Man er også interesseret i at estimere spredningen σ. Det sædvanlige estimat for σ er: 1 σ =0.844 2 σ =0.713 3 σ =[70.5381 325.2/42]/7 4 σ = [70.5381 6 325.2 2 /(6 42)]/7 5 σ = [70.5381 6 325.2 2 /42]/5 Fortsæt på side 7 6

I et lignende forsøg fik man følgende resultater (altså IKKE de samme data, som vist ovenfor): Call: lm(formula = y2 ~ x2) Residuals: Min 1Q Median 3Q Max -4.11111-3.16444 0.08222 1.81222 5.24222 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 5.5178 2.1495 2.567 0.0372 * x2 5.4117 0.2257 23.972 5.59e-08 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 3.497 on 7 degrees of freedom Multiple R-squared: 0.988, Adjusted R-squared: 0.9862 F-statistic: 574.7 on 1 and 7 DF, p-value: 5.591e-08 Det oplyses, at gennemsnittet af x-værdierne nu er 8 og variansen for x-værdierne er 30. Spørgsmål III.3 (10): Et 95% konfidensinterval for hældningskoefficienten i den lineære model er: 1 5.52 ± 1.96 2.15 2 5.52 ± 2.15 3 4.88 <β<5.95 4 5.41 ± 1.96 0.2257 5 5.41 ± 2.36 3.497 Spørgsmål konklusion: III.4 (11): Hypotesetestet på niveau α = 0.1% for hypotesen: β = 0 får følgende 1 Hypotesen forkastes, idet P-værdien er større end α 2 Hypotesen accepteres, idet P-værdien er mindre end α 3 Hypotesen accepteres, idet korrelationen er tæt på1 4 Hypotesen accepteres, idet P-værdien er større end α 5 Hypotesen forkastes, idet P-værdien er mindre end α Fortsæt på side 8 7

Spørgsmål III.5 (12): Der foretages en ny x-måling: x ny = 9. Hvad er 95% prædiktionsgrænserne for denne værdi? 1 (5.5178 + 5.4117 9) ± 2.365 3.497 2 (1 + 1 9 + 1 240 ) 2 (5.4117 9) ± 1.96 3.497 2 (1 + 1 9 + 1 30 ) 3 (5.4117 9) ± 2.365 3.497 2 ( 1 9 + 1 30 ) 4 (5.5178 + 5.4117 9) ± 2.365 3.497 2 ( 1 9 + 1 240 ) 5 (5.5178 + 5.4117 9) ± 1.96 3.497( 1 9 + 1 240 ) Spørgsmål III.6 (13): De9målinger blev udført i rækkefølge efter koncentrationsniveauet, startende med den laveste koncentration. De 9 afvigelser (residualer) fra modellen blev (i samme ordnede rækkefølge): 0.08 0.66-3.16 1.81-4.11 3.87 5.24-0.98-3.40 Kan det påvises at disse tal ikke er tilfældige? (Både svar og argument skal være i orden) (Brug det sædvanlige test selvom antallet af observationer egentlig ikke er stort nok) 1 Nej, idet 2 P (t > 0.001 3.27 ) 1.00, hvor t er t-fordelt med 8 frihedsgrader 2 Ja, idet 2 P (t > 6 1.309 1.00, hvor t er t-fordelt med 8 frihedsgrader 3 Ja, idet 2 P (Z > 6 1.309 ) 0.00, hvor Z N(0, 1) 4 Nej, idet 2 P (Z > 0.001 3.27 ) 1.00, hvor Z N(0, 1) 5 Nej, idet 2 P (Z > 6 5 1.309 ) 0.44, hvor Z N(0, 1) Fortsæt på side 9 8

Opgave IV Man er ved at udvikle et naturmiddel til forebyggelse af lus hos skolebørn. Midlet, som er et planteudtræk, tænkes benyttet i en shampoo, og teorien er, at midlet kan hæmme luseæggenes klækning, så lusene hos en angreben person efterhånden vil uddø. Der er fra hver af et antal personer udtaget et antal æg, som er opbevaret under betingelser, som er tilstræbt at svare til lusenes normale livsbetingelser med hensyn til temperatur og fugtighed mv. Følgende data viser antallet udtagne og klækkede æg for 4 behandlede personer i et første forsøg: Behandlede personer Per Trine Fie Julie Sum og antal æg udtaget 20 25 35 27 107 Antal klækkede æg 10 10 12 12 44 Antal ikke klækkede æg 10 15 23 15 63 Spørgsmål IV.1 (14): Betragt nu resultaterne for Fie. Hvad er den øvre grænse for et 95% konfidensinterval for andelen af klækkede æg? (Vi antager her, at normalfordelingstilnærmelsen til binomialfordelingen er gyldig.) 1 35/23 + 1.96 12 35/(23 23 35) 2 12/35 + 1.96 12 23/(35 35 35) 3 12/23 + 1.96 12 35/(23 23 23) 4 12/35 + 1.96 12 23/35 5 12/35 + 1.96 12 23 35/(23 23) Fortsæt på side 10 9

En forudsætning for, at det er rimeligt at opsummere resultaterne i det samlede antal X af klækkede æg er, at sandsynligheden for, at et æg klækkes, er den samme for alle de involverede personer. Den fælles sandsynlighed estimeres til 44/107 = 0.4112. Fordelingen af æg, burde iså fald være: Behandlede personer Per Trine Fie Julie Sum og antal æg udtaget 20 25 35 27 107 Antal klækkede æg 8.22 10.28 14.39 11.10 44 Antal ikke klækkede æg 11.78 14.72 20.61 15.90 63 Spørgsmål IV.2 (15): Den sædvanlige teststørrelse for at teste hypotesen om ens andele for de fire personer er givet ved 1 (10 8.22)2 8.22 + (10 10.28)2 10.28 + (12 14.39)2 14.39 + (12 11.10)2 11.10 2 (10 8.22)2 8.22 + (10 11.78)2 11.78 + (10 10.28)2 10.28 + (15 14.72)2 14.72 + (12 14.39)2 14.39 + (23 20.61)2 20.61 + (12 11.10)2 11.10 + (15 15.90) 2 15.90 3 (10 11.78)2 11.78 + (15 14.72)2 14.72 + (23 20.61)2 20.61 + (15 15.90)2 15.90 4 10 8.22 + 10 10.28 + 12 14.39 + 12 11.10 5 10 8.22 + 10 11.78 + 10 10.28 + 15 14.72 + 12 14.39 + 23 20.61 + 12 11.10 + 15 15.90 Spørgsmål IV.3 (16): Betragt nu kun data for de tre piger, dvs. se bort fra data fra Per. Den kritiske værdi for den sædvanlige teststørrelse for at teste hypotesen om ens andele for de tre personer er givet ved: (Anvend α =0.05) 1 F 0.05 (3, 2) = 19.16 2 F 0.05 (2, 3) = 9.55 3 χ 2 0.05 (2) = 5.991 4 χ 2 0.025 (2) = 7.378 5 χ 2 0.025 (3) = 9.348 Fortsæt på side 11 10

Opgave V En multiple-choice test består af 10 spørgsmål med 3 svarmuligheder til hvert spørgsmål, som har netop et korrekt svar. Et korrekt svar giver 3 points, mens et forkert giver -1 point. Lad X være det opnåede pointtal for en tilfældig valgt person. Antag at man gætter i samtlige 10 spørgsmål. Hvad er da middelværdi og varians for det opnåede pointtal? Spørgsmål V.1 (17) 1 Middelværdi: 0 og varians: 10/3 2 Middelværdi: 10/3 og varians: 160/9 3 Middelværdi: 10/3 ogvarians: 10/9 4 Middelværdi: 10/3 og varians: 320/9 5 Middelværdi: 10/3 og varians: 320/3 Spørgsmål V.2 (18): For et enkelt spørgsmål svarede 33 studerende ud af 66 korrekt. Kan man afvise hypotesen (α =0.05) om at ingen kender svaret på dette spørgsmål? (Både svar og argument skal være i orden) 1 Nej, idet P (X 32) = 0.996, hvor X b(x;66,1/3) 2 Nej, idet P (X 33) = 0.549, hvor X b(x;66,1/2) 132 9 3 Ja, idet P (Z > 10.5 132 9 4 Nej, idet P (Z 10.5 )=0.003, hvor Z N(0, 1) )=0.997, hvor Z N(0, 1) 5 Ja, idet P (Z > 1 3 )=0.3694, hvor Z N(0, 1) Fortsæt på side 12 11

Opgave VI En TV producent har ladet 20 forbrugere bedømme kvaliteten af 2 forskellige fladskærms TV-apparater ved at hvert TV har været bedømt af 10 forbrugere. Man brugte en skala fra 1(dårligst) til 5 (bedst), og fik følgende resultater: Apparat 1 Apparat 2 1 3 2 4 1 2 3 4 2 2 1 3 2 2 3 4 1 3 1 2 Spørgsmål VI.1 (19): Kanmanpåvise en kvalitetsforskel på de to apparater? (Både svar og argument skal være i orden) 1 Nej, idet P (t > 4.81) ikke er lille, hvor t er t-fordelt med 18 frihedsgrader 2 Ja, idet P (t < 4.81) er særdeles lille, hvor t er t-fordelt med 9 frihedsgrader 3 Nej, idet (1/2) 8 er særdeles lille. 4 Ja, idet P (X 8) ikke er lille, hvor X b(x;10,1/2) 5 Ja, idet P (Z < 2.495) er lille, hvor Z N(0, 1) Fortsæt på side 13 12

Opgave VII Man måler billedskarpheden (på en her ikke nærmere forklaret måde) for i alt 5 forskellige TV apparater ved hjælp af 4 forskellige målemetoder: Apparat 1 Apparat 2 Apparat 3 Apparat 4 Apparat 5 Metode 1 y 11 y 12 y 13 y 14 y 15 Metode 2 y 21 y 22 y 23 y 24 y 25 Metode 3 y 31 y 32 y 33 y 34 y 35 Metode 4 y 41 y 42 y 43 y 44 y 45 Der er foretaget følgende beregninger på data: Variations- Kvadratafkilde vigelsessum Mellem TV-apparater 194.25 Mellem metoder 111.08 Restvariation 34.25 Total variation 339.58 Spørgsmål VII.1 (20): Den sædvanlige teststørrelse for hypotesen om ingen forskel på TVapparaterne (mht. til skarphedsniveauet) og den tilhørende kritiske værdi (α =0.05) er givet ved: 1 Teststørrelse: 2 Teststørrelse: 3 Teststørrelse: 4 Teststørrelse: 5 Teststørrelse: 194.25/4 34.25/12, kritisk værdi: F 0.05(4, 12) = 3.26 111.08/4 339.58/20, kritisk værdi: F 0.05(4, 20) = 2.87 34.25/3 339.58/12, kritisk værdi: F 0.05(3, 12) = 3.49 (111.08+34.25)/12 339.58/12, kritisk værdi: F 0.05 (12, 12) = 2.69 (111.08+34.25)/3 34.25/12, kritisk værdi: F 0.05 (3, 12) = 3.49 Fortsæt på side 14 13

I det viste forsøg indgår åbenbart to variationskilder nemlig metoder og TV-apparater samt en vis måleusikkerhed. Spørgsmål VII.2 (21): Det sædvanlig estimat for denne måleusikkerheds spredning er: 1 σ = 339.58/19 2 σ = 111.08/4 3 σ = 34.25/18 4 σ = 339.59/18 5 σ = 34.25/12 Spørgsmål VII.3 (22): Hvis man analyserer data som en ensidig (oneway) variansanalyse med TV-apparater som behandlingsfaktoren (treatment), får man følgende teststørrelse for den relevante hypotese om ingen forskel på apparaterne og tilhørende kritiske værdi (α = 0.05): 1 Teststørrelse: 2 Teststørrelse: 3 Teststørrelse: 4 Teststørrelse: 5 Teststørrelse: 194.25/4 34.25/15, kritisk værdi: F 0.05(4, 15) = 3.06 111.08/4 339.58/20, kritisk værdi: F 0.05(4, 20) = 2.87 34.25/3 339.58/12, kritisk værdi: F 0.05(3, 12) = 3.49 194.25/4 (111.08+34.25)/15, kritisk værdi: F 0.05(4, 15) = 3.06 (111.08+34.25)/3 34.25/12, kritisk værdi: F 0.05 (3, 12) = 3.49 Fortsæt på side 15 14

Opgave VIII På forsiden af Jyllands-Posten den 17/11 2008 var en historie baseret på at 107 ud af en stikprøve på 482 dopingprøver var positive. En positiv test betyder, at der blev fundet doping. Der var tale om en stikprøve af brugere af fitnesscentre. Spørgsmål VIII.1 (23): Et 90% konfidensinterval for andelen af brugere af fitnesscentre, der bruger doping er: 1 107 ± t 0.95 (106) 107 (1 107/482)/ 482 2 107 ± 1.96 107 375/482/ 482 3 0.222 ± 1.96 107 375/482 4 0.222 ± t 0.95 (16) 107 375/482 3 5 0.222 ± 1.645 107 375/482 3 Spørgsmål VIII.2 (24): En tidligere undersøgelse havde vist at 52 ud af 322 var positive. Kan man påvise en stigning i andelen af positive? (Både svar og argument skal være i orden) 1 Nej, idet P (X > (63.68 52)2 63.68 + (95.32 107)2 95.32 ) > 0.05, X χ 2 (1) 2 Ja, idet P (X > (63.68 52)2 63.68 + (95.32 107)2 95.32 ) < 0.05, X χ 2 (1) ( ( )) 3 Ja, idet P Z>( 107 482 52 322 )/ [159 645 ( 1 322 + 1 482 )]/804 =0.017, Z N(0, 1) 4 Ja, idet P (Z >(107/375 52/270)/ (1/322 + 1/482)/804) = 0.000, Z N(0, 1) 5 Nej, idet P (X > (258.32 270)2 258.32 + (386.68 375)2 368.68 ) > 0.05, X χ 2 (2) Fortsæt på side 16 15

Spørgsmål VIII.3 (25): I en kommende undersøgelse ønsker man at kende andelen af dopingbrugere med en nøjagtighed, så 95% konfidensnitervallet bliver plus/minus 0.02 (altså plus/minus 2 procentpoint). Man forventer, at niveauet er omtrent som nu. Hvor stor skal stikprøven omtrent være? 1 1 4 (1.645/0.01)2 6765 2 0.22 0.78(1.645/0.01) 2 4644 3 0.22 0.78(1.96/0.02) 2 1648 4 0.22 0.78(1.96/0.02) 2 /4 412 5 1.96 (0.22 0.78/0.01) 2 577 Fortsæt på side 17 16

Opgave IX En chokoladepakning består af 8 stykker chokolade. Det antages at vægten af de enkelte stykker chokolade følger en normalfordeling med middelvægt µ = 100g og en spredning på σ =1g. I det følgende ses fire fordelinger: a b 0.00 0.04 0.08 0.12 0.00 0.01 0.02 0.03 0.04 0.05 790 795 800 805 810 770 780 790 800 810 820 830 c d 0.00 0.02 0.04 0.06 0.08 0.10 0.0 0.1 0.2 0.3 0.4 790 795 800 805 810 815 797 798 799 800 801 802 803 Spørgsmål IX.1 (26): Hvilken af de fire figurer viser fordelingen af vægten af chokoladepakningerne? 1 a) 2 b) 3 c) 4 d) 5 Ingen af ovenstående Fortsæt på side 18 17

Der ses herunder et boxplot af 100 datapunkter fra en normalfordeling. 700 750 800 850 900 950 Spørgsmål IX.2 (27): Hvilken af de fire oven for viste fordelinger kommer disse datapunkter fra (om nogen af dem overhovedet)? 1 a) 2 b) 3 c) 4 d) 5 Ingen af ovenstående Fortsæt på side 19 18

Opgave X Der er foretaget nogle målinger efter en bestemt temmelig indviklet målemetode. Målingerne er udført af to laboranter, og de fik følgende resultater og beregnede gennemsnit og spredninger: Operatør målinger Gennemsnit Spredning Laborant X 125.4 125.8 132.0 121.3 118.2 x = 124.54 s x =5.2123 Laborant Y 125.3 121.4 120.4 124.9 123.5 y = 123.10 s y =2.1459 Man forestiller sig først, at de to laboranter måler med samme usikkerhed. usikkerhed har en spredning, som vi nu benævner σ. Denne fælles Spørgsmål X.1 (28): Angiv det sædvanlige skøn for σ: 1 σ =3.6791 2 σ =3.9858 3 σ =3.6791/5 4 σ =7.3582 5 σ =3.6791 2 Fortsæt på side 20 19

Man har en forhåndsformodning om, at hvis der faktisk skulle være forskel på de to operatører, er det sikkert laborant X, som har den største varians, fordi vedkommende har mindre erfaring med den pågældende metode. Inden man beregner det fælles variansestimat σ 2, burde man derfor teste hypotesen σ 2 x = σ 2 y mod σ 2 x >σ 2 y. Spørgsmål X.2 (29): Hvis man benytter signifikansniveauet α = 5% for dette test, fås den sædvanlige teststørrelse (her kaldet A) og tilhørende kritiske værdi som: 1 A =4.23 og kritisk værdi 1.96 2 A =3.03 og kritisk værdi 1.86 3 A =3.03 og kritisk værdi 1.96 4 A =5.90 og kritisk værdi 6.39 5 A =9.16 og kritisk værdi 3.84 Spørgsmål X.3 (30): Hvilken af nedenstående antagelser er den eneste, der ikke er nødvendig for at det sædvanlige t-test i dette setup (baseret på s 2 p ) er gyldigt? 1 Data er normalfordelt 2 Der skal være mindst 15 observationer 3 De to varianser er ens 4 De to stikprøver er uafhængige 5 De to stikprøver er udtaget tilfældigt 20