Side 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2003. Kursus navn og nr: Introduktion til Statistik, 02402



Relaterede dokumenter
2 Gennemsnitligt indhold af aktivt stof i en tablet fra et glas med 200 tabletter

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Danmarks Tekniske Universitet Side 1 af 19 sider

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Løsning til eksamen d.27 Maj 2010

Danmarks Tekniske Universitet Side?? af 20 sider

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

(studienummer) (underskrift) (bord nr)

Multiple choice opgaver

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Test nr. 5 af centrale elementer 02402

02402 Løsning til testquiz02402f (Test VI)

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

Test nr. 6 af centrale elementer 02402

Eksempel I. Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ =2minutter.

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Test nr. 4 af centrale elementer 02402

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Forelæsning 11: Kapitel 11: Regressionsanalyse

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Løsning til eksaminen d. 29. maj 2009

CIVILINGENIØREKSAMEN. Side 1 af 19 sider. Skriftlig prøve, den: 20. december 2006 Kursus nr : Kursus navn: Sandsynlighedsregning

Løsning eksamen d. 15. december 2008

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 29 sider. Skriftlig prøve, den: 14. december 1999 Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 9: Inferens for andele (kapitel 10)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 20. december 2011 Kursus nr : (navn) (underskrift) (bord nr)

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Konfidensintervaller og Hypotesetest

(studienummer) (underskrift) (bord nr)

Løsning til eksaminen d. 14. december 2009

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Note til styrkefunktionen

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: PQ. juli 200Z Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 2: Kapitel 4, Diskrete fordelinger

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 24. maj 2012 Kursus nr : (navn) (underskrift) (bord nr)

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 4. juni 2013 Kursus nr : (navn) (underskrift) (bord nr)

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 18. december 2013 Kursus nr : (navn) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2018 Kursus nr : (navn) (underskrift) (bord nr)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

CIVILINGENIØREKSAMEN. Side 1 af 18 sider. Skriftlig prøve, den: 2. juni 2009 Kursus nr : Kursus navn: Sandsynlighedsregning

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Nanostatistik: Opgavebesvarelser

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2014 Kursus nr : (navn) (underskrift) (bord nr)

Tema. Dagens tema: Indfør centrale statistiske begreber.

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

DANMARKS TEKNISKE UNIVERSITET Side 1 af 18 sider. Skriftlig prøve, den: 16. december 2003 Kursus nr : (navn) (underskrift) (bord nr)

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Produkt og marked - matematiske og statistiske metoder

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Personlig stemmeafgivning

DANMARKS TEKNISKE UNIVERSITET Side?? af?? sider. Skriftlig prøve, den: 18. december 2014 Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Kapitel 7 Forskelle mellem centraltendenser

Fagplan for statistik, efteråret 2015

Kapitel 12 Variansanalyse

Standardformular STANDARDFORMULAR 1

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

MPH specialmodul Epidemiologi og Biostatistik

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Eksamen i Statistik for biokemikere. Blok

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

1 Hb SS Hb Sβ Hb SC = , (s = )

Vejledende besvarelser til opgaver i kapitel 14

Definition. Definitioner

Transkript:

Danmarks Tekniske Universitet Side 1 af 21 sider Skriftlig prøve: 15. december 2003 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af eksaminant nr Opgavesættet består af 30 spørgsmål af multiple choice typen. Bevarelserne af multiple choice spørgsmålene anføres ved at udfylde skemaet på forsiden (denne side), med numrene på de svarmuligheder, du mener er de korrekte. Et forkert svar kan rettes ved at sværte det forkerte svar over og anføre det rigtige i stedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end ét nummer ved et spørgsmål, betragtes spørgsmålet som ubesvaret. Kladde, mellemregninger eller andet tillægges ingen betydning, kun svarene i tabellen tæller. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. Ubesvarede spørgsmål eller et 6-tal (svarende til ved ikke ) giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelig besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Kun skemaet tillægges betydning ved besvarelsen. Opgaveteksten skal dog afleveres i sin helhed, inden eksamen forlades også selv om du vælger at aflevere blankt. Opgave I II III IV V VI VII VIII IX X Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Opgave XI XII XIII XIV XV XVI XVII Spørgsmål (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar Opgave XVIII XIX XX XXI XXII XXIII XXIV XXV Spørgsmål (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 21; blad lige om og se, at den er der. Fortsæt på side 2 1

Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I Det antages, at der er en lineær sammenhæng mellem nervøsitet og score på en bestemt test. Data for både nervøsitet og score kan antages at være normalfordelt. Baseret på et stort antal observationer er korrelationskoefficienten mellem nervøsitet og score estimeret til r = 0.73. Spørgsmål I.1 (1): Hvilket af de følgende udsagn er korrekt? 1 Når nervøsiteten stiger, så stiger scoren på testen 2 Når nervøsiteten falder, så stiger scoren på testen 3 Høj grad af nervøsitet giver en høj score på testen 4 Når nervøsiteten falder, så falder scoren på testen 5 Scoren kan ikke anvendes som mål for nervøsitet Fortsæt på side 3 2

Opgave II Nedenstående tabel viser reduktion i blodtryk for 6 patienter, efter et stykke tids behandling med en ny medicin Patient nr. Reduktion (mmhg) 1 20 2 25 3 21 4 34 5 41 6 37 Spørgsmål II.1 (2): Median for reduktion i blodtryk for de 6 patienter bliver 1 27.50 2 29.50 3 29.67 4 8.85 5 25.00 Fortsæt på side 4 3

Opgave III I et australsk studie fra 1990-1996 af en gruppe brandmænd fandtes 8 tilfælde af testikelkræft. Det nationale gennemsnit i en gruppe af samme størrelse var på samme tid 3 tilfælde. Spørgsmål III.1 (3): Hvis du vil undersøge om forekomsten af testikelkræft blandt brandmænd er usædvanligt højt sammenlignet med det nationale gennemsnit, hvilken af følgende beregnede sandsynligheder, p, er så mest hensigtsmæssig 1 p = 1 P(X 3), hvor X er poissonfordelt, X Pois(3) 2 p = P(X 8), hvor X er poissonfordelt, X Pois(3) 3 p = 1 P(X 8), hvor X er poissonfordelt, X Pois(8) 4 p = 1 P(X 8), hvor X er binomialfordelt, X B(3, 3 8 ) 5 p = P(X 8), hvor X er binomialfordelt,x B(3, 3 8 ) Opgave IV I bladet The Family Circle (juni 1990) konkluderer to forskere: Ved 25 års alderen har 29% af alle mænd og 34% af alle kvinder fået nogle grå hår, men forskellen er så lille, at den ikke kan betragtes at være signifikant. Spørgsmål IV.1 (4): Såfremt der deltog 1000 mænd og 1000 kvinder i et tilsvarende studie, ville forskellen (de 29% mod 34%) så være signifikant på et 5% signifikansniveau? 0.05 1 ja, idet Z = = 2.41 og z 0.025 = 1.96 0.315(1 0.315) (2/1000) 0.05 2 nej, idet Z = = 0.107 og z 0.025 = 1.96 0.315(1 0.315) 0.05 3 nej, idet Z = = 2.41 og z 0.025 = 1.96 0.315(1 0.315) (2/1000) 4 nej, idet Z = 0.052 2/1000 = 1.25 og z 0.05 = 1.645 5 ja, idet Z = 0.05 2 (0.315(1 0.315) (2/1000)) = 2.412 og z 0.05 = 1.645 Fortsæt på side 5 4

Opgave V I et studie af dødsårsager observerede man Spørgsmål V.1 (5): Dødsårsag Kvinder Mænd hjerteinfarkt 854 1317 kræft 828 1119 hjerneblødning 460 371 ulykke 147 346 Man interesserer sig for at teste om der er signifikant forskel på fordelingen af dødsårsager for mænd og kvinder på et 5% signifikansniveau. Den sædvanlige teststørrelse bliver 97.375, og denne teststørrelse skal sammenlignes med en kritisk værdi, der findes som 1 χ 2 0.05 (3) = 7.815 2 t 0.05 (7) = 1.895 3 χ 2 0.05 (7) = 14.067 4 F(3,3) 0.95 = 1/9.28 5 F(3,3) 0.05 = 9.28 Opgave VI I et studie undersøgte man et bestemt type præparat (vitamin) og dets eventuelle effekt på muskeludholdenhed. 15 mandlige testpersoner udførte forsøget 2 gange, 1 gang efter indtagelse af præparatet og 1 gang efter indtagelse af placebo (dvs. tablet uden vitamin). Man fik følgende resultater Person Vitamin Placebo Person Vitamin Placebo 1 145 417 9 159 363 2 185 279 10 122 258 3 387 678 11 264 288 4 593 636 12 1052 526 5 248 170 13 218 180 6 245 699 14 117 172 7 349 372 15 185 278 8 902 582 Fortsæt på side 6 5

Spørgsmål VI.1 (6): Hvis det antages, at målingerne af udholdenhed er normalfordelt, hvilken af følgende metoder er bedst egnet til at analysere om vitaminet har en effekt på muskeludholdenhed? 1 Almindelig t-test 2 Ensidet variansanalyse 3 Parret t-test 4 Rank-Sum test 5 Lineær regressionsanalyse Opgave VII Nedenstående tabel viser fordelingen af bombenedslag i et område af London under 2. verdenskrig. Det totale område var 36 kvadratkilometer, og blev indelt i 576 (0.25 0.25 km 2 ) lige store felter. Af tabellen ses, at der var 229 felter uden nedslag, 211 felter hvor 1 nedslag var registreret osv. antal nedslag 0 1 2 3 4 5 6 7 antal felter 229 211 93 35 7 0 0 1 Spørgsmål VII.1 (7): Man interesserer sig nu for om bombenedslagene kan karakteriseres som tilfældigt fordelt, dvs. om de er Poissonfordelt. For at afgøre dette test skal den beregnede teststørrelse sammelignes med en kritisk værdi, der findes i 1 Poissonfordelingen 2 Binomialfordelingen 3 χ 2 -fordelingen 4 F-fordelingen 5 Eksponentialfordelingen Fortsæt på side 7 6

Opgave VIII Tæthedsfunktionen for den diskrete stokastiske variabel X er givet i nedenstående tabel x 0 1 2 3 4 5 f(x) 0.75 0.13 0.06 0.04 0.02 0 Spørgsmål VIII.1 (8): Middelværdi µ og varians σ 2 for X er 1 µ = 0.45 og σ 2 = 1.580 2 2 µ = 0.45 og σ 2 = 1.025 2 3 µ = 0.45 og σ 2 = 0.175 2 4 µ = 0.45 og σ 2 = 0.846 2 5 µ = 0.45 og σ 2 = 0.921 2 Opgave IX I et studie undersøgtes en stikprøve af 100 tilfældig udvalgte forsøgsdyr for tilstedeværelse af en leversygdom, og man fandt at 25 af dyrene havde sygdommen. Spørgsmål IX.1 (9): Angiv et 95% konfidensinterval for andelen af dyr, der har sygdommen 1 0.25 ± 1.960 0.25(1 0.25)/25 2 0.25 ± 1.960 0.25(1 0.25)/25 3 0.25 ± 1.645 0.25(1 0.25)/25 4 0.25 ± 1.960 0.25(1 0.25)/100 5 0.25 ± 2.064 0.25(1 0.25)/100 Fortsæt på side 8 7

Opgave X Indtil fornyligt, har sandsynligheden for, at en rotte inficeret med den meget dødelige virus i hjernen, herpes simplex virus encephalitis, ville dø været p = 0.7. I et nyt studie har man testet en ny medicin mod sygdommen. Ud af 50 tilfældigt udvalgte rotter med virus, der fik medicinen, døde 14. Spørgsmål X.1 (10): Angiv den sædvanlige teststørrelse for om medicinen er effektiv 1 (14 70) 2 /14 2 1 4 (1.96 0.1 )2 3 1.960 0.14(1 0.14)/50 4 (14 35)/ 35(1 0.7) 5 (14 35)/ 35(1 0.7)/50 Opgave XI I et vægtstudie med rotter undersøgtes virkningen af proteinkilde (oksekød/korn) samt mængde (lav/høj). Nedenstående tabel giver vægtforøgelsen (i gram) for 40 rotter, idet der var 10 gentagelser for hver kombination af forsøget. Lav mængde Høj mængde Oksekød 90 76 90 64 86 73 102 118 104 81 51 72 90 95 78 107 100 87 117 111 Korn 107 95 97 80 98 98 74 56 111 95 74 74 67 89 58 88 82 77 86 92 Spørgsmål XI.1 (11): Hvilket af følgende metoder er best egnet til at analysere om faktorerne (mængde og/eller proteinkilde) har betydning for vægtforøgelse? 1 Test i antalstabel for uafhængighed 2 Ensidet variansanalyse 3 Parret t-test 4 Tosidet variansanalyse 5 Sign test Fortsæt på side 9 8

Opgave XII I en produktionsvirksomhed tilstræbes, at andelen af defekte emner højst er 5%. For at kontrollere kvaliteten har man en testprøveprocedure, der er som følger: Der udtages en stikprøve på 20 emner. Såfremt der er flere end 2 defekte emner i stikprøven, afvises at andelen af defekte emner er 5%. Spørgsmål XII.1 (12): Antag, at defektsandsynligheden i virkeligheden er 5%. Angiv signifikansniveauet af ovenstående testprocedure 1 1 0.6770 2 1 0.7358 3 1 0.8570 4 1 0.9245 5 1 0.9841 Spørgsmål XII.2 (13): Antag, at defektsandsynligheden i virkeligheden er 10%. Angiv sandsynligheden for en type II fejl ved brug af testproceduren 1 0.1216 2 0.1350 3 0.4060 4 0.6769 5 0.7358 Fortsæt på side 10 9

Opgave XIII For 7 rygere har man målt carbon monoxide transfer factor, en indikator for lungebetændelse, før og en uge efter indlæggelse på hospital. Data, der ikke kan antages at være normalfordelte, er givet i nedenstående tabel Patient Før Efter nr. indlæggelse indlæggelse 1 40 73 2 50 52 3 56 80 4 58 85 5 60 64 6 62 63 7 66 60 Spørgsmål XIII.1 (14): Hvilken metode er bedst egnet til at analysere en eventuel ændring i carbon monoxide transfer factor i løbet af indlæggelsen. 1 Sign test 2 Test i antalstabel 3 Tosidet variansanalyse 4 Almindelig t-test for 2 uafhængige stikprøver 5 Rank-sum test Opgave XIV Kunder ankommer til et supermarked uafhængigt af hinanden og ifølge en poissonproces med intensitet λ = 3.23 kunder/minut. Spørgsmål XIV.1 (15): En kunde er netop ankommet til supermarkedet. Hvad er sandsynligheden, p, for at der går mindst 2 minutter inden næste kunde ankommer? 1 p = 1 2 0 3.23 e x 3.23 dx = 0.00156 2 p = 2 0 3.23 e x 3.23 dx = 0.99843 3 p = 1 2 4 p = 1 2 0 5 p = 1 1 0 1 3.23 e x/3.23 dx = 0.46162 1 3.23 e x/3.23 dx = 0.53837 1 3.23 e x 6.46 dx = 0.73374 Fortsæt på side 11 10

Opgave XV Fortætningspunktet for en væske er et mål for graden af krystallisering i en opløsning. Fortætningspunktet kan blive målt ved et såkaldt refractive index. I et studie er man interesseret i at undersøge om tilsætning af et stof, I 8, kan påvirke fortætningspunktet, og man har udført følgende forsøg I 8 i % Fortætnings- I 8 i % Fortætningspunkt punkt 0 21.9 5 28.9 0 22.1 6 29.8 0 22.8 6 30.0 1 24.5 6 30.3 2 26.0 7 30.4 2 26.1 8 31.4 3 26.8 8 31.5 3 27.3 9 31.8 4 28.2 10 33.1 4 28.5 Spørgsmål XV.1 (16): Hvis man vil undersøge om tilsætning af I 8 har betydning for fortætningspunktet gøres dette (bedst) ved 1 Almindelig t-test 2 Rank sum test 3 Parret t-test 4 Tosidet variansanalyse 5 Lineær regressionsanalyse Fortsæt på side 12 11

Opgave XVI I et amerikansk studie blev en eventuel sammenhæng mellem salg af is, y (pint pr. capita), og middeltemperatur, x ( F) analyseret. Data for en 2 årig periode (30 målinger) er givet i nedenstående tabel temp salg temp salg temp salg 41 0.386 28 0.286 44 0.319 56 0.374 26 0.298 40 0.307 63 0.393 32 0.329 32 0.284 68 0.425 40 0.318 27 0.326 69 0.406 55 0.381 28 0.309 65 0.344 63 0.381 33 0.359 61 0.327 72 0.470 41 0.376 47 0.288 72 0.443 52 0.416 32 0.269 67 0.386 64 0.437 24 0.256 60 0.342 71 0.548 Det oplyses at S xx = 7820.7, S yy = 0.1255 og S xy = 24.3017 x = 49.1, ȳ = 0.3594, og (0.1255 (24.3017) 2 /7820.7) 30 2 = 0.0423 2 Det antages nu, at følgende model er egnet til at beskrive data y i = a + b x i + ε i Spørgsmål XVI.1 (17): Angiv teststørrelsen, t, for om der er en sammenhæng mellem temperatur og salg 1 t = (24.3017/7820.7) 0.0423 7820.7 2 2 t = 0.2072 30 7820.7 0.0423 7820.7+30(49.1) 2 3 t = (24.3017/7820.7) 30 7820.7 0.0423 7820.7+30(49.1) 2 4 t = (24.3017/7820.7) 30 7820.7 0.0423 2 7820.7+30(49.1) 2 5 t = (24.3017/7820.7) 0.0423 7820.7 Fortsæt på side 13 12

Opgave XVII Nedenstående tabel viser nøgletal for prisen af en speciel type whisky. Der er opdelt mellem statsejede og privatejede forretninger. statsejet X privatejet Y antal observationer n 1 = 16 n 2 = 26 estimeret gennemsnit x = 4.346 ȳ = 4.838 estimeret varians s 2 X = 0.3442 s 2 Y = 0.2642 Spørgsmål XVII.1 (18): Et 95% konfidensinterval for variansen af priserne i statsejede forretninger bliver 1 [0.344 2 1.96 0.344/16 ; 0.344 2 + 1.96 0.344/16] = [0.276 2 ; 0.401 2 ] 2 [ (16 1)0.3442 27.488 ; (16 1)0.344 2 6.262 ] = [0.254 2 ; 0.532 2 ] 3 [4.346 2.131 0.344/4 ; 4.346 + 2.131 0.344/4] = [4.163 ; 4.529] 4 [ (16 1)0.3442 24.996 ; (16 1)0.344 2 7.261 ] = [0.266 2 ; 0.494 2 ] 5 [0.344 2 2.131 0.344/16 ; 0.344 2 + 2.131 0.344/16] = [0.269 2 ; 0.405 2 ] Spørgsmål XVII.2 (19): Den sædvanlige teststørrelse for om variansen af priserne i statsejede forretninger, σ 2 X, er større end variansen af priserne i privatejede forretninger, σ2 Y, bliver 1 Teststørrelse 0.344 0.264 2 Teststørrelse 0.3442 0.264 2 3 Teststørrelse 0.344 0.264 4 Teststørrelse χ 2 0.05 (26 16) 5 Teststørrelse F 0.05 (15,25) Fortsæt på side 14 13

Spørgsmål XVII.3 (20): Det antages nu, at varianserne af priserne i hhv. statsejet og privatejet er ens. Et fælles skøn for variansen bliver s 2 = 0.297 2. Man ønsker herefter at teste hypotesen H 0 : H 1 : µ X + 0.30 = µ Y µ X + 0.30 < µ Y hvor µ X og µ Y er middelværdi for pris i hhv. statsejet og privatejet forretninger. Angiv teststørrelse, t 1 t = 4.346+0.30 4.838 0.344 2 + 0.2642 16 26 2 t = 4.346+0.30 4.838 0.297 0.30 1 16 + 1 26 3 t = 4.346+0.30 4.838 0.297 1 42 4 t = 4.346+0.30 4.838 0.297 1 16 + 1 26 = 1.91 = 0.61 = 4.19 = 2.03 5 t = 4.346 4.838 0.297 1 16 + 1 26 = 5.21 Opgave XVIII Nedenstående tabel viser en bedømmelse af 29 kandidater udført af 2 forskellige bedømmere (A og B). Det oplyses, at bedømmelsesskalaen går fra 0=meget dårlig til 4=fremragende. kand. A B kand. A B kand. A B 1 1 2 11 1 2 21 2 3 2 0 0 12 2 3 22 4 4 3 0 0 13 0 1 23 0 0 4 2 2 14 4 3 24 0 0 5 0 0 15 4 3 25 4 3 6 4 3 16 1 2 26 0 2 7 0 0 17 0 2 27 1 2 8 0 0 18 1 2 28 3 4 9 0 0 19 2 3 29 2 3 10 2 3 20 0 0 Fortsæt på side 15 14

Spørgsmål XVIII.1 (21): Hvilken af følgende metoder vil være mest passende til at analysere om de to bedømmere dømmer ens? 1 Sign test 2 Goodness-of-fit test 3 Test i antalstabel for uafhængighed 4 Almindelig t-test for 2 uafhængige stikprøver 5 Lineær regressionsanalyse Opgave XIX Der kastes med en mønt. En serie på 12 kast har givet følgende serie (P angiver Plat, K angiver Krone) P K K P K P K P P K K K Spørgsmål XIX.1 (22): Man interesserer sig for at teste om ovenstående serie er fremkommet tilfældigt (dvs. mønten er fair). p-værdien for dette test findes i 1 Binomialfordelingen, B(x;12,0.5) 2 χ 2 fordelingen, χ 2 (12 1) 3 Poissonfordelingen, Pois(6) 4 Poissonfordelingen, Pois( 1 2 ) 5 Binomialfordelingen, B(x;12, 5 12 ) Opgave XX På et atomkraftværk undersøgte man den kumulative strålings dose over en periode på 6 måneder. Specielt var man interesserede i at undersøge hvorvidt der var forskel på doserne på 3 forskellige steder på værket, her benævnt A, B og C. Målinger fra personer, der arbejdede på en af de 3 lokaliteter er gengivet i tabellen på næste side. Det kan antages at målingerne er normalfordelte. Fortsæt på side 16 15

A B C 11 29 37 27 41 51 19 19 42 21 39 28 31 24 35 14 35 48 28 46 75 22 64 49 18 52 61 10 23 52 Spørgsmål XX.1 (23): Såfremt man udfører et test på 5% signifikansniveau om der er forskel på strålingsdoserne på de 3 steder (A, B og C), skal teststørrelsen sammenlignes med 1 t-fraktilen t 0.05 (27) 2 t-fraktilen t 0.05 (29) 3 χ 2 -fraktilen χ 0.05 (29) 4 F-fraktilen F 0.05 (2,27) 5 F-fraktilen F 0.05 (3,30) Opgave XXI En producent af ost anvender en maskine, der skærer ostene i passende stykker. I de følgende 3 spørgsmål kan det antages, at vægten af et tilfældigt udvalgt stykke ost er normalfordelt, dvs. X N(µ,σ 2 ) hvor middelværdi µ = 500 g og varians σ 2 = 10 2. Spørgsmål XXI.1 (24): Der udtages en stikprøve på 20 stykker ost med henblik på at fastlægge middelvægten af stykkerne. Det vides nu, at gennemsnitsvægten er fordelt som 1 t-fordelt X t(20) 2 t-fordelt X t(19) 3 Normalfordelt X N(5000,10 2 )) 4 Normalfordelt X N(500, 102 20 ) 5 Normalfordelt X N(500, 102 20 ) Fortsæt på side 17 16

Spørgsmål XXI.2 (25): Producenten sælger 200 stykker ost til den lokale købmand. Samtidigt garanterer han, at den samlede vægt ikke er under 99.5 kg. Beregn sandsynligheden for at den samlede vægt ikke er under 99.5 kg? 1 P(Z < 99500 200 500 2002 10 2 ) hvor Z N(0,1 2 ) 2 P(Z < 200 500 99500 2002 10 2 ) hvor Z N(0,1 2 ) 3 P(Z < 99500 200 500 200 10 2 ) hvor Z N(0,1 2 ) 4 P(Z > 99500 200 500 2002 10 2 ) hvor Z N(0,1 2 ) 5 P(Z > 99500 200 500 200 10 2 ) hvor Z N(0,1 2 ) Spørgsmål XXI.3 (26): Det ugentlige salg, Y (antal stykker), varierer med middelværdi E(Y ) = 400 og varians V ar(y ) = 100. Producentens indtjening er 25 kr. pr. stykke ost, uanset hvor meget der sælges. Beregn sandsynligheden for at den ugentlige fortjeneste overstiger 12000 kr. 1 P(Z < 12000 400 25 25 10 2 ) hvor Z N(0,1 2 ) 2 P(Z < 12000 400 25 252 10 2 ) hvor Z N(0,1 2 ) 3 P(Z > 12000 400 25 252 10 2 ) hvor Z N(0,1 2 ) 4 P(Z < 400 25 12000 ) hvor Z N(0,1 2 ) 252 10 5 P(Z > 400 25 12000 25 10 2 ) hvor Z N(0,1 2 ) Fortsæt på side 18 17

Opgave XXII Antal af sporer af typen Candida albican fra test på en række kvinder er givet i nedenstående tabel Antal sporer x 0 1 2 3 4 5 6 7 Antal prøver g(x) 21 50 51 28 14 5 2 1 Det oplyses at 21 + 50 + 51 + 28 + 14 + 5 + 2 + 1 = 172 Spørgsmål XXII.1 (27): Såfremt en Poisson fordeling kan anvendes til at beskrive fordelingen af antal sporer fra testen, hvad bliver estimatet af parameteren λ? 1 ˆλ = 1 8 8i=1 x i g(x i ) 172 = 0.244 2 ˆλ = 8 i=1 x i g(x i ) 172 = 1.95 3 ˆλ = 172 8 = 21.5 4 ˆλ = 8 8 i=1 x i g(x i ) 172 = 15.6 5 ˆλ = 172 8 1 = 24.57 Fortsæt på side 19 18

Opgave XXIII Et instrument skal kalibreres. Man har i forvejen (med stor nøjagtighed) udmålt nogle koncentrationer af et stof i en opløsning, og disse værdier kan antages at være kendt. Herefter har man målt koncentrationen vha. instrumentet. Resulaterne (20 forsøg) er givet i nedenstående tabel sand målt sand målt sand målt sand målt konc. konc. konc. konc. konc. konc. konc. konc. 1 1.1 3 1.4 5 8.2 10 13.2 1 0.7 3 4.9 5 6.2 15 18.7 1 1.8 3 4.4 10 12.0 15 19.7 1 0.4 3 4.5 10 13.1 15 17.4 3 3.0 5 7.3 10 12.6 15 17.1 Idet man ønsker en model for sammenhængen mellem den målte og sande koncentration, har man estimeret følgende model Y = 0.1595 + 1.2277 X hvor Y angiver målt indhold og X er sand koncentration. Iøvrigt oplyses, at S yy = 814.05, S xx = 526.20 og S xy = 646.01 814.05 (646.01) ȳ = 8.385, x = 6.70, og 2 /526.20 20 2 = 1.079 2 Spørgsmål XXIII.1 (28) Man vil nu udtale sig om hvad den målte værdi ville blive hvis den sande koncentration er x = 4.6. Angiv et 99% prædiktionsinterval for den målte værdi 1 1 5.807 ± 2.878 1.079 20 + (4.6 6.7)2 526.20 2 4.600 ± 2.552 1.079 3 5.807 ± 2.878 1.079 1 20 + (4.6 6.7)2 526.20 1 + 1 20 + (4.6 6.7)2 526.20 4 4.600 ± 2.576 1.079 1 + 1 20 + (4.6 6.7)2 526.20 5 5.807 ± 2.878 1.079 1 + 21 20 + (4.6 6.7)2 526.20 Fortsæt på side 20 19

Opgave XXIV Et historisk datasæt består af målinger af højden for bror og søster (målt i inches) for elleve familier. Målingerne kan antages at følge en normalfordeling. Familie 1 2 3 4 5 6 7 8 9 10 11 Højde bror X 71 68 66 67 70 71 70 73 72 65 66 Højde søster Y 69 64 65 63 65 62 65 64 66 59 62 Spørgsmål XXIV.1 (29): Et nøgletal/parameter for en lineær sammenhæng mellem bror og søsters højde er 1 parameteren α i regressionslinien Y = α + βx + ε 2 parameteren ε i regressionslinien Y = α + βx + ε 3 korrelationskoefficinenten r 4 forskellen i middelværdi D = X Ȳ 5 forholdet mellem varianserne F = σx 2 /σ2 Y Fortsæt på side 21 20

Opgave XXV I et studie ønskede man at undersøge hypotesen om, at kvinder, der var involveret i en ulykke når de kørte bil, var mere udsatte end mænd for at pådrage sig en skade. Specielt var man interesserede i at undersøge om dette kunne skyldes at kvinder foretrak mindre - og dermed mindre sikre biler - end mænd. Man havde indsamlet følgende data over uheld, fordelt på køn og bilens størrelse, som vist i nedenstående tabel Bil lille mellem stor i alt kvinder 43 75 26 144 mænd 25 61 47 133 i alt 68 136 73 277 Spørgsmål XXV.1 (30): Det skal nu testes om der er signifikant forskel på fordeling af bilens størrelse for mænd og kvinder. Såfremt man anvender signifikansniveau α = 1% fås testets kritiske værdi 1 χ 2 0.99 (2) = 0.0201 2 t 0.01 (5) = 3.365 3 χ 2 0.01 (2) = 9.210 4 χ 2 0.01 (5) = 15.056 5 F 0.01 (1,4) = 21.20 Slut på opgavesættet. Glædelig jul & godt nyt år! 21