Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5 Timeløn.......................... 7 6.6 Fiberbrød......................... 8 6.7 Kropstemperaturer.................... 10 6.8 Kropstemperatur og hjerterytme............ 15 6.9 Sølvmønter Obligatorisk opgave nr. 3, 2005... 17 1
6.1 To laboranter To laboranter udfører koncentrationsbestemmelser på henholdsvis 10 og 14 prøver. Det forudsættes, at alle 24 prøver stammer fra samme homogene opløsning. Analyseresultaterne er følgende: Laborant A 12.38 12.53 12.25 12.37 12.48 12.58 12.43 12.30 12.46 12.43 Laborant B 12.25 12.45 12.31 12.31 12.30 12.20 12.25 12.25 12.26 12.73 12.42 12.17 12.09 12.23 a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? c) Beregn 95%- og 99%-konfidensinterval for forskellen mellem laborant A s måleniveau og laborant B s måleniveau. 2
6.2 Nicotamid i piller En medicinalvarefabrik ønsker at påbegynde fremstillingen af en ny pilletype. Blandt de krav, man stiller til produktionen, er, at det gennemsnitlige nicotamid-indhold i en pille skal være 25 mg. Der udarbejdes to produktionsmetoder, A og B, og ved hver metode fremstilles 20 piller, hvis nicotamid-indhold måles. Måleresultatern ordnet efter størrelse er angivet i nedenstående tabel. Undersøg om det, efter disse resultater at dømme, er rimeligt at antage, at metoderne A og B tilfredsstiller det nævnte krav. Undersøg også, om der mht nicotamid-indhold er væsentlig forskel på de to produkter. 3
Nicotamid-indholdet i mg af 40 piller. Observationerne er for hver af produktionsmetoderne A og B ordnet efter størrelse. A B 22.67 25.04 23.29 25.14 23.40 25.18 23.56 25.32 23.76 25.41 23.83 25.56 23.95 25.96 24.21 25.97 24.50 26.13 24.64 26.14 24.87 26.29 25.05 26.35 25.35 26.38 25.36 26.55 25.73 26.55 25.79 26.62 4 25.80 26.81
6.3 Karakterer Ved et kursus blev der på to på hinanden følgende år givet følgende karakterer: 1. år 5, 8, 8, 7, 8, 7, 8, 03, 7, 10, 10, 7, 8, 9 sum = 105 kvadratsum = 831 2. år 8, 9, 9, 8, 10, 7, 6, 8, 8, 5, 10, 7, 6 sum = 101 kvadratsum = 813 a) Undersøg for hvert år for sig om fordelingen af karakterer er normalfordelt. b) Er den gennemsnitlige karakter ens de to år? c) Idet det antages at svaret på spørgsmål b) er ja, skal det undersøges om den gennemsnitlige karakter de to år er 8. 5
6.4 Blodtryk hos kvinder Ved en undersøgelse af blodtryk i befolkningen måltes det systoliske blodtryk blandt andet på 15 kvinder i alderen 60 64 år og 12 kvinder i alderen 30 34 år. Middeltal og skøn over varianser og spredninger fandtes til: X s 2 s n 60 64 år 134.1 265.3 16.3 15 30 34 år 114.4 127.2 11.3 12 Sammenlign blodtrykket i de to aldersklasser med hensyn til niveau og variabilitet. (Nævn de statistiske forudsætninger i forbindelse med beregningerne.) Husk også at anføre den medicinske konklusion i almindelige ord, f.eks.: Ældre kvinders blodtryk er gennemgående højere og mere variabelt end yngre kvinders. 6
6.5 Timeløn En tilfældig stikprøve af danske arbejdere i to industrier viser følgende resultater for timeløn i danske kr i 1982: stikprøve- gennemsnit stikprøvestørrelse x varians s 2 Fabriksarbejdere 20 53.5 10.0 Bygningsarbejdere 25 56.5 20.0 Under forudsætning af normalfordelte variable med ens varians, kan man påvise en statistisk forskel i middelværdi i timeløn i de to industrier? 7
6.6 Fiberbrød Der er kommet en ny slags fiberbrød på markedet, der skulle have mindst 12.5% fiberindhold. Man bruger en prøve (som antages at være homogen) for at teste denne påstand og for at sammenligne to laboranter (A og B). De to laboranter udfører hver 10 gentagne bestemmelser af fiberindholdet i %, med følgende resultater: Laborant A 12.25, 12.30, 12.37, 12.38, 12.43, 12.46, 12.48, 12.53, 12. Laborant B 12.10, 12.15, 12.20, 12.20, 12.31, 12.36, 12.41, 12.46, 12. Hvis x i er data for laborant A, og y i er data for laborant B, kan man benytte: 8
x = 1 10 y = 1 10 10 i=1 10 i=1 10 x i = 12.441, y i = 12.342, i=1 x 2 i = 1547.9149, a = (x + y) /2 = 12.3915, 10 i=1 10 (x i x) 2 = 0.13009 (y i y) 2 = 0.27016 i=1 10 yi 2 = 1523.5198 i=1 10 (x i a) 2 + 10 i=1 i=1 (y i a) 2 = 0.44926 a) Kan målinger af laborant A beskrives ved en normalfordeling? Hvadenten der svares bekræftende eller afkræftende på spørgsmål a), bedes de følgende opgaver besvaret under forudsætning af normalitet for målinger af både laborant A og B. 9
b) Er der signifikant forskel i varians for de to laboranter (dvs test H 0 : σ 2 A = σ2 B )? c) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? d) Hvis man nu antager at både middelværdi og varians er det samme for de to laboranter test nulhypotesen om, at middelfiberindholdet for brødet er 12.5% imod alternativhypotesen om, at den er mindre end 12.5%. 6.7 Kropstemperaturer Denne opgave tager udgangspunkt i en artikel fra Journal of the American Medical Association (JAMA) hvor der blandt andet undersøges om menneskets kropstemperatur er de velkendte 37 C (om morgenen). 10
Materialet er baseret på en tilfældig stikprøve bestående af 65 mænd og 65 kvinder. Kropstemperaturer for disse 65 mænd og 65 kvinder målt om morgenen er gengivet i tabellen. 11
Kropstemperatur Mænd Kvinder 35.72 36.56 36.94 35.78 36.78 37.06 35.94 36.61 37.00 35.94 36.78 37.06 36.06 36.61 37.00 36.00 36.78 37.11 36.11 36.67 37.00 36.22 36.78 37.11 36.17 36.67 37.00 36.22 36.78 37.11 36.17 36.67 37.00 36.33 36.83 37.11 36.17 36.67 37.00 36.44 36.83 37.11 36.22 36.67 37.06 36.50 36.83 37.11 36.28 36.67 37.06 36.50 36.89 37.11 36.33 36.72 37.11 36.56 36.89 37.17 36.33 36.72 37.11 36.56 36.89 37.22 36.33 36.78 37.11 36.56 36.89 37.22 36.33 36.78 37.17 36.61 36.89 37.28 36.39 36.78 37.22 36.61 36.94 37.28 36.39 36.78 37.22 36.61 37.00 37.33 36.44 36.83 37.22 36.67 37.00 37.33 36.44 36.83 37.28 36.67 37.00 37.39 36.44 36.89 37.33 36.67 37.00 37.44 12 36.50 36.89 37.39 36.67 37.06 37.72
Her ses nogle standardberegninger for data: Mænd Kvinder Xi 2387.12 2397.58 X 2 i 87676.4382 88447.6800 I figur 6.1 ses probit-diagrammer, der kan benyttes ved besvarelsen. a) Redegør for at kropstemperaturmålingerne for både mænd og kvinder kan anses for at være normalfordelte. b) Undersøg, for mænd og kvinder separat, om middelkropstemperaturen kan antages at være 37 C. c) Vis at der er varianshomogenitet mellem mænd og kvinder. I den pågældende JAMA-artikel foreslås 36.8 C som en ny normal kropstemperatur, fælles for mænd og kvinder. 13
Figure 6.1: Probitdiagram for kropstemperatur for mænd og kvinder. d) Angiv testsandsynligheden (p-værdien) for hypotesen om, at mænd og kvinder har den samme middelkropstemperatur. Er det rimeligt, at antage en fælles normal kropstemperatur på 36.8 C? 14
6.8 Kropstemperatur og hjerterytme Samtidig med indsamlingen af kropstemperaturer, som blev givet i foregående opgave, har man målt pulsen (beats per minute, bpm) for hver af de 65 mænd og 65 kvinder. Formålet er at belyse, om der er en association mellem kropstemperatur og hjerterytme. I figur 6.2 nedenfor er kropstemperaturen tegnet op mod pulsen. Til besvarelsen af opgaven kan det antages, at værdierne af pulsen for en given kropstemperatur kan betragtes som normalfordelt. De yderligere betingelser for regressionsanalyse antages også at være opfyldt. Ved beregninger i opgaven kan benyttes, at gennemsnit og Sum of Squares (SS) for kropstemperatur og puls, samt Sum of Cross- Products (SCP) mellem kropstemperatur og puls er som givet her: 15
Mænd Kvinder Krops- Puls Krops- Puls temperatur temperatur X Y X Y Gennemsnit 36.725 75.920 36.886 73.546 SS 9.6398 1658.8307 10.9130 1879.4782 SCP 37.8660 72.8864 a) Angiv for mænd estimater for parametrene i den lineære regression af puls på kropstemperatur. b) Angiv for kvinder estimater for parametrene i den lineære regression af puls på kropstemperatur. c) Vis, at det kan antages, at regressions-variansen σy 2 X samme for mænd og kvinder. er den d) Vis, at det kan antages, at regressionskoefficienten for mænd og kvinder er ens. Angiv estimatet for den fælles regressionskoefficient. 16
6.9 Sølvmønter Obligatorisk opgave nr. 3, 2005 Der er gjort to fund af gamle søvlmønter fra henholdsvis tidligt og sent i en konges regeringsperiode. I stikprøver fra de to fund er sølvindholdet målt (i procent), idet man har mistanke om at sølvindholdet var lavere sent i en konges regeringsperiode. Her ses data for sølvindholdet i procent: Tidlig periode 6.9 7.8 7.4 8.0 7.6 8.7 8.2 7.9 7.2 7.8 Sen periode 6.3 6.6 6.5 6.1 7.2 6.8 6.8 a) Kan stikprøven fra første periode antages at stamme fra en normalfordeling? b) Er sølvindholdet mindre i den sene periode end i den tidlige periode? Normalitet af begge stikprøver kan antages. 17
c) Opstil og fortolk et 95% konfidensinterval for differensen af middelværdierne. d) Undersøg samme problemstilling som i spørgsmål b) ved en ikkeparametrisk test. [Fra eksamen juni 2002] 18
Figure 6.2: Pulsen tegnet op mod mænd og kvinders kropstemperatur. De rette linjer i figuren er estimerede regressionslinjer. 19