Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 11 opgaver. Besvarelserne af multiple choice spørgsmålene anføres ved at udfylde skemaet på forsiden (denne side), med numrene på de svarmuligheder, du mener er de korrekte. Et forkert svar kan rettes ved at sværte det forkerte svar over og anføre det rigtige i stedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end ét nummer ved et spørgsmål, betragtes spørgsmålet som ubesvaret. Kladde, mellemregninger eller andet tillægges ingen betydning, kun svarene i tabellen tæller. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. Ubesvarede spørgsmål eller et 6-tal (svarende til ved ikke ) giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Opgave I.1 I.2 II.1 II.2 II.3 III.1 III.2 III.3 III.4 III.5 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 1 3 5 1 4 2 4 5 1 3 Opgave IV.1 V.1 V.2 V.3 VI.1 VI.2 VII.1 VII.2 VIII.1 VIII.2 (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar 4 3 4 2 1 3 5 2 2 5 Opgave IX.1 IX.2 IX.3 X.1 X.2 X.3 X.4 X.5 XI.1 XI.2 (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar 4 4 5 1 3 3 1 4 2 3 Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 19; blad lige om og se, at den er der. Fortsæt på side 2 1
Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I En kasse indeholder 6 sedler: På 1 af sedlerne står der et 1-tal På 2 af sedlerne står der et 2-tal På 2 af sedlerne står der et 3-tal På 1 af sedlerne står der et 4-tal Der udtrækkes 2 sedler fra kassen, og følgende stokastiske variabel indføres: X, som beskriver antal sedler med et 4-tal blandt de 2 udtrukne. De 2 sedler udtrækkes uden mellemliggende tilbagelægning. I.1 (1) Middelværdi og varians for X, samt P (X = 0) bliver: 1 µ x = 1/3, σx 2 = 2/9 og P (X = 0) = 2/3 2 µ x = 1/3, σx 2 = 2/9 og P (X = 0) = 29/30 3 µ x = 1/3, σx 2 = 5/18 og P (X = 0) = 25/36 4 µ x = 1/3, σx 2 = 5/18 og P (X = 0) = 29/30 5 µ x = 1/3, σx 2 = 2/9 og P (X = 0) = 25/36 I.2 (2) De 2 sedler udtrækkes nu med mellemliggende tilbagelægning. Hvad er sandsynligheden for at ingen af de to udrukne sedler er en seddel med et 1-tal? 1 1/36 2 5/6 3 25/36 4 1/4 5 2/3 Fortsæt på side 3 2
Opgave II Bemandingen til besvarelse af opkald på en virksomhed er baseret på, at der kommer 180 telefonopkald pr. time tilfældigt fordelt. I 9 perioder på 5 minutter er følgende antal opkald (pr. 5 minutter) registreret: 15 20 26 11 16 29 22 12 19 Hvis der sker 20 opkald eller flere i en periode på 5 minutter overstiges kapaciteten, og der kommer en uønsket ventetid - der er altså en kapacitet på 19 opkald pr. 5 minutter. II.1 (3) Bruger man den sædvanlige poissonmodel for sådanne data, kan man ud fra registreringerne finde en P-værdi for hypotesen: H 0 : µ = 180 H 1 : µ > 180 hvor µ er middelværdien for antal opkald pr. time, som: 1 P (X 29), X P o(λ), λ = 9 2 P (X 170), X N(135, 135 2 ) 3 P (X 170), X N(170, 170 2 ) 4 P (X = 170), X P o(λ), λ = 180 5 P (X 170), X P o(λ), λ = 135 bliver: II.2 (4) Sandsynligheden for, at kapaciteten overstiges en tilfældig periode på 5 minutter 1 P (X 20) = 0.125, hvor X P o(15) 2 P (X 5) = 0.999, hvor X P o(15) 3 P (X 5) = 0.560, hvor X P o(5) 4 P (X < 5) = 0.440, hvor X P o(5) 5 P (X 9) = 0.070, hvor X P o(15) Fortsæt på side 4 3
II.3 (5) Hvis sandsynligheden skal være mindst 99% for, at alle opkald ekspederes uden ventetid inden for en tilfældigt valgt periode på 5 minutter, hvor stor skal kapaciteten pr. 5 minutter da mindst være? 1 Kapaciteten skal være mindst 22 pr. 5 minutter 2 Kapaciteten skal være mindst 23 pr. 5 minutter 3 Kapaciteten skal være mindst 24 pr. 5 minutter 4 Kapaciteten skal være mindst 25 pr. 5 minutter 5 Kapaciteten skal være mindst 26 pr. 5 minutter Opgave III Længden af et afskåret aluminiumsprofil kontrolleres ved, at der udtages en stikprøve på 16 emner, hvis længde måles. Måleresultaterne fra en sådan stikprøve er angivet nedenfor, alle mål er i mm: 180.02 180.00 180.01 179.97 179.92 180.05 179.94 180.10 180.24 180.12 180.13 180.22 179.96 180.10 179.96 180.06 Af data fås: x = 180.05 og s = 0.0959 Kravene til profilernes længde er: µ L = 180mm og σ L = 0.08mm III.1 (6) Udføres hypotesetestet: H 0 : σ 2 = 0.08 2 H 1 : σ 2 > 0.08 2 Fås følgende P-værdi og konklusion, hvis α = 5% anvendes: 1 P-værdi= 0.12, nulhypotesen kan afvises 2 P-værdi> 0.05, nulhypotesen kan ikke afvises 3 P-værdi< 0.05, nulhypotesen kan afvises 4 P-værdi= 0.88, nulhypotesen kan afvises 5 P-værdi= 0.88, nulhypotesen kan ikke afvises Fortsæt på side 5 4
III.2 (7) Udføres hypotesetestet: H 0 : µ = 180 H 1 : µ 180 fås følgende sædvanlige teststørrelse og konklusion, hvis α = 5% anvendes: 1 Teststørrelse: 7508. Konklusion: Nulhypotesen forkastes 2 Teststørrelse: 1877. Konklusion: Nulhypotesen forkastes 3 Teststørrelse: 7.30. Konklusion: Nulhypotesen kan ikke forkastes 4 Teststørrelse: 2.09. Konklusion: Nulhypotesen kan ikke forkastes 5 Teststørrelse: 0.05. Konklusion: Nulhypotesen kan ikke forkastes III.3 (8) Et 90%-konfidensinterval for µ bliver: 1 180.05 ± 1.96 0.0959/16 2 180.05 ± 1.96 0.0959/15 3 180.05 ± 2.131 0.0959/4 4 180.05 ± 1.753 0.0959/16 5 180.05 ± 1.753 0.0959/4 III.4 (9) Et 99%-konfidensinterval for σ bliver: 1 15 0.0092 15 0.0092 32.801 < σ < 4.601 2 16 0.0092 28.845 < σ < 3 15 0.0092 6.262 < σ < 16 0.0092 6.908 15 0.0092 27.488 4 0.0959 ± 1.96 0.0959/4 5 0.0959 ± 2.676 0.0959/16 Fortsæt på side 6 5
III.5 (10) Middelprofillængden for en ny produktion af profiler ønskes bestemt ved en ny stikprøve. Hvis man antager, at spredningen er omtrent 0.1, altså σ = 0.1mm, og man ønsker, at et 95%-konfidensinterval skal have en bredde på kun 0.05mm, hvor mange profiler skal så måles? 1 1 4 (1.96/0.05)2, dvs mindst 385 2 1 4 3 4 (1.96/0.025)2, dvs mindst 1153 3 (1.96 0.1/0.025) 2, dvs mindst 62 4 (2.576 0.05/0.025) 2, dvs mindst 27 5 (2.576 0.2/0.05) 2, dvs mindst 107 Opgave IV En parallelforbindelse af to eletriske modstande R 1 og R 2 giver en samlet modstand R p, der er givet ved: R P = R 1 R 2 R 1 + R 2 I en given parallelforbindelse anvendes to modstande med følgende værdier og spredninger: (i Ohm) R 1 = 500, σ 1 = 25 R 2 = 100, σ 2 = 5 IV.1 (11) Variansen for den samlede modstand R p bliver omtrentlig: 1 1/2 25 + 1/2 5 = 15 2 1/2 25 2 + 1/2 5 2 = 325 3 ( ) 100 600 25 2 + ( 500 600) 5 2 = 125 4 ( ) 2 ( ) 100 2 600 25 2 + 500 2 2 2 600 5 2 = 12.5 2 5 ( ) ( ) 100 2 25 2 + 500 2 5 2 = 34.7 600 2 600 2 Fortsæt på side 7 6
Opgave V En virksomhed skal anvende nogle rør. Det er væsentligt for anvendelsen, at rørenes indvendige ruhed er mindst mulig. For at finde de bedst egnede rør, indhentes rørprøver fra fire mulige leverandører. På hver rørprøve foretages 9 målinger af den indvendige ruhed, måledata fremgår af nedenstående tabel: Ruhed Række- Rækkegennemsnit spredning A 17 25 22 21 16 22 23 20 17 20.33 3.08 B 21 25 20 19 24 19 21 21 17 20.78 2.49 C 14 13 16 16 17 24 20 15 19 17.11 3.41 D 18 19 20 12 13 19 20 14 17 16.89 3.10 En chef ønsker leverandør A og B sammenlignet uden brug af nogen antagelse om normalfordeling, og får lavet følgende kørsel i R: xa=c(17,25,22,21,16,22,23,20,17) xb=c(21,25,20,19,24,19,21,21,17) k = 10000 Asamples = replicate(k, sample (xa, replace = TRUE)) Bsamples = replicate(k, sample (xb, replace = TRUE)) mymeandifs = apply(asamples, 2, mean)-apply(bsamples, 2, mean) hist(mymeandifs) Histogrammet, der laves i sidste linie, viser bootstrap-fordelingen af middelforskellene: Histogram of mymeandifs Frequency 0 500 1000 1500 6 4 2 0 2 4 mymeandifs Fortsæt på side 8 7
muligheder: V.1 (12) Hvad er den eneste fornuftige konklusion baseret på R-kørslen blandt følgende 1 De to spredninger er signifikant forskellige på niveau 5% 2 Der er på niveau 1% signifikant forskel på middelruheden for leverandør A og B 3 Der er på niveau 5% ikke signifikant forskel på middelruheden for leverandør A og B 4 Spredningen man ser i histogrammet er omtrent 1, og derfor er der ingen forskel på de to middelværdier 5 Histogrammet er ikke symmetrisk, og derfor kan vi ikke bruge det til noget V.2 (13) Der foretages nu en sædvanlig variansanalyse af hele datamaterialet. Det oplyses at SS total = 4 9 i=1 j=1 (y ij ȳ) 2 = 410.22. Hvad bliver F-teststørrelsen for den sædvanlige hypotese i denne situation: µ 1 = µ 2 = µ 3 = µ 4 og konklusionen derpå med α = 5%? 1 F = 410.22/36 9.23 = 1.23, så hypotesen accepteres 2 F = 410.22/36 9.23 = 1.23, så hypotesen forkastes 3 F = 38.3 9.23 = 4.15, så hypotesen accepteres 4 F = 38.3 9.23 = 4.15, så hypotesen forkastes 5 F = 410.22 36 = 11.40, så hypotesen forkastes V.3 (14) Man ønsker at sammenligne varianserne for leverandør C og D, og følgende hypotese skal derfor testes: (alene baseret på data for disse to leverandører) H 0 : σc 2 = σd 2 H 1 : σc 2 σd 2 Man får følgende sædvanlige teststørrelse og kritisk værdi med α = 0.10: 1 Teststørrelse: 3.412 3.26 2. Kritisk værdi: 6.03 2 Teststørrelse: 3.412 3.10 2. Kritisk værdi: 3.44 3 Teststørrelse: 3.41 3.26. Kritisk værdi: 1.96 4 Teststørrelse: 3.41 3.10. Kritisk værdi: 3.84 5 Teststørrelse: 3.41 3.10 3.26/9. Kritisk værdi: 2.180 Fortsæt på side 9 8
Opgave VI En virksomhed, der sælger udendørs belysning, får fremstillet en lampe i 3 materialevarianter, i kobber, med malet overflade og i rustfrit stål. Lamperne sælges dels i Danmark og dels til eksport. For 250 lamper er den procentvise fordelingen af salget mellem de 3 varianter og Danmark/eksport opgjort. Data fremgår af nedenstående tabel. Land Danmark Eksport Kobbervariant 7.2% 6.4% Malet variant 28.0% 34.8% Rustfri variant 8.8% 14.8% VI.1 (15) Er der signifikant forskel på andelen, der eksporteres og andelen der sælges i Danmark? (Med α = 0.05) 1 Nej, idet 15/ 250/4 = 1.90 ligger inden for ±1.96 2 Ja, idet 15/ 250/4 = 1.90 ligger inden for ±1.96 3 Ja, idet 15 2 /(250/4) = 3.6 er større end 1.645 4 Ja, idet 15 2 /(250/4) = 3.6 er mindre end ±3.84 5 Nej, idet 15/ 250/4 = 1.90 er større end 1.645 VI.2 (16) Den relevante kritiske værdi for at teste om der er signifikant forskel på hvorledes varianterne fordeler sig i Danmark og i udlandet bliver: (med α = 0.05) 1 z 0.025 = 1.96 2 χ 2 0.025 (3) = 9.348 3 χ 2 0.05 (2) = 5.991 4 χ 2 0.05 (1) = 3.841 5 F 0.05 (3, 2) = 19.16 Fortsæt på side 10 9
Opgave VII I et klinisk forsøg med et kolesterolsænkende middel, har man målt 15 patienters kolesteroltal (i mmol/l) før behandlingen, og 3 uger efter behandlingens start. Data er angivet i nedenstående tabel: Patient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Før 9.1 8.0 7.7 10.0 9.6 7.9 9.0 7.1 8.3 9.6 8.2 9.2 7.3 8.5 9.5 Efter 8.2 6.4 6.6 8.5 8.0 5.8 7.8 7.2 6.7 9.8 7.1 7.7 6.0 6.6 8.4 Følgende kørsler i R udførtes: x1=c(9.1,8.0,7.7,10.0,9.6,7.9,9.0,7.1,8.3,9.6,8.2,9.2,7.3,8.5,9.5) x2=c(8.2,6.4,6.6,8.5,8.0,5.8,7.8,7.2,6.7,9.8,7.1,7.7,6.0,6.6,8.4) t.test(x1,x2,var.equal=true) t.test(x1,x2,pair=true) med følgende resultater: > t.test(x1,x2,var.equal=true) Two Sample t-test data: x1 and x2 t = 3.3206, df = 28, p-value = 0.002505 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.4648623 1.9618043 sample estimates: mean of x mean of y 8.600000 7.386667 > t.test(x1,x2,pair=true) Paired t-test data: x1 and x2 t = 7.3407, df = 14, p-value = 3.672e-06 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.8588225 1.5678442 sample estimates: mean of the differences 1.213333 Fortsæt på side 11 10
α = 0.001? VII.1 (17) Kan der baseret på disse data påvises et signifikant fald i kolesteroltallet med 1 Nej, idet den relevante P-værdi er mindre end 0.05 2 Nej, idet den relevante P-værdi er mindre end 0.001 3 Nej, idet den relevante P-værdi er mindre end 0.001 4 Ja, idet den relevante P-værdi er større end 0.001 5 Ja, idet den relevante P-værdi er mindre end 0.001 VII.2 (18) Hvad er medianen for kolesteroltallet for patienterne før behandlingen? 1 10 7.1 = 2.9 2 8.5 3 8.6 4 10 + 7.1 = 8.55 5 1.21 Fortsæt på side 12 11
Opgave VIII Ved produktion af plastslanger, skal slangediameteren løbende kontrolleres. Ved en prøveproduktion er der fremstillet to stykker slange med to forskellige indstillinger på maskinen. Diameteren er målt 10 steder på hver slange med følgende resultater: (i mm) Indstilling 1: n 1 = 10, x 1 = 5.996, s 1 = 0.0082 Indstilling 2: n 2 = 10, x 2 = 6.014, s 2 = 0.0121 VIII.1 (19) De to varianser kan ikke påvises signifikant forskellige (med α = 0.10), idet: 1 6.014 5.996 2 0.0103/ 10 = 2.846 > t 0.025(18) = 2.093 2 0.01212 0.0082 2 = 2.177 < F 0.05 (9, 9) = 3.18 3 0.0121 0.0082 = 1.476 < F 0.01(9, 9) = 5.35 4 6.014 5.996 0.0103/ 20 = 8.050 > t 0.025(18) = 2.093 5 0.01212 = 1.37 < χ 2 0.0103 2 0.975 (9) = 3.325 VIII.2 (20) Antag at varianserne for de to indstillinger er ens. Hvad er da 95%-konfidensintervallet for middeldiameterforskellen? 1 0.018 ± 2.262 0.0103 1/10 2 0.018 2 ± 3.84 2/10 3 0.018 ± 1.96 (0.0082 + 0.0121) 2/10 4 0.018 ± 1.96 0.0103 1/10 5 0.018 ± 2.101 0.0103 2/10 Fortsæt på side 13 12
Opgave IX Ved kommunalvalget i november 2013 fik socialdemokraterne (A) p = 29.5% af stemmerne på landsplan. En tidlig såkaldt exitpoll estimerede, at de kun ville få 22.7% af stemmerne. Antag at exitpoll en var baseret på 740 personer, hvoraf altså 168 personer angav at have stemt på A. IX.1 (21) På tidspunktet for exitpoll en kendtes p naturligvis ikke. Testes nedenstående hypotese baseret på exitpoll en: H 0 : p = 0.295 H 1 : p 0.295 fås følgende teststørrelse og konklusion: (med α = 0.001) 1 Teststørrelse: 0.227/0.295 = 0.77. Konklusion: Vi afviser nulhypotesen, idet 0.77 > 0.001 2 Teststørrelse: 0.295 0.227 0.227 0.773 = 0.16. Konklusion: Vi accepterer nulhypotesen, idet 0.16 < z 0.0005 = 3.291 3 Teststørrelse: 0.227 0.295 0.295 0.705 = 0.15. Konklusion: Vi accepterer nulhypotesen, idet 0.15 < z 0.025 = 1.96 4 Teststørrelse: 4.05. Konklusion: Vi afviser nulhypotesen, idet 4.05 < z 0.0005 = 3.291 5 Teststørrelse: 4.05. Konklusion: Vi accepterer nulhypotesen, idet 4.05 > χ 2 0.05 (1) = 3.841 IX.2 (22) Et 95%-konfidensinterval for p baseret på exitpoll en bliver: 1 168 ± 1.96 0.227 0.773 740 2 0.227 ± 1.96 0.227 740 3 168 ± 1.645 0.227 740 0.227 0.773 4 0.227 ± 1.96 740 0.227 0.773 5 0.773 ± 1.645 740 Fortsæt på side 14 13
IX.3 (23) Med udgangspunkt i det scenarie, at en stemmeandel er omkring 30%, hvor stor en exitpoll skal man i så fald lave for at opnå et 99%-konfidensinterval med en bredde på 0.01? 1 0.3 0.7 (2.326/0.02) 2 2840 personer 2 0.3 0.7 (1.96/0.02) 2 2017 personer 3 1/4 (2.576/0.01) 2 16589 personer 4 1/4 (1.96/0.01) 2 9604 personer 5 0.3 0.7 (2.576/(0.01/2)) 2 55741 personer Opgave X Ved en undersøgelse af forureningen i et vandløb er koncentrationen af forurening målt 5 forskellige steder. Hvert sted er der udtaget 4 vandprøver og koncentrationen er målt (i mg/l). Resultatet af analysen er angivet i nedenstående tabel: Observationssted 1 2 3 4 5 9.9 8.8 10.3 9.5 10.5 9.1 10.0 11.0 10.9 11.3 9.7 10.1 9.5 9.9 11.9 8.5 9.8 10.2 10.6 12.3 I ne- Det oplyses yderligere at observationsstederne har forskellig afstand til forureningskilden. denstående tabel er disse afstande samt den gennemsnitlige forurening angivet: Afstand fra forureningskilde (i km) 10 8 6 4 2 Gennemsnitlig koncentration 9.3 9.675 10.25 10.225 11.5 To relevante analyser køres i R, først: Koncentration=c(9.9,8.8,10.3,9.5,10.5, 9.1,10.0,11.0,10.9,11.3, 9.7,10.1,9.5,9.9,11.9, 8.5,9.8,10.2,10.6,12.3) Sted=factor(c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5)) anova(lm(koncentration~sted)) med følgende resultat, hvor en del af det sædvanlige R-output dog er udeladt (og erstattet af et X ): Fortsæt på side 15 14
Analysis of Variance Table Response: Koncentration Df Sum Sq Mean Sq F value Pr(>F) Sted X 11.113 X X X Residuals X 6.465 X og dernæst:(2. analyse) Koncentration=c(9.3,9.675,10.250,10.225,11.500) Afstand=c(10,8,6,4,2) summary(lm(koncentration~afstand)) med følgende resultat: Call: lm(formula = Koncentration ~ Afstand) Residuals: 1 2 3 4 5 0.10-0.02 0.06-0.46 0.32 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 11.67500 0.34679 33.665 5.76e-05 *** Afstand -0.24750 0.05228-4.734 0.0179 * --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 0.3307 on 3 degrees of freedom Multiple R-squared: 0.8819,Adjusted R-squared: 0.8426 F-statistic: 22.41 on 1 and 3 DF, p-value: 0.01787 X.1 (24) Baseret på den første analyse, hvad bliver teststørrelse og kritisk værdi (med α = 0.05) for hypotesen om ingen forskel i middelværdierne for de fem observationssteder? 1 Teststørrelse = 6.45 og kritisk værdi = 3.06 2 Teststørrelse = 1.72 og kritisk værdi = 1.96 3 Teststørrelse = 2.78 og kritisk værdi = 3.84 4 Teststørrelse = 0.431 og kritisk værdi = 2.71 5 Teststørrelse = 1.72 og kritisk værdi = 3.84 Fortsæt på side 16 15
X.2 (25) Et 90%-konfidensinterval for middelforskellen mellem observationssted 1 og 2 bliver: 1 10.19 ± 1.753 2.778 1/4 2 10.19 ± 1.96 0.431 1/20 3 0.375 ± 1.753 0.431 1/2 4 0.375 ± 2.086 2.778 1/2 5 0.375 ± 2.086 0.925 1/4 X.3 (26) Hvad er parameter-estimaterne for de 3 ukendte parametre i den sædvanlige lineære regressionsmodel, der ligger til grund for den anden analyse: 1) Afskæring med y-aksen, 2) hældningen og 3) (residual)spredningen? 1 1) 0.2475, 2) 0.05228 og 3) 0.8819 2 1) 11.675, 2) 0.3468 og 3) 0.3307 3 1) 11.675, 2) 0.2475 og 3) 0.3307 4 1) 4.734, 2) 33.665 og 3) 0.22 5 1) 0.06, 2) 0 og 3) 0.01787 X.4 (27) Hvor stor en del af koncentrationsvariationen kan forklares af afstanden? 1 88.2% 2 93.9% 3 91.8% 4 1.79% 5 95% Fortsæt på side 17 16
X.5 (28) Et 95%-konfidensinterval for den forventede forureningskoncentration 7km fra kilden bliver: 1 9.91 ± 0.30 2 9.91 ± 0.38 3 81.5 ± 5.0 4 9.94 ± 0.50 5 9.94 ± 0.17 Fortsæt på side 18 17
Opgave XI Der skal produceres nogle plastslanger for hvilke trækbrudstyrken er væsentlig. Der produceres derfor prøveemner, og der foretages en trækprøvning af disse, hvor emnernes trækbrudspænding bestemmes. To forskellige granulater og fire mulige leverandører deltager i forsøget. Måleresultaterne (i MPa) )fra forsøget er opgivet i nedenstående tabel. Granulat g1 g2 Leverandør a 34.2 33.1 Leverandør b 34.8 31.2 Leverandør c 31.3 30.2 Leverandør d 31.9 31.6 Følgende kørtes i R: Y=c(34.2,34.8,31.3,31.9,33.1,31.2,30.2,31.6) Leverandoer=c("a","b","c","d","a","b","c","d") Granulat=factor(c(1,1,1,1,2,2,2,2)) anova(lm(y~leverandoer+granulat)) med følgende resultat: Analysis of Variance Table Response: Y Df Sum Sq Mean Sq F value Pr(>F) Leverandoer 3 10.0338 3.3446 3.2537 0.1792 Granulat 1 4.6512 4.6512 4.5249 0.1233 Residuals 3 3.0837 1.0279 Fortsæt på side 19 18
XI.1 (29) Hvilken fordeling har været brugt for at finde P-værdien 0.1792? 1 t-fordelingen med frihedsgraderne ν = 7 2 F-fordelingen med frihedsgraderne ν 1 = 3 og ν 2 = 3 3 F-fordelingen med frihedsgraderne ν 1 = 3 og ν 2 = 1 4 χ 2 -fordelingen med frihedsgraderne ν = 7 5 F-fordelingen med frihedsgraderne ν 1 = 4 og ν 2 = 8 XI.2 (30) Hvad er den mest korrekte konklusion baseret på analysen? (brug α = 0.05) 1 Der kan påvises signifikant forskel i varianserne fra variansanalysen 2 Der kan påvises signifikant forskel i middelværdierne for de 2 granulater men ikke for de 4 leverandører 3 Der kan ikke påvises signifikant forskel i middelværdierne for hverken de 4 leverandører eller de 2 granulater 4 Der kan påvises signifikant forskel i middelværdierne for såvel de 4 leverandører som de 2 granulater 5 Der kan påvises signifikant forskel i middelværdierne for de 4 leverandører men ikke for de 2 granulater SÆTTET ER SLUT. GOD JUL! 19