(studienummer) (underskrift) (bord nr)

Relaterede dokumenter
(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

(studienummer) (underskrift) (bord nr)

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

(studienummer) (underskrift) (bord nr)

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Forelæsning 11: Kapitel 11: Regressionsanalyse

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Klasseøvelser dag 2 Opgave 1

Løsning til eksamen d.27 Maj 2010

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr)

Løsning eksamen d. 15. december 2008

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Løsning til eksaminen d. 14. december 2009

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

(studienummer) (underskrift) (bord nr)

Konfidensintervaller og Hypotesetest

(studienummer) (underskrift) (bord nr)

Danmarks Tekniske Universitet Side 1 af 19 sider

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

1 Hb SS Hb Sβ Hb SC = , (s = )

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

En Introduktion til SAS. Kapitel 5.

Danmarks Tekniske Universitet Side?? af 20 sider

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Forelæsning 11: Envejs variansanalyse, ANOVA

Tema. Dagens tema: Indfør centrale statistiske begreber.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

Forelæsning 10: Statistik ved hjælp af simulering

Løsning til eksaminen d. 29. maj 2009

Skriftlig eksamen Science statistik- ST501

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Appendiks Økonometrisk teori... II

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Eksamen i Statistik for biokemikere. Blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Forelæsning 9: Inferens for andele (kapitel 10)

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Reeksamen i Statistik for Biokemikere 6. april 2009

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Eksamen i Statistik for Biokemikere, Blok januar 2009

Generelle lineære modeller

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Reeksamen i Statistik for biokemikere. Blok

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Opgavebesvarelse, brain weight

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

(student number) (signature) (table number)

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Kursus 02402/02323 Introducerende Statistik

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Multiple choice opgaver

Personlig stemmeafgivning

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Anvendt Statistik Lektion 8. Multipel Lineær Regression

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

1 Regressionsproblemet 2

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Transkript:

Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 11 opgaver. Besvarelserne af multiple choice spørgsmålene anføres ved at udfylde skemaet på forsiden (denne side), med numrene på de svarmuligheder, du mener er de korrekte. Et forkert svar kan rettes ved at sværte det forkerte svar over og anføre det rigtige i stedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end ét nummer ved et spørgsmål, betragtes spørgsmålet som ubesvaret. Kladde, mellemregninger eller andet tillægges ingen betydning, kun svarene i tabellen tæller. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. Ubesvarede spørgsmål eller et 6-tal (svarende til ved ikke ) giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Opgave I.1 I.2 II.1 II.2 II.3 III.1 III.2 III.3 III.4 III.5 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 1 3 5 1 4 2 4 5 1 3 Opgave IV.1 V.1 V.2 V.3 VI.1 VI.2 VII.1 VII.2 VIII.1 VIII.2 (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar 4 3 4 2 1 3 5 2 2 5 Opgave IX.1 IX.2 IX.3 X.1 X.2 X.3 X.4 X.5 XI.1 XI.2 (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar 4 4 5 1 3 3 1 4 2 3 Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 19; blad lige om og se, at den er der. Fortsæt på side 2 1

Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I En kasse indeholder 6 sedler: På 1 af sedlerne står der et 1-tal På 2 af sedlerne står der et 2-tal På 2 af sedlerne står der et 3-tal På 1 af sedlerne står der et 4-tal Der udtrækkes 2 sedler fra kassen, og følgende stokastiske variabel indføres: X, som beskriver antal sedler med et 4-tal blandt de 2 udtrukne. De 2 sedler udtrækkes uden mellemliggende tilbagelægning. I.1 (1) Middelværdi og varians for X, samt P (X = 0) bliver: 1 µ x = 1/3, σx 2 = 2/9 og P (X = 0) = 2/3 2 µ x = 1/3, σx 2 = 2/9 og P (X = 0) = 29/30 3 µ x = 1/3, σx 2 = 5/18 og P (X = 0) = 25/36 4 µ x = 1/3, σx 2 = 5/18 og P (X = 0) = 29/30 5 µ x = 1/3, σx 2 = 2/9 og P (X = 0) = 25/36 I.2 (2) De 2 sedler udtrækkes nu med mellemliggende tilbagelægning. Hvad er sandsynligheden for at ingen af de to udrukne sedler er en seddel med et 1-tal? 1 1/36 2 5/6 3 25/36 4 1/4 5 2/3 Fortsæt på side 3 2

Opgave II Bemandingen til besvarelse af opkald på en virksomhed er baseret på, at der kommer 180 telefonopkald pr. time tilfældigt fordelt. I 9 perioder på 5 minutter er følgende antal opkald (pr. 5 minutter) registreret: 15 20 26 11 16 29 22 12 19 Hvis der sker 20 opkald eller flere i en periode på 5 minutter overstiges kapaciteten, og der kommer en uønsket ventetid - der er altså en kapacitet på 19 opkald pr. 5 minutter. II.1 (3) Bruger man den sædvanlige poissonmodel for sådanne data, kan man ud fra registreringerne finde en P-værdi for hypotesen: H 0 : µ = 180 H 1 : µ > 180 hvor µ er middelværdien for antal opkald pr. time, som: 1 P (X 29), X P o(λ), λ = 9 2 P (X 170), X N(135, 135 2 ) 3 P (X 170), X N(170, 170 2 ) 4 P (X = 170), X P o(λ), λ = 180 5 P (X 170), X P o(λ), λ = 135 bliver: II.2 (4) Sandsynligheden for, at kapaciteten overstiges en tilfældig periode på 5 minutter 1 P (X 20) = 0.125, hvor X P o(15) 2 P (X 5) = 0.999, hvor X P o(15) 3 P (X 5) = 0.560, hvor X P o(5) 4 P (X < 5) = 0.440, hvor X P o(5) 5 P (X 9) = 0.070, hvor X P o(15) Fortsæt på side 4 3

II.3 (5) Hvis sandsynligheden skal være mindst 99% for, at alle opkald ekspederes uden ventetid inden for en tilfældigt valgt periode på 5 minutter, hvor stor skal kapaciteten pr. 5 minutter da mindst være? 1 Kapaciteten skal være mindst 22 pr. 5 minutter 2 Kapaciteten skal være mindst 23 pr. 5 minutter 3 Kapaciteten skal være mindst 24 pr. 5 minutter 4 Kapaciteten skal være mindst 25 pr. 5 minutter 5 Kapaciteten skal være mindst 26 pr. 5 minutter Opgave III Længden af et afskåret aluminiumsprofil kontrolleres ved, at der udtages en stikprøve på 16 emner, hvis længde måles. Måleresultaterne fra en sådan stikprøve er angivet nedenfor, alle mål er i mm: 180.02 180.00 180.01 179.97 179.92 180.05 179.94 180.10 180.24 180.12 180.13 180.22 179.96 180.10 179.96 180.06 Af data fås: x = 180.05 og s = 0.0959 Kravene til profilernes længde er: µ L = 180mm og σ L = 0.08mm III.1 (6) Udføres hypotesetestet: H 0 : σ 2 = 0.08 2 H 1 : σ 2 > 0.08 2 Fås følgende P-værdi og konklusion, hvis α = 5% anvendes: 1 P-værdi= 0.12, nulhypotesen kan afvises 2 P-værdi> 0.05, nulhypotesen kan ikke afvises 3 P-værdi< 0.05, nulhypotesen kan afvises 4 P-værdi= 0.88, nulhypotesen kan afvises 5 P-værdi= 0.88, nulhypotesen kan ikke afvises Fortsæt på side 5 4

III.2 (7) Udføres hypotesetestet: H 0 : µ = 180 H 1 : µ 180 fås følgende sædvanlige teststørrelse og konklusion, hvis α = 5% anvendes: 1 Teststørrelse: 7508. Konklusion: Nulhypotesen forkastes 2 Teststørrelse: 1877. Konklusion: Nulhypotesen forkastes 3 Teststørrelse: 7.30. Konklusion: Nulhypotesen kan ikke forkastes 4 Teststørrelse: 2.09. Konklusion: Nulhypotesen kan ikke forkastes 5 Teststørrelse: 0.05. Konklusion: Nulhypotesen kan ikke forkastes III.3 (8) Et 90%-konfidensinterval for µ bliver: 1 180.05 ± 1.96 0.0959/16 2 180.05 ± 1.96 0.0959/15 3 180.05 ± 2.131 0.0959/4 4 180.05 ± 1.753 0.0959/16 5 180.05 ± 1.753 0.0959/4 III.4 (9) Et 99%-konfidensinterval for σ bliver: 1 15 0.0092 15 0.0092 32.801 < σ < 4.601 2 16 0.0092 28.845 < σ < 3 15 0.0092 6.262 < σ < 16 0.0092 6.908 15 0.0092 27.488 4 0.0959 ± 1.96 0.0959/4 5 0.0959 ± 2.676 0.0959/16 Fortsæt på side 6 5

III.5 (10) Middelprofillængden for en ny produktion af profiler ønskes bestemt ved en ny stikprøve. Hvis man antager, at spredningen er omtrent 0.1, altså σ = 0.1mm, og man ønsker, at et 95%-konfidensinterval skal have en bredde på kun 0.05mm, hvor mange profiler skal så måles? 1 1 4 (1.96/0.05)2, dvs mindst 385 2 1 4 3 4 (1.96/0.025)2, dvs mindst 1153 3 (1.96 0.1/0.025) 2, dvs mindst 62 4 (2.576 0.05/0.025) 2, dvs mindst 27 5 (2.576 0.2/0.05) 2, dvs mindst 107 Opgave IV En parallelforbindelse af to eletriske modstande R 1 og R 2 giver en samlet modstand R p, der er givet ved: R P = R 1 R 2 R 1 + R 2 I en given parallelforbindelse anvendes to modstande med følgende værdier og spredninger: (i Ohm) R 1 = 500, σ 1 = 25 R 2 = 100, σ 2 = 5 IV.1 (11) Variansen for den samlede modstand R p bliver omtrentlig: 1 1/2 25 + 1/2 5 = 15 2 1/2 25 2 + 1/2 5 2 = 325 3 ( ) 100 600 25 2 + ( 500 600) 5 2 = 125 4 ( ) 2 ( ) 100 2 600 25 2 + 500 2 2 2 600 5 2 = 12.5 2 5 ( ) ( ) 100 2 25 2 + 500 2 5 2 = 34.7 600 2 600 2 Fortsæt på side 7 6

Opgave V En virksomhed skal anvende nogle rør. Det er væsentligt for anvendelsen, at rørenes indvendige ruhed er mindst mulig. For at finde de bedst egnede rør, indhentes rørprøver fra fire mulige leverandører. På hver rørprøve foretages 9 målinger af den indvendige ruhed, måledata fremgår af nedenstående tabel: Ruhed Række- Rækkegennemsnit spredning A 17 25 22 21 16 22 23 20 17 20.33 3.08 B 21 25 20 19 24 19 21 21 17 20.78 2.49 C 14 13 16 16 17 24 20 15 19 17.11 3.41 D 18 19 20 12 13 19 20 14 17 16.89 3.10 En chef ønsker leverandør A og B sammenlignet uden brug af nogen antagelse om normalfordeling, og får lavet følgende kørsel i R: xa=c(17,25,22,21,16,22,23,20,17) xb=c(21,25,20,19,24,19,21,21,17) k = 10000 Asamples = replicate(k, sample (xa, replace = TRUE)) Bsamples = replicate(k, sample (xb, replace = TRUE)) mymeandifs = apply(asamples, 2, mean)-apply(bsamples, 2, mean) hist(mymeandifs) Histogrammet, der laves i sidste linie, viser bootstrap-fordelingen af middelforskellene: Histogram of mymeandifs Frequency 0 500 1000 1500 6 4 2 0 2 4 mymeandifs Fortsæt på side 8 7

muligheder: V.1 (12) Hvad er den eneste fornuftige konklusion baseret på R-kørslen blandt følgende 1 De to spredninger er signifikant forskellige på niveau 5% 2 Der er på niveau 1% signifikant forskel på middelruheden for leverandør A og B 3 Der er på niveau 5% ikke signifikant forskel på middelruheden for leverandør A og B 4 Spredningen man ser i histogrammet er omtrent 1, og derfor er der ingen forskel på de to middelværdier 5 Histogrammet er ikke symmetrisk, og derfor kan vi ikke bruge det til noget V.2 (13) Der foretages nu en sædvanlig variansanalyse af hele datamaterialet. Det oplyses at SS total = 4 9 i=1 j=1 (y ij ȳ) 2 = 410.22. Hvad bliver F-teststørrelsen for den sædvanlige hypotese i denne situation: µ 1 = µ 2 = µ 3 = µ 4 og konklusionen derpå med α = 5%? 1 F = 410.22/36 9.23 = 1.23, så hypotesen accepteres 2 F = 410.22/36 9.23 = 1.23, så hypotesen forkastes 3 F = 38.3 9.23 = 4.15, så hypotesen accepteres 4 F = 38.3 9.23 = 4.15, så hypotesen forkastes 5 F = 410.22 36 = 11.40, så hypotesen forkastes V.3 (14) Man ønsker at sammenligne varianserne for leverandør C og D, og følgende hypotese skal derfor testes: (alene baseret på data for disse to leverandører) H 0 : σc 2 = σd 2 H 1 : σc 2 σd 2 Man får følgende sædvanlige teststørrelse og kritisk værdi med α = 0.10: 1 Teststørrelse: 3.412 3.26 2. Kritisk værdi: 6.03 2 Teststørrelse: 3.412 3.10 2. Kritisk værdi: 3.44 3 Teststørrelse: 3.41 3.26. Kritisk værdi: 1.96 4 Teststørrelse: 3.41 3.10. Kritisk værdi: 3.84 5 Teststørrelse: 3.41 3.10 3.26/9. Kritisk værdi: 2.180 Fortsæt på side 9 8

Opgave VI En virksomhed, der sælger udendørs belysning, får fremstillet en lampe i 3 materialevarianter, i kobber, med malet overflade og i rustfrit stål. Lamperne sælges dels i Danmark og dels til eksport. For 250 lamper er den procentvise fordelingen af salget mellem de 3 varianter og Danmark/eksport opgjort. Data fremgår af nedenstående tabel. Land Danmark Eksport Kobbervariant 7.2% 6.4% Malet variant 28.0% 34.8% Rustfri variant 8.8% 14.8% VI.1 (15) Er der signifikant forskel på andelen, der eksporteres og andelen der sælges i Danmark? (Med α = 0.05) 1 Nej, idet 15/ 250/4 = 1.90 ligger inden for ±1.96 2 Ja, idet 15/ 250/4 = 1.90 ligger inden for ±1.96 3 Ja, idet 15 2 /(250/4) = 3.6 er større end 1.645 4 Ja, idet 15 2 /(250/4) = 3.6 er mindre end ±3.84 5 Nej, idet 15/ 250/4 = 1.90 er større end 1.645 VI.2 (16) Den relevante kritiske værdi for at teste om der er signifikant forskel på hvorledes varianterne fordeler sig i Danmark og i udlandet bliver: (med α = 0.05) 1 z 0.025 = 1.96 2 χ 2 0.025 (3) = 9.348 3 χ 2 0.05 (2) = 5.991 4 χ 2 0.05 (1) = 3.841 5 F 0.05 (3, 2) = 19.16 Fortsæt på side 10 9

Opgave VII I et klinisk forsøg med et kolesterolsænkende middel, har man målt 15 patienters kolesteroltal (i mmol/l) før behandlingen, og 3 uger efter behandlingens start. Data er angivet i nedenstående tabel: Patient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Før 9.1 8.0 7.7 10.0 9.6 7.9 9.0 7.1 8.3 9.6 8.2 9.2 7.3 8.5 9.5 Efter 8.2 6.4 6.6 8.5 8.0 5.8 7.8 7.2 6.7 9.8 7.1 7.7 6.0 6.6 8.4 Følgende kørsler i R udførtes: x1=c(9.1,8.0,7.7,10.0,9.6,7.9,9.0,7.1,8.3,9.6,8.2,9.2,7.3,8.5,9.5) x2=c(8.2,6.4,6.6,8.5,8.0,5.8,7.8,7.2,6.7,9.8,7.1,7.7,6.0,6.6,8.4) t.test(x1,x2,var.equal=true) t.test(x1,x2,pair=true) med følgende resultater: > t.test(x1,x2,var.equal=true) Two Sample t-test data: x1 and x2 t = 3.3206, df = 28, p-value = 0.002505 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.4648623 1.9618043 sample estimates: mean of x mean of y 8.600000 7.386667 > t.test(x1,x2,pair=true) Paired t-test data: x1 and x2 t = 7.3407, df = 14, p-value = 3.672e-06 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.8588225 1.5678442 sample estimates: mean of the differences 1.213333 Fortsæt på side 11 10

α = 0.001? VII.1 (17) Kan der baseret på disse data påvises et signifikant fald i kolesteroltallet med 1 Nej, idet den relevante P-værdi er mindre end 0.05 2 Nej, idet den relevante P-værdi er mindre end 0.001 3 Nej, idet den relevante P-værdi er mindre end 0.001 4 Ja, idet den relevante P-værdi er større end 0.001 5 Ja, idet den relevante P-værdi er mindre end 0.001 VII.2 (18) Hvad er medianen for kolesteroltallet for patienterne før behandlingen? 1 10 7.1 = 2.9 2 8.5 3 8.6 4 10 + 7.1 = 8.55 5 1.21 Fortsæt på side 12 11

Opgave VIII Ved produktion af plastslanger, skal slangediameteren løbende kontrolleres. Ved en prøveproduktion er der fremstillet to stykker slange med to forskellige indstillinger på maskinen. Diameteren er målt 10 steder på hver slange med følgende resultater: (i mm) Indstilling 1: n 1 = 10, x 1 = 5.996, s 1 = 0.0082 Indstilling 2: n 2 = 10, x 2 = 6.014, s 2 = 0.0121 VIII.1 (19) De to varianser kan ikke påvises signifikant forskellige (med α = 0.10), idet: 1 6.014 5.996 2 0.0103/ 10 = 2.846 > t 0.025(18) = 2.093 2 0.01212 0.0082 2 = 2.177 < F 0.05 (9, 9) = 3.18 3 0.0121 0.0082 = 1.476 < F 0.01(9, 9) = 5.35 4 6.014 5.996 0.0103/ 20 = 8.050 > t 0.025(18) = 2.093 5 0.01212 = 1.37 < χ 2 0.0103 2 0.975 (9) = 3.325 VIII.2 (20) Antag at varianserne for de to indstillinger er ens. Hvad er da 95%-konfidensintervallet for middeldiameterforskellen? 1 0.018 ± 2.262 0.0103 1/10 2 0.018 2 ± 3.84 2/10 3 0.018 ± 1.96 (0.0082 + 0.0121) 2/10 4 0.018 ± 1.96 0.0103 1/10 5 0.018 ± 2.101 0.0103 2/10 Fortsæt på side 13 12

Opgave IX Ved kommunalvalget i november 2013 fik socialdemokraterne (A) p = 29.5% af stemmerne på landsplan. En tidlig såkaldt exitpoll estimerede, at de kun ville få 22.7% af stemmerne. Antag at exitpoll en var baseret på 740 personer, hvoraf altså 168 personer angav at have stemt på A. IX.1 (21) På tidspunktet for exitpoll en kendtes p naturligvis ikke. Testes nedenstående hypotese baseret på exitpoll en: H 0 : p = 0.295 H 1 : p 0.295 fås følgende teststørrelse og konklusion: (med α = 0.001) 1 Teststørrelse: 0.227/0.295 = 0.77. Konklusion: Vi afviser nulhypotesen, idet 0.77 > 0.001 2 Teststørrelse: 0.295 0.227 0.227 0.773 = 0.16. Konklusion: Vi accepterer nulhypotesen, idet 0.16 < z 0.0005 = 3.291 3 Teststørrelse: 0.227 0.295 0.295 0.705 = 0.15. Konklusion: Vi accepterer nulhypotesen, idet 0.15 < z 0.025 = 1.96 4 Teststørrelse: 4.05. Konklusion: Vi afviser nulhypotesen, idet 4.05 < z 0.0005 = 3.291 5 Teststørrelse: 4.05. Konklusion: Vi accepterer nulhypotesen, idet 4.05 > χ 2 0.05 (1) = 3.841 IX.2 (22) Et 95%-konfidensinterval for p baseret på exitpoll en bliver: 1 168 ± 1.96 0.227 0.773 740 2 0.227 ± 1.96 0.227 740 3 168 ± 1.645 0.227 740 0.227 0.773 4 0.227 ± 1.96 740 0.227 0.773 5 0.773 ± 1.645 740 Fortsæt på side 14 13

IX.3 (23) Med udgangspunkt i det scenarie, at en stemmeandel er omkring 30%, hvor stor en exitpoll skal man i så fald lave for at opnå et 99%-konfidensinterval med en bredde på 0.01? 1 0.3 0.7 (2.326/0.02) 2 2840 personer 2 0.3 0.7 (1.96/0.02) 2 2017 personer 3 1/4 (2.576/0.01) 2 16589 personer 4 1/4 (1.96/0.01) 2 9604 personer 5 0.3 0.7 (2.576/(0.01/2)) 2 55741 personer Opgave X Ved en undersøgelse af forureningen i et vandløb er koncentrationen af forurening målt 5 forskellige steder. Hvert sted er der udtaget 4 vandprøver og koncentrationen er målt (i mg/l). Resultatet af analysen er angivet i nedenstående tabel: Observationssted 1 2 3 4 5 9.9 8.8 10.3 9.5 10.5 9.1 10.0 11.0 10.9 11.3 9.7 10.1 9.5 9.9 11.9 8.5 9.8 10.2 10.6 12.3 I ne- Det oplyses yderligere at observationsstederne har forskellig afstand til forureningskilden. denstående tabel er disse afstande samt den gennemsnitlige forurening angivet: Afstand fra forureningskilde (i km) 10 8 6 4 2 Gennemsnitlig koncentration 9.3 9.675 10.25 10.225 11.5 To relevante analyser køres i R, først: Koncentration=c(9.9,8.8,10.3,9.5,10.5, 9.1,10.0,11.0,10.9,11.3, 9.7,10.1,9.5,9.9,11.9, 8.5,9.8,10.2,10.6,12.3) Sted=factor(c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5)) anova(lm(koncentration~sted)) med følgende resultat, hvor en del af det sædvanlige R-output dog er udeladt (og erstattet af et X ): Fortsæt på side 15 14

Analysis of Variance Table Response: Koncentration Df Sum Sq Mean Sq F value Pr(>F) Sted X 11.113 X X X Residuals X 6.465 X og dernæst:(2. analyse) Koncentration=c(9.3,9.675,10.250,10.225,11.500) Afstand=c(10,8,6,4,2) summary(lm(koncentration~afstand)) med følgende resultat: Call: lm(formula = Koncentration ~ Afstand) Residuals: 1 2 3 4 5 0.10-0.02 0.06-0.46 0.32 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 11.67500 0.34679 33.665 5.76e-05 *** Afstand -0.24750 0.05228-4.734 0.0179 * --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 0.3307 on 3 degrees of freedom Multiple R-squared: 0.8819,Adjusted R-squared: 0.8426 F-statistic: 22.41 on 1 and 3 DF, p-value: 0.01787 X.1 (24) Baseret på den første analyse, hvad bliver teststørrelse og kritisk værdi (med α = 0.05) for hypotesen om ingen forskel i middelværdierne for de fem observationssteder? 1 Teststørrelse = 6.45 og kritisk værdi = 3.06 2 Teststørrelse = 1.72 og kritisk værdi = 1.96 3 Teststørrelse = 2.78 og kritisk værdi = 3.84 4 Teststørrelse = 0.431 og kritisk værdi = 2.71 5 Teststørrelse = 1.72 og kritisk værdi = 3.84 Fortsæt på side 16 15

X.2 (25) Et 90%-konfidensinterval for middelforskellen mellem observationssted 1 og 2 bliver: 1 10.19 ± 1.753 2.778 1/4 2 10.19 ± 1.96 0.431 1/20 3 0.375 ± 1.753 0.431 1/2 4 0.375 ± 2.086 2.778 1/2 5 0.375 ± 2.086 0.925 1/4 X.3 (26) Hvad er parameter-estimaterne for de 3 ukendte parametre i den sædvanlige lineære regressionsmodel, der ligger til grund for den anden analyse: 1) Afskæring med y-aksen, 2) hældningen og 3) (residual)spredningen? 1 1) 0.2475, 2) 0.05228 og 3) 0.8819 2 1) 11.675, 2) 0.3468 og 3) 0.3307 3 1) 11.675, 2) 0.2475 og 3) 0.3307 4 1) 4.734, 2) 33.665 og 3) 0.22 5 1) 0.06, 2) 0 og 3) 0.01787 X.4 (27) Hvor stor en del af koncentrationsvariationen kan forklares af afstanden? 1 88.2% 2 93.9% 3 91.8% 4 1.79% 5 95% Fortsæt på side 17 16

X.5 (28) Et 95%-konfidensinterval for den forventede forureningskoncentration 7km fra kilden bliver: 1 9.91 ± 0.30 2 9.91 ± 0.38 3 81.5 ± 5.0 4 9.94 ± 0.50 5 9.94 ± 0.17 Fortsæt på side 18 17

Opgave XI Der skal produceres nogle plastslanger for hvilke trækbrudstyrken er væsentlig. Der produceres derfor prøveemner, og der foretages en trækprøvning af disse, hvor emnernes trækbrudspænding bestemmes. To forskellige granulater og fire mulige leverandører deltager i forsøget. Måleresultaterne (i MPa) )fra forsøget er opgivet i nedenstående tabel. Granulat g1 g2 Leverandør a 34.2 33.1 Leverandør b 34.8 31.2 Leverandør c 31.3 30.2 Leverandør d 31.9 31.6 Følgende kørtes i R: Y=c(34.2,34.8,31.3,31.9,33.1,31.2,30.2,31.6) Leverandoer=c("a","b","c","d","a","b","c","d") Granulat=factor(c(1,1,1,1,2,2,2,2)) anova(lm(y~leverandoer+granulat)) med følgende resultat: Analysis of Variance Table Response: Y Df Sum Sq Mean Sq F value Pr(>F) Leverandoer 3 10.0338 3.3446 3.2537 0.1792 Granulat 1 4.6512 4.6512 4.5249 0.1233 Residuals 3 3.0837 1.0279 Fortsæt på side 19 18

XI.1 (29) Hvilken fordeling har været brugt for at finde P-værdien 0.1792? 1 t-fordelingen med frihedsgraderne ν = 7 2 F-fordelingen med frihedsgraderne ν 1 = 3 og ν 2 = 3 3 F-fordelingen med frihedsgraderne ν 1 = 3 og ν 2 = 1 4 χ 2 -fordelingen med frihedsgraderne ν = 7 5 F-fordelingen med frihedsgraderne ν 1 = 4 og ν 2 = 8 XI.2 (30) Hvad er den mest korrekte konklusion baseret på analysen? (brug α = 0.05) 1 Der kan påvises signifikant forskel i varianserne fra variansanalysen 2 Der kan påvises signifikant forskel i middelværdierne for de 2 granulater men ikke for de 4 leverandører 3 Der kan ikke påvises signifikant forskel i middelværdierne for hverken de 4 leverandører eller de 2 granulater 4 Der kan påvises signifikant forskel i middelværdierne for såvel de 4 leverandører som de 2 granulater 5 Der kan påvises signifikant forskel i middelværdierne for de 4 leverandører men ikke for de 2 granulater SÆTTET ER SLUT. GOD JUL! 19