(studienummer) (underskrift) (bord nr)

Relaterede dokumenter
Løsning til eksamen d.27 Maj 2010

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

(studienummer) (underskrift) (bord nr)

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

(studienummer) (underskrift) (bord nr)

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Danmarks Tekniske Universitet Side?? af 20 sider

Forelæsning 11: Kapitel 11: Regressionsanalyse

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Danmarks Tekniske Universitet Side 1 af 19 sider

Løsning eksamen d. 15. december 2008

(studienummer) (underskrift) (bord nr)

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

(studienummer) (underskrift) (bord nr)

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Side 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december Kursus navn og nr: Introduktion til Statistik, 02402

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 14. december 2009

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Eksamen i Statistik for biokemikere. Blok

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

Appendiks Økonometrisk teori... II

1 Hb SS Hb Sβ Hb SC = , (s = )

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Multiple choice opgaver

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Konfidensintervaller og Hypotesetest

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

Vejledende løsninger kapitel 8 opgaver

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Test nr. 5 af centrale elementer 02402

Vejledende besvarelser til opgaver i kapitel 14

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 28. maj 2010 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

Test nr. 6 af centrale elementer 02402

(studienummer) (underskrift) (bord nr)

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Tema. Dagens tema: Indfør centrale statistiske begreber.

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

(studienummer) (underskrift) (bord nr)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Skriftlig eksamen Science statistik- ST501

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Kapitel 7 Forskelle mellem centraltendenser

Nanostatistik: Opgavebesvarelser

Reeksamen i Statistik for biokemikere. Blok

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : (navn) (underskrift) (bord nr)

Kapitel 12 Variansanalyse

En Introduktion til SAS. Kapitel 5.

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Løsninger til kapitel 9

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Forelæsning 9: Inferens for andele (kapitel 10)

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Besvarelser til øvelsesopgaver i uge 6

Test nr. 4 af centrale elementer 02402

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Opgaver til kapitel 3

Reeksamen i Statistik for Biokemikere 6. april 2009

Klasseøvelser dag 2 Opgave 1

Kapitel 12 Variansanalyse

Transkript:

Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 16 opgaver. Besvarelserne af multiple choice spørgsmålene anføres ved at udfylde skemaet på forsiden (denne side), med numrene på de svarmuligheder, du mener er de korrekte. Et forkert svar kan rettes ved at sværte det forkerte svar over og anføre det rigtige i stedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end ét nummer ved et spørgsmål, betragtes spørgsmålet som ubesvaret. Kladde, mellemregninger eller andet tillægges ingen betydning, kun svarene i tabellen tæller. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. Ubesvarede spørgsmål eller et 6-tal (svarende til ved ikke ) giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Opgave I.1 I.2 I.3 II.1 I1.2 III.1 III.2 IV.1 IV.2 IV.3 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 1 4 2 3 5 2 1 3 3 1 Opgave V.1 V.2 V.3 VI.1 VII.1 VIII.1 VIII.2 IX.1 IX.2 X.1 (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar 2 1 1 2 4 5 3 4 3 5 Opgave X.2 XI.1 XII.1 XII.2 XIII.1 XIII.2 XIV.1 XV.1 XVI.1 XVI.2 (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar 1 1 1 1 4 2 4 1 2 4 Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 21; blad lige om og se, at den er der. Fortsæt på side 2 1

Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I I et rygestopkursus havde man over en periode på 4måneder registreret antallet af mandlige og kvindelige deltagere samt hvor mange af disse, der efter kurset var blevet røgfrie. Følgende antal blev registreret i løbet af de 4 måneder: Ikke røgfri Røgfri Kvinder 91 352 Mænd 32 212 I.1 (1): Et relevant test for hypotesen om, at der ingen forskel er på andelen af mænd og kvinder der bliver røgfrie efter deltagelse i kurset giver følgende resultat: 1 Teststørrelse= 5.91, så p-værdi< 0.025 2 Teststørrelse= 4.86, så p-værdi< 0.025 3 Teststørrelse= 0.96, så p-værdi> 0.05 4 Teststørrelse= 1.96, så p-værdi< 0.05 5 Teststørrelse= 12.44, så p-værdi< 0.005 I.2 (2): Tidligere gennemførte kurser havde vist, at sandsynligheden for at en tilfældigt udvalgt deltager ville blive røgfri var 80%. I et lignende rygestop kursus deltog 20 rygere. Hvad er sandsynligheden for, at mindst 18 ud af de 20 deltagere vil være røgfri efter at have deltaget i kurset? (Nedenfor betegner B(x; n, p) fordelingsfunktionen for binomialfordelingen) 1 B(18; 20, 0.80) 2 1 B(18; 20, 0.80) 3 1 B(2; 20, 0.20) 4 B(2; 20, 0.20) 5 B(17; 20, 0.80) Fortsæt på side 3 2

I.3 (3): Hvis man efter et rygestop kursus tilfældigt udspørger nogle af deltagerne om de er blevet røgfri, hvor mange deltagere skal man som minimum udspørge, for at sandsynligheden for, at mindst 1 af de adspurgte IKKE er blevet røgfri overstiger 50%? 1 3 2 4 3 5 4 6 5 7 Fortsæt på side 4 3

Opgave II Det systoliske blodtryk (SBT) blev målt på 8 parkinson patienter og 21 raske personer. Formålet med undersøgelsen var at undersøge, om der er forskel i SBT mellem de 2 grupper. For parkinson gruppen blev følgende værdier udregnet: y 1 = 132.86 og s 1 =15.34, og for de raske personer: y 2 = 127.44 og s 2 =18.23. Det antages, at de to populationer kan beskrives ved en normalfordeling. II.1 (4): Hvis det antages at de to grupper har samme varians, hvad bliver da teststørrelsen for et tosidet test på signifikansniveau α = 0.05? 1 t = 132.86 127.44 16.79 ( 1 8 + 1 21) 2 t = 132.86 127.44 17.53 1 7 + 1 20 3 t = 132.86 127.44 17.53 1 8 + 1 21 4 t = 132.86 127.44 17.53 1 8 2 + 1 21 2 5 t = 132.86 127.44 16.79 ( 1 7 + 1 20) II.2 (5): Hvis man ønskede at teste hvorvidt varianserne for de to grupper kunne antages ens, kunne man konstruere et F-test. Ved et sådan test på 2 % signifikansniveau ville man konkludere følgende: (Både konklusion og argument skal være i orden) 1 Acceptere H 0 idet 18.232 15.34 2 =1.41 <F 0.01 (7, 20) 2 Forkaste H 0 idet 18.232 15.34 =1.41 >F 2 0.01 (20, 7) 3 Acceptere H 0 idet 18.23 15.34 =1.19 <F 0.01(20, 7) 4 Forkaste H 0 idet 18.23 15.34 =1.19 >F 0.01(20, 7) 5 Acceptere H 0 idet 18.232 15.34 =1.41 <F 2 0.01 (20, 7) Fortsæt på side 5 4

Opgave III Arrangørerne af Københavns maraton ønsker at teste om der er en sammenhæng mellem hvor mange maraton løbsdeltagerne tidligere har gennemført, og den tid løbsdeltagerne gennemførte de 42.195 km på til Københavns maraton i maj 2009. I nedenstående tabel er deltagerne opdelt i 3 forskellige grupper alt efter hvor mange maraton de tidligere har gennemført og løbstiderne er inddelt i 5 forskellige grupper, hvor i.g. står for ikke gennemført: Løbstid i timer [0;3) [3;4) [4;5) [5;6) i.g. Total 0 maraton 51 1281 811 125 194 2462 10 maraton 82 1523 1077 108 134 2924 > 10 maraton 92 1812 1298 122 120 3444 Total 225 4616 3186 355 448 8830 De forventede frekvenser for hver celle er udregnet og angivet i nedenstående tabel: Løbstid i timer [0;3) [3;4) [4;5) [5;6) i.g. Total 0 maraton 63 1287 888 99 125 2462 10 maraton 74 1529 1055 118 148 2924 > 10 maraton 88 1800 1243 138 175 3444 Total 225 4616 3186 355 448 8830 Teststørrelsen kan nu udregnes til: χ 2 = (51 63)2 63 + (1281 1287)2 1287 +...+ (120 175)2 175 =79.25 III.1 (6): Konklusionen på ovenstående test ved signifikansniveau α = 0.01 bliver? 1 H 0 accepteres idet p-værdi> 0.05 2 H 0 forkastes idet p-værdi< 0.01 3 H 0 forkastes idet p-værdi< 0.05 4 H 0 accepteres idet p-værdi> 0.025 5 H 0 accepteres idet p-værdi> 0.01 Fortsæt på side 6 5

III.2 (7): Havde man kun valgt at inddele løbstiderne i følgende 3 grupper: [0;3), [3;5), og [5; )(inkl. i.g.-gruppen), så skulle man ved et test på signifikansniveau α = 0.05, benytte følgende kritiske værdi: 1 χ 2 0.05 (4) 2 χ 2 0.05 (6) 3 χ 2 0.025 (4) 4 χ 2 0.025 (6) 5 χ 2 0.05 (5) Fortsæt på side 7 6

Opgave IV Indholdet af tungmetallet Cadmium i dåsetun blev målt i tun fra 3 forskellige producenter af dåsetun. Fra hver producent blev der tilfældigt udvalgt 5 dåser tun. Følgende mængder af Cadmium i µg/kg blev målt i de i alt 15 forskellige dåser tun: Producent 1: 57, 52, 62, 49, 43 Producent 2: 55, 74, 62, 42, 52 Producent 3: 61, 54, 55, 53, 51 Det ønskes at teste, om der er forskel i mængden af Cadmium i dåsetun fra de 3 producenter. I nedenstående tabel ses resultatet for en sædvanlig variansanalyse af indholdet af Cadmium ide15dåser: DF SS MS F Producenter 48.4 24.2 0.35 Fejl 838.0 69.8 Total 886.4 IV.1 (8): Kolonnen for frihedsgrader der ikke er udfyldt bliver (nævnt i rækkefølgen producenter, fejl, total): 1 2, 13, 15 2 3, 12, 15 3 2, 12, 14 4 2, 14, 16 5 3, 14, 17 1? IV.2 (9): Hvad er den 3. kvartil (øvre) for Cadmium indholdet hos Producent 1 52 2 54.5 3 57 4 52.6 5 55.75 Fortsæt på side 8 7

IV.3 (10): Hvaders ɛ, estimatet for standardafvigelsen for fejlen? 1 69.8 2 69.8 3 838.0 4 0.35 5 Kan ikke estimeres ud fra ovenstående Fortsæt på side 9 8

Opgave V En idrætslærer ønsker at teste sine elevers kondition. Han benytter den klassiske Cooper test, hvor det gælder om at løbe så langt som muligt på 12 minutter, og han påstår over for sine elever, at landsgennemsnittet for elever i samme klassetrin er 2000 meter. Testen udføres på i alt 16 elever og gennemsnittet og standardafvigelsen for hvor langt eleverne nåede at løbe på de 12 minutter blev (angivet i meter): y = 1850 og s = 356. V.1 (11): Hvis man ved at sammenligne middelværdien for de 16 elever og landsgennemsnittet ønsker at vise, at de 16 elever HAR en dårligere kondition end landsgennemsnittet, hvorledes vil man formulere nul hypotesen (H 0 ) og den alternative hypotese (H 1 )? 1 H 0 : µ = 1850 og H 1 : µ>1850 2 H 0 : µ = 2000 og H 1 : µ<2000 3 H 0 : µ = 1850 og H 1 : µ 1850 4 H 0 : µ = 2000 og H 1 : µ 2000 5 H 0 : µ = 2000 og H 1 : µ = 1850 V.2 (12): Hvis det antages, at distancen eleverne løber på de 12 minutter er normalfordelt, kan det da konkluderes, at eleverne har en dårligere kondition end landsgennemsnittet, på signifikansniveau 5%? (Både konklusion og argument skal være i orden) 1 Nej fordi t = 1850 2000 356/ 16 > t 0.05(15) 2 Ja fordi t = 1850 2000 356/ 16 > t 0.05(15) 3 Ja fordi Z = 1850 2000 356/ 16 < z 0.05 4 Nej fordi Z = 1850 2000 356/ 15 > z 0.05 5 Nej fordi t = 1850 2000 356/ > t 15 0.05(16) Fortsæt på side 10 9

V.3 (13): Hvis det IKKE kunne antages at distancen eleverne løber på de 12 minutter er normalfordelt, hvilket test ville da være egnet til at teste elevernes kondition i forhold til landsgennemsnittet? 1 Et fortegns test (sign test) 2 Et parret t test 3 Et t test med 15 frihedsgrader 4 Test for tilfældighed 5 Rank-Sum test Fortsæt på side 11 10

Opgave VI Fra januar 2010 blev der indført en kommunal madordning i nogle af landets børnehaver. Tilfredsheden med madordningen var meget varierende fra kommune til kommune. Nedenstående data stammer fra en undersøgelse der målte hvorvidt forældre i Jylland, på Fyn og på Sjælland var for eller i mod madordningen. Jylland Fyn Sjælland For madordningen 160 102 209 Imod madordningen 198 110 124 Der udføres det sædvanlige test med nul hypotesen, at andelen af forældre der er for madordningen er den samme i Jylland, på Fynogpå Sjælland. test? VI.1 (14): Med et signifikansniveau på 0.01 bliver den kritiske værdi for dette 1 χ 2 0.005 (2) = 10.597 2 χ 2 0.01 (2) = 9.210 3 χ 2 0.01 (3) = 11.345 4 χ 2 0.01 (6) = 16.812 5 χ 2 0.005 (3) = 12.838 Fortsæt på side 12 11

Opgave VII VII.1 (15): Hvilken af følgende påstande om ikke-parametriske metoder er falsk? 1 Et sign-test kan benyttes som alternativ til hypotese test for én middelværdi 2 Et sign-test kan benyttes som alternativ til et parret t-test 3 Rank sum test kan benyttes som alternativ til t-test for 2 uafhængige stikprøver 4 Rank sum test kan benyttes som alternativ til F-test for to varianser 5 Sign-test kan benyttes til at teste hypoteser om medianen Opgave VIII En tilfældig stikprøve af 10 ejendomsmæglere viste, at de skulle fremvise en ejendom til 8, 7, 10, 14, 11, 7, 10, 11, 16, 12 forskellige købere før ejendommen blev solgt. VIII.1 (16): Ved et test for hypotesen at medianen er lig med 10 købere mod alternativet at den er større end 10 med α = 0.05,bliver konklusionen: 1 Nul-hypotesen accepteres, idet P (X 5) = 1 0.3770 = 0.6230 er større end α =0.05 2 Nul-hypotesen forkastes, idet P (X 5) = 1 0.6367 = 0.3633 er større end α =0.05 3 Nul-hypotesen forkastes, idet P (X 5) = 1 0.8555 = 0.1445 er større end α =0.05 4 Nul-hypotesen forkastes, idet P (X 5) = 1 0.3770 = 0.6230 er større end α =0.05 5 Nul-hypotesen accepteres, idet P (X 5) = 1 0.6367 = 0.3633 er større end α =0.05 VIII.2 (17): Medianen for antallet af fremvisninger af en ejendom bliver? 1 10.6 2 11 3 10.5 4 11.75 5 10 Fortsæt på side 13 12

Opgave IX En undersøgelse har vist, at der ved hver femte fødsel opleves komplikationer. Hvis en kvinde får netop 3 børn, hvad er så risikoen for, at hun ved mindst den ene fødsel oplever komplikationer? IX.1 (18): 1 0.2 3 2 1 0.2 3 3 0.2 4 1 0.8 3 5 0.8 3 IX.2 (19): Undersøgelsen var baseret på 500 fødsler, hvoraf der altså varkom- plikationer ved 100 af disse. Hvad er 95% konfidensintervallet for andelen af fødsler med komplikationer? 1 0.2 ± 1.96 0.2(1 0.2) 100 2 0.2 ± 1.645 0.2(1 0.2) 500 3 0.2 ± 1.96 0.2(1 0.2) 500 4 0.2 ± 1.96 0.2 500 5 0.2 ± 1.645 0.2(1 0.2) 100 Fortsæt på side 14 13

Opgave X Herunder ses tæthedsfunktionerne for tre normalfordelinger: 0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.4 0.8 1.2 0.00 0.10 0.20 3 4 5 6 7 a 1.0 0.5 0.0 0.5 1.0 b 0 2 4 6 8 10 c X.1 (20): Det er oplyst, at den midterste fordeling har en spredning på σ =0.3. Hvis man skal nævne de tre fordelinger i rækkefølge efter størrelsen på spredningen, hvor man nævner fordelingen med den mindste spredning først og fordelingen med den største spredning til sidst, bliver rækkefølgen? 1 a, b, c 2 a, c, b 3 b, c, a, 4 c, a, b 5 b, a, c X.2 (21): 2.5 % og 97.5 % fraktilerne for den midterste fordeling bliver ca.? 1 ±0.6 2 ±1.6 3 ±1.96 4 ±1 5 ±0.3 Fortsæt på side 15 14

Opgave XI På større universitets hold tilsigter man, at karaktererne er fordelt efter følgende procenter for beståede elever: Karakter 2 4 7 10 12 Procent 10 25 30 25 10 XI.1 (22): Variansen for denne karakterfordelingen er: 1 9.5 2 0.95 3 7 4 5 5 2.85 Fortsæt på side 16 15

Opgave XII For at verificere fedtprocenten i oksekød hos en slagter udtages 6 uafhængige stikprøver på hver 10 gram, hvor mængden af fedt blev målt i hver stikprøve. De 6 uafhængige målinger af fedt angivet i gram blev: 7.41, 6.20, 6.73, 5.44, 6.20, og 6.55. Antag at data er normalfordelt. XII.1 (23): Et 99%-konfidensinterval for det sande indhold af fedt i oksekødet bliver da ca.: 1 6.42 ± 4.032 0.268 2 6.42 ± 3.707 0.268 3 6.42 ± 4.032 0.293 4 6.42 ± 3.707 0.293 5 6.42 ± 2.576 0.072 XII.2 (24): Antag at den sande varians er 0.36. Hvor mange prøver skal man tage i en kommende undersøgelse for at opnå en maximal fejl på 0.2 med 95% konfidens? 1 Mindst 35 idet (1.96 0.6/0.2) 2 =34.57 2 Mindst 13 idet (1.96 0.36/0.2) 2 =12.45 3 Mindst 25 idet (1.645 0.6/0.2) 2 =24.35 4 Mindst 20 idet (2.447 0.36/0.2) 2 =19.40 5 Mindst 54 idet (2.447 0.6/0.2) 2 =53.89 Fortsæt på side 17 16

Opgave XIII Nedenstående tabel viser data fra en lineær regresionsanalyse: i 1 2 3 4 5 6 7 8 9 10 11 12 x i 5.0 3.4 2.9 4.0 3.6 6.4 3.6 5.4 4.5 0.5 3.0 3.8 y i 8.5 6.3 6.3 6.6 5.6 10.5 6.3 10.3 8.2 3.3 5.7 8.7 Til besvarelse af opgaven kan følgende udregningsstørrelser benyttes n n x i =46.1, y i =86.3, x= 1 n x i =3.84, y = 1 n y i =7.19 n n i=1 i=1 i=1 i=1 n (x i x) 2 =23.85, n (y i y) 2 =48.25, n (x i x)(y i y) =31.42 i=1 i=1 i=1 XIII.1 (25): Hvad er estimaterne for henholdsvis afskæringen med Y-aksen, a, og hældningskoefficienten, b, i den sædvanlige lineære regressionsmodel: Y i = α + βx i + ɛ i? 1 a =25.4ogb=2.02 2 a =0.177 og b =1.32 3 a =25.4ogb=0.65 4 a =2.13 og b =1.32 5 a =2.13 og b =0.65 XIII.2 (26): Estimatet for variansen (s 2 e)ergivetved: 1 (48.25 (23.85/31.42) 2 )/10 2 (48.25 (31.42 2 /23.85))/10 3 (48.25 (23.85 2 /31.42))/10 4 (23.85 (31.42 2 /48.25))/10 5 (48.25 (23.85/31.42))/10 Fortsæt på side 18 17

Opgave XIV Nedenfor ses boxplot for 3 forskellige grupper af data. 4 6 8 10 12 a b c XIV.1 (27): Hvilket af følgende udsagn er falsk? 1 Medianen for datasættet i b er ca. 8 2 Den største observation blandt alle 3 datasæt er ca. 12 3 Datasættet i boxplot c har klart den mindste varians 4 95 % fraktilen for datasættet i boxplot a er ca. 12 5 Den øvre kvartil for boxplot c er ca. 7.4 Fortsæt på side 19 18

Opgave XV For at et taxaselskab tjener penge, skal antallet af kunder for en given taxachauffør som minimum være 4 pr. time. I en periode på 3 timer observeredes 9 kunder hos en tilfældig udvalgt taxachauffør. Det ønskes at undersøge om der er grund til at tro, at taxaselskabet taber penge på denne taxachauffør(på længere sigt)? XV.1 (28) P-værdien for en sådan undersøgelse findes ved: 1 P-værdi er lig P (X 9) = 0.242, hvor X Poisson(12) 2 P-værdi er lig 1 P (X 8)=0.845, hvor X Poisson(12) 3 P-værdi er lig P (X 3) = 0.433, hvor X Poisson(4) 4 P-værdi er lig 1 P (X 2)=0.762, hvor X Poisson(4) 5 Er ikke mulig at svare på udfra ovenstående oplysninger Fortsæt på side 20 19

Opgave XVI Nedenfor ses en lineær regressionsanalyse af sammenhængen mellem antal solskinstimer og antal Birke pollen pr. m 3 i København i april måned 2010. Antal Birke pollen pr. kubikmeter 50 100 150 200 250 300 2 4 6 8 10 Solskinstimer XVI.1 (29) Hvilken korrelationskoefficient beskriver bedst ovenstående analyse? 1-0.99 2 0.99 3 0.50 4-0.50 5 0.30 Fortsæt på side 21 20

I R er værdierne for solskinstimer gemt i variablen X og værdierne for pollental gemt i variablen Y. Fra R fås følgende kommandoer og (delvis) output for data: > fit.evap <- lm(y ~ X) > summary(fit.evap) Call: lm(formula = Y ~ X) Residuals: Min 1Q Median 3Q Max -20.914-8.824-1.024 10.036 25.792 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -38.3762 5.7622-6.66 3.16e-07 *** X 31.1562 0.8706 35.78 < 2e-16 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 XVI.2 (30): Den estimerede lineære sammenhæng er: 1 Y =38.38 X 31.16 2 Y =5.76 X 38.38 3 Y =35.78 X 6.66 4 Y =31.16 X 38.38 5 Y =0.87 X +5.76 21