02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende: for hver annonceret salgspris angives en højere faktisk salgspris ved (+), lige præcis ved (0), og mindre (-) i forhold til hvad kunden havde forlangt, som vist i nedenstående tabel Kunde nr. 1 2 3 4 5 6 7 8 9 10 11 12 Salg - - - + - - 0 + + 0 - - Angiv hvilken metode der er (bedst) egnet til at teste og eventuelt påvise, at kunden som oftest får mindre end hvad den har forlangt for sin bolig. 2. Sign test 3. Test i antaltstabel for fordeling 4. lineær regressionsanalyse Korrekt svar: 2 Spørgsmål 5. En fisker tjener 20 kroner for et kg rejer. Hans fangst varierer lidt, i middel 40 kg, og standard afvigelse 5 kg. Angiv middelværdi og varians af fiskerens fortjeneste ved en fangst 1. Middelværdi 40 og varians 5 2. Middelværdi 40 og varians 25 3. Middelværdi 800 og varians 10000 4. Middelværdi 800 og varians 500 Løsning Fiskerens fangst X er en stokastisk variabel med E[X] =40 Var[X]=5 2 Idet a = 20, og der er tale om en skalering, fås E[a X] =a[x]=20 40 Var[X]=a 2 Var[X]=20 2 5 2 Korrekt svar: 3 1
Spørgsmål 6. I et forsøg var man interesseret i at undersøge om indtagelse af koffein (i form af kaffe) havde effekt af hvor hurtigt man kunne indtaste en tekst (200 ord) på computer. Målingerne er givet i nedenstående tabel Koffein (ml) 0 20 40 60 80 100 120 140 160 180 200 Tid (sek.) 212 218 236 217 237 218 223 229 168 211 235 En evt sammenhæng mellem indtagelse af koffein og hvor hurtigt man kan indtaste en tekst analyseres mest hensigtsmæssigt ved 2. Sign test 3. test i antaltstabel for fordeling 4. lineær regressionsanalyse Løsning Idet vi søger en sammenhæng mellem 2 variable x (koffein) og y hastighed, dvs en sammenhæng mellem sammenhørende værdier, gøres dette mest hensigtsmæssigt ved lineær regressionsanalyse, dvs y = α + β x + ε Iøvrigt vil man kunne påvise en sammenhæng (på et givet signifkansniveau) hvis man kan afvise nul-hypotesen, H 0 : β =0 Korrekt svar: 4 Spørgsmål 7. Ventetiden når man ringer op til en servicetelefon følger en eksponetialfordeling med middelværdi 3 minutter. Hvad er sandsynligheden for, at man skal vente længere end 6 minutter, når man ringer til servicetelefonen? 1. 0.1353 2. 0.050 3. 0.950 4. 1-0.1353 Løsning Opgaven kan løses på 2 forskellige måder. Enten direkte i eksponentialfordelingen (sandsynligheden for at vente længere en 6 minutter), eller ved regning i poissonfordelingen (sandsynligheden for ingen hændelser i løbet af 6 minutter). Her vises det sidste alternativ For en periode på 6 minutter vil man i middel forvente 2 kundeankomster, således at for perioden beskrives antal ankomster ved X pois(2). Den søgte sandsynlighed bliver derfor (tabel 2, side 570) P (X 0) = 0.135 2
Korrekt svar: 1 Spørgsmål 8. Du bliver tildelt 5 kort fra et almindelig spil kort (dvs. indholdende 52 kort). Hvad er sandsynligheden for, at alle 5 kort er hjerter? 1. 5/13 2. 1024/371293 3. 1024/154440 4. 1287/2598960 Løsning Idet sandsynligheden for at trække en hjerter er betinget af hvad man har trukket allerede, fås sandsynligheden ved at betragte den hypergeometriske fordeling Korrekt svar: 4 ( )( ) 13 39 5 0 ( ) = 1287 52 2598960 5 Spørgsmål 9. I behandling af en sygdom sammenlignede man to typer af medicin (I og II). For en række patienter registrerede man graden af forbedring på en skala fra 1 til 4 (hvor 1 er bedst) og fik følgende resultater for 273 patienter 1 2 3 4 I 26 51 21 40 II 31 59 11 34 Hvilken metode er (best) egnet til at undersøge om fordelingen i de to grupper (og dermed effektiviteten af de to typer medicin) er ens 2. Parret t-test 3. Test i antaltstabel 4. Lineær regressionsanalyse Løsning Tabellen viser, at patienter, der har afprøvet en af de to typer medicin, er blevet klassificeret på skalaen 1-4. Observationerne i hver celle (antal) kan altså betragtes som en andel ud af det totale antal, der har prøvet medicinen. Den mest hensigtsmæssige analysemetode er derfor test i en antalstabel Korrekt svar: 3 3
Spørgsmål 10. Når man tester en tosidet statistisk hypotese, og finder at teststørrelsen er numerisk mindre end de kritiske værdier, kan det konkluderes 1. At H 0 accepteres på det angivne signifikansniveau 2. At H 0 forkastes på det angivne signifikansniveau 3. At H 1 påvises på det angivne signifikansniveau 4. At H 1 påvises med sandsynligheden 5% Løsning Idet teststørrelsen er numerisk mindre end de kritiske værdier, og dermed ligger i acceptområdet, accepteres H 0 på det angivne signifikansniveau Korrekt svar: 1 Spørgsmål 11. I et amerikansk studie har man har stillet en række børn i 4 klasse følgende spørgsmål: Hvad vil du helst foretrække mht skolen? og hertil havde man følgende svarmuligheder a) få gode karakterer b) være dygtig til sport c) være populær Såfremt man vil undersøge om drenge og piger fordeler sig ens mht ovenstående svarmuligheder gøres dette mest hensigtsmæssigt ved 2. Sign test 3. Test i antaltstabel 4. Lineær regressionsanalyse Idet man vil registrere hvor mange drenge og piger, der svarer i en af de 3 kategorier, vil den efterfølgende analyse mest hensigtsmæssigt være test i en antalstabel korrekt svar: 3 4
Spørgsmål 12. I et studie undersøgte man om det tog længere tid for en baby at lære at kravle i kolde måneder (om vinteren) end i varme måneder (om sommeren). (Motivation var egentlig at undersøge om lag af varmt tøj forhindrede babyen i at kravle). Man registrerede derfor babyens alder, når den først lærte at kravle og den tilhørende udendørstemperatur. Såfremt korrelationskoefficienten mellem alder og udendørstemperatur er -0.5, og der i øvrigt er en lineær sammenhæng, kan det konkluderes 1. At piger lærer hurtigere at kravle end drenge 2. At når temperaturen falder, så kravler børn hurtigere, end når det er varmt 3. At når temperaturen falder, så tager det længere tid for babyer at lære at kravle 4. Børn kravler meget stærkt i varme korrekt svar: 3 Spørgsmål 13. Fortsat fra spm 12. Såfremt man ønsker en modellere sammenhæng mellem kravlealder og udendørstemperatur ved modellen Y = a + b X + e og man samtidig har estimeret korrelationskoefficienten mellem alder og udendørstemperatur er estimeret til r = 0.5, kan det konkluderes at 1. estimatet af a er negativt 2. estimatet af b er negativt 3. estimatet af e er negativt 4. man kan ikke konkludere noget direkte Løsning Hældningen på den rette linie, der passer bedst til data vil være negativ (men ikke nødvendigvis signifikant forskellig fra nul). korrekt svar: 2 5
Spørgsmål 14. Fortsat fra spm 12. Såfremt man har estimeret parametrene a og b i ligningen Y = a + b X + e hvor Y angiver kravlealder og X angiver temperatur. Variablen e angiver da 1. e angiver modellens residualer, 2. e angiver modelles forklaringsgrad 3. e angiver liniens hældning 4. e er ikke typisk en del af en regressionsmodel Løsning e angiver modellens residualer, dvs afvigelse mellem model og observationer, e = Y a b X Korrekt svar: 1 Spørgsmål 15. Fortsat fra spm 12. Lad os antage at X er angivet i grader celcius, Y i måneder og estimatet af a er 8 og estimatet af b er 0.05. Hvor meget hurtigere lærer et barn at kravle hvis middeltemperaturen er 10 grader højere ifølge modellen? 1. Det kan kun besvares hvis man ved at b er signifikant forskellig fra 0 2. 8 en halv måned 3. 7 en halv måned 4. en halv måned Løsning Såfremt a og b er signifikante haves modellen Y =8 0.05 X Heraf ses, at hvis X bliver 10 grader højere, så bliver Y mindre, mere præcis 0.05 10 = 0.5 måned mindre. Men hvis b ikke er signifikant (man kan antage at b = 0), gælder ovenstående model ikke. Spørgsmålet kan altså kun besvares, hvis det man ved at b er signifikant forskellig fra 0 Korrekt svar: 1 6
Spørgsmål 16. Såfremt man ved et statistisk test ikke kan afvise nul-hypotesen H 0 : b =0 kan det konkludere 1. at skæring med y-aksen kan antages at være 0 2. at en nyfødt baby kan kravle 3. at der ikke kan påvises sammenhæng mellem udetemperatur og kravlealder 4. at der kan påvises sammenhæng mellem udetemperatur og kravlealder Korrekt svar: 3 7