02402 Løsning til testquiz02402f (Test VI)



Relaterede dokumenter
Test nr. 6 af centrale elementer 02402

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Note til styrkefunktionen

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Konfidensinterval for µ (σ kendt)

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

c) For, er, hvorefter. Forklar.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Løsning til eksaminen d. 29. maj 2009

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Forelæsning 9: Inferens for andele (kapitel 10)

Multiple choice opgaver

Forelæsning 8: Inferens for varianser (kap 9)

Module 12: Mere om variansanalyse

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Test nr. 4 af centrale elementer 02402

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Tema. Dagens tema: Indfør centrale statistiske begreber.

Konfidensintervaller og Hypotesetest

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

2 Gennemsnitligt indhold af aktivt stof i en tablet fra et glas med 200 tabletter

Modul 5: Test for én stikprøve

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Statistik Lektion 17 Multipel Lineær Regression

Test nr. 5 af centrale elementer 02402

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

En intro til radiologisk statistik

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Forelæsning 11: Kapitel 11: Regressionsanalyse

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Peter Harremoës Mat A eksamen med hjælpemidler 15. december f (x) = 0. 2x + k 1 x = 0 2x 2 + k = 0 2x 2 = k x 2 = k 2. k 2.

Løsning til eksaminen d. 14. december 2009

Statistik i basketball

Teoretisk Statistik, 2. december Sammenligning af poissonfordelinger

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Kvantitative Metoder 1 - Forår Dagens program

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

9. Chi-i-anden test, case-control data, logistisk regression.

Kapitel 12 Variansanalyse

Opgave 6. Opgave 7. Opgave 8. Peter Harremoës Mat A delprøve med hjælpemidler 15 december 2015

Løsning til eksamen d.27 Maj 2010

Kapitel 12 Variansanalyse

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Modul 12: Exercises Sukkersygepatienters vægt

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Kapitel 7 Forskelle mellem centraltendenser

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Løsning eksamen d. 15. december 2008

1 Hb SS Hb Sβ Hb SC = , (s = )

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Produkt og marked - matematiske og statistiske metoder

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Vejledende løsninger kapitel 8 opgaver

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

(studienummer) (underskrift) (bord nr)

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Matematik B. Højere handelseksamen

Personlig stemmeafgivning

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Værktøjshjælp for TI-Nspire CAS Struktur for appendiks:

Eksamen i Statistik for biokemikere. Blok

Nanostatistik: Opgavebesvarelser

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Mat2SS Vejledende besvarelse uge 11

Oversigt over nyttige fordelinger

Fokus på Forsyning. Datagrundlag og metode

for gymnasiet og hf 2016 Karsten Juul

Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Estimation og usikkerhed

Module 12: Mere om variansanalyse

(studienummer) (underskrift) (bord nr)

Transkript:

02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende: for hver annonceret salgspris angives en højere faktisk salgspris ved (+), lige præcis ved (0), og mindre (-) i forhold til hvad kunden havde forlangt, som vist i nedenstående tabel Kunde nr. 1 2 3 4 5 6 7 8 9 10 11 12 Salg - - - + - - 0 + + 0 - - Angiv hvilken metode der er (bedst) egnet til at teste og eventuelt påvise, at kunden som oftest får mindre end hvad den har forlangt for sin bolig. 2. Sign test 3. Test i antaltstabel for fordeling 4. lineær regressionsanalyse Korrekt svar: 2 Spørgsmål 5. En fisker tjener 20 kroner for et kg rejer. Hans fangst varierer lidt, i middel 40 kg, og standard afvigelse 5 kg. Angiv middelværdi og varians af fiskerens fortjeneste ved en fangst 1. Middelværdi 40 og varians 5 2. Middelværdi 40 og varians 25 3. Middelværdi 800 og varians 10000 4. Middelværdi 800 og varians 500 Løsning Fiskerens fangst X er en stokastisk variabel med E[X] =40 Var[X]=5 2 Idet a = 20, og der er tale om en skalering, fås E[a X] =a[x]=20 40 Var[X]=a 2 Var[X]=20 2 5 2 Korrekt svar: 3 1

Spørgsmål 6. I et forsøg var man interesseret i at undersøge om indtagelse af koffein (i form af kaffe) havde effekt af hvor hurtigt man kunne indtaste en tekst (200 ord) på computer. Målingerne er givet i nedenstående tabel Koffein (ml) 0 20 40 60 80 100 120 140 160 180 200 Tid (sek.) 212 218 236 217 237 218 223 229 168 211 235 En evt sammenhæng mellem indtagelse af koffein og hvor hurtigt man kan indtaste en tekst analyseres mest hensigtsmæssigt ved 2. Sign test 3. test i antaltstabel for fordeling 4. lineær regressionsanalyse Løsning Idet vi søger en sammenhæng mellem 2 variable x (koffein) og y hastighed, dvs en sammenhæng mellem sammenhørende værdier, gøres dette mest hensigtsmæssigt ved lineær regressionsanalyse, dvs y = α + β x + ε Iøvrigt vil man kunne påvise en sammenhæng (på et givet signifkansniveau) hvis man kan afvise nul-hypotesen, H 0 : β =0 Korrekt svar: 4 Spørgsmål 7. Ventetiden når man ringer op til en servicetelefon følger en eksponetialfordeling med middelværdi 3 minutter. Hvad er sandsynligheden for, at man skal vente længere end 6 minutter, når man ringer til servicetelefonen? 1. 0.1353 2. 0.050 3. 0.950 4. 1-0.1353 Løsning Opgaven kan løses på 2 forskellige måder. Enten direkte i eksponentialfordelingen (sandsynligheden for at vente længere en 6 minutter), eller ved regning i poissonfordelingen (sandsynligheden for ingen hændelser i løbet af 6 minutter). Her vises det sidste alternativ For en periode på 6 minutter vil man i middel forvente 2 kundeankomster, således at for perioden beskrives antal ankomster ved X pois(2). Den søgte sandsynlighed bliver derfor (tabel 2, side 570) P (X 0) = 0.135 2

Korrekt svar: 1 Spørgsmål 8. Du bliver tildelt 5 kort fra et almindelig spil kort (dvs. indholdende 52 kort). Hvad er sandsynligheden for, at alle 5 kort er hjerter? 1. 5/13 2. 1024/371293 3. 1024/154440 4. 1287/2598960 Løsning Idet sandsynligheden for at trække en hjerter er betinget af hvad man har trukket allerede, fås sandsynligheden ved at betragte den hypergeometriske fordeling Korrekt svar: 4 ( )( ) 13 39 5 0 ( ) = 1287 52 2598960 5 Spørgsmål 9. I behandling af en sygdom sammenlignede man to typer af medicin (I og II). For en række patienter registrerede man graden af forbedring på en skala fra 1 til 4 (hvor 1 er bedst) og fik følgende resultater for 273 patienter 1 2 3 4 I 26 51 21 40 II 31 59 11 34 Hvilken metode er (best) egnet til at undersøge om fordelingen i de to grupper (og dermed effektiviteten af de to typer medicin) er ens 2. Parret t-test 3. Test i antaltstabel 4. Lineær regressionsanalyse Løsning Tabellen viser, at patienter, der har afprøvet en af de to typer medicin, er blevet klassificeret på skalaen 1-4. Observationerne i hver celle (antal) kan altså betragtes som en andel ud af det totale antal, der har prøvet medicinen. Den mest hensigtsmæssige analysemetode er derfor test i en antalstabel Korrekt svar: 3 3

Spørgsmål 10. Når man tester en tosidet statistisk hypotese, og finder at teststørrelsen er numerisk mindre end de kritiske værdier, kan det konkluderes 1. At H 0 accepteres på det angivne signifikansniveau 2. At H 0 forkastes på det angivne signifikansniveau 3. At H 1 påvises på det angivne signifikansniveau 4. At H 1 påvises med sandsynligheden 5% Løsning Idet teststørrelsen er numerisk mindre end de kritiske værdier, og dermed ligger i acceptområdet, accepteres H 0 på det angivne signifikansniveau Korrekt svar: 1 Spørgsmål 11. I et amerikansk studie har man har stillet en række børn i 4 klasse følgende spørgsmål: Hvad vil du helst foretrække mht skolen? og hertil havde man følgende svarmuligheder a) få gode karakterer b) være dygtig til sport c) være populær Såfremt man vil undersøge om drenge og piger fordeler sig ens mht ovenstående svarmuligheder gøres dette mest hensigtsmæssigt ved 2. Sign test 3. Test i antaltstabel 4. Lineær regressionsanalyse Idet man vil registrere hvor mange drenge og piger, der svarer i en af de 3 kategorier, vil den efterfølgende analyse mest hensigtsmæssigt være test i en antalstabel korrekt svar: 3 4

Spørgsmål 12. I et studie undersøgte man om det tog længere tid for en baby at lære at kravle i kolde måneder (om vinteren) end i varme måneder (om sommeren). (Motivation var egentlig at undersøge om lag af varmt tøj forhindrede babyen i at kravle). Man registrerede derfor babyens alder, når den først lærte at kravle og den tilhørende udendørstemperatur. Såfremt korrelationskoefficienten mellem alder og udendørstemperatur er -0.5, og der i øvrigt er en lineær sammenhæng, kan det konkluderes 1. At piger lærer hurtigere at kravle end drenge 2. At når temperaturen falder, så kravler børn hurtigere, end når det er varmt 3. At når temperaturen falder, så tager det længere tid for babyer at lære at kravle 4. Børn kravler meget stærkt i varme korrekt svar: 3 Spørgsmål 13. Fortsat fra spm 12. Såfremt man ønsker en modellere sammenhæng mellem kravlealder og udendørstemperatur ved modellen Y = a + b X + e og man samtidig har estimeret korrelationskoefficienten mellem alder og udendørstemperatur er estimeret til r = 0.5, kan det konkluderes at 1. estimatet af a er negativt 2. estimatet af b er negativt 3. estimatet af e er negativt 4. man kan ikke konkludere noget direkte Løsning Hældningen på den rette linie, der passer bedst til data vil være negativ (men ikke nødvendigvis signifikant forskellig fra nul). korrekt svar: 2 5

Spørgsmål 14. Fortsat fra spm 12. Såfremt man har estimeret parametrene a og b i ligningen Y = a + b X + e hvor Y angiver kravlealder og X angiver temperatur. Variablen e angiver da 1. e angiver modellens residualer, 2. e angiver modelles forklaringsgrad 3. e angiver liniens hældning 4. e er ikke typisk en del af en regressionsmodel Løsning e angiver modellens residualer, dvs afvigelse mellem model og observationer, e = Y a b X Korrekt svar: 1 Spørgsmål 15. Fortsat fra spm 12. Lad os antage at X er angivet i grader celcius, Y i måneder og estimatet af a er 8 og estimatet af b er 0.05. Hvor meget hurtigere lærer et barn at kravle hvis middeltemperaturen er 10 grader højere ifølge modellen? 1. Det kan kun besvares hvis man ved at b er signifikant forskellig fra 0 2. 8 en halv måned 3. 7 en halv måned 4. en halv måned Løsning Såfremt a og b er signifikante haves modellen Y =8 0.05 X Heraf ses, at hvis X bliver 10 grader højere, så bliver Y mindre, mere præcis 0.05 10 = 0.5 måned mindre. Men hvis b ikke er signifikant (man kan antage at b = 0), gælder ovenstående model ikke. Spørgsmålet kan altså kun besvares, hvis det man ved at b er signifikant forskellig fra 0 Korrekt svar: 1 6

Spørgsmål 16. Såfremt man ved et statistisk test ikke kan afvise nul-hypotesen H 0 : b =0 kan det konkludere 1. at skæring med y-aksen kan antages at være 0 2. at en nyfødt baby kan kravle 3. at der ikke kan påvises sammenhæng mellem udetemperatur og kravlealder 4. at der kan påvises sammenhæng mellem udetemperatur og kravlealder Korrekt svar: 3 7