Skriftlig eksamen Science statistik- ST501



Relaterede dokumenter
Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Reeksamen i Statistik for Biokemikere 6. april 2009

Skriftlig eksamen Science statistik- ST501

Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Eksamen i Statistik for Biokemikere, Blok januar 2009

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Eksamen i Statistik for biokemikere. Blok

Konfidensintervaller og Hypotesetest

Forelæsning 11: Kapitel 11: Regressionsanalyse

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Løsning til eksaminen d. 14. december 2009

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Løsning til eksaminen d. 29. maj 2009

Modul 6: Regression og kalibrering

Lineær regression i SAS. Lineær regression i SAS p.1/20

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Besvarelse af vitcap -opgaven

Statistiske modeller

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Eksamen i Statistik for biokemikere. Blok

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Undervisningsbeskrivelse

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Skriftlig Eksamen Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Statistik II 4. Lektion. Logistisk regression

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Indblik i statistik - for samfundsvidenskab

Løsning eksamen d. 15. december 2008

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Skriftlig Eksamen ST501: Sandsynlighedsteori og Statistik Mandag den 31. oktober 2005 kl

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Skriftlig Eksamen Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Multipel Lineær Regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

To samhørende variable

Fagplan for statistik, efteråret 2015

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Reeksamen i Statistik for biokemikere. Blok

Tema. Dagens tema: Indfør centrale statistiske begreber.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Skriftlig Eksamen Algoritmer og sandsynlighed (DM538)

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Skriftlig Eksamen Diskret Matematik (DM528)

Statistik Lektion 2. Uafhængighed Stokastiske Variable Sandsynlighedsfordeling Middelværdi og Varians for Stok. Var.

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Simpel Lineær Regression

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Modul 11: Simpel lineær regression

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Vejledende besvarelser til opgaver i kapitel 14

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Besvarelse af juul2 -opgaven

Transkript:

SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt. Du bedes tjekke, at opgavesættet består af 6 sider i alt. Eksamen varer 3 timer hvor alle sædvanlige hjælpemidler herunder bøger, noter samt lommeregner er tilladte. Der lægges vægt på, at de benyttede metoder fremgår af besvarelsen, og at svarene begrundes. Bemærk, at senere delspørgsmål i en opgave ofte kan besvares uden at alle tidligere spørgsmål er besvaret. Det er således tilladt at bruge oplysninger fra tidligere delspørgsmål selvom disse ikke er besvaret. Bemærk: når frihedsgraderne, der skal anvendes i en hypotesetest, ikke er i den relevante tabel i bogen, så brug den nærmeste lavere frihedsgrad i tabellen til at udføre testen.

Opgave 1 Blodsukkeret måles på en gruppe af diabetikere efter de har spist et stykke kage. Følgende koncentrationer måles, hvis diabetikerne ikke har tages insulin: 17.2 20.5 22.0 19.1 23.4 18.7 19.6 17.9 17.6 21.8 18.9 1) Find middelværdien og variansen af ovenstående koncentrationer. Blodsukkeret måles efterfølgende på 13 personer, der ikke har diabetes, efter de har spist et stykke kage. Middelkoncentrationen er 8.0 og variansen er 1.1. 2) Lav en test på niveau 5% om middelkoncentrationen er forskellig for personer med og uden diabetes. Gør rede for hvilke antagelser, du har gjort. Opgave 2 Lad X være en stokastisk variabel med følgende tæthedsfunktion c, 0 x < 1 f X (x) = 0.1, 1 x < 3 0, ellers 1) Bestem værdien af c. 2) Find middelværdien og variansen af X. Lad Y være den stokastiske variabel, der er givet ved Y = X 1 + X 2 + + X 300, hvor X 1, X 2,..., X 300 er uafhængige stokastiske variable med samme fordeling som X. 3) Angiv den approksimative fordeling for Y. 4) Find den approksimative sandsynlighed for at Y antager en værdi mindre end 200. 2

Opgave 3 Man ønsker at sammenligne arbejdsbelastningen i gymnasiet og på universitetet. Man har således spurgt en tilfældig valgt gruppe på 150 universitetsstuderende, hvor mange timer om ugen de brugte på hjemmearbejde mens de gik i gymnasiet, og hvor mange timer om ugen de bruger, mens de går på universitetet. Følgende resultater (i timer) fås: Middelværdi Spredning Gymnasiet 7.5 1.4 Universitetet 16.0 2.4 Universitetet - Gymnasiet 8.5 2.7 I den sidste linje, har man betragtet forskellen i timers hjemmearbejde mellem universitetet og gymnasiet. 1) Udregn et 95% konfidensinterval, der angiver forskellen på det gennemsnitlige antal timer om ugen, der bruges på hjemmearbejde på universitetet og i gymnasiet. Hvilke antagelser gøres? Opgave 4 Angiv med sandt eller falsk sandhedsværdien af følgende udsagn. Du skal i hvert tilfælde argumentere for dit svar. 1a) For alle stokastiske variable X med middelværdi 5 og alle stokastiske variable Y med middelværdi 3 gælder, at X Y har middelværdi 2. b) For alle stokastiske variable X med varians 5 og alle stokastiske variable Y med varians 3 gælder, at X Y har varians 2. c) Fordelingsfunktionen for enhver stokastisk variabel er voksende. 2a) I et kortspil bestående af 13 klør, 13 spar, 13 hjerter og 13 ruder, modtager en spiller 8 kort. Lad X være den stokastiske variabel, der angiver antallet af ruder spilleren får. X er binomialfordelt. b) For enhver kontinuert stokastisk variabel gælder, at arealet under tæthedsfunktionen er 1. 3

Opgave 5 I amerikanske regioner formoder man, at der er en sammenhæng mellem indbyggernes uddannelsesniveau og mængden af kriminalitet, der begås. I en undersøgelse af 84 regioner sammenholder man procentdelen af indbyggere med mindst en high-school eksamen med den kriminelle rate (antal kriminelle tilfælde pr. 100000 indbyggere) i løbet af et år. Output fra en statistisk analyse ses nedenfor. Det foreslås at analysere data med en lineær regression, hvor responsvariablen er Y = den kriminelle rate, og den forklarende variabel er x = procentdelen af indbyggere med mindst en high-school eksamen. 1) Opskriv modellen for lineær regression, og angiv hvilke antagelser, der foretages. Giver residualplottene og xy-plottet anledning til at betvivle modellen? Uanset svaret på spørgsmål 1) vil vi nu benytte den lineære regressionsmodel. 2) Giv et estimat for forskellen i den gennemsnitlige kriminelle rate for to regioner, hvor forskellen på indbyggere med mindst en high-school eksamen er 1 procentpoint. 3) Lav en test på niveau 5% om den kriminelle rate afhænger af procentdelen af indbyggere med mindst en high-school eksamen. 4) Find et 95% prædiktionsinterval for den kriminelle rate i en region, hvor 83% af indbyggerne har mindst en high-school eksamen. 4

High s c h o o l eksamen Moments N 8 4. 0 0 0 0 Sum Wgts 84.0000 Mean 7 8. 5 9 5 2 Sum 6602.0000 Std. Dev 6. 2 2 1 1 CSS 3212.2380 Kriminel r a t e N 8 4. 0 0 0 0 Sum Wgts 84.0000 Mean 7 1 1 1. 2 0 2 0 Sum 597341.0000 Std. Dev 2 5 7 1. 2 4 1 0 CSS 548736.0800 Kriminel r a t e = High s c h o o l eksamen Response D i s t r i b u t i o n : Normal Link Function : I d e n t i t y Parametric Regression Fit Model Error Curve Degree ( Polynomial ) DF Mean Square DF Mean Square 1 1 93462942.00 82 5552112.00 Summary o f Fit Mean o f Response 7 1 1 1. 2 0 2 0 R Square 0.1703 Root MSE 2 3 5 6. 2 9 2 0 Adj R Sq 0.1602 Parameter Estimates Variable DF Estimate Std Error I n t e r c e p t 1 2 0 5 1 7. 6 0 3277.640 High s c h o o l eksamen 1 170.58 41.570 5

6