Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Relaterede dokumenter
Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

En Introduktion til SAS. Kapitel 5.

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Eksamen i Statistik for Biokemikere, Blok januar 2009

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

INSTITUT FOR MATEMATISKE FAG c

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Eksamen i Statistik for biokemikere. Blok

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for biokemikere. Blok

Forelæsning 11: Kapitel 11: Regressionsanalyse

Tema. Dagens tema: Indfør centrale statistiske begreber.

Eksamen i Statistik for biokemikere. Blok

Skriftlig eksamen Science statistik- ST501

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 4

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistiske modeller

Løsning eksamen d. 15. december 2008

Elementær sandsynlighedsregning

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

k normalfordelte observationsrækker (ensidet variansanalyse)

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Elementær sandsynlighedsregning

Konfidensintervaller og Hypotesetest

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

(studienummer) (underskrift) (bord nr)

MPH specialmodul Epidemiologi og Biostatistik

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Matematisk Modellering 1 Cheat Sheet

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Reeksamen i Statistik for biokemikere. Blok

Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Eksamen i Statistik for biokemikere. Blok

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Lineær regression i SAS. Lineær regression i SAS p.1/20

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod.

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Multipel Lineær Regression

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Kommentarer til øvelser i basalkursus, 2. uge

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : (navn) (underskrift) (bord nr)

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

(studienummer) (underskrift) (bord nr)

Uge 10 Teoretisk Statistik 1. marts 2004

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

1 Regressionsproblemet 2

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Simpel Lineær Regression

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Nanostatistik: Opgaver

Vejledende besvarelse af hjemmeopgave, efterår 2016

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Opgaver til Matematisk Modellering 1

Modul 6: Regression og kalibrering

Basal statistik. 30. oktober 2007

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Opgavebesvarelse, Basalkursus, uge 3

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Basal statistik. 30. oktober Den generelle lineære model

Transkript:

Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers, samt at Y po(λ) (det vil sige at Y er Poissonfordelt med parameter λ). Her er λ et positivt tal. 1) Beregn P(X 2). 2) Vis, at EX = 2 samt at V arx = 2 3. 3) Gør rede for at E Y = V ar Y = λ samt at P(Y 1) = 1 e λ. Antag nu at X og Y er uafhængige samt at λ = 1. 4) Beregn Cov(X, 2Y ) og V ar(x Y ). 5) Beregn E(XY ) og E(X(X + 5Y )). Lad Z betegne endnu en stokastisk variabel. Antag at Z og X er uafhængige, samt at Z har samme fordeling som X. Det vil sige, at Z har sandsynlighedsfunktion p Z givet ved { 1 hvis z {1, 2, 3}, p Z (z) = 3 0 ellers. 6) Find sandsynlighedsfunktionen p X,Z for den to-dimensionale diskrete stokastiske vektor (X, Z) og beregn P(X Z 2). Opgavesættet fortsættes

Matematisk Modellering 1 (reeksamen) Side 2 Opgave 2 Lad (X, Y ) være en to-dimensional absolut kontinuert stokastisk vektor med tæthedsfunktion f X,Y givet ved { 3 x hvis 0 < x < y < 2, f X,Y (x, y) = 4 0 ellers. 1) Vis, at X og Y er absolut kontinuerte med tæthedsfunktioner f X og f Y givet ved f X (x) = f Y (y) = { 3 x(2 x) hvis 0 < x < 2, 4 0 ellers, { 3 8 y2 hvis 0 < y < 2, 0 ellers. 2) Vis, at E Y = 3 2 samt at E(XY ) = 8 5. Lad F Y betegne fordelingsfunktionen for Y. 3) Vis, at samt at P(Y 1) = 7 8. F Y (y) = 0 hvis y 0, 1 8 y3 hvis y ]0, 2[, 1 hvis y 2, Lad (U, V ) være den to-dimensionale stokastiske vektor defineret ved U = X Y V = Y. 4) Vis, at (U, V ) er absolut kontinuert med tæthedsfunktion f U,V givet ved f U,V (u, v) = { 3 4 uv2 hvis 0 < u < 1 og 0 < v < 2, 0 ellers. Gør rede for at U og V er uafhængige. Opgavesættet fortsættes

Matematisk Modellering 1 (reeksamen) Side 3 Opgave 3 I denne opgave skal vi undersøge, om indtagelse af calcium kan medvirke til at sænke blodtrykket. Ved et forsøg inddelte man ved lodtrækning 21 mænd i to grupper. Den første gruppe bestod af 10 mænd, som i 12 uger hver dag fik et vitamintilskud med et højt indhold af calcium. Denne gruppe vil vi kalde calcium-gruppen. Den anden gruppe, der vil blive omtalt som placebo-gruppen, bestod af 11 mænd, som i samme periode fik et vitamintilskud uden calcium. De 21 forsøgspersoner fik ikke at vide, om deres vitamintilskud indeholdt calcium eller ej. Man målte ændringen i blodtrykket for hver forsøgsperson. (Denne ændring er opgjort som blodtryk efter 12 ugers vitaminkur minus blodtryk ved start af vitaminkur). Data kan i øvrigt aflæses fra SAS udskriften på næste side. En indledende statistisk analyse viser, at det kan antages, at de to observationsrækker er normalfordelte. I det følgende vil vi derfor arbejde under denne antagelse. Til besvarelsen af de to første spørgsmål kan SAS udskrifterne på de næste to sider benyttes; se specielt udskriften side 5. Datasættet blodtryk har 21 observationer og 2 variable. Variablen beh har to niveauer, calcium og placebo, som angiver om en person har fået calcium eller ej. Variablen aendring angiver ændringen i blodtrykket. 1) Estimer såvel spredningen som variansen på ændringen i blodtrykket for begge grupper. Vis, at det kan antages, at variansen på ændringen i blodtrykket er den samme for de to grupper. 2) Vis, at det kan antages, at middelværdien af ændringen i blodtrykket er den samme for de to grupper. I det følgende vil vi modellere ændringen i blodtrykket som en normalfordelt observationsrække med 21 observationer. Til besvarelsen af de næste to spørgsmål kan man benytte, at standardberegninger baseret på alle 21 observationer giver n = 21, S = 47, USS = 1287. 3) Estimer variansen på ændringen i blodtrykket, angiv estimatets fordeling og beregn et 95%-konfidensinterval for variansen. 4) Estimer middelværdien af ændringen i blodtrykket, angiv estimatets fordeling og beregn et 95%-konfidensinterval for middelværdien. Opgaven fortsættes

Matematisk Modellering 1 (reeksamen) Side 4 Nedenstående udskrift viser indholdet af datasættet blodtryk. Obs beh aendring 1 Calcium -18 2 Calcium -17 3 Calcium -11 4 Calcium -10 5 Calcium -7 6 Calcium -1 7 Calcium 2 8 Calcium 3 9 Calcium 4 10 Calcium 5 11 Placebo -12 12 Placebo -5 13 Placebo -3 14 Placebo -2 15 Placebo 1 16 Placebo 1 17 Placebo 1 18 Placebo 3 19 Placebo 3 20 Placebo 5 21 Placebo 11 Opgaven fortsættes

Matematisk Modellering 1 (reeksamen) Side 5 Programstumpen TITLE1 Calciums indvirkning på blodtrykket ; TITLE2 Analyse ved PROC TTEST ; PROC TTEST DATA=blodtryk; CLASS beh; VAR aendring; RUN; giver anledning til følgende udskrift. Calciums indvirkning på blodtrykket Analyse ved PROC TTEST The TTEST Procedure Statistics Lower CL Upper CL Lower CL Variable beh N Mean Mean Mean Std Dev Std Dev aendring Calcium 10-11.25-5 1.2545 6.0139 8.7433 aendring Placebo 11-3.691 0.2727 4.2369 4.1229 5.9007 aendring Diff (1-2) -12.03-5.273 1.4808 5.6161 7.3848 Statistics Upper CL Variable beh Std Dev Std Err Minimum Maximum aendring Calcium 15.962 2.7649-18 5 aendring Placebo 10.355 1.7791-12 11 aendring Diff (1-2) 10.786 3.2267 T-Tests Variable Method Variances DF t Value Pr > t aendring Pooled Equal 19-1.63 0.1187 aendring Satterthwaite Unequal 15.6-1.60 0.1288 Equality of Variances Variable Method Num DF Den DF F Value Pr > F aendring Folded F 9 10 2.20 0.2365 Opgavesættet fortsættes

Matematisk Modellering 1 (reeksamen) Side 6 Opgave 4 Ved at observere en supernova kan man bestemme to størrelser, som vi her vil kalde x og t. Man forventer, at der approksimativt er en lineær sammenhæng på formen x = α + βt, hvor β = 0.2. Konstanten k H = 10 α+5 kaldes for Hubbles konstant, og kan blandt andet benyttes til at bestemme universets alder. Til interesserede kan oplyses, at k H måles i enheden km/(s Mpc). Her svarer km til kilometer, s til sekund, og en Mpc er cirka lig med 3.09 10 19 km. Til sammenligning er et lysår cirka 3.07 10 7 Mpc. Man har bestemt x og t for 20 supernovaer. Vi vil i det følgende betragte de 20 observerede værdier af t som faste tal, mens de 20 observerede værdier af x er udfald af stokastiske variable. For at undersøge om data kan beskrives ved en lineær regression af x på t, har man lavet tre kontroltegninger, som kan ses på de næste to sider. I Figur 1 er værdierne af x og t indtegnet sammen med den estimerede regressionslinje. I Figur 2 ses et fraktildiagram for de standardiserede residualer ved en lineær regression af x på t. Endelig ses i Figur 3 de standardiserede residualer tegnet op mod t. 1) Gør, med udgangspunkt i Figur 1-3, rede for, at det er rimeligt at modellere data ved en lineær regression af x på t. Standardberegninger baseret på de observerede værdier af x og t resulterer i nedenstående tabel. n 20 x S 76.707 702.63 USS 296.240615 24738.1561 SP 2705.28028 t I øvrigt kan det anbefales, at man benytter så mange betydende cifre som muligt ved mellemregninger i de næste spørgsmål. 2) Estimer afskæringen α og hældningen β i den lineære regression af x på t. Estimer også variansen på x. 3) Vis, at det kan antages, at hældningen β er 0.2. Som nævnt ovenfor lader vi k H = 10 α+5 betegne Hubbles konstant. 4) Beregn et 95%-konfidensinterval for α. Estimer Hubbles konstant k H og beregn et 95%-konfidensinterval for denne parameter. Opgaven fortsættes

Matematisk Modellering 1 (reeksamen) Side 7 x 4. 5 4. 4 4. 3 4. 2 4. 1 4. 0 3. 9 3. 8 3. 7 3. 6 3. 5 3. 4 3. 3 3. 2 3 2 3 3 3 4 3 5 3 6 3 7 3 8 3 9 t Figur 1: x tegnet op mod t. Desuden er den estimerede regressionslinje indtegnet. Opgaven fortsættes

Matematisk Modellering 1 (reeksamen) Side 8 3 2 p f r a c t i l e 1 0-1 - 2-3 - 0. 0 5-0. 0 4-0. 0 3-0. 0 2-0. 0 1 0. 0 0 0. 0 1 0. 0 2 0. 0 3 0. 0 4 0. 0 5 s t a n d _ r e s i Figur 2: Fraktildiagram for de standardiserede residualer ved en lineær regression af x på t. 0. 0 5 0. 0 4 0. 0 3 S t a n d a r d i s e r e d e r e s i d u a l e r 0. 0 2 0. 0 1 0. 0 0-0. 0 1-0. 0 2-0. 0 3-0. 0 4-0. 0 5 3 2 3 3 3 4 3 5 3 6 3 7 3 8 3 9 t Figur 3: De standardiserede residualer tegnet op mod t.