NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Relaterede dokumenter
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Den lineære normale model

Den lineære normale model

Eksamen i Statistik for biokemikere. Blok

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Tema. Dagens tema: Indfør centrale statistiske begreber.

Forelæsning 11: Kapitel 11: Regressionsanalyse

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Opgaver til kapitel 3

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistik 1TS 2003 Obligatorisk opgave 1

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Reeksamen i Statistik for Biokemikere 6. april 2009

Skriftlig eksamen Science statistik- ST501

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod.

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Reeksamen 2014/2015 Mål- og integralteori

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Løsning eksamen d. 15. december 2008

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Estimation og usikkerhed

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Statistik II 4. Lektion. Logistisk regression

Eksamen 2014/2015 Mål- og integralteori

Normalfordelingen og Stikprøvefordelinger

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Skriftlig Eksamen ST501: Science Statistik Torsdag den 4. januar 2007 kl

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Løsning til eksaminen d. 29. maj 2009

Kvantitative metoder 2

Vejledende besvarelser til opgaver i kapitel 14

Kvantitative metoder 2

Kvantitative metoder 2

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Reeksamen i Statistik for biokemikere. Blok

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Estimation og konfidensintervaller

Kvantitative Metoder 1 - Efterår Dagens program

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Perspektiver i Matematik-Økonomi: Linær regression

Susanne Ditlevsen Institut for Matematiske Fag susanne

Module 4: Ensidig variansanalyse

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Reeksamen i Statistik for biokemikere. Blok

Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl

Kvantitative Metoder 1 - Forår 2007

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

1 Hb SS Hb Sβ Hb SC = , (s = )

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Uge 10 Teoretisk Statistik 1. marts 2004

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

(studienummer) (underskrift) (bord nr)

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Statistik og Sandsynlighedsregning 2

Nanostatistik: Opgaver

Simpel Lineær Regression

Lineære normale modeller (4) udkast

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Statistik for ankomstprocesser

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Transkript:

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive med blyant og benytte viskelæder, så længe skriften er læselig og udviskninger foretages grundigt. Overstregning trækker ikke ned og anbefales ved større ændringer. Sættet består af 2 opgaver, med ialt 18 delspørgsmål. Ved bedømmelsen indgår disse 18 delspørgsmål med samme vægt. Opgave 1 Lad X være en reel stokastisk variabel, der er Weibull-fordelt med formparameter > 0 og skalaparameter β > 0. Fordelingen af X har altså tæthed f(x) = β x 1 e ( ) x β for x > 0, med hensynt til Lebesguemålet på den reelle akse. Spørgsmål 1.1. Vis at ( ) k + x k f(x) = β k Γ for alle k > 0. 0 Spørgsmål 1.2. Find middelværdi og varians for X. Spørgsmål 1.3. Find middelværdi og varians for X. 1

Lad X 1,..., X n være uafhængige, identisk fordelte stokastiske variable, alle Weibullfordelte med formparameter og skalaparameter β. Vi antager at formparameteren er kendt, og vi ønsker at drage inferens om den ukendte skalaparameter β. Spørgsmål 1.4. Gør rede for at β = er en momentestimator for β. 1 n n i=1 X i Γ ( ) 1+ Spørgsmål 1.5. Gør rede for at β er asymptotisk normalfordelt, og find de asymptotiske parametre. Spørgsmål 1.6. Udregn β på data fra tabel 1, under antagelse af at formparameteren er lig med 4. Angiv også et approksimativt 95% konfidensområde for β. Det kan benyttes at Γ ( 5 4 ) = 0.9064025, Γ ( 3 2 ) = 0.886227. I den resterende del af opgaven, vil vi forsøge os med maksimaliseringsestimation. Spørgsmål 1.7. Opskriv likelihoodfunktionen, og gør rede for at er suffiient for β. n i=1 X i i 1 2 3 4 5 6 7 8 9 10 X i 0.76 1.14 0.66 0.93 0.81 1.70 0.69 0.89 1.04 0.96 Tabel 1: Et prøvedatasæt med 10 observationer. Observationerne stammer fra en Weibull-fordeling med formparameter 4 og ukendt skalaparameter.. 2

Spørgsmål 1.8. Find sorefunktionen og informationsfunktionen, og udregn den forventede information. Spørgsmål 1.9. Gør rede for at der maksimaliseringsestimatoren ˆβ er entydigt bestemt, og angiv en formel for den. Spørgsmål 1.10. Gør rede for at maksimaliseringsestimatoren ˆβ er asymptotisk normalfordelt, og find de asymptotiske parametre. Spørgsmål 1.11. Udregn ˆβ på data fra tabel 1, under antagelse af at formparameteren er lig med 4. Angiv også et approksimativt 95% konfidensområde for β, baseret på maksimaliseringsestimatoren. Opgave 2 En ny metode er blevet foreslået til at måle brintindhold i svejselegeringer. Metoden er baseret på polymeriseringsreaktioner i en elektrolytopløsning, og er således kemisk funderet. Metoden er nem at anvende, i modsætning til den klassiske målemetode, der baserer sig på gaskromatografi. Men den nye metodes præision er ukendt, hvorimod gaskromatografi giver anledning til meget præise målinger. I et eksperiment har man målt brintindholdet i en række svejselegeringer med både den nye og den klassiske teknik. Resultaterne er angivet i tabel 2. Vi betragter de 10 gaskromatografimålinger som kovariater t 1,..., t 10 og de 10 tilsvarende målinger med den nye teknik som responsvariable X 1,..., X 10. Vi antager at X erne er uafhængige, normalfordelte med samme varians σ 2, og at EX i = α + βt i for i = 1,..., 10. Der kan benyttes følgende regnestørrelser: S t = 819 SS t = 72107 SP tx = 72268 S x = 815 SS x = 72913. 3

Klassisk metode Ny metode 47 38 62 62 65 53 70 67 70 84 78 79 95 93 100 106 114 117 118 116 Tabel 2: Brintindhold i en række svejselegeringer, målt med en meget præis klassisk metode og med en ny eksperimentel metode. Enheden for alle målinger er ppm (parts per million). Spørgsmål 2.1. Tegn en skitse af sammenhængen mellem måleresultaerne for de to teknikker, og kontroller at at vi har opstillet en rimelig model. Spørgsmål 2.2. Estimer parametrene i den lineære regression, og angiv fordelingen af estimatorerne. Spørgsmål 2.3. Konstruer et 95% konfidensinterval for hældningsparameteren β. I en sammenhæng som denne kan der være god grund til at tro at det sande α er nul. en omhyggelig kalibrering af den nye målemetode bør have sikret at den ikke giver et systematisk udslag i svejselegeringer, der slet ikke indeholder brint. Vi opstiller altså hypotesen H : α = 0. Spørgsmål 2.4. Estimer parametrene β og σ 2 under hypotesen H. Angiv fordelingen af estimatorerne. 4

Spørgsmål 2.5. Test hypotesen H. Spørgsmål 2.6. Konstruer et 95% konfidensinterval for hældningsparameteren β under hypotesen H. Spørgsmål 2.7. Sammenlign de to konfidensintervaller for β, fundet henholdsvis indenfor og udenfor hypotesen H. Diskuter om man i almindelighed skal inkludere et interept α i modellen, hvis man tror på at α = 0. 5