NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive med blyant og benytte viskelæder, så længe skriften er læselig og udviskninger foretages grundigt. Overstregning trækker ikke ned og anbefales ved større ændringer. Sættet består af 2 opgaver, med ialt 18 delspørgsmål. Ved bedømmelsen indgår disse 18 delspørgsmål med samme vægt. Opgave 1 Lad X være en reel stokastisk variabel, der er Weibull-fordelt med formparameter > 0 og skalaparameter β > 0. Fordelingen af X har altså tæthed f(x) = β x 1 e ( ) x β for x > 0, med hensynt til Lebesguemålet på den reelle akse. Spørgsmål 1.1. Vis at ( ) k + x k f(x) = β k Γ for alle k > 0. 0 Spørgsmål 1.2. Find middelværdi og varians for X. Spørgsmål 1.3. Find middelværdi og varians for X. 1
Lad X 1,..., X n være uafhængige, identisk fordelte stokastiske variable, alle Weibullfordelte med formparameter og skalaparameter β. Vi antager at formparameteren er kendt, og vi ønsker at drage inferens om den ukendte skalaparameter β. Spørgsmål 1.4. Gør rede for at β = er en momentestimator for β. 1 n n i=1 X i Γ ( ) 1+ Spørgsmål 1.5. Gør rede for at β er asymptotisk normalfordelt, og find de asymptotiske parametre. Spørgsmål 1.6. Udregn β på data fra tabel 1, under antagelse af at formparameteren er lig med 4. Angiv også et approksimativt 95% konfidensområde for β. Det kan benyttes at Γ ( 5 4 ) = 0.9064025, Γ ( 3 2 ) = 0.886227. I den resterende del af opgaven, vil vi forsøge os med maksimaliseringsestimation. Spørgsmål 1.7. Opskriv likelihoodfunktionen, og gør rede for at er suffiient for β. n i=1 X i i 1 2 3 4 5 6 7 8 9 10 X i 0.76 1.14 0.66 0.93 0.81 1.70 0.69 0.89 1.04 0.96 Tabel 1: Et prøvedatasæt med 10 observationer. Observationerne stammer fra en Weibull-fordeling med formparameter 4 og ukendt skalaparameter.. 2
Spørgsmål 1.8. Find sorefunktionen og informationsfunktionen, og udregn den forventede information. Spørgsmål 1.9. Gør rede for at der maksimaliseringsestimatoren ˆβ er entydigt bestemt, og angiv en formel for den. Spørgsmål 1.10. Gør rede for at maksimaliseringsestimatoren ˆβ er asymptotisk normalfordelt, og find de asymptotiske parametre. Spørgsmål 1.11. Udregn ˆβ på data fra tabel 1, under antagelse af at formparameteren er lig med 4. Angiv også et approksimativt 95% konfidensområde for β, baseret på maksimaliseringsestimatoren. Opgave 2 En ny metode er blevet foreslået til at måle brintindhold i svejselegeringer. Metoden er baseret på polymeriseringsreaktioner i en elektrolytopløsning, og er således kemisk funderet. Metoden er nem at anvende, i modsætning til den klassiske målemetode, der baserer sig på gaskromatografi. Men den nye metodes præision er ukendt, hvorimod gaskromatografi giver anledning til meget præise målinger. I et eksperiment har man målt brintindholdet i en række svejselegeringer med både den nye og den klassiske teknik. Resultaterne er angivet i tabel 2. Vi betragter de 10 gaskromatografimålinger som kovariater t 1,..., t 10 og de 10 tilsvarende målinger med den nye teknik som responsvariable X 1,..., X 10. Vi antager at X erne er uafhængige, normalfordelte med samme varians σ 2, og at EX i = α + βt i for i = 1,..., 10. Der kan benyttes følgende regnestørrelser: S t = 819 SS t = 72107 SP tx = 72268 S x = 815 SS x = 72913. 3
Klassisk metode Ny metode 47 38 62 62 65 53 70 67 70 84 78 79 95 93 100 106 114 117 118 116 Tabel 2: Brintindhold i en række svejselegeringer, målt med en meget præis klassisk metode og med en ny eksperimentel metode. Enheden for alle målinger er ppm (parts per million). Spørgsmål 2.1. Tegn en skitse af sammenhængen mellem måleresultaerne for de to teknikker, og kontroller at at vi har opstillet en rimelig model. Spørgsmål 2.2. Estimer parametrene i den lineære regression, og angiv fordelingen af estimatorerne. Spørgsmål 2.3. Konstruer et 95% konfidensinterval for hældningsparameteren β. I en sammenhæng som denne kan der være god grund til at tro at det sande α er nul. en omhyggelig kalibrering af den nye målemetode bør have sikret at den ikke giver et systematisk udslag i svejselegeringer, der slet ikke indeholder brint. Vi opstiller altså hypotesen H : α = 0. Spørgsmål 2.4. Estimer parametrene β og σ 2 under hypotesen H. Angiv fordelingen af estimatorerne. 4
Spørgsmål 2.5. Test hypotesen H. Spørgsmål 2.6. Konstruer et 95% konfidensinterval for hældningsparameteren β under hypotesen H. Spørgsmål 2.7. Sammenlign de to konfidensintervaller for β, fundet henholdsvis indenfor og udenfor hypotesen H. Diskuter om man i almindelighed skal inkludere et interept α i modellen, hvis man tror på at α = 0. 5