02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Relaterede dokumenter
02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Løsning til eksamen d.27 Maj 2010

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Løsning eksamen d. 15. december 2008

Besvarelser til øvelsesopgaver i uge 6

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Løsning til eksaminen d. 29. maj 2009

Opgaver til kapitel 3

Produkt og marked - matematiske og statistiske metoder

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Konfidensintervaller og Hypotesetest

Løsning til eksaminen d. 14. december 2009

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Nanostatistik: Opgavebesvarelser

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Note om Monte Carlo metoden

Normalfordelingen og Stikprøvefordelinger

Tema. Dagens tema: Indfør centrale statistiske begreber.

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

02402 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel 4

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

En Introduktion til SAS. Kapitel 5.

(studienummer) (underskrift) (bord nr)

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

(studienummer) (underskrift) (bord nr)

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Kvantitative Metoder 1 - Forår Dagens program

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Modelkontrol i Faktor Modeller

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Eksamen i Statistik for biokemikere. Blok

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Kvantitative Metoder 1 - Forår 2007

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

(studienummer) (underskrift) (bord nr)

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Sandsynlighedsregning

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Matematisk Modellering 1 Cheat Sheet

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Klasseøvelser dag 2 Opgave 1

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Forelæsning 11: Kapitel 11: Regressionsanalyse

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Efterår Dagens program

Ex µ = 3,σ 2 = 1 og µ = 1,σ 2 = 4. hvor. Vha. R: Vha. tabel:

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Nanostatistik: Opgaver

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Uge 10 Teoretisk Statistik 1. marts 2004

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Hvorfor er det lige at vi skal lære det her?

Module 4: Ensidig variansanalyse

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Løsninger til kapitel 9

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Transkript:

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling og normalfordelingen, nemlig at X LN(α, β 2 ) log(x) N(α, β 2 ) hvor log(x) betyder den naturlige logaritme. 0.7 0.6 0.5 0.4 N(0,1) og LN(0,1) fordelinger 0.3 0.2 0.1 0 3 2 1 0 1 2 3 4 5 6 Log-normalfordelingen har en lang højre hale. Når man tager logaritmen af observationerne, bliver logaritmens fordeling normal og symmetrisk. Det benytter man ofte for data med kun positive værdier, som har en lang højre hale. I opgaven er X LN(8.85, 1.03 2 ). Vi skal finde a) P r {X > 200} = P r {log(x) > log(200)} = P r {Y > 5.2983} hvor Y N(8.85, 1.03 2 ). P r {Y > 5.2983} = P r { Y 8.85 1.03 > 5.2983 8.85 } = P {N(0, 1) > 3.4482} = 0.9997 1.03 idet P r {N(0, 1) > 3.4482} = 1 P {N(0, 1) 3.4482} = 1 Φ( 3.4482) I R > 1-plnorm(200,8.85,1.03) [1] 0.9997179 b) På samme måde: P r {X < 300} = P r {log(x) < log(300)} = P r {Y < 5.7038} hvor Y N(8.85, 1.03 2 ). P r {Y < 5.7038} = P r { Y 8.85 1.03 < 5.7038 8.85 } = P r {N(0, 1) < 3.05} = Φ( 3.05) = 0.0011 1.03 1

I R > plnorm(300,8.85,1.03) [1] 0.001126879 Opgave 5.120, side 171 (7ed: 5.119, side 201 og 6ed: 5.119, side 197) Vi har følgende data: X = {12, 30, 30, 27, 30, 39, 18, 27, 48, 24, 18}. Vi ønsker at vurdere, om det er tænkeligt, at disse data kan stamme fra en normalfordeling. I følgende figur er tegnet den empiriske fordelingsfunktion og den normale fordelingsfunktion med dataenes gennemsnit og spredning som middelværdi og standard afvigelse: N(27.55, 10.02 2 ); 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 5 10 15 20 25 30 35 40 45 50 55 Det ser for så vidt nydeligt ud, men vi tegner nu det normalfordelings plot, der er bedt om i opgaveteksten. Ordnede data x ( i) 12 18 18 24 27 27 30 30 30 39 48 Orden i 1 2 3 4 5 6 7 8 9 10 11 p i = (i 0.5)/11 0.05 0.14 0.23 0.32 0.41 0.50 0.59 0.68 0.77 0.86 0.95 Normal scores z i -1.65-1.10-0.75-0.47-0.23 0.00 0.23 0.47 0.75 1.10 1.65 Værdierne z i er udregnede, så Φ(z i ) = p i. For eksempel er Φ(0.23) = 0.59. Vi kan nu tegne den ønskede figur, idet der også er tegnet den linie ind, som svarer til N(27.55, 10.02 2 )-fordelingen; den går gennem punkterne ( 2.00, 27.55 2 10.02) og (+2.00, 27.55 + 2 10.02). 2

5 10 15 20 25 30 35 40 45 50 2 (i 0.5)/n 1.5 0.9 Standard normal fractiles 1 0.5 0 0.5 1 1.5 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 2 Observations sorted På baggrund af plottet vil man ikke afvise, at data med rimelighed kan antages normalfordelte. På figuren er z erne afsat på abscisse aksen, medens observationerne er afsat på ordinataksen. Læg mærke til, at z erne er beregnet lidt anderledes end i bogen (og f.eks. også anderledes end i opgave 5.95). Den viste metode anses af de fleste for den bedste. I R Du kan også lave et normal score plot i R. Her bliver den dog beregnet lidt anderledes end i R, og resultatet vil derfor heller ikke ligne ovenstå ende plot eksakt. Vi benytter funktionen qqnorm, der tegner et normalscoreplot. I R behøver vi ikke at sortere vores data eller udregne normalscorerne. R har også en indbygget funktion kaldet qqline, som vi også vil benytte her. Den tegner en linje gennem 1. og 3. kvartil. Grunden til dette er robusthed, og princippet er lidt det samme som i boxplot. Vi ønsker ikke, at lade halerne af dataene influere vores linje. velocity = c(12,30,30,27,30,39,18,27,48,24,18) normalscore = qqnorm(velocity) qqline(velocity) 3

Normal Q Q Plot Sample Quantiles 15 20 25 30 35 40 45 1.5 1.0 0.5 0.0 0.5 1.0 1.5 Theoretical Quantiles Opgave 6.2, side 186 (7ed: side 214 og 6ed: side 210) For 8.ed.: Hvis man systematisk KUN måler pådet samme lille sted påalle rullerne, kan stikprøven være fejlagtig, hvis f.eks. klarheden er anderledes i kanten end påmidten. Der ud over skal der tages hã jde for stikprøve udtagningen af de 7 ruller. Hvis de 7 ruller udtages fra produktionslinien i rækkefølge, dvs. at netop disse 7 ruller er produceret lige efter hinanden, såvil denne stikprøve ikke være tilfældig. For 6.ed og 7.ed.: I 1932 havde flertallet ikke telefon. Når man spurgte via telefoninterview, fik man kun kontakt med meget velhavende mennesker. Disse stemte imidlertid slet på samme måde som den almindelige amerikaner. Vejledende løsning 6.11 Variansen pågennemsnittet X baseret påen stikprøve af størrelse n er σ 2 /n. Dermed er standard afvigelsen (eller spredningen) σ/ n a) 1 2 b) 2 3 c) 3 d) 4 4

Opgave 6.17, side 187 (7ed: side 216 og 6ed: side 212) I denne opgave skal vi benytte to resultater. Det ene er, hvordan vi finder fordelingen af en sum af stokastiske variable, og det andet er, hvorledes fordelingen af en sum kan antages at være. Endelig er der et opslag i normalfordelingen. Vægten af en tilfældigt udvalgt person kalder vi X i. Vi har ifølge teksten, at E{X i } = µ = 163 pund. Og variansen af X i er V {X i } = σ 2 = 18 2 pund 2. Vi har nu summen af n personer Y = X 1 + X 2 + + X n Vi benytter formlen for en sum af stokastiske variables middelværdi og varians, f.eks. som vi benyttede den i opgave 5.91, og som det står bogen side 185 (183). E{Y } = µ + µ + + µ = n µ V {Y } = 1 2 σ 2 + 1 2 σ 2 + + 1 2 σ 2 = n σ 2 fordi alle X er har middelværdien µ og variansen σ 2 (de stammer alle fra samme fordeling, men er naturligvis ikke ens). Ifølge Den centrale grænseværdi sætning, side 212 (208), gælder for en sum (i bogen står der gennemsnittet, men det samme gælder selvfølgelig også summen), at den tilnærmelsesvist vil følge en normalfordeling. Er data fra starten normalfordelte, vil resultatet gælde eksakt. Vi har altså µ = 163 og σ 2 x = 18 2, hvoraf, da 36 Y = X i at E{Y } = 36 163 = 5868 og V {Y } = 36 18 2 = 108 2 i=1 Dvs, at Y N(5868, 108 2 ) eventuelt tilnærmelsesvist. P r {Y > 6000} = 1 P r {Y 6000} = 1 P r { Y 5868 108 6000 5868 } 108 = 1 P r {N(0, 1 2 ) 1.222} = 1 Φ(1.222) = 1 0.8888 = 0.1112 eventuelt tilnærmelsesvist (stadig på grund af normalfordelingsantagelsen). opgave 7.4 side 213 (for 7ed og 6ed se nedenfor) Fra data har vi x = 1.865 og s = 1.25 ud fra n = 52 observationer. Fra bogen side 210 (7ed: 232) har vi fã lgende: P r {X + z α/2 s/ n > µ > X z α/2 s/ n} = 1 α (ved at flytte X ud og gange med -1). Derved bliver intervallet I(µ) 1 α = X ± z α/2 s/ n I R I(µ) 1 α = 1.865 ± 1.96 1.25/ 52 = 1.865 ± 0.3398 = [1.5252, 2.2048] 5

> x=c(2.15,2.27,0.99,0.63,2.45,1.3,2.63,2.2,0.99,1,1.05, + 3.44,0.49,0.93,2.52,1.05,1.39,1.22,3.17,0.85,1.18,2.27, + 1.52,0.48,1.33,4.2,1.37,2.7,0.63,1.13,3.81,0.2,1.08, + 2.92,2.87,2.62,1.03,2.76,0.97,0.78,4.68,5.2,1.9,0.55, + 1,2.95,0.45,0.7,2.43,3.65,4.55,0.33) > t.test(x,mu=1.865,alt="two.sided",conf.level=0.95) One Sample t-test data: x t = -0.0022, df = 51, p-value = 0.9982 alternative hypothesis: true mean is not equal to 1.865 95 percent confidence interval: 1.516636 2.212595 sample estimates: mean of x 1.864615 opgave 7.5 side 213 (for 7ed og 6ed se nedenfor) Opgaven går ud på at angive en mulig estimationsfejl for µ, idet vi vil estimere µ ved µ = x på sædvanlig måde. Vi benytter (ligesom i bogen side 207), at fordi X µ s/ t(n 1). n Dvs P r { t(n 1) α/2 < X µ s/ n < t(n 1) α/2} = 1 α P r { t(n 1) α/2 s/ n < X µ < t(n 1) α/2 s/ n} = 1 α P r { X µ < t(n 1) α/2 s/ n} = 1 α Den maximale estimationsfejl er altså t(n 1) α/2 s/ n med konfidensgrad 1 α. Fra data har vi s = 3.057 ud fra n = 45 observationer. E 0.98 = t(44) 0.01 3.057/ 45 = 2.326 3.057/ 45 = 1.0600 (Bemærk, at de t(44) 0.01 2.326 kommer fra en aflæsning i nederste række i Tabel 3, mens en præcis beregning fra R ville give: t(44) 0.01 = 2.4141) opgave 7.4 og 7.5, 7ed: side 235 og 6ed: side 231 Opgaven går ud på at angive en mulig estimationsfejl for µ, idet vi vil estimere µ ved µ = x på sædvanlig måde. Vi benytter (ligesom i bogen side 231 (226)), at P r { t(n 1) α/2 < X µ s/ n < t(n 1) α/2} = 1 α 6

fordi X µ s/ t(n 1). n Dvs P r { t(n 1) α/2 s/ n < X µ < t(n 1) α/2 s/ n} = 1 α P r { X µ < t(n 1) α/2 s/ n} = 1 α Den maximale estimationsfejl er altså t(n 1) α/2 s/ n med konfidensgrad 1 α. Fra data har vi s = 14054 ud fra n = 50 observationer. E 0.95 = t(49) 0.975 14054/ 50 = 1.96 14054/ 50 = 3896 Et (1 α) konfidensinterval konstrueres på praktisk taget samme måde: P r { t(n 1) α/2 s/ n < X µ < t(n 1) α/2 s/ n} = 1 α P r {X + t(n 1) α/2 s/ n > µ > X t(n 1) α/2 s/ n} = 1 α (ved at flytte X ud og gange med -1). Derved bliver intervallet I(µ) 1 α = X ± t(n 1) α/2 s/ n Fra data har vi x = 11795 og s = 14054 ud fra n = 50 observationer. I(µ) 1 α = 11795 ± 1.96 14054/ 50 = 11795 ± 3896 = [7899, 15691] Opgave 7.11, side 213 (7ed: side 236 og 6ed side 231) Vi har principielt samme problematik som i opgave 7.4, bortset fra, at vi nu forudsætter forhåndskendskab til σ 2, idet det antages, at σ 2 = 1.40 2 (praksis ville man måske indsamle nogle data og benytte s 2 som skøn over σ 2 ). Vi kræver et konfidensniveau på (1 α) = 0.99, dvs at α = 1 0.99 = 0.01 og α/2 = 0.005. Vi har formlen for den maximale estimationsfejl med konfidensgrad (1 α) og det stillede krav σ E 1 α = z α/2 0.25 n som ved at isolere n og kvadrere giver n ( σ ) 2 z α/2 0.25 Vi regner med σ = 1.40, og har det krævede z 0.005 = 2.58, hvoraf n ( 2.58 1.40 ) 2 = 208.7 209 0.25 7

Opgave 7.15, side 213 (for 7ed og 6ed se nedenfor Konfidensintervallet er givet ved P r {X + t 1 s/ n < µ < X + t 2 s/ n} = 1 (α) Nu har vi så x = 114 og s = 69.5 = 8.3367 baseret på n = 9, dvs.: I(µ) 1 α = 114±t(8) 0.025 8.3367/ 9 = 114±2.306 8.3367/ 9 = 114±6.4081 = [107.59, 120.41] I R > x=c(123,106,114,128,113,109,120,102,111) > t.test(x,mu=1.865,alt="two.sided",conf.level=0.95) One Sample t-test data: x t = 40.3525, df = 8, p-value = 1.565e-10 alternative hypothesis: true mean is not equal to 1.865 95 percent confidence interval: 107.5919 120.4081 sample estimates: mean of x 114 Opgave 7.15 (7ed: side 236 og 6ed: side 232) I denne opgave har vi forelagt et interval [472 502], og vi forstiller os, at det er beregnet som et konfidensinterval. Vi benytter (ligesom i bogen side 231 (226)), at fordi generelt X µ s/ t(n 1) n gælder P r {t 1 < X µ s/ n < t 2} = 1 (α 1 + α 2 ) hvor t 1 og t 2 er fraktiler i t(99)-fordelingen. Situationen er som vist i følgende figur: t(99) α 1 α 2 t 1 t 2 8

Konfidensintervallet er givet ved P r {X + t 1 s/ n < µ < X + t 2 s/ n} = 1 (α 1 + α 2 ) Grænserne er altså X + t 1 s/ n og X + t 2 s/ n hhv. Nu har vi så x = 487 og s = 48 baseret på n = 100. Intervallets grænser 472 = x + t 1 s/ n = 487 + t 1 48/ 100 = t 1 = 3.125 502 = x + t 2 s/ n = 487 + t 1 48/ 100 = t 2 = +3.125 Nu skal vi så slå 3.125 og +3.125 op i t(99)-fordelingen. Hvis vi går ind i tabellen side 587 (576), ender den ved v = inf., som betyder infinitum, dvs v = mange frihedsgrader. Men, hvis antal frihedgrader, v, bliver stort, kan vi approximere t-fordelingen med en N(0,1)-fordeling (skriv det til i tabellen!) 0.09 0.08 0.07 0.06 N(0,1 2 ) 0.05 0.04 0.03 0.02 0.01 0 0.01 3.125 3.125 4 3 2 1 0 1 2 3 4 Fra tabellen over normalfordelingen aflæser vi, at i en N(0,1)-fordeling er der sandsynligheden α 1 = 0.0009 under 3.125. Over +3.125 er der ligeledes α 2 = 0.0009. Det foreslåede intervals konfidensgrad er derfor ca 1 (α 1 + α 2 ) = 1 0.0018 = 0.9982 99.8%. Opgave 7.24, side 214 (7ed: side 237 og 6ed: side 232) Vi har nu data X = {2.2, 1.8, 3.1, 2.0, 2.4, 2.0, 2.1, 1.2}, og vi beregner x = 2.1000 og s = 0.5372. Vi benytter (som sædvanligt) et tosidet symmetrisk konfidensinterval. Konfidensintervallet er da givet ved P r {X + t 1 s/ n < µ < X + t 2 s/ n} = 1 (α 1 + α 2 ) idet t 1 = t(n 1) α/2 og t 2 = t(n 1) α/2, dvs at t 1 = t 2. Grænserne er altså X t 2 s/ n og X + t 2 s/ n hhv. I opgaven er n = 8 og kravet til konfidensgraden er 1 α = 0.95. Dvs α = 0.05, og α/2 = 0.025. Ved opslag i t-fordelingen findes t(8 1) 0.025 = 2.365. 9

Konfidensintervallet bliver derved: I R I(µ) 0.95 = 2.1000 ± 0.5372 8 2.365 = 2.1000 ± 0.4492 [1.65, 2.55] > x=c(2.2,1.8,3.1,2,2.4,2,2.1,1.2) > t.test(x,mu=1.865,alt="two.sided",conf.level=0.95) One Sample t-test data: x t = 1.2373, df = 7, p-value = 0.2559 alternative hypothesis: true mean is not equal to 1.865 95 percent confidence interval: 1.650899 2.549101 sample estimates: mean of x 2.1 dec04.1 Lad Y = X 1 + X 2. Såer: EY = 6, Var(Y ) = 8 Og dermed P (Y > 10) = P (Z > 10 6 8 Og dermed er svarmulighed 1) det korrekte svar. dec04.17 20 kunder i timen er det samme som λ = 2/3 kunde pr. 2 minutter. Dermed kan vi bruge at Y = antal kunder i 2 minutter er poisson-fordelt, og hændelsen svarer til at der kommer mindst een kunde indefir de 2 minutter: Og det korrekte svar er 3. I R > 1-ppois(0,2/3) [1] 0.4865829 P (Y 1) = 1 P (Y = 0) = 1 e 2/3 Vejledende løsning Ropg6.3.1 Begge kommandoer angiver en 97.5% fraktil for en t-fordeling. I første tilfælde med 17 frihedsgrader: P (t 2.109816) = 0.975 I andet tilfælde med 1000 frihedsgrader: P (t 1.962339) = 0.975 hvilket således i praksis svarer til standard normalfordelingen. 10

Vejledende løsning Ropg6.3.2 Kommandoen angiver sandsynligheden, der er givet ved fã lgende: P (t 2.75) hvor t altsåer t-fordelt med 17 frihedsgrader. Vejledende løsning 6.3 (a) Luxury cruise people are not average persons (b) Most likely NOT all questionaires are returned AND there is the risk that there is a bias in this: maybe graduates with low (or even no) income is more reluctant to return the quetionaire. And secondly there COULD be a overenthusiastic reporting for those who do return. (c) The question is sending some values ( Værdiladet ) Solution 6.5, 8Ed (a) The binomial coefficient 2 out of 7 : ( ) 7 7! = 2 (5!)(2!) = 6 7 = 21 2 > choose(7,2) [1] 21 (b) The binomial coefficient 2 out of 24 : ( ) 24 24! 24 23 = = = 276 2 (22!)(2!) 2 > choose(24,2) [1] 276 Solution 6.5, 7Ed (a) The binomial coefficient 2 out of 6 : ( ) 6 6! = 2 (4!)(2!) = 6 5 = 15 2 > choose(6,2) [1] 15 (b) The binomial coefficient 2 out of 25 : ( ) 25 25! 24 25 = = = 300 2 (23!)(2!) 2 > choose(25,2) [1] 300 11

Vejledende løsning 6.15 For 8. udgave af bogen: Idet σ/ n = 0.0042/ 40 og P (0.2245 X 0.2260) = P ( 0.7529 X 0.2250 0.0042/ 1.5058) F (1.51) F ( 0.75) 40 = 0.9345 0.2266 = 0.7079 > pnorm(0.226,0.225,0.0042/sqrt(40))-pnorm(0.2245,0.225,0.0042/sqrt(40)) [1] 0.7081987 Der gœres opmærksom på, at facit i bogen IKKE er korrekt, idet der ikke er taget hœjde for n = 40. For 7. og 6. udgave af bogen: Idet σ/ n = 16/10 og P (75 X 78) = P ( 0.625 X 76 16/10 > pnorm(78,76,1.6)-pnorm(75,76,1.6) [1] 0.6283647 Vejledende løsning 6.18 1.25) F (1.25) F ( 0.625) = 0.628 a) Hvis X har tæthedsfunktion f(x) og Y = X µ, sågælder Idet µ Y = (x µ)f(x)dx = xf(x)dx µ f(x)dx og fås µ Y = µ µ = 0 b) σ 2 Y = E((X µ) 0) 2 = xf(x)dx = µ f(x)dx = 1 (x µ) 2 f(x)dx = σ 2 12