Besvarelser til øvelsesopgaver i uge 6

Relaterede dokumenter
02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Løsning eksamen d. 15. december 2008

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Løsning til eksaminen d. 14. december 2009

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Eksamen i Statistik for biokemikere. Blok

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Konfidensintervaller og Hypotesetest

Vejledende besvarelser til opgaver i kapitel 14

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Vejledende løsninger kapitel 8 opgaver

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Opgaver til kapitel 3

Tema. Dagens tema: Indfør centrale statistiske begreber.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Produkt og marked - matematiske og statistiske metoder

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Note til styrkefunktionen

Løsning til eksaminen d. 29. maj 2009

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Note om Monte Carlo metoden

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

(studienummer) (underskrift) (bord nr)

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Om hypoteseprøvning (1)

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Løsninger til kapitel 9

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Nanostatistik: Opgavebesvarelser

Løsninger til kapitel 6

c) For, er, hvorefter. Forklar.

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Kapitel 7 Forskelle mellem centraltendenser

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Estimation og konfidensintervaller

(studienummer) (underskrift) (bord nr)

Konfidensinterval for µ (σ kendt)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

(studienummer) (underskrift) (bord nr)

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Susanne Ditlevsen Institut for Matematiske Fag susanne

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

1 Hb SS Hb Sβ Hb SC = , (s = )

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

To-sidet varians analyse

Forsøgsplanlægning Stikprøvestørrelse

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Kapitel 12 Variansanalyse

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Løsning til eksamen d.27 Maj 2010

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

StatDataN: Test af hypotese

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Personlig stemmeafgivning

Kvantitative Metoder 1 - Efterår Dagens program

Test nr. 4 af centrale elementer 02402

Multiple choice opgaver

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Schweynoch, Se eventuelt

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Kapitel 12 Variansanalyse

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Estimation og usikkerhed

Forelæsning 11: Kapitel 11: Regressionsanalyse

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

02402 Vejledende løsninger til hjemmeopgaver og øvelser i kapitel 4

Transkript:

Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret. Vi kunne tænke os at benytte et t-test med n 1 frihedsgrader. Der er to måder at stille problemet op på. a) Vi vælger på forhånd at regne med, at device et virker: H 0 : µ µ 0, hvor µ 0 er en vis maximal emission, som vi vil tilstræbe. H 1 : µ > µ 0 Type I fejlen består nu i, at vi gennem testet ledes til at afvise H 0, selv om µ faktisk er mindre end µ 0 (dvs at H 0 er sand). Type II fejlen består i, at vi gennem testet ledes til at acceptere H 0, selv om µ faktisk er større end µ 0 (dvs at H 0 er falsk). Hvis vi benytter den angivne kombination af H 0 og H 1 vil der være en vis sandsynlighed for at opretholde H 0, selv om µ faktisk er lidt over µ 0. Man kan sige, at tvivlen kommer H 0 tilgode. Afvisning af H 0 kræver nemlig, at x > µ 0 + t(n 1) α s/ n, dvs at x er signifikant større end grænsen µ 0. På denne måde kan man påvise, at device et ikke virker, og at µ > µ 0. Det gælder, hvis man faktisk afviser H 0. b) Alternativt kunne man vælge forhåndsmistanken som H 0 : H 0 : µ µ 0, hvor µ 0 stadig er en vis maximal emission, som vi vil tilstræbe. H 1 : µ < µ 0 Type I fejlen består nu i, at vi gennem testet ledes til at afvise H 0, selv om µ faktisk er større end µ 0 (dvs at H 0 er sand). Vi ledes altså fejlagtigt til at tro, at device et fungerer (godt). Type II fejlen består i, at vi gennem testet ledes til at acceptere H 0, selv om µ faktisk er mindre end µ 0, dvs at vi fejlagtigt opretholder vores mistanke. Hvis vi benytter den angivne kombination af H 0 og H 1 vil der være en vis sandsynlighed for at opretholde H 0, selv om µ faktisk er lidt under µ 0. Man kan igen sige, at tvivlen kommer H 0 tilgode. Afvisning af H 0 kræver, at x < µ 0 t(n 1) α s/ n, dvs at x er signifikant under grænsen µ 0. På denne måde kan man påvise, at device et faktisk virker, og at µ < µ 0. Det gælder, hvis man afviser H 0, som er mistanken. De to betragtningsmåder a) og b) repræsenterer to meget forskellige synsvinkler. Vælger man a), kommer tvivlen producenten af device et tilgode. Vælger man b), kommer tvivlen miljøet tilgode. Generelt, hvis man ønsker at påvise en tilstand, skal man vælge den modsatte som H 0. Afvisning af H 0 (og dermed antagelse af H 1 ) er det stærke udsagn. Følgende figurer illustrerer OC-funktionerne (som angiver sandsynligheden for at opretholde H 0 ) i de to situationer a) og b). Abscisseværdien µ 0 er den samme i de to figurer, og den angiver den tilstræbte maximale emission. 1

1.00 1.00 Sandsynlighed for at Sandsynlighed for at opretholde H 0 i situation a) opretholde H 0 i situation b) 0.50 0.50 μ 0 μ 1 >μ 0 μ 1 <μ 0 μ 0 0.00 Emission 0.00 Emission Opgave 7.62, side 235 (for 6. og 7. ed. lï 1 2s/se opgave 7.38) H 0 : µ 58, 000 H 1 : µ > 58, 000 Signifikansniveau α 5% t X µ 0 σ/ n 58, 392 58, 000 648/ 6 1.48 trin 3) p-værdi: P (t(5) > 1.48) 1 P (t(5) < 1.48) 1 0.90 0.10 1-pt(1.48,5) [1] 0.09947331 trin 4) idet 0.10 > α accepteres H 0 på signifikansniveau α 5% Alternativt kunne man bestemme den kritiske værdi som (idet test er ensidet): t(5) 0.05 2.015. Idet t < t(5) 0.05 fås den samme konklusion. qt(0.95,5) [1] 2.015048 Opgave 7.52, side 229 (7ed: 7.38, side 245 og 6ed: 7.38, side 241) a) Det stærke udsagn er det udsagn, man får, når man afviser H 0 jvf. opgave 7.46. Leverandøren hævder, at den stokastiske variabel X, som er den Ohm ske modstand i et kredsløb har en værdi som er max 50 Ω. Dens middelværdi kaldes µ x. Vi vælger nu (evt. H 0 : µ x 50 eller) H 0 : µ x 50 Ω og H 1 : µ x < 50 Ω Hvis vi afviser H 0 har vi (med en vis sikkerhed) påvist H 1. Det er det, der (efter teksten at dømme) er hensigten. 2

Man vil, hvis data kan antages normalfordelte eller tilnærmelsesvist normalfordelte, benytte et t-test og reglen Afvis H 0 hvis x < 50 t(n 1) α s/ n b) Igen vil vi som agere som djævelens advokat og vælge H 0 : µ 3000 timer og H 1 : µ > 3000 timer. Hvis vi får afvist H 0, kan man anse det for påvist (med en vis sikkerhed), at levetiden faktisk er større end 3000 timer. Efter teksten at dømme er det det, der er hensigten. Vi vil afvise H 0, hvis de målte levetider ligger signifikant højere end 3000 timer gennemsnitligt. Kun for 6. og 7. ed. af lærerbogen: Opgave 7.39, side 256(7ed) og side 252(6ed) H 0 : µ 73.2 H 1 : µ > 73.2 Signifikansniveau α 1% Z X µ 0 σ/ n 76.7 73.2 8.6/ 45 2.73 trin 3) p-værdi: P (Z > 2.73) 1 P (Z < 2.73) 1 0.9968 0.0032 > 1-pnorm(2.73) [1] 0.003166716 trin 4) idet 0.0032 < α forkastes H 0 på signifikansniveau α 1% Alternativt kunne man bestemme den kritiske værdi som (idet test er ensidet): z 0.01 2.32. Idet Z > z 0.01 fås den samme konklusion. qnorm(0.99) [1] 2.326348 Opgave 7.61, side 235 (7ed.: 7.42, side 257 og 6ed: 7.42, side 253) H 0 : µ 30.0 H 1 : µ 30.0 Signifikansniveau α 5% t X µ 0 s/ n 30.91 30.0 0.788/ 10 3.652 trin 3) p-værdi (bemærk: 2-sidet test, derfor ganges med 2): P (t(9) > 3.652) < 2 0.0025 0.005 2*(1-pt(3.652,9)) [1] 0.005301019 3

trin 4) Idet p-værdien er mindre end 1% og signifikansniveau er 5% afvises H 0. Alternativt kunne man bestemme den kritiske værdi som (idet test er tosidet): t(9) 0.025 2.262. Idet t > t(9) 0.025 fås den samme konklusion. qt(0.975,9) [1] 2.262157 4

Opgave 7.63, side 235 (7ed: 7.48, side 257 og 6ed: 7.48, side 253) H 0 : µ 14.0 H 1 : µ 14.0 Signifikansniveau α 5% t X µ 0 s/ n 14.4 14.0 0.158/ 5 5.66 trin 3) p-værdi (bemærk: 2-sidet test, derfor ganges med 2): > 2*(1-pt(5.66,4)) [1] 0.004802981 P (t(4) > 5.66) < 2 0.0024 0.001 trin 4) Idet p-værdien er mindre end 1% og signifikansniveau er 5% afvises H 0. Alternativt kunne man bestemme den kritiske værdi som (idet test er tosidet): t(4) 0.025 2.776. Idet t > t(4) 0.025 fås den samme konklusion. qt(0.975,4) [1] 2.776445 Opgave 7.64, side 235 (7ed: 7.49, side 257 og 6ed: 7.49, side 253) H 0 : µ 14.0 H 1 : µ 14.0 Signifikansniveau α 5% t X µ 0 s/ n 14.7 14.0 0.74162/ 5 2.11 trin 3) p-værdi (bemærk: 2-sidet test, derfor ganges med 2): 2*(1-pt(2.11,4)) [1] 0.1024905 P (t(4) > 2.11) 2 0.05 0.10 trin 4) Idet p-værdien er større end signifikansniveauet på 5% accepteres H 0. Alternativt kunne man bestemme den kritiske værdi som (idet test er tosidet): t(4) 0.025 2.776. qt(0.975,4) [1] 2.776445 Idet t < t(4) 0.025 fås den samme konklusion. Paradokset er forklaret ved at standard afvigelsen (spredningen) er meget højere nu. 5

Kun for 6. og 7. ed. af lærerbogen: Opgave 7.43, side 257(7ed) og side 253(6ed) Vi har data x 1, x 2,..., x n for tidsforbruget, hvor n 60 observationer. H 0 : µ µ 0 og H 1 : µ > µ 0 hvor µ 0 32.6 minutter. Stikprøvefunktionen er igen t (x µ 0 )/(s/ n) og vi benytter beslutningsreglen: Afvis H 0, hvis t > t(n 1) α Med n 60 og α 0.05 findes t(n 1) α t(59) 0.05 1.645 (slået op i normalfordelingen, da n er stor). qnorm(0.95) [1] 1.644854 Med de fundne data bliver t (33.8 32.6)/(6.1/ 60) 1.52 Situationen er nu som vist i følgende figur, idet det sorte areal starter ved t(59) 0.05 1.645 t(59) α 0.05 1.52 Da 1.52 < 1.645 kan vi ikke på det foreliggende grundlag afvise H 0. Opgave 7.84, side 243 (for 6. og 7. ed. lï 1 2s/se opgave 7.39) H 0 : µ 7.5 minutter H 1 : µ > 7.5 minutter Signifikansniveau α 5%, fordi α sandsynligheden for at begï 1 2 en type I fejl. t X µ 0 σ/ n 7.9 7.5 1.2/ 20 1.49 trin 3) p-værdi: P (t(19) > 1.49) 1 P (t(19) < 1.49) 1 0.9237 0.0763 6

1-pt(1.49,19) [1] 0.07631908 trin 4) idet 0.0763 > α accepteres H 0 på signifikansniveau α 5% Alternativt kunne man bestemme den kritiske værdi som (idet test er ensidet): t(19) 0.05 1.729. Idet t < t(19) 0.05 fås den samme konklusion. qt(0.95,19) [1] 1.729133 Opgave 7.87, side 244 (for 6. og 7. ed. lï 1 2s/se opgave 7.43) a) Et (1 α) konfidensinterval konstrueres ved: P r { z α/2 s/ n < X µ < z α/2 s/ n} 1 α P r {X + z α/2 s/ n > µ > X z α/2 s/ n} 1 α (ved at flytte X ud og gange med -1). Derved bliver intervallet I(µ) 1 α X ± z α/2 s/ n Fra data har vi x 1.65 og s 0.82 ud fra n 180 observationer. I(µ) 1 α 1.65 ± 1.96 0.82/ 180 1.65 ± 0.1198 [1.53, 1.77] b) Da 1.65 er den estimerede middelvï 1 2rdi ud fra data, som er benyttet til at konstruere konfidens intervallet ovenfor, vil denne vï 1 2 rdi selvfï 1 2 lgelig vï 1 2re centrum for det givne konfidens interval. Den sande middelvï 1 2 rdi, µ, vil sï 1 2ledes med 95% sandsynlighed ligge i konfidens intervallet. c) Som beskrevet ovenfor er der netop 95% sandsynlighed for at den sande middelvï 1 2rdi vil ligge indenfor grï 1 2 nserne i (1 α) konfidensintervallet. Ved at estimere en lang rï 1 2 kke af sï 1 2danne (1 α) konfidensintervaller, ud fra en lang rï 1 2 kke eksperiementer, vil der sï 1 2 ledes vï 1 2re (1 α)% af disse konfidensintervaller der indeholder den sande middelvï 1 2 rdi. Dec04.5 Idet stikprøvestørrelsen er lille (n 9), er det sædvanlige test et t-test. Idet n 1 8, er der kun een mulighed tilbage, som iøvrigt passer med, at vi finder den t-værdi, der har 5% til højre for sig i fordelingen. Derfor er det korrekte svar 3. Dec04.24 Den eneste mulighed for en tællevariabel med mulige værdier mellem 0 og 170 er binomialfordelingen, altså svar 3. 7

Dec04.27 Igen er der kun een mulighed: Svar 5. Vejledende løsning Ropg7.3.1 H 0 : µ 20 H 1 : µ 20 Signifikansniveau α 1% n 10 Idet t x 20, og man kan aflæse t-stï 1 SE x 2 rrelsen samt gennemsnittet, fï 1 2s Standard error for gennemsnittet som: 16.4 20 SE x 3.1125 1.1566 Den maximale fejl med 99% konfidens kan udledes af det angivne konfidensinterval: 20.15884 16.4 3.75884, idet et sï 1 2 dant er gennemsnittet plus/minus den maximale fejl. Man kunne ogsï 1 2 beregnede standard error med den kritiske t-stï 1 2 rrelse og fï 1 2 : kombinere den 1.1566 3.249836 3.75884 8