Vejledende besvarelser til opgaver i kapitel 14

Relaterede dokumenter
Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Konfidensintervaller og Hypotesetest

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Vejledende løsninger kapitel 8 opgaver

Tema. Dagens tema: Indfør centrale statistiske begreber.

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Kapitel 7 Forskelle mellem centraltendenser

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Forelæsning 9: Inferens for andele (kapitel 10)

Note til styrkefunktionen

Konfidensinterval for µ (σ kendt)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Løsninger til kapitel 9

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Kapitel 12 Variansanalyse

Opgaver til kapitel 3

Eksamen i Statistik for biokemikere. Blok

Dagens program. Praktisk information:

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Dagens program. Praktisk information: Husk evalueringer af kurset

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Besvarelser til øvelsesopgaver i uge 6

Kapitel 12 Variansanalyse

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

(studienummer) (underskrift) (bord nr)

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Produkt og marked - matematiske og statistiske metoder

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Kvantitative metoder 2

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Løsning eksamen d. 15. december 2008

Løsning til eksaminen d. 14. december 2009

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Personlig stemmeafgivning

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Schweynoch, Se eventuelt

Hypotesetests, fejltyper og p-værdier

(studienummer) (underskrift) (bord nr)

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Om hypoteseprøvning (1)

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Kvantitative Metoder 1 - Efterår Dagens program

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Modul 5: Test for én stikprøve

Statistik II 1. Lektion. Analyse af kontingenstabeller

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Estimation og konfidensintervaller

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative metoder 2

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Susanne Ditlevsen Institut for Matematiske Fag susanne

Forelæsning 8: Inferens for varianser (kap 9)

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

ca. 5 min. STATISTISKE TEGN

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Statistik II 4. Lektion. Logistisk regression

(studienummer) (underskrift) (bord nr)

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

c) For, er, hvorefter. Forklar.

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Test nr. 5 af centrale elementer 02402

Løsning til eksaminen d. 29. maj 2009

To-sidet varians analyse

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

1 Hb SS Hb Sβ Hb SC = , (s = )

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Transkript:

Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden går imod teorien. Oftest er det lettest at tænke på nulhypotesen som den hypotese, der støtter vores teori og alternativhypotesen som den, der går imod. Men det kan lige så vel være omvendt. Eksempel: Vores nulhypotese er, at mænd og kvinder får samme løn for samme arbejde i Danmark, mens alternativhypotesen er, at de ikke gør det. b) En type-i fejl begås, hvis man forkaster en sand nulhypotese, mens en type-ii fejl begås hvis man accepterer en falsk nulhypotese. Eksempel: Hvis vi accepterer ovenstående nulhypotese (på baggrund af en stikprøve), og mænd og kvinder i virkeligheden ikke får samme løn, så begår vi en type-ii fejl. c) Signifikansniveauet er sandsynligheden for at begå en type-ii fejl. Vi fastsætter typisk selv testens signifikansniveau ved på forhånd at bestemme, hvor stor en værdi af teststatistikken der skal til, for at vi forkaster vores nulhypotese. d) De tre trin er: i) Formulér hypoteser. Se spørgsmål a). ii) Find et mål, der kan skelne mellem hypoteserne. Her findes et kvantitativt mål, som fx er nul, hvis nulhypotesen er sand og forskelligt fra nul, hvis den er falsk. iii) Implementér testen. Først konstrueres en teststatistik på baggrund af målet fra ii). Dernæst finder vi fordelingen af denne teststatistik under nulhypotesen (dvs. hvis nulhypotesen er sand). Næste trin er at bruge stikprøven til at beregne værdien af teststatistikken. Herefter kan vi bruge de kritiske værdier (baseret på det valgte signifikansniveau) til at afgøre om nulhypotesen skal forkastes eller accepteres. Alternativt kan vi udregne P-værdien for testen. Vi forkaster nulhypotesen, hvis P-værdien er tilstrækkelig lav. e) P-værdien er sandsynligheden for at få den observerede værdi (eller en mere ekstrem værdi) af teststatistikken, givet at nulhypotesen er sand. De kritiske værdier er en eller flere værdier af teststatistikken, således at der på forhånd kun er sandsynligheden α (= signifikansniveauet) for at få en mere ekstrem værdi af teststatistikken, givet at nulhypotesen er sand. f) Ved en dobbeltsidet alternativhypotese for middelværdien forkaster vi nulhypotesen ved både lave og høje værdier af teststatistikken. Dvs. hvis enten stikprøvegennemsnittet er meget lavere eller meget højere end værdien af middelværdien under nulhypotesen. Ved en enkeltsidet alternativhypotese forkaster vi kun nulhypotesen, hvis teststatistikken antager en høj (eller en lav afhængigt af udformningen af alternativhypotesen) værdi. Ved dobbeltsidede alternativhypoteser har man derfor to kritiske værdier, mens man ved en enkeltsidet alternativhypotese kun har én som til gengæld er numerisk mindre, hvis signifikansniveauet er det samme, da der da skal være samme sandsynlighed for at begå en type-i fejl (forkaste en sand nulhypotese).

Ved dobbeltsidede alternativhypoteser udregnes P-værdien som sandsynligheden for at få en numerisk højere værdi af teststatistikken end den observerede, givet at nulhypotesen er sand. Ved en enkeltsidet alternativhypotese er det sandsynligheden for at få en værdi af teststatistikken, der er mere ekstrem end den observerede i retning af alternativhypotesen. g) En tests styrke er dets evne til at opdage en falsk nulhypotese. Formelt er det sandsynligheden for at forkaste nulhypotesen, givet at denne er falsk. h) De forskellige tilfælde: i) Det generelle tilfælde: Når stikprøvestørrelsen er stor (varians enten kendt eller ukendt), så er teststatistikken approksimativt standardnormalfordelt. ii) Normalfordelte elementer: Her er teststatistikken eksakt normalfordelt når iii) variansen er kendt, mens den er eksakt t-fordelt, når variansen er ukendt. Bernoullifordelte elementer (test på en andel): Når stikprøvestørrelsen er stor, så er teststatistikken approksimativt standardnormalfordelt. i) Både Type I of II fejl bliver mindre når stikprøvestørrelsen øges. Tradeoff mellem Type I og Type II fejl kan kontrolleres gennem valg af signifikansniveauet. Man kan derfor typisk finde en signifikanssandsynlighed således Type I og II fejlene har en bestemt størrelse når man også kan vælge stikprøvestørrelsen. j) Man kan bruge teststatistikken Y ( n 1) S. k) Statistisk signifikans bedømmer usikkerheden i forhold til den sikkerhed, man ønsker om vurderingen af en hypotese. Reel signifikans bedømmer vigtigheden af resultatet i praksis, så den er typisk målt i en til problemstillingen relevant måleenhed fx kr. l) Typisk kan man bruge et konfidensinterval til at vurdere om en hypotese skal forkastes, og denne vurdering er ækvivalent til vurderingen ved brug af hypotesetest (hvis konfidensintervallet er konstrueret ud fra samme test statistik). Opgave a) Vi ved, at elementerne i stikprøven er normalfordelte med kendt varians. Derfor er den relevante teststatistik: X Z / n b) Teststatistikken er eksakt standardnormalfordelt under nulhypotesen. Z ~ N(, 1) c) Værdien af Z beregnes til: X,9 Z 1,84 / n 4 /1 og P-værdien for denne dobbeltsidede test er: P - værdi 1,84 1,84,39, 658 d) Nej, da P-værdien er større end,5. Ja, da P-værdien er mindre end,1. e) P-værdien bliver da:

P - værdi 1 1,84 1,9671, 39 f) Ja, her er P-værdien mindre end,5. Der er kun godt 3% sandsynlighed for at få en værdi a Z der er større end 1,84 under nulhypotesen, mens der er godt 6% sandsynlighed for at få en værdi, der er enten større end 1,84 eller mindre end -1,84 (det dobbeltsidede alternativ). Opgave 3 a) Vi ved, at elementerne i stikprøven er normalfordelte med kendt varians. Derfor er den relevante teststatistik: X Z / n b) Teststatistikken er eksakt standardnormalfordelt under nulhypotesen. Z ~ N(, 1) c) Værdien af Z beregnes til: X 5,53 5 Z 1,59 / n, /18 P - værdi 1,59 1,59,559, 1118 d) De kritiske værdier for en dobbeltsidet test ved et 5% signifikansniveau er: Z Z 1,96,5 /,5 Z1,5 / Z,975 1,96 H kan altså ikke forkastes. e) Den kritiske værdi for en enkeltsidet test, H 1 : µ > µ, ved et 5% signifikansniveau er: Z 1,5 Z,95 1,6449 Ved et 1% signifikansniveau er den: Z Z 1,816 1,1,9 f) Kun ved et 1% signifikansniveau kan H forkastes. g) Hvis variansen af indholdet i en tilfældigt udvalgt sodavand er ukendt er den relevante teststatistik: X T S / n h) T er eksakt t-fordelt med n - 1 = 17 frihedsgrader under H. i) Værdien af T beregnes til: X 5,53 5 T 1,637 S / n,18859 /18

P - værdi P T 1,637,6, 1 j) De kritiske værdier for en dobbeltsidet test ved et 5% signifikansniveau er: t (18 1) t 17,11,5 /,5 17, 11 t1,5 / (18 1) t,975 Vi kan derfor ikke forkaste H. k) Den kritiske værdi for en enkeltsidet test, H 1 : µ > 5, ved et 5% signifikansniveau er: t 1,518 1 t, 9517 1, 74 Så heller ikke her kan H forkastes. Opgave 4 a) Nulhypotesen og alternativhypotesen er: H : 14 H : 14 1 b) Idet vi ikke kan antage at elementerne er normalfordelte, og fordi variansen er ukendt, er den relevante teststatistik: X Z S / n c) som er approksimativt standardnormalfordelt under H, dvs. når stikprøvestørrelsen er tilpas stor. d) De kritiske værdier for en dobbeltsidet test ved et 5% signifikansniveau er: Z Z 1,96,5 /,5 Z1,5 / Z,975 1,96 Ved et 1% signifikansniveau er de: Z Z 1,6449,1/ 1,1/,5 Z Z,95 1,6449 e) Værdien af Z beregnes til: X 138,4 14 Z,3 S / n 6,3/1 P - værdi,3,3,1 f) Ja, ved begge signifikansniveauer., 44 g) P-værdien ved en enkeltsidet test, H 1 : µ < 14 er: P - værdi,3, 1 h) Nulhypotesen kan forkastes for alle signifikansniveauer over,1%, se g).

Opgave 5 a) Det afhænger af, hvordan de er udvalgt. Har man fx taget de 8 første biler, der blev produceret, eller kun dem, der blev produceret af dagsholdet, så kan man frygte, at stikprøven ikke er simpel tilfældig. b) X i er Bernoullifordelt med parameteren p, som er sandsynligheden for, at den er defekt. ~ Ber( p) X i c) Nulhypotesen er: H : p,8 d) Alternativhypotesen ved en dobbeltsidet test: H : p,8 1 e) Her skal vi teste på en andel elementerne i stikprøven er Bernoullifordelte. Derfor bliver teststatistikken: Z p p p 1 p / n som er approksimativt standardnormalfordelt under H, når stikprøvestørrelsen er stor. f) De kritiske værdier for en dobbeltsidet test ved et 5% signifikansniveau er: Z Z 1,96,5 / Z Z 1,5 /,5,975 1,96 g) Værdien af Z beregnes til: p p 11/ 8,8 Z 1,83 p 1 p / n,81,8/8 P - værdi 1,83 1,83,336, H kan således ikke forkastes. 67 h) De kritiske værdier ved et 1% signifikansniveau er: Z Z 1,6449,1/,5 Z1,1/ Z,95 1,6449 og her kan H altså forkastes. i) Hvis alternativhypotesen i stedet er: H 1 : p >,8, bliver den kritiske værdi ved et 5% signifikansniveau: Z 1,5 Z,95 1,6449 og ved et 1% signifikansniveau er den: Z Z,363 1,1,99

j) Her kan man forkaste H ved et 5% signifikansniveau men ikke ved et 1% signifikansniveau.