1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Relaterede dokumenter
Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Konfidensintervaller og Hypotesetest

Løsning eksamen d. 15. december 2008

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Vejledende besvarelser til opgaver i kapitel 14

Tema. Dagens tema: Indfør centrale statistiske begreber.

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Normalfordelingen og Stikprøvefordelinger

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kapitel 7 Forskelle mellem centraltendenser

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Vejledende løsninger kapitel 8 opgaver

Personlig stemmeafgivning

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Note om Monte Carlo metoden

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Nanostatistik: Opgavebesvarelser

Kapitel 12 Variansanalyse

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

J E T T E V E S T E R G A A R D

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Løsning til eksamen d.27 Maj 2010

Kapitel 12 Variansanalyse

Kapitel 4 Sandsynlighed og statistiske modeller

(studienummer) (underskrift) (bord nr)

Løsning til eksaminen d. 14. december 2009

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Om hypoteseprøvning (1)

Note til styrkefunktionen

1 Hb SS Hb Sβ Hb SC = , (s = )

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Forsøgsplanlægning Stikprøvestørrelse

Estimation og konfidensintervaller

1 Regressionsproblemet 2

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Forelæsning 9: Inferens for andele (kapitel 10)

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Løsninger til kapitel 9

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Kvantitative Metoder 1 - Forår 2007

Susanne Ditlevsen Institut for Matematiske Fag susanne

1 Multipel lineær regression

Basal statistik. 6. februar 2007

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

1 Multipel lineær regression

Oversigt over nyttige fordelinger

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Basal statistik. 6. februar 2007

Løsning til eksaminen d. 29. maj 2009

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Kapitel 4 Sandsynlighed og statistiske modeller

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Hypotesetests, fejltyper og p-værdier

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Nanostatistik: Test af hypotese

Vejledende løsninger kapitel 9 opgaver

StatDataN: Test af hypotese

Forsøgsplanlægning Stikprøvestørrelse

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Eksamen i Statistik for biokemikere. Blok

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Basal statistik. 11.september Sandsynligheder Fordelinger og modeller Statistisk analyse Type 1 og 2 fejl, styrke

Opgaver til kapitel 3

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Module 4: Ensidig variansanalyse

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Statistik og Sandsynlighedsregning 2

To-sidet varians analyse

Transkript:

Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi.......................................... 3 1.4 Signifikansniveau..................................... 4 2 t-test for middelværdi 5 2.1 Tosidet t-test for middelværdi.............................. 5 2.2 Ensidet t-test for middelværdi.............................. 6 2.3 Agresti: Oversigt over t-test............................... 7 3 Signifikanstest for en andel 7 3.1 Approksimativt test................................... 8 3.2 Binomial test....................................... 9 3.3 Binomialtest i Rcmdr................................... 11 4 Agresti: Oversigt over test for middelværdi og andel 12 1

1 Statistisk inferens: Hypotese og test Hypotesebegrebet En hypotese er et udsagn om en given population. Som oftest formuleret ved at en populationsparameter har en given værdi eller ligger i et bestemt interval. Eksempler: Kvalitetskontrol af produkter, hvor hypotesen er at produkterne fex har en bestemt vægt, et givet strømforbrug eller en mindste holdbarhed. Det kan være svært at designe forsøg, som belyser sidstnævnte! Videnskabelige hypoteser, fex at der ikke er sammenhæng mellem en virksomheds alder og overskudsgrad. Graden af sammenhæng måles ofte med en parameter kaldet korrelation, og denne er nul, hvis der er mangel på sammenhæng. Signifikanstest Et signifikanstest bruges til at undersøge, hvorvidt data strider mod hypotesen eller ej. Hvis hypotesen siger at en parameter har en bestemt værdi, så skal testet svare på, om stikprøveestimat ligger langt væk fra denne værdi. Eksempelvis: Ventetider i en kø. Vi sampler n kunder og tæller hvor mange, der venter over 5 minutter. Virksomhedens politik er at højst 10% af kunderne må vente over 5 minutter. I en stikprøve med n = 32 observeres 4 med ventetid over 5 minutter, dvs den estimerede andel er ˆπ = 4 32 = 12.5%. Er dette langt over 10%? Spirituspromillen hos en studerende måles 4 gange og giver værdierne 0.504, 0.500, 0.512, 0.524, dvs den estimerede middelværdi er ȳ = 0.51. Ligger dette langt fra en grænse på 0.5? 1.1 Nulhypotese - alternativ. Nulhypotese Nulhypotesen - betegnet H 0 - vil som oftest specificere, at en populationsparameter antager en bestemt værdi. Eksempelvis µ er populationsmiddelværdien af en promillemåling. Nulhypotesen er H 0 : µ = 0.5. 2

Alternativ hypotese En Alternativ hypotese - betegnet H a - vil specificere, at populationsparameteren ligger i et sæt af værdier forskellig fra nulhypotesen. Eksempelvis µ er populationsmiddelværdien af en promillemåling. Nulhypotesen er H 0 : µ = 0.5. Alternativ hypotese: H a : µ > 0.5. 1.2 Teststatistik Teststatistik Vi kigger på en populationsparameter µ og opstiller nulhypotesen H 0 : µ = µ 0 hvor µ 0 er et kendt tal, fex µ 0 = 0.5. På basis af en stikprøve har vi estimatet ˆµ. En teststatistik T vil typisk afhænge af ˆµ og µ 0 og måle T (ˆµ, µ 0 ): Hvor langt ligger ˆµ fra µ 0? Ofte anvendes T (ˆµ, µ 0 )= antallet af standardafvigelser fra ˆµ til µ 0. Eksempelvis vil det være højst usandsynligt af ligge over 3 standardafvigelser væk fra µ 0, dvs µ 0 er næppe den rigtige værdi af populationsparameteren. 1.3 P-værdi P-værdi Vi betragter H 0 : en nulhypotese. H a : en alternativ hypotese hypotese. T : en teststatistik, hvor vi for det aktuelle eksperiment har beregnet værdien t obs. 3

Antag at nulhypotesen er sand. Hvis vi gentager eksperimentet, hvad er så sandsynligheden for at T antager værdien t obs eller en anden værdi, som mere tydeligt peger på H a? Dette kaldes p-værdien. Hvis denne er lav - dvs det er svært af finde T -værdier, som peger mere tydeligt på H a - så må vi være tæt på H a. Ergo Jo lavere p-værdi, jo mindre tillid har vi til H 0. Hvad er en lille p-værdi? Hvis denne er under 5% taler man om signifikans på niveau 5%. 1.4 Signifikansniveau Signifikansniveau Vi betragter H 0 : en nulhypotese. H a : en alternativ hypotese hypotese. T : en teststatistik, hvor vi for det aktuelle eksperiment har beregnet værdien t obs og p- værdien p obs. Små værdier af p obs er kritiske for H 0. I praksis kan det være nødvendigt at beslutte om vi vil forkaste H 0. Beslutningen kan træffes, hvis vi på forhånd har lagt os fast på et såkaldt α-niveau, hvor α er en given procent som opfylder Vi forkaster H 0, hvis p obs er mindre end eller lig med α. α kaldes testets signifikansniveau. Typiske valg af α er 5% eller 1%. 4

2 t-test for middelværdi 2.1 Tosidet t-test for middelværdi t-test for middelværdi Vi antager at data er en stikprøve fra N(µ, σ). Estimaterne er ˆµ = ȳ og ˆσ = s baseret på n observationer. H 0 : µ = µ 0, hvor µ 0 er en kendt værdi. H a : µ µ 0. Teststørrelse: t = ȳ µ 0 s, hvor se = se. n Dvs t måler, hvor mange standardafvigelser - med fortegn - vi ligger fra µ 0. Hvis H 0 er sand, så er t en observation fra t-fordelingen med df = n 1. P-værdi: Værdier større end t og mindre end t peger mere på H a end H 0. Vi beregner: p-værdi=2 x øvre halesandsynlighed for t. t-fordelingen med df frihedsgrader. Sandsynligheden beregnes i Eksempel Promillemålinger: 0.504, 0.500, 0.512, 0.524. Disse antages at være en stikprøve fra en normalfordeling. Vi beregner ȳ = 0.51 og s = 0.0106 se = s n = 0.0106 4 = 0.0053. H 0 : µ = 0.5, dvs µ 0 = 0.5. t = ȳ µ 0 se = 0.51 0.5 0.0053 = 1.89. Vi er altså knap 2 standardafvigelser fra 0.5. Er dette ekstremt i en t-fordeling med 3 frihedsgrader? Eksempel 5

Tosidet test: p værdi svarende til t score p værdien er lig med 2q Vi kender t. Find arealet q af det skraverede område Vi har beregnet t = 1.89. Er dette kritisk i t-fordelingen med 3 frihedsgrader? 3 t 1 0 1 t 3 Tæthed for t fordelingen med df=3 Distributions/Continuous distributions/t distribution/ t probabilities... Vi får en p-værdi på 2 0.078, dvs over 15%. Vi kan ikke forkaste H 0. 2.2 Ensidet t-test for middelværdi Ensidet test Vi antager at data er en stikprøve fra N(µ, σ). Estimaterne er ˆµ = ȳ og ˆσ = s baseret på n observationer. H 0 : µ = µ 0, hvor µ 0 er en kendt værdi. H a : µ > µ 0 (eller µ < µ 0 ). Teststørrelse: t = ȳ µ 0 se, hvor se = s n. Hvis H 0 er sand, så er t en observation fra t-fordelingen med df = n 1. P-værdi: Værdier større end t peger mere på H a end H 0. Vi beregner: p-værdi= øvre halesandsynlighed for t. Sandsynligheden beregnes i t-fordelingen med df frihedsgrader. 6

Hvis alternativet er H a : µ < µ 0 beregnes: p-værdi= nedre halesandsynlighed for t. 2.3 Agresti: Oversigt over t-test Oversigt 3 Signifikanstest for en andel Test for andel Givet en stikprøve af størrelse n, hvor vi observerer om en given egenskab er til stede. 7

Frekvensen af egenskaben i populationen er π. Denne estimeres ved ˆπ. Nulhypotese: H 0 : π = π 0, hvor π 0 er et kendt tal. Tosidet alternativ hypotese: H a : π π 0. Ensidet alternativ hypotese: H a : π > π 0 (eller H a : π < π 0 ). π Hvis H 0 er sand er standardfejlen på ˆπ givet ved se 0 = 0 (1 π 0 ). n Teststatistik: z = ˆπ π se 0 Dvs z måler, hvor mange standardafvigelser - med fortegn - der er fra ˆπ til π 0. 3.1 Approksimativt test Approksimativt test Hvis både nˆπ og n(1 ˆπ) er større end 15 gælder fra tidligere at ˆπ er normalfordelt(appoksmativt), dvs Hvis H 0 er sand, så er z en observation fra standardnormalfordelingen. P-værdi for tosidet test: Værdier større end z og mindre end z peger mere på H a end H 0. Vi beregner: p-værdi=2 x øvre halesandsynlighed for z. standardnormalfordelingen. P-værdi for alternativ H a : π > π 0 : p-værdi= øvre halesandsynlighed for z i standardnormalfordelingen. P-værdi for alternativ H a : π < π 0 : p-værdi= nedre halesandsynlighed for z i standardnormalfordelingen. Sandsynligheden beregnes i 8

Eksempel Undersøgelse fra Florida Poll i 2006. En tilfældig stikprøve på 1200 personer blev ift problemer med financiering af offentlig service spurgt om de foretrak serviceforringelser eller skattestigninger. 52% gik ind for skattestigninger. Repræsenterer disse et flertal? Stikprøve med n = 1200 observationer og estimeret andel ˆπ = 0.52. Nulhypotese H 0 : π = 0.5. Alternativ H a : π 0.5. Standardfejl se 0 = Teststatistik z = ˆπ π 0 se 0 π 0 (1 π 0 ) n = = 0.52 0.5 0.0144 = 1.39 0.5 0.5 1200 = 0.0144 øvre halesandsynlighed for 1.39 i standardnormalfordelingen er 0.0823, dvs vi får en p- værdi på 2 0.0823 16%. Konklusion: Der er ikke tilstrækkeligt evidens til at forkaste H 0, dvs vi kan ikke udelukke at holdningen til spørgsmålet er fifty-fifty. 3.2 Binomial test Binomial test Givet en stikprøve af størrelse n, hvor vi observerer om en given egenskab er til stede. Frekvensen af egenskaben i populationen er π. Denne estimeres ved ˆπ. Lad y + = nˆπ være frekvensen af egenskaben i stikprøven. Det kan vises at denne har en såkaldt binomialfordeling med antalsparameter n og sandsynlighedsparameter π. Vi skal bruge betegnelsen Bin(n, π) for denne fordeling Nulhypotese: H 0 : π = π 0, hvor π 0 er et kendt tal. 9

Binomialtest P-værdi for tosidet binomialtest: Hvis y + nπ 0 : 2 x øvre halesandsynlighed for y + i Bin(n, π 0 ) fordelingen. Hvis y + < nπ 0 : 2 x nedre halesandsynlighed for y + i Bin(n, π 0 ) fordelingen. P-værdi for alternativ H a : π > π 0 : øvre halesandsynlighed for y + i Bin(n, π 0 ) fordelingen. P-værdi for alternativ H a : π < π 0 : nedre halesandsynlighed for y + i Bin(n, π 0 ) fordelingen. Eksempel Binomial Distribution: n = 30, π= 0.3 Forsøg med n = 30, hvor vi registrerer y + = 14 successer. Vi vil teste H 0 : π = 0.3 mod H a : π 0.3. Da y + > nπ 0 = 9 skal vi beregne sandsynligheden for øvre hale svarende til summen af højderne af de røde pinde i grafen. Probability Mass 0.00 0.05 0.10 0.15 5 10 15 Number of Successes 10

Eksempel Distributions/Discrete Distributions/Binomial distribution/binomial tail probabilities... Tosidet test: pværdi=2 x 0.04=8% Hvis H a : π > 0.3 bliver p-værdien blot 4%. Hvis H a : π < 0.3 bliver p-værdien den nedre halesansynlighed, dvs 1-0.04=96%. 3.3 Binomialtest i Rcmdr Statistics/Proportions/Single sample proportion test... Vi kigger på datasættet Chile i pakken car. Vi interesserer os for variablen sex, dvs kønsfordelingen i stikprøven, hvor vi undersøger H 0 : π = 0.5. Binomialtestet opnås ved at afmærke Exact binomial. 11

Vi opnår en p-værdi på godt 27%, dvs der er ikke signifikant forskel på andelen af mænd og kvinder. Det approksimative test giver en p-værdi på godt 26%. 4 Agresti: Oversigt over test for middelværdi og andel Agresti:Oversigt 12