Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!



Relaterede dokumenter
Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Sammenligning af to grupper

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Hypotesetest. Hypotesetest og kritiske værdier Type 1 og Type 2 fejl Styrken af en test Sammenligning af to populationer

Løsninger til kapitel 7

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Stikprøvefordelinger og konfidensintervaller

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Statistik Lektion 8. Test for ens varians

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Opsamling. Lidt om det hele..!

9. Binomialfordelingen

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Konfidens intervaller

Generelle lineære modeller

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Vejledende besvarelser til opgaver i kapitel 15

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Motivation. En tegning

Maja Tarp AARHUS UNIVERSITET

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Estimation ved momentmetoden. Estimation af middelværdiparameter

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Uge 40 I Teoretisk Statistik, 30. september 2003

Kvantitative metoder 2

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Matematisk Modellering 1 Hjælpeark

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Modul 14: Goodness-of-fit test og krydstabelanalyse

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Teoretisk Statistik, 9. februar Beskrivende statistik

Vejledende opgavebesvarelser

Program. Populationer og stikprøver. Praktiske oplysninger. Eksempel vaccine mod miltbrand hos får. Praktiske oplysninger

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Estimation og test i normalfordelingen

antal gange krone sker i første n kast = n

Den flerdimensionale normalfordeling

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Elementær Matematik. Polynomier

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

6 Populære fordelinger

STATISTIKNOTER Simple normalfordelingsmodeller

Tema. Dagens tema: Indfør centrale statistiske begreber.

Oversigt. 1 Fordelingen for gennemsnittet t-fordelingen. 3 Den statistiske sprogbrug og formelle ramme

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 9. forelæsning Bo Friis Nielsen

STATISTISKE GRUNDBEGREBER

Konfidensintervaller og Hypotesetest

Sandsynlighedsregning i biologi

Renteformlen. Erik Vestergaard

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Diskrete og kontinuerte stokastiske variable

STATISTISKE GRUNDBEGREBER

Introduktion til Statistik

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

GENEREL INTRODUKTION.

Program. Middelværdi af Y = t(x ) Transformationssætningen

TEKST NR TEKSTER fra IMFUFA

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Introduktion til uligheder

IMFUFA TEKST NR TEKSTER fra ROSKILDE UNIVERSITETSCENTER. Jørgen Larsen

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Forelæsning 9: Inferens for andele (kapitel 10)

Formelsamling til statistik-del af metodekursus, 4. semester, lægevidenskab Version 3 (26/9-2011)

Introduktion til uligheder

Morten Frydenberg version dato:

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

(VIDENSKABSTEORI) STATISTIK (EKSPERIMENTELT ARBEJDE)

Noter om polynomier, Kirsten Rosenkilde, Marts Polynomier

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Nanostatistik: Opgavebesvarelser

Susanne Ditlevsen Institut for Matematiske Fag susanne

Noter om Kombinatorik 2, Kirsten Rosenkilde, februar

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

Test i polynomialfordelingen

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

Eksempel 10.1 En autoregressiv proces af orden 1 (ofte blot kaldet en AR(1)- proces) pårhar et opdateringsskema (10.1) med funktionen. for y R.

Transkript:

Statistik Lektio 8 Parrede test Test for forskel i adele Test for es varias Gesy med flyskræk!

Afhægige og uafhægige stikprøver Ved e uafhægig stikprøve udtages e stikprøve fra hver gruppe.. Mæd og kviders lø: Tag e stikprøve fra gruppe af mæd og e stikprøve fra gruppe af kvider og sammelig geemsitsløe for de to grupper.. Kilometer per liter: Tilfældig stikprøve af Toura er og tilfældig stikprøve af Skoda er. Ved e afhægig stikprøve er observatioere i de to grupper parrede. Oftest er det de samme perso/gestad, der bliver observeret i to forskellige situatioer.. Bio bezi kotra almidelig bezi: Vælg tilfældigt et atal VW Toura er og test dem med de to forskellige typer bezi.. Origial Nike sko kotra Super Nike sko: Vælg tilfældigt ogle persoer til at løbe 5 km og lad dem teste begge par sko.

Forrige forlæsig Sammeligig af to middelværdier kedt varias orm. pop. eller stort. Hypotesetest + Kofidesiterval Sammeligig af to middelværdier ukedt varias ormal populatio. Hypotesetest + Kofidesiterval Dee forlæsig Sammeligig af to adele. Hypotesetest + Kofidesiterval Parrede observatioer. Hypotesetest + Kofidesiterval Test for es varias i to populatioer

Parrede observatioer For de i te perso har vi to observatioer X i, og X i,, fx. blodtryk før og efter behadlig. For de i te perso defierer vi differece D i X i, X i,. Forskelle mellem før og efter ka u udersøges vha. hypotesetest af middeldifferece, μ D. Typisk atagelse er, at differecere er ormalfordelte, D i ~ N(μ D, σ D ). Estimatere for hhv. middelværdi og varias beteges og. x D s D

Parrede observatioer Udreg differecer: Nike Super 0 7 8 5 6 7 0 0 Nike Origial 9 9 0 7 6 0 Super-Origial - - - -5 - - 0 Beregx H 0 : μ μ D D og s D D ud fra differecere. Ha : μd μd 0 xd μd 0 Teststørrelse: t, sd Er t fordeltmed D frihedsgrader, hvis differecere er ormalfordelte. Kofidesiterval: sd xd ± tα 0

Samme Historie I R Commader Statistics Meas Paired t-test Bemærk: 95% kofidesiterval for forskelle i middelværdi ideholder 0! p-værdi 0.08345 > 0.05, dvs. vi ka ikke afvise H 0. Dvs. vi ka ikke afvise at de to sko-typer er lige gode.

Sammeligig af to adele, p p, store stikprøver H 0 : p p 0 ( dvs. H 0 : p p ) H : p p 0 ( dvs. H 0 : p p ) Teststørrelse z ( ˆ ) +, hvor Hvis H 0 er sad, så gælder Z ~ N(0,). Forkast H 0, år p-værdie er lille, eller sammelig med de kritiskeværdier. p x + + x

Eksempel - Titaic Er adele af mæd, der overlevede, p m, de samme som adele af kvider, der overlevede, p k? 68 37 m 0.98 m 0. 756 68 + 680 6 + 37

Eksempel - Titaic H 0 : p k p m H : p k p m z ˆ k pm ( )(/ k + / m) 0.756 0.98 0.3757( 0.3757)(/ 443+ / 848) 8.3 xk + xm k + m 68 + 37 (680 + 68) + (6 + 37) 0.3757 H 0 forkastes da p-værdie P( Z >8.3) 0.

Sammeligig af to adele, p - p D, store stikprøver Hypoteser : H 0 : p p D H : p p D Teststørrelse : z ( ) / + D ( ) / Beslutig : Forkast H, 0 år p - værdie er lille, eller sammelig med de kritiske værdier. Ka også laves som højresidet vestresidet test. test og

Kofides iterval for differece, p p, mellem to adele (-α)00% kofides iterval for p p : ( ) ± z α / ( ) + ( ) zα / vælges ige ud fra kofides iveauet. For eksempel for et 95% kofidesiterval, er z 0.05,96. Og ligesom før, hvis kofidesitervallet ideholder 0, svarer det til, at et hypotesetest ikke havde forkastet ul hypotese om at de to middelværdier er es.

Eksempel - Titaic Fid et 95% kofidesiterval for forskelle i adele af overlevede bladt mæd og kvider: ( ) ± zα / m k ( (0.98 0.756) ±.96 0.575 ± 0.0498 [ 0.5673, 0.55] m m m ) + k ( 0.98( 0.98) 68 + 680 k k ) + 0.756( 0.756) 6 + 37 Da kofidesitervallet ikke ideholder ul, ka vi afvise H 0 : μ μ på sigifikasiveau α 0.05.

F fordelige og test for lighed af to populatiosvariaser F fordelige er er fordelige af af brøke brøke af af to to chi-i-ade stokastiske variable, der der er er uafhægige og og hver hver er er divideret med med atallet atallet af af des des frihedsgrader. E E F fordelt fordelt stokastisk variable med med k og og k frihedsgrader: f(f).0 F (5,30) F ( k k ) χ k, χ k 0.5 F (0,5) 0.0 F (5,6) 0 3 4 5 F

F-tabelle Critical Poits of the F Distributio Cuttig Off a Right-Tail Area of 0.05 k 3 4 5 6 7 8 9 F-fordelige med 7 og frihedsgrader 0.7 k 6.4 99.5 5.7 4.6 30. 34.0 36.8 38.9 40.5 8.5 9.00 9.6 9.5 9.30 9.33 9.35 9.37 9.38 3 0.3 9.55 9.8 9. 9.0 8.94 8.89 8.85 8.8 4 7.7 6.94 6.59 6.39 6.6 6.6 6.09 6.04 6.00 5 6.6 5.79 5.4 5.9 5.05 4.95 4.88 4.8 4.77 6 5.99 5.4 4.76 4.53 4.39 4.8 4. 4.5 4.0 7 5.59 4.74 4.35 4. 3.97 3.87 3.79 3.73 3.68 8 5.3 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 9 5. 4.6 3.86 3.63 3.48 3.37 3.9 3.3 3.8 0 4.96 4.0 3.7 3.48 3.33 3. 3.4 3.07 3.0 4.84 3.98 3.59 3.36 3.0 3.09 3.0.95.90 4.75 3.89 3.49 3.6 3. 3.00.9.85.80 3 4.67 3.8 3.4 3.8 3.03.9.83.77.7 4 4.60 3.74 3.34 3..96.85.76.70.65 5 4.54 3.68 3.9 3.06.90.79.7.64.59 f(f) 0.6 0.05 0.5 0.4 0.3 0. 0. 0.0 0 /F (,7) 0.78 3 F (7,) 3.0 4 0.05 5 F Det vestresidet kritiske pukt, der hører til F (k,k) er givet ved: F( k, k ) hvor F (k,k) er det højresidet kritiske pukt for e F fordelt stokastisk variabel, me det omvedte atal frihedsgrader.

Kritiske pukter i F fordelige F(6, 9), α 0.0 F-fordelig med 6 og 9 frihedsgrader Det Det højresidet kritiske kritiske pukt: pukt: 0.05 f(f) 0.7 0.6 0.5 0.4 0.3 0. 0. 0.0 0 0.90 3 4 0.05 5 F F (6,9) 3.37 (6,9) 3.37 Det Det tilsvarede vestresidet pukt: pukt: 0439. F, 40. ( 96) F 0.95 (/4.0)0.439 F 0.05 3.37

Test for es varias Teststørrelse til test for es populatios varias i to ormalfordelte populatioer er givet ved: F s (, ) s I: I: Tosidet Tosidettest: test: σ σ H 0 : σ σ σ σ H 0 : σ σ H : : σ σ II:Esidet test test σ σ H 0 : σ σ σ σ H 0 : σ σ H : >σ : σ >σ

Eksempel Populatio 4 s 0. Sigifika siveau : α 0.05 Kritiske værdier : F 3.8 ( 3,8) Populatio 9 s 0. F (8,3).77 0.36 F.77 (8,3) Hypoteser : H : σ σ 0 H : σ σ Teststørrelse: F (, ) ( 3,8 ) F s s 0. 0..9 H0 ka ikke forkastes på et 5% sigifikas- iveau, da.9 ikke er større ed 3.8 eller midre ed 0.36.

Vigtigste fordeliger i kurset Biomial B(,p) Normal N(μ,σ ) χ χ () Hvis Z, K, Z gælder i Z uafh. og Z i ~ χ ( ) i ~ N(0,), så t t() Hvis Z og X uafh. og Z X ~ χ ( ) så gælder Z ~ N(0,) og X ~ t( ) F F(k,k ) Hvis X og Y uafh. og X ~ χ ( k) og Y ~ χ ( k ) så gælder ( X k ) ( Y k ) ~ F( k, k ) Hvis X ~ t( ) så gælder X ~ F(, )

Flyskræk! Passer overskrifte? Politike 6/- 07 Er du tryg ved at flyve? Ja: 86% i 005 83% i 007 Er der sket e statistisk sigifikat ædrig? Sum selv svaret ;-)

Sidste Summeopgave Atag at der er blevet udspurgt 00 persoer i både 005 og 007. Test på sigifikasiveau α0.05 om der er e forskel i adele af folk, der er trygge ved at flyve. Bestem p-værdie. Hvad syes I om overskrifte?

Til efteråret: Økoometri Økoometri: Statistik avedt på økoomiske problemstilliger Idhold: Lieær regressio - Middelværdie er forklaret ved e eller flere kotiuerte forklarede variable Form: 7 forelæsiger efterfulgt af projekt.