Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Relaterede dokumenter
Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Nanostatistik: Opgavebesvarelser

Kapitel 7 Forskelle mellem centraltendenser

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Forsøgsplanlægning Stikprøvestørrelse

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Basal statistik. 16. september 2008

1 Hb SS Hb Sβ Hb SC = , (s = )

Basal statistik. 18. september 2007

Eksempel: To metoder, som forventes at skulle give samme resultat: MF: Transmitral volumetric flow, bestemt ved Doppler ekkokardiografi

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Ikke-parametriske tests

Basal statistik. 18. september 2007

Basal statistik 19. september Eksempel: To metoder, som forventes at skulle give samme resultat:

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Besvarelse af vitcap -opgaven

Tema. Dagens tema: Indfør centrale statistiske begreber.

Kapitel 12 Variansanalyse

Løsning til eksamen d.27 Maj 2010

Forsøgsplanlægning Stikprøvestørrelse

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

MPH specialmodul Epidemiologi og Biostatistik

Løsning eksamen d. 15. december 2008

Eksamen i Statistik for biokemikere. Blok

Ensidet variansanalyse

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Kapitel 12 Variansanalyse

Statistik og Sandsynlighedsregning 2

En Introduktion til SAS. Kapitel 5.

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Løsning til eksaminen d. 29. maj 2009

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Løsning til eksaminen d. 14. december 2009

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Note til styrkefunktionen

Nanostatistik: Test af hypotese

(studienummer) (underskrift) (bord nr)

StatDataN: Test af hypotese

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Nanostatistik: Konfidensinterval

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Project in Statistics MB

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Skriftlig eksamen Science statistik- ST501

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Vejledende løsninger kapitel 8 opgaver

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Velkommen til StatBK. Program. Introduktion, summary measures, SAS. Praktisk info. Praktisk info

Statistik viden eller tilfældighed

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Forelæsning 11: Envejs variansanalyse, ANOVA

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Normalfordelingen og Stikprøvefordelinger

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

(studienummer) (underskrift) (bord nr)

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Om hypoteseprøvning (1)

Transkript:

Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt om parrede vs. ikke-parrede stikprøver Test af ens spredninger: Reeksamen blok 2 2007 08, opgave 2(c) Sign test for parrede stikprøver Wilcoxon rank sum test for uparrede stikprøver I eftermiddag: Forsøg på at skabe lidt overblik... Eksempler på parrede og uparrede data Eksempel: lav-glycogen Parametriske vs. ikke-parametriske metoder Lidt om projektet StatBK (Uge 3, torsdag) To stikprøver 1 / 20 StatBK (Uge 3, torsdag) To stikprøver 2 / 20 Repetition fra tirsdag: ikke-parrede stikprøver Test for ens spredninger Data: x 11,...,x 1n1 og x 21,...,x 2n2 fra to grupper. Statistisk model: alle x er uafhængige, alle x 1i N(µ 1,σ 1 ), alle x 2i N(µ 2,σ 2 ). Interesseret i µ 1 µ 2. Estimat: ˆµ 1 ˆµ 2 = x 1 x 2. To situationer: med eller uden antagelsen σ 1 = σ 2. I begge tilfælde er 95% konfidensinterval på formen x 1 x 2 ± t 0.975,df SE( x 1 x 2 ) Teststørrelse for H 0 : µ! = µ 2 på formen T = x 1 x 2 SE( x 1 x 2 ) Men udtrykket for SE( x 1 x 2 ) og antal frihedsgrader (df) er forskellige! Den nyeste version af SAS laver begge konfidensintervaller! Min gamle version lavede kun KI svarende til ens spredninger. Data: x 11,...,x 1n1 fra gruppe 1, N(µ 1,σ 1 ), uafh. Stikprøvespredning s 1. x 21,...,x 2n2 fra gruppe 2, N(µ 2,σ 2 ), uafh. Stikprøvespredning s 2. Hypotese: H 0 : σ 1 = σ 2 testes mod H A : σ 1 σ 2. Teststørrelse og p-værdi: F obs = max(s2 1,s2 2 ) min(s 2 1,s2 2 ), p = 2 P(F F obs) Viser sig at F obs skal vurderes i en F -fordeling med (df 1,df 2 ) frihedsgrader hvor { (n1 1,n (df 1,df 2 ) = 2 1) hvis s 1 > s 2 (n 2 1,n 1 1) hvis s 2 < s 1 F -tabeller i FLH tabel B11 side 474 476. StatBK (Uge 3, torsdag) To stikprøver 3 / 20 StatBK (Uge 3, torsdag) To stikprøver 4 / 20

Reeksamen blok 2 2007 08, opgave 2(c) Parrede vs. ikke-parrede stikprøver Transmittere: n 1 = 49, s 1 = 19.3 Ikke-transmittere: n 2 = 47, s 2 = 18.3. Hypotese: H 0 : σ 1 = σ 2 testes mod H A : σ 1 σ 2. Teststørrelse: F obs = max(s2 1,s2 2 ) min(s 2 1,s2 2 ) = s2 1 s 2 2 = 19.32 18.3 2 = 1.11 Er dette signifikant større end 1? Skal vurderes i F -fordeling med (48,46) frihedsgrader, tosidet. Tabel B11 i FLH side 474: 90%-fraktil i F (48,46)-ford. er cirka 1.44. Så: p = 2 P(F 1.11) 2 0.10 = 0.2 Altså ikke tegn på forskellige spredninger. Ikke-parrede eller uafhængige stikprøver: x 11,...,x 1n1 henholdsvis x 21,...,x 2n2 x 1i og x 2i ikke har noget med hinanden at gøre. n 1 og n 2 kan være forskellige Under N-antagelser: T -test baseret på x 1 x 2. To versioner: med eller uden antagelsen σ 1 = σ 2. Test evt. hypotesen σ 1 = σ 2 først. Uden N-antagelse: Wilcoxon rank sum test (eller Kruskal-Wallis) Parrede stikprøver: (x 11,x 21 ),...,(x 21,x 2n ). Observationerne hører sammen i par samme antal af hver slags. Under N-antagelse: analyse af differenser, d i = x 1i x 2i. Uden N-antagelse: Sign test eller (Wilcoxon Signed Rank test). StatBK (Uge 3, torsdag) To stikprøver 5 / 20 StatBK (Uge 3, torsdag) To stikprøver 6 / 20 Sammenligning af diæter Sammenligning af diæter: sign test Husk eksemplet side 222 med sammenligning af to diæter. 20 par af personer. Parret så personerne i et par har samme køn, (cirka) samme vægt, samme motionsniveau, samme... De to personer i et par sat på hver sin diæt: diæt 1 og 2. Vægttab efter diæt registreret for alle 40 personer. Sidste uge: Kiggede på differenserne d i = x 1i x 2i Statistisk model: d i N(µ,σ). Test for hypotese H 0 : µ = 0. Hvis vi ikke er villige til at bruge normalfordelingsantagelsen, så kan vi i stedet udføre et sign test (fortegnstest). Det var faktisk det der blev gjort i FLH, afsnit 8.1.4. Hvis der ikke er forskel på diæterne vil vi forvente at der er (cirka) lige mange par hvor personen på diæt 2 taber sig mere end personen på diæt 1 og omvendt. Det svarer til at sandsynligheden for at personen på diæt 1 taber sig mere end personen på diæt 2 i et tilfældigt par er π = 0.5. Observation, x: antal par hvor personen på diæt 1 har tabt sig mere end personen på diæt 2. Viser sig at være 13. Hypotese: π = 0.5. p-værdi: Hvis H 0 er sand, hvor sandsynligt er det så at få data der passer mindst lige så dårligt med hypotesen som x = 13? StatBK (Uge 3, torsdag) To stikprøver 7 / 20 StatBK (Uge 3, torsdag) To stikprøver 8 / 20

Sammenligning af diæter: sign test Eksempel: kalorieindtag Hvilke værdier af x passer mindst lige så dårligt med hypotesen som x = 13? Under hypotesen er x binomialfordelt med antalsparameter 20 og sandsynlighedsparameter 0.5. Brug tabel B2 side 454 457. Hvad er konklusionen? Parametrisk vs. ikke-parametrisk Færre antagelser mere robust Bruger ikke værdierne, kun fortegnet på differenserne Mindre styrke forskelle skal typisk være større før hypotesen bliver forkastet. Eksempel 9.1, side 250 i FLH: Kalorieindtag for 33 drenge, to dage. Reversion towards the mean? Følges et (meget) stort/lille indtag på dag 1 typisk af det modsatte på dag 2? Sign test: Ser på de laveste 7 og højeste 7 på dag 1. Hvorfor netop 7... obs.: antal drenge blandt de 14 der bevæger sig towards the mean, dvs. mod noget mindre ekstremt. Hvor mange? Hvad ville vi forvente hvis der ikke var reversion towards the mean? p-værdi for hypotesen om ingen reversion towards the mean effekt? Hvad er konklusionen? Kunne vi teste hypotesen med et parametrisk test? Hvordan? Under hvilke forudsætninger? StatBK (Uge 3, torsdag) To stikprøver 9 / 20 StatBK (Uge 3, torsdag) To stikprøver 10 / 20 Wilcoxons rank sum test Lille dataeksempel To uparrede stikprøver: x 11,...,x 1n1 og x 21,...,x 2n2. Antag n 1 n 2. Ordn alle observationer efter størrelse og tildel mindste obs. rang 1, næstmindste obs. rang 2, osv. Hvad er summen af alle rangene? Afhænger summen af data? Læg rangene sammen for gruppe 1 (den mindste): R WRS. Hvilken værdi ville vi forvente hvis der ikke er forskel på grupperne? Hvilke værdier passer godt med hypotesen? Hvilke værdier passer dårligt med hypotesen? Hvis hypotesen er sand, så er alle mulige kombinationer af range lige sandsynlige. p-værdi: andelen af kombinationer der passer mindst lige så dårligt med hypotesen som den observerede størrelse. Eksempel (simulerede data): Gruppe 1: 12.2 11.3 9.6 11.7 Gruppe 2: 11.4 9.8 10.1 10.3 Wilcoxon rank sum test: Tildel range Beregn R WRS. Mulige kombinationer af range i gruppe 1? Se Tabel 9.6. Fordeling af R WRS under hypotesen: Se Tabel 9.7. Bestemmelse af p-værdi og kritisk område (værdier af R WRS der fører til afvisning). Se også Tabel B10. (NB. N 1 N 2 ). StatBK (Uge 3, torsdag) To stikprøver 11 / 20 StatBK (Uge 3, torsdag) To stikprøver 12 / 20

I praksis Eksempel: Fedtindtag i to aldersgrupper FLH eksempel 7.6, side 190. Hvis n 1 og n 2 er store nok, bruges en normalfordelingsapproksimation til fordelingen af R WRS. Hvis hypotesen er sand gælder middelværdien af R WRS er n 1 (n + 1)/2 variansen af R WRS er n 1 n 2 (n + 1)/12 R WRS er approksimativt N ( n 1 (n + 1)/2,n 1 n 2 (n + 1)/12 ) Denne approksimation benyttes også af SAS! I mandags: Sammenligning med ens spredninger gav T = 0.72, p = 0.48. Wilcoxon: Tildeling af range: se Tabel 9.5. Teststørrelse R WRS = 224.5 (sum af range i lille gruppe). NB: Ties Forventet antal under hypotesen: 14 34/2 = 238 Spredning under hypotese: 14 19 34/12 = 27.453. Normeret teststørrelse, korrigeret for kontinuitet: z = 224.5 238 0.5 27.453 = 0.4735 p-værdi: p = 2 P(Z 0.4735) = 0.64 Samme konklusion i de to test. StatBK (Uge 3, torsdag) To stikprøver 13 / 20 StatBK (Uge 3, torsdag) To stikprøver 14 / 20 SAS (redigeret) Resume: overblik over ikke-parametriske test proc npar1way wilcoxon data=fat; class group; var fatpct; run; Sum of Expected Std Dev Mean group N Scores Under H0 Under H0 Score 0 19 336.50 323.0 27.450696 17.710526 1 14 224.50 238.0 27.450696 16.035714 Statistic 224.5000 Normal Approximation Z -0.4736 One-Sided Pr < Z 0.3179 Two-Sided Pr > Z 0.6358 Parrede data: Sign test som vi har set det Wilcoxon signed rank test læs selv afsnit 9.2 Friedman test: også til sammenligning af mere end to grupper med afhængige data. Ikke pensum. Uparrede data: Wilcoxon rank sum test som vi har set det Kruskal-Wallis: generalisering af Wilcoxon rank sum test til mere end to grupper. Læs selv afsnit 9.5. Z includes a continuity correction of 0.5. StatBK (Uge 3, torsdag) To stikprøver 15 / 20 StatBK (Uge 3, torsdag) To stikprøver 16 / 20

Parametriske vs. ikke-parametriske metoder Parrede vs. uparrede data Hvornår og hvorfor skal vi bruge ikke-parametriske metoder? Når der kan sås tvivl om normalfordelingsantagelsen Robusthed: færre antagelser der kan være forkerte Hvornår og hvorfor skal vi bruge parametriske metoder? Når der ikke kan sås tvivl om normalfordelingsantagelsen Bruger mere information fra data: selve værdierne snarere end blot fortegn eller range Større styrke. Afvigelser fra hypotesen opdages lettere med parametriske metoder. Eksempel 1: symmetrien af gangen hos 10 heste måles, dels i almindelig tilstand, dels efter induceret halthed. Parret eller uparret? Kunne vi have lavet eksperimentet anderledes? Hvad er pointen ved at lave designet som beskrevet? Eksempel 2: Et giftstof tilsættes til kosten hos 20 rotter. De slagtes og størrelsen af leveren registreres. Tilsvarende for 20 rotter der ikke får gift. Parret eller uparret? Kunne vi have lavet eksperimentet anderledes? StatBK (Uge 3, torsdag) To stikprøver 17 / 20 StatBK (Uge 3, torsdag) To stikprøver 18 / 20 Analyser Eksempel Parrede stikprøver: (x 11,x 21 ),...,(x 21,x 2n ). Parametrisk: analyse af differenser Ikke-parametrisk: sign test eller Wilcoxon signed rank test Ikke-parrede eller uafhængige stikprøver: x 11,...,x 1n1 henholdsvis x 21,...,x 2n2. n 1 og n 2 kan være forskellige x 1i og x 2i ikke har noget med hinanden at gøre. Parametrisk: forskellige analyser afhængig af om vi antager σ 1 = σ 2 eller ej! Kan teste hypotesen σ 1 = σ 2. Ikke-parametrisk: Wilcoxon rank sum test Eksempel fra Introduktion til SAS (hentet fra artikel af Collinge et al). Analyse: To CJD-varianter. 6 hhv. 18 observationer for de to typer. Respons: procentdel lower-molecular-mass glycoforms i PrP Spørgsmål: er procentdelen den samme i de to grupper. Tyder boxplot på at der er en forskel? Er der grund til at betvivle normalfordelingsantagelsen? Er der grund til at tro at spredningerne er forskellige? Er der grund til at der er forskel på procentdelen af lower-molecular mass glycoform for de to CJD varianter? Estimat og konfidensinterval for forskel? Sammenlign med ikke-parametrisk analyse. StatBK (Uge 3, torsdag) To stikprøver 19 / 20 StatBK (Uge 3, torsdag) To stikprøver 20 / 20