Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Relaterede dokumenter

k normalfordelte observationsrækker (ensidet variansanalyse)

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Reeksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Tema. Dagens tema: Indfør centrale statistiske begreber.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

En Introduktion til SAS. Kapitel 5.

ELISA. ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig.

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Besvarelse af vitcap -opgaven

Konfidensintervaller og Hypotesetest

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Statistiske Modeller 1: Kontingenstabeller i SAS

Eksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for Biokemikere 6. april 2009

Opgavebesvarelse, brain weight

Regressionsanalyse i SAS

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

To samhørende variable

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

Lineær regression i SAS. Lineær regression i SAS p.1/20

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Skriftlig eksamen Science statistik- ST501

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

(studienummer) (underskrift) (bord nr)

To-sidet varians analyse

Module 12: Mere om variansanalyse

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Modelkontrol i Faktor Modeller

Klasseøvelser dag 2 Opgave 1

Vejledende besvarelse af hjemmeopgave, efterår 2018

(studienummer) (underskrift) (bord nr)

Reeksamen i Statistik for biokemikere. Blok

Forelæsning 11: Kapitel 11: Regressionsanalyse

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Besvarelse af juul2 -opgaven

En Introduktion til SAS. Kapitel 6.

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

1 Hb SS Hb Sβ Hb SC = , (s = )

Opgavebesvarelse, brain weight

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Løsning til eksamen d.27 Maj 2010

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Modul 11: Simpel lineær regression

Matematisk Modellering 1 Cheat Sheet

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Besvarelse af opgave om Vital Capacity

Stastistik og Databehandling på en TI-83

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Løsning til øvelsesopgaver dag 4 spg 5-9

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

ELISA. ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig.

Eksamen i Statistik for Biokemikere, Blok januar 2009

Løsning til eksaminen d. 29. maj 2009

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Modul 5: Test for én stikprøve

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Vejledende besvarelse af hjemmeopgave, forår 2015

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

MPH specialmodul Epidemiologi og Biostatistik

Eksempel , opg. 2

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 4

Module 12: Mere om variansanalyse

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Vejledende besvarelser til opgaver i kapitel 14

Uge 13 referat hold 4

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Løsning eksamen d. 15. december 2008

Transkript:

Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og n 2 = 15 (15 universitetslærere). p. 1/24

Test H 0σ 2 : σ 2 1 = σ 2 2 Før vi sammenligner middelværdierne skal varianserne testes ens. Ifølge Table 3.8 (eller side 196-197) er σ 2 1 s2 (1) = 18.14949 σ2 1 χ2 (11)/11 σ 2 2 s2 (2) = 19.44953 σ2 2 χ2 (13)/13 (11 = f (1) = n 1 2 og 13 = f (2) = n 2 2) p. 2/24

Test H 0σ 2 : σ 2 1 = σ 2 2 - fortsat Benyt F = s2 (2) s 2 (1) = 1.07 F(13, 11) hvor både store og små værdier er kritiske. Accept. Med m 3 grupper testes varianserne ens ved Bartlett. Husk frihedsgraderne er nu f (h) = n h 2. p. 3/24

Modellen er nu M 1 : X hi N(α h + β h t hi,σ 2 ), h = 1,...,m i = 1,...,n h (m regressionslinjer med samme varians omkring linjerne.) Det fælles variansskøn fremkommer som et vægtet gennemsnit af de oprindelige variansskøn; σ 2 s 2 1 = f (1) f (1) + f (2) s 2 (1) + f (2) f (1) + f (2) s 2 (2) = 18.85 σ 2 χ 2 (f 1 )/f 1 hvor f 1 = f (1) + f (2) = 24 i det konkrete eksempel. Smgl. output fra proc glm for M 1. p. 4/24

Test under M 1 Kan nu teste enten M 2 : X hi N(α + β h t hi,σ 2 ), h = 1,...,m eller M 2 : X hi N(α h + βt hi,σ 2 ), h = 1,...,m Hvis hypotesen accepteres kan vi teste M 3 : X hi N(α + βt hi,σ 2 ), h = 1,...,m Se skema side 188. p. 5/24

Test under M 1 - fortsat Der er tale om test i LNM. Når vi tester, vil vi benytte til-og-fra -formlen. Skal derfor specificere modellerne i proc glm. (Se senere hvordan dette gøres). Vi vil fremover lade proc glm beregne så meget som muligt for os (estimater, std Error, Error-linje,...) p. 6/24

Bemærkninger til modellerne - her M 2 Under M 2 har vi fælles afskæring (intercept). Lidt spøjs model i den konkrete situation idet afskæringen er vanskelig at fortolke. Betyder at forskellen i blodtryk mellem de to professioner øges med alderen, jvf. Fig. 4.4 hvor de estimerede linjer under M 2 er indtegnet). p. 7/24

Bemærkninger til modellerne - her M 2 Under M 2 har vi fælles hældning (parallelle linjer). α 1 α 2 = (α 1 + βt) (α 2 + βt) angiver den forventede forskel i blodtrykket mellem jævnaldrende mænd hvor den ene er journalist og den anden unilærer. (Uanset alderen t). p. 8/24

Bemærkninger til modellerne - her M 3 Under M 3 har vi blot een regressionslinje; dvs. professionen har ingen betydning. p. 9/24

Test for M 2 under M 1 ( Fra -modellen er M 1. Til -modellen er M 2.) Dvs F = (SSD 02 SSD 1 )/(f 02 f 1 ) s 2 1 (462.661342 452.488513)/(25 24) = 18.853688 = 0.5396 F(1, 24) hvor store værdier er kritiske. Testss 0.4697. Accept. p. 10/24

Test for M 2 under M 1 - fortsat Bemærk at da m = 2 kan modellen M 2 også testes under M 1 ved et t-test. (Vi skal jo undersøge α 1 α 2 = 0.) Dvs t = α 1 α 2 Std Error t(24). Der gælder t 2 = F så samme test. Se estimater samt ki under M 2 i Table 4.10. p. 11/24

Herefter kan M 3 testes under M 2. ( Fra -modellen er M 2. Til -modellen er M 3.) Dvs F = (SSD 03 SSD 02 )/(f 03 f 02 ) s 2 02 (845.97 462)/(26 25) = 18.5 = stort tal F(1, 25) hvor store værdier er kritiske. Testss 0. Forkast. p. 12/24

Herefter kan M 3 testes under M 2 - fortsat Bemærk at da m = 2 kan M 3 også testes under M 2 ved et t-test, idet vi jo skal undersøge β 1 β 2 = 0. Dvs t = β 1 β 1 Std Error t(25). Der gælder t 2 = F så samme test. Std Error beregnes under M 2. p. 13/24

Alternativ Kunne også starte med at teste M 2 under M 1. ( Fra -modellen er M 1. Til -modellen er M 2.) Dvs F = (SSD 02 SSD 1)/(f02 f 1) s 2 1 (452.892448 452.488513)/(25 24) = 18.853688 = 0.02142 F(1, 24) hvor store værdier er kritiske. Accept. Bemærk at da m = 2 kan M 2 også testes under M 1 ved et t-test. Test for M 3 under M 2 giver forkastelse. p. 14/24

Konklusion I denne situation kan modellerne M 2 og M2 til at beskrive data. begge benyttes Derimod kan M 3 ikke bruges. (Dvs. der er forskel på de to professioner). Der kræves et større datamateriale for at kunne skelne mellem M 2 og M 2. p. 15/24

Specifikation i proc glm Lineære normal modeller kan specificeres i proc glm. Error-linjen er vigtig. Hvis der er k led på HS af model-linjen vil vi under Source kunne aflæse et F -test for hvert af de k led. (Se side 202-203 for forklaring). Generelt er det kun F -testet for leddet længst til højre der kan bruges til noget. Dette er testet fra modellen specificeret ved alle k led til modellen specificeret ved de første k 1 led. Under Parameter ser vi relevante parameterestimater med tilhørende Std Error ( nævneren i t-testet ) samt ki. p. 16/24

Modellen M 2 proc glm data=to_prof; class gruppe; model blodtryk = gruppe alder/ SS1 clparm solution; run; p. 17/24

Modellen M 2 - fortsat Da gruppe er en klassevariabel inddeles i to grupper således at hver gruppe får sit eget intercept (egen afskæring). alder giver fælles hældning. SAS fitter fælles intercept gruppe to er referencegruppe. alder står yderst så under source alder ses testet for reduktionen X hi N(α h + βt hi,σ 2 ) X hi N(α h,σ 2 ) (Tester til to normalfordelte observationsrækker). p. 18/24

Modellen M 1 proc glm data=to_prof; class gruppe; model blodtryk = gruppe gruppe*alder/ SS1 clparm solution; run; p. 19/24

Modellen M 1 - fortsat Da gruppe er en klassevariabel inddeles i to grupper således at hver gruppe får sit eget intercept (egen afskæring). gruppe*alder giver forskellige hældninger i de to grupper. SAS fitter fælles intercept gruppe to er referencegruppe. gruppe*alder står yderst så under source ses testet for reduktionen X hi N(α h + β h t hi,σ 2 ) X hi N(α h,σ 2 ) (Tester til to normalfordelte observationsrækker. Ikke relevant). p. 20/24

Bemærkning Vi har set hvordan man kan teste fra M 1 til M 2 v.hj.a. til-og-fra -formlen. Vi ønsker dog også at finde en model-linje hvorunder testet direkte kan aflæses under source. Husk på at under source testes fra modellen specificeret i model-linjen til modellen hvor yderste led fjernes. p. 21/24

Modellen M 1 igen proc glm data=to_prof; class gruppe; model blodtryk = gruppe alder gruppe*alder/ SS1 clparm solution; run; p. 22/24

Modellen M 1 igen - fortsat Da gruppe er en klassevariabel inddeles i to grupper således at hver gruppe får sit eget intercept (egen afskæring). gruppe*alder giver forskellige hældninger i de to grupper. Modellen der specificeres er M 1. På grund af alder vil SAS også forsøge at fitte en fælles hældning. (Gruppe 2 bliver reference-gruppe). gruppe*alder står yderst så under source ses testet for reduktionen X hi N(α h + β h t hi,σ 2 ) X hi N(α h + βt hi,σ 2 ) (Tester til fælles hældning som jo er M 2!) p. 23/24

Ved hjælp af proc glm finder vi: Model DF Sum of Squares Mean square M 1 24 452.488513 18.853688 M 2 25 462.661342 18.506454 M2 25 452.892448 18.115698 M 3 26 845.972201 32.537392 p. 24/24