Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og n 2 = 15 (15 universitetslærere). p. 1/24
Test H 0σ 2 : σ 2 1 = σ 2 2 Før vi sammenligner middelværdierne skal varianserne testes ens. Ifølge Table 3.8 (eller side 196-197) er σ 2 1 s2 (1) = 18.14949 σ2 1 χ2 (11)/11 σ 2 2 s2 (2) = 19.44953 σ2 2 χ2 (13)/13 (11 = f (1) = n 1 2 og 13 = f (2) = n 2 2) p. 2/24
Test H 0σ 2 : σ 2 1 = σ 2 2 - fortsat Benyt F = s2 (2) s 2 (1) = 1.07 F(13, 11) hvor både store og små værdier er kritiske. Accept. Med m 3 grupper testes varianserne ens ved Bartlett. Husk frihedsgraderne er nu f (h) = n h 2. p. 3/24
Modellen er nu M 1 : X hi N(α h + β h t hi,σ 2 ), h = 1,...,m i = 1,...,n h (m regressionslinjer med samme varians omkring linjerne.) Det fælles variansskøn fremkommer som et vægtet gennemsnit af de oprindelige variansskøn; σ 2 s 2 1 = f (1) f (1) + f (2) s 2 (1) + f (2) f (1) + f (2) s 2 (2) = 18.85 σ 2 χ 2 (f 1 )/f 1 hvor f 1 = f (1) + f (2) = 24 i det konkrete eksempel. Smgl. output fra proc glm for M 1. p. 4/24
Test under M 1 Kan nu teste enten M 2 : X hi N(α + β h t hi,σ 2 ), h = 1,...,m eller M 2 : X hi N(α h + βt hi,σ 2 ), h = 1,...,m Hvis hypotesen accepteres kan vi teste M 3 : X hi N(α + βt hi,σ 2 ), h = 1,...,m Se skema side 188. p. 5/24
Test under M 1 - fortsat Der er tale om test i LNM. Når vi tester, vil vi benytte til-og-fra -formlen. Skal derfor specificere modellerne i proc glm. (Se senere hvordan dette gøres). Vi vil fremover lade proc glm beregne så meget som muligt for os (estimater, std Error, Error-linje,...) p. 6/24
Bemærkninger til modellerne - her M 2 Under M 2 har vi fælles afskæring (intercept). Lidt spøjs model i den konkrete situation idet afskæringen er vanskelig at fortolke. Betyder at forskellen i blodtryk mellem de to professioner øges med alderen, jvf. Fig. 4.4 hvor de estimerede linjer under M 2 er indtegnet). p. 7/24
Bemærkninger til modellerne - her M 2 Under M 2 har vi fælles hældning (parallelle linjer). α 1 α 2 = (α 1 + βt) (α 2 + βt) angiver den forventede forskel i blodtrykket mellem jævnaldrende mænd hvor den ene er journalist og den anden unilærer. (Uanset alderen t). p. 8/24
Bemærkninger til modellerne - her M 3 Under M 3 har vi blot een regressionslinje; dvs. professionen har ingen betydning. p. 9/24
Test for M 2 under M 1 ( Fra -modellen er M 1. Til -modellen er M 2.) Dvs F = (SSD 02 SSD 1 )/(f 02 f 1 ) s 2 1 (462.661342 452.488513)/(25 24) = 18.853688 = 0.5396 F(1, 24) hvor store værdier er kritiske. Testss 0.4697. Accept. p. 10/24
Test for M 2 under M 1 - fortsat Bemærk at da m = 2 kan modellen M 2 også testes under M 1 ved et t-test. (Vi skal jo undersøge α 1 α 2 = 0.) Dvs t = α 1 α 2 Std Error t(24). Der gælder t 2 = F så samme test. Se estimater samt ki under M 2 i Table 4.10. p. 11/24
Herefter kan M 3 testes under M 2. ( Fra -modellen er M 2. Til -modellen er M 3.) Dvs F = (SSD 03 SSD 02 )/(f 03 f 02 ) s 2 02 (845.97 462)/(26 25) = 18.5 = stort tal F(1, 25) hvor store værdier er kritiske. Testss 0. Forkast. p. 12/24
Herefter kan M 3 testes under M 2 - fortsat Bemærk at da m = 2 kan M 3 også testes under M 2 ved et t-test, idet vi jo skal undersøge β 1 β 2 = 0. Dvs t = β 1 β 1 Std Error t(25). Der gælder t 2 = F så samme test. Std Error beregnes under M 2. p. 13/24
Alternativ Kunne også starte med at teste M 2 under M 1. ( Fra -modellen er M 1. Til -modellen er M 2.) Dvs F = (SSD 02 SSD 1)/(f02 f 1) s 2 1 (452.892448 452.488513)/(25 24) = 18.853688 = 0.02142 F(1, 24) hvor store værdier er kritiske. Accept. Bemærk at da m = 2 kan M 2 også testes under M 1 ved et t-test. Test for M 3 under M 2 giver forkastelse. p. 14/24
Konklusion I denne situation kan modellerne M 2 og M2 til at beskrive data. begge benyttes Derimod kan M 3 ikke bruges. (Dvs. der er forskel på de to professioner). Der kræves et større datamateriale for at kunne skelne mellem M 2 og M 2. p. 15/24
Specifikation i proc glm Lineære normal modeller kan specificeres i proc glm. Error-linjen er vigtig. Hvis der er k led på HS af model-linjen vil vi under Source kunne aflæse et F -test for hvert af de k led. (Se side 202-203 for forklaring). Generelt er det kun F -testet for leddet længst til højre der kan bruges til noget. Dette er testet fra modellen specificeret ved alle k led til modellen specificeret ved de første k 1 led. Under Parameter ser vi relevante parameterestimater med tilhørende Std Error ( nævneren i t-testet ) samt ki. p. 16/24
Modellen M 2 proc glm data=to_prof; class gruppe; model blodtryk = gruppe alder/ SS1 clparm solution; run; p. 17/24
Modellen M 2 - fortsat Da gruppe er en klassevariabel inddeles i to grupper således at hver gruppe får sit eget intercept (egen afskæring). alder giver fælles hældning. SAS fitter fælles intercept gruppe to er referencegruppe. alder står yderst så under source alder ses testet for reduktionen X hi N(α h + βt hi,σ 2 ) X hi N(α h,σ 2 ) (Tester til to normalfordelte observationsrækker). p. 18/24
Modellen M 1 proc glm data=to_prof; class gruppe; model blodtryk = gruppe gruppe*alder/ SS1 clparm solution; run; p. 19/24
Modellen M 1 - fortsat Da gruppe er en klassevariabel inddeles i to grupper således at hver gruppe får sit eget intercept (egen afskæring). gruppe*alder giver forskellige hældninger i de to grupper. SAS fitter fælles intercept gruppe to er referencegruppe. gruppe*alder står yderst så under source ses testet for reduktionen X hi N(α h + β h t hi,σ 2 ) X hi N(α h,σ 2 ) (Tester til to normalfordelte observationsrækker. Ikke relevant). p. 20/24
Bemærkning Vi har set hvordan man kan teste fra M 1 til M 2 v.hj.a. til-og-fra -formlen. Vi ønsker dog også at finde en model-linje hvorunder testet direkte kan aflæses under source. Husk på at under source testes fra modellen specificeret i model-linjen til modellen hvor yderste led fjernes. p. 21/24
Modellen M 1 igen proc glm data=to_prof; class gruppe; model blodtryk = gruppe alder gruppe*alder/ SS1 clparm solution; run; p. 22/24
Modellen M 1 igen - fortsat Da gruppe er en klassevariabel inddeles i to grupper således at hver gruppe får sit eget intercept (egen afskæring). gruppe*alder giver forskellige hældninger i de to grupper. Modellen der specificeres er M 1. På grund af alder vil SAS også forsøge at fitte en fælles hældning. (Gruppe 2 bliver reference-gruppe). gruppe*alder står yderst så under source ses testet for reduktionen X hi N(α h + β h t hi,σ 2 ) X hi N(α h + βt hi,σ 2 ) (Tester til fælles hældning som jo er M 2!) p. 23/24
Ved hjælp af proc glm finder vi: Model DF Sum of Squares Mean square M 1 24 452.488513 18.853688 M 2 25 462.661342 18.506454 M2 25 452.892448 18.115698 M 3 26 845.972201 32.537392 p. 24/24