Varasaalyse på ormalfordelte observatoer af Jes Frs
Esdg varasaalyse Model eelt ormalfordelt observatosræe Lad X, X, X er dbyrdes uafhægge N(μ, σ ) - fordelt stoastse varable Det tlhørede observatossæt aldes,, Estmater ˆ ˆ ( ) s Kvadratsumsopspaltg f - ( ) ( ) ( )
Hypotese H 0 : μ = μ 0 med H : μ μ 0 øses testet Teststørrelse blver t 0 s Det ses, at (X X) er e stoasts varabel, og derfor er t e ormalfordelt Ma a vse, at (X er σ χ X) - fordelt med f=- frhedsgrader Testore t følger e såaldt t-fordelg med f=- frhedsgrader t-fordelge overgere mod N(0, ) fordelge for gåede mod uedelg t-fordelges tæthedsfuto er også symmetrs om 0 Hypotese accepteres hvs T - f (α/) t T - f (-α/), hvor T f er fordelgdfutoe svarede tl t-fordelge med f frhedsgrader
Esempel: Ved produto af pller har ma målt cotamd-dholdet 0 pller Idholdet sal være 5mg Ved stprøve på 0 pller f ma følgede resultater:,67 3,9 3,40 3,56 3,76 3,83 3,95 4, 4,50 4,64 4,87 5,05 5,35 5,73 5,79 5,80 6, 6,97 5,36 7, Model : X N(μ, σ ) for = tl 0 er uafhægge stoastse varable H 0 : μ = 5, H : μ 5 Parametree estmeres = 4,797 ; s =,587 Teststørrelse blver 4,797 5 t,587 0 0,737 Da,5% s fratle er -,093 for 9 frhedsgrader, accepters hypotese
Avedelse af SPSS tl aalyse: Først udersøges om observatossættet a ases for ormalfordelt Ma får et såaldt Q-Q plots Det accepteres at observatossættet er ormalfordelt
Herefter testes hypotese : l Aalyze Compare Meas Oe-Sample T test Vælg Test Value tl 5 Hypotese accepteres
Smpel leær regresso Atag at Y for = tl er uafhægge N(μ, σ ) -fordelte således at ( ) Ma a vse at estmatere for parametree er ) ( ) )( ( ˆ ; ˆ y y y )) ˆ( ( ˆ y y s Ma a også vse, at estmatore for β er - fordelt ) ) (, N( Ma a derfor teste hypotese H 0 : β = β 0 med teststørrelse s t 0 ) ( ˆ som er t-fordelt med - frhedsgrader uder H 0 Hvs β 0 = 0 tester ma uafhægghed af og y værdere Bemær at særg med y-ase er y ˆ
Kvadratsumsopspaltg : f Omrg lje ( y - y ˆ( )) lje ( ) total ( y y) - ˆ Som test for H 0 : β = 0 a også avedes / /( ) som er F(,-) fordelt
Esempel : Ma for 8 pateter målt reatdholdet blodet før og efter dødes dtræde Er der e sammehæg? Dataee a ses e ecelfl Der er e pæ leær sammehæg og parametree estmeres ˆ y,04 ; ˆ,0 ; ˆ s 0,000 ; 8 ( ),485 Ma vl gere teste hypotese H 0 : β = t,0,000 0,000,485 0,3 som er t-fordelt med 6 frhedsgrader Da 97,5% s fratle er,056 accepteres hypotese Dataee er aalyseret vha SPSS : reatsav
Aalyse vha SPSS Først udersøges det om der er e leær sammehæg: Dette accepteres
Parametree estmeres: Kl Aalyze Regrsso Lear s Særg med y-ase og ˆ Spredge på ˆ Testet for H0 : β = blver 0 t 03 009, som det blev vst tdlgere
Yderlgere modelotrol : Ma bør udersøge resduere, dvs afvgelsere fra modelle Kl Aalyze Regresso Lear Save og fluebe som vst Opteg de forvetede mod de observerede y-værder mod hade og ogle passede plots af resduere
Model flere ormalfordelte observatosræer Lad X j, =,, j=, være dbyrdes uafhægge N(μ, σ ) - fordelt stoastse varable Det tlhørede observatossæt aldes j, =,, j=,, og lad Estmater ˆ j j ˆ s 0 ( j ) j Modelotrol Det forudsættes at for hver er observatosræe ormalfordelt, og at der er tale om varashomogetet for de observatosræer dvs for ( j ) j ˆ s, =, Ma a beytte et Barletts test eller et Levee test ( er tlgægelgt SPSS)
Følgede hypotese øses testet: H 0 : μ = μ, =, (samme mddelværd de observatosræer) Kvadratsumsopspaltg : Ide for grupper Mellem grupper 0 ( j ) - - ( ) Total - ) j j ( j f /( ) Teststørrelse for H 0 er, som er F(-,-) fordelt 0 /( ) Store værder er rtse Hvs H 0 accepteres er estmatere følgede: ˆ j j ˆ s j ( j )
Esempel To ttrergsmetoder avedes Det øses udersøgt om de gver samme resultat: T T 76,35 76,3 Det sal først udersøges om de to observatosræer a 76,33 76,30 ases for ormalfordelte, og beræftede fald om der er 76,45 76,33 varashomogetet Dataee orgaseres som lste SPSS: 76,40 76,33 r Tr 76,68 76,8 76,35 Atag at dataee er ormalfordelte 76,33 76,45 76,33 Kl Aalyze Compare Meas 76,40 76,38 76,45 Oe-way Aova : 76,8 76,43 76,40 76,58 76,45 osv 76,65 76,60 76,40 76,40 77,03 76,80 76,90 76,95 74,83 74,88 75,8 75,5
Ma får Da teststørrelse er 0,04 og de er F(, 8) fordelt accepters hypotese om varashomogetet s 0 s 0 Test-størrelse H 0 accepters ( ge forsel på de to ttrergsmetoder)
Tosdg varasaalyse X N( j, ) Model : ~ =, r ; j=, s ; =, t ; =rst j I første omgag sal ma udersøge om der er varashomogetet de rs observatosræer Dee hypotese aldes H 0 (arbejdshypotese) Derefter er der flere hypoteser, som ma a opstlle H : Dvs e ræeeffet plus e søjleeffet j j H : 0 Dvs ge ræeeffet H * : j 0 Dvs ge søjleeffet H 3 : j Dvs samme fordelg de rs observatosræer (fuldstædg homogetet) Der er valgt e ormerg således at 0 og r j 0 s j
Ma a vse, at estmatere for mddelværdparametree uder H er : ˆ rst ˆ st r s j s t t j j j ˆ j j rt r t j Uder H 0 er estmatet for σ : 0 /f 0 ( se æste sde) Uder H er estmatet for σ : ( 0 + )/(f 0 +f )
Kvadratsumsopspaltg: Ide for grupper 0 f f 0 =rs(t-) r s Veselvrg f =(r-)(t-) j r Ræevrg f =r- s Søjlevrg * f *=t- Total r s t f=rst- r s j j t( ) j t st( ) rt( ) j ( j j) j ( j ) j
Test: H : adtvtet F som er F f, f ) 0 / f / f 0 ( fordelt H : ge ræevrg F ( 0 / f ) /( f 0 f ) som er F( f, f0 f) fordelt H 3 : fuldstædg homogetet (heller ge søjlevrg ) F ( 0 */ f * ) /( f 0 f f ) som er F( f*, f0 f f) fordelt Ma a også vælge at teste for ge søjlevrg først Der sal så byttes rudt på og * og deres frhedsgrader de to test Hver gag ma har accepteret e hypotese, er ædres estmatet for varase Hvs f H accepteres er Estmatet for varase ( 0 + + )/(f 0 +f +f )
Es Ma har testet et byggematerale for vadgeemtrægg, målt seuder Ma har derpå taget logartme tl tde Byggemateralet blev produceret på 3 forsellge maser 9 forsellge dage med 3 målger pr dag: Først sal ma lave e modelotrol Da der u er dag mase mase mase3,404,306,93,346,68,674,68,40,399,447,4,46,569,85,768,80,56,859 3,94,506,38,477,575,690,894,649,36 4,887,673,7,485,37,58,39,4,37 5,77,7,30,78,397,489,545,53,336 6,665,404,633,539,45,6,680,67,359 7,98,9,38,93,508,80,9,436,385 8,845,583,689,790,67,48,04,8,795 9,540,636,703,48,067,370,704,384,839 tre observatoer pr dag, er det e mulgt at lave e foruftg otrol af, om der er tale om ormalfordelte observatoer pr mase dag Dermod a ma estmer varase pr mase dag, og teste om der er varashomogetet Dette gøres med ete et Bartletts test eller Levee I SPSS er det mulgt, at foretage et Levee test For at beytte SPSS sal dataee orgaseres som e lag lste : dag mase målg,404,346,68,306,68,40 3,93 3,674 3,399,447 osv
Dette a gøres samtdgt med de tosdge varasaalyse SPSS: Kl Aalyze Geerel Lear Model Uvarate og udfyld som vst Teststørrelse er F(6,54) fordelt Testet er dobbeltsdgt og e sgfat her Grafs modelotrol for addtvtet : Der afsættes putere (, j), r og ( j, j), j s som sal lgge omrg e ret lje med hældgsoeffcete
Herefter selve varasaalyse: Her er r=9, s=3(atal maser) og t=3 Er test for H, me s /s o Test for H accept 0
Tosdg varasaalyse med forsellgt atal observatoer pr celle X N( j, ) Model : ~ =, r ; j=, s ; =, j ; = j Alt er stort set som før Ma får følgede vadratsumopspaltg Ide for grupper 0 f 0 =-rs r s Veselvrg f =(r-)(t-) j r Ræevrg f =r- s Søjlevrg * f *=t- Total r s t f=- r s ( ) j j ( ) j j j j j ( ( ) j j j ( j ) j ) f r s j j
Leær regresso med flere observatoer pr Atag at Y j for = tl, j= tl er uafhægge N(μ j, σ ) -fordelte således at j j,,,, ) ( Ma a vse at estmatere for parametree er ) ( ) ( ˆ ; ˆ j j y y Ma a også vse, at estmatore for β er - fordelt ) ) (, N( Ma a derfor teste hypotese H : β = β 0 med teststørrelse s t 0 0 ) ( ˆ som er t-fordelt med f 0+ frhedsgrader uder H 0 Hvs β 0 = 0 tester ma uafhægghed af og y værdere Vedr s 0 se følgede Bemær ge at særg med y-ase er y ˆ Bemær at
Kvadratsumsopspaltg : Ide for grupper Omrg lje Regressoslje 0 ( j y ) f f 0 =- f =- f = Total f=- y j ( y y ˆ( )) ˆ j ( ( y j ) y) Testet for H : leær regresso er som er F(-,-) fordelt Bemær, at hvs H accepteres er estmatet for varase s 0 =( 0 + )/(f 0 +f ) Testet for H : β = 0 fuldstædg homogetet er ( 0 ) /( ) som er F(, -) fordelt Modelotrol: Det sal udersøges, at for hvert a observarosræe y j, j=, ases for ormalfordelt 0 /( /( ) ) /
Esempel: Nedeståede tabel vser logartme tl træstyre (g/cm ) og de recproe hærdgstd ( dage) for ogle cemetstyer: dage målg r Træstyre log recpro dag 3,00,4,000 3,30,4,000 3,80,07,000,90,340 0,500 4,50,389 0,500 3 4,70,393 0,500 3 9,80,474 0,333 3 8,00,447 0,333 3 3 4,0,38 0,333 3 4 4,0,384 0,333 3 5 6,0,48 0,333 7 3,40,5 0,43 7 30,40,483 0,43 7 3 34,50,538 0,43 7 4 33,0,50 0,43 7 5 35,70,553 0,43 8 4,80,6 0,036 8 4,60,69 0,036 8 3 40,30,605 0,036 8 4 35,70,553 0,036 Først e grafs udersøgelse: 8 5 37,30,57 0,036
Som det ses er der tale om e pæ leær Sammehæg Lad y j betege log(træstyre) og de recproe hærdgstd =, = 5 0 Kl Aalyze Compare Meas Oe-Way Aova
Accept af varashomogetet 0 Herefter sal der foretages e leær regresso Tast Aalyze Regresso Lear og ma får
0 + ˆ Særg med y-ase /f /f (0,00466 0,06808) / 3 0,06808/6 Test for leartet F, 6 0 0 som accepteres
Vderegåede regressosaalyse : Model: Atag at Y for = tl er uafhægge N(μ, σ ) -fordelte således at p j j j,hvor j ere er edte værder og β j ere uedte parametre Dette a formuleres med matrcer: Xβ p p p p Og lad være et uderrum Estmatere blver R p R L β Xβ : X' y X' X β ) ( ˆ dm ˆ ˆ L s Xβ y og lad y y y y betege observatoere Ofte sættes første søjle X tl -taller således, at β er det geerelle veau
Esempel : Idaere Peru Ædrger meesers lvsbetgelser a gve sg udslag fysologse ædrger, esempelvs ædret blodtry E gruppe atropologer udersøgte hvorda blodtryet ædrer sg hos peruvase daere der flyttes fra deres oprdelge prmtve samfud de høje Adesbjerge tl de såaldte cvlsato, dvs storbye, der øvrgt lgger lagt mdre højde over havets overflade ed deres oprdelg bopæl (Dav (975), her cteret e er Rya et al (976)) Atropologere udvalgte e stprøve på 39 mæd over år der havde udergået e såda flytg På hver af dsse måltes blodtryet (det systolse og det dastolse) samt e ræe baggrudsvarable, herbladt alder, atal år sde flytge, højde, vægt og puls Desude har ma udreget edu e baggrudsvarabel, emlg»brødel af lvet levet de ye omgvelser«, dvs atal år sde flytg dvderet med uværede alder Ma forestllede sg at dee baggrudsvarabel ue have stor»forlargseve«
Her vl v e se på hele talmateralet, me u på blodtryet (det systolse) der sal optræde som y-varabel, og på de to -varable brødel af lvet de ye omgvelser og vægt Dsse er agvet tabel 8 (fra Rya et al (976)) Atropologere mete at, brødel levet de ye omgvelser, var et godt mål for hvor læge persoere havde levet de cvlserede omgvelser, og at det derfor måtte være teressat at se om ue forlare varatoe blodtryet y Første srdt ue derfor være at estmere e smpel leær regressosmodel med som forlarede varabel Gør det! Hvs ma et oordatsystem afsætter y mod, vser det sg mdlertd at det fats e vrer særlg rmelgt at hævde at (mddelværde af) y afhæger leært af Derfor må ma gve sg tl at overveje om adre af de målte baggrudsvarable med fordel a ddrages Nu ved ma at e persos vægt har betydg for de pågældedes blodtry, så æste modelforslag ue være e multpel regressosmodel med både og 3 som forlarede varable I SPSS dtastes dataee således: (hvs ma e havde -tallee vl SPSS gve det samme) y 3 70 0,048 7,0 0 0,73 56,5 5 0,08 56,0 48 0,04 6,0 40 0,040 65,0 Osv Tast Aalyze Regresso Lear
Esempel : Idaere Peru ( se opgavear) s 'eree test for lg 0 Alle test for β = 0 er sgfate
Modelotrol : Der laves først smple grafer over sammehæg mellem y ere og ere og derpå 3 ere Der er e overbevsede leær sammehæg Parametree de multple regresso estmeres og de forvetede værder og resdueree bereges :l yderlgere på Save og sæt fluebe somvst Sammehæget mellem forvetet og observeret er e overbevsede me acceptabelt Resdueree udersøges: Det accepteres, at resduere a ases for ormalfordelte, me det er e flot