Fejlstrata. Vi forestiller os at V har. 1) Et underrum L. 2) Et indre produkt, 3) En ortogonal dekomposition V = W W m

Relaterede dokumenter
Den lineære normale model

Den lineære normale model

Fejlstratummodeller. Kapitel 3

Fejlstratummodeller. Kapitel 3

Additive hypoteser i flerfaktorforsøg

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Faktorforsøg. Antag at X i, i I, er uafhængige reelle variable og at. for alle i I. En faktor er en afbildning. hvor F er en mængde af labels.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

Module 12: Mere om variansanalyse

Estimation. Lad (ν θ ) θ Θ være en statistisk model på (X, E). En estimator af θ er en afbildning t : X Θ. En konkret værdi t(x) kaldes et estimat.

Den generelle lineære model

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Reeksamen 2014/2015 Mål- og integralteori

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

standard normalfordelingen på R 2.

Eksamen i Statistik for biokemikere. Blok

Module 4: Ensidig variansanalyse

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Statistik og Sandsynlighedsregning 2

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Module 12: Mere om variansanalyse

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

EKSAMEN Flerdimensional Analyse Sommer sider

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Module 1: Lineære modeller og lineær algebra

S T A T I S T I S K T E O R I 1 : V A R I A N S A N A L Y S E J Ø R G E N G R A N F E L D T

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Del II. Den lineære normale model

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

To-sidet varians analyse

Normalfordelingen og Stikprøvefordelinger

Konfidensintervaller og Hypotesetest

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Betingning med en uafhængig variabel

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

(studienummer) (underskrift) (bord nr)

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Statistisk hypotese. Lad P være en statistisk model på (X, E). (P er altså en familie af sandsynlighedsmål på (X, E).)

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Løsninger til kapitel 9

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Forsøgsplanlægning Stikprøvestørrelse

Kapitel 12 Variansanalyse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Nanostatistik: Opgavebesvarelser

Kapitel 12 Variansanalyse

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Eksamen 2014/2015 Mål- og integralteori

Module 9: Residualanalyse

Vi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Kvantitative metoder 2

Statistik II 4. Lektion. Logistisk regression

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Sandsynlighedsregning Oversigt over begreber og fordelinger

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Lidt om fordelinger, afledt af normalfordelingen

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Besvarelser til øvelsesopgaver i uge 6

Økonometri: Lektion 6 Emne: Heteroskedasticitet

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Skriftlig eksamen Vejledende besvarelse MATEMATIK B (MM02)

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

1 Hb SS Hb Sβ Hb SC = , (s = )

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Kombinant. En kombinant er en afbildning. hvor (Y, K) er endnu et målbart rum. Typisk taler vi om reelle kombinanter, hvor Y = R.

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Transkript:

Fejlstrata Vi forestiller os at V har 1) Et underrum L 2) Et indre produkt, 3) En ortogonal dekomposition V = W 1 +... + W m Underrummene W i kaldes fejlstrata. Typisk eksempel på en fejlstratumdekomposition: W 1 = L F, W 2 = L F. p.1/13

Fejlstratummodel X er regulært normalfordelt på V med centrum ξ L og en præcision, der er givet som x, y ω 2 = m i=1 r i (x), r i (y) ω 2 i for x, y V. hvor r i være projektionen ned i W i med hensyn til,. Parametre: 1) ξ L 2) ω 2 = (ω 2 1,...,ω 2 m) (0, ) m. p.2/13

Varians i fejlstratummodel Lad V = R I, og lad, være det sædvanlige indre produkt. Sætning Hvis X er regulært normalfordelt med præcision, ω 2 så er V X = m ωl 2 R l l=1 hvor R 1,...,R m er projektionsmatricerne hørende til strataene W 1,...,W m. Alternativt: V X = ω 2 m I + (ωl 2 ωm) 2 R l m 1 l=1. p.3/13

Eksempel Se på dekompositionen R I = L F + L F. Da er V X = ω 2 2 I + (ω 2 l ω 2 2) P F Cov(X i, X i ) = ω 2 2 + ω2 1 ω 2 2 n F (j) ω 2 1 ω 2 2 n F (j) hvis i = i, f(i) = j hvis i i, f(i) = f(i ) = j 0 hvis f(i) f(i ). p.4/13

Eksempel fortsat V X = Σ 1 0... 0 0 Σ 2... 0........ 0 0... Σ F hvor Σ j = ω 2 2 1 + λ j λ j... λ j λ j 1 + λ j... λ j...... hvor λ j = ω2 1 ω 2 2 n F (j) ω 2 2 λ j λ j... 1 + λ j Vrøvl hvis n F (j) varierer. Tilfældigt F -intercept hvis n F (j) konstant.. p.5/13

Varianskomponenter og fejlstrata Sætning 3.10 Lad X være regulært normalfordelt på R I med E X L og V X = σ 2 I + m 1 l=1 ν l 2 B l B T l hvor de tilfældige effekter er intercepts svarende til faktorer G 1,...,G m 1. Antag at G erne udgør et ortogonalt, -stabilt design og at de alle er balancerede. Så kan varianskomponentmodellen INDLEJRES i fejlstratummodel med m strata. Strataene er den ortogonale dekomposition for designet, tilføjet I.. p.6/13

ML-estimation i fejlstratummodel Sætning 3.12 Antag at middelværdiunderrummet L står geometrisk ortogonalt på hvert stratum W 1,...,W m, og at L ikke indeholder noget stratum. Så gælder der med sandsynlighed 1 at ML-estimatoren er ˆξ = p(x), ω2 i = r i(x) r i p(x) 2 dimw i. hvor p er projektionen ned i L, og hvor r i er projektionen ned i W i.. p.7/13

Fordeling af ML-estimater ˆξ, ω 2 1,..., ω 2 m er uafhængige. ˆξ er regulært normalfordelt på L med centrum ξ ω 2 i er χ2 -fordelt med df = dimw i diml i og skalaparameter ω 2 i / dimw i, hvor L i = L W i Centralt estimat: ω 2 i = r i(x) r i p(x) 2 dimw i diml i. p.8/13

REML-estimation i fejlstratummodel Sætning 3.13 Antag at middelværdiunderrummet L står geometrisk ortogonalt på hvert stratum W 1,...,W m, og at L ikke indeholder noget stratum. Så gælder der med sandsynlighed 1 at REML-estimatoren er ˆξ = p(x), ω2 i = r i(x) r i p(x) 2 dimw i diml i. hvor p er projektionen ned i L, og hvor r i er projektionen ned i W i.. p.9/13

REML-estimation i varianskomponentmodeller Konklusion For en varianskomponentmodel, der kan indlejres i en fejlstratummodel, fører REML-princippet til centrale estimater for variansparametrene. Så er REML-princippet sikkert også sundt for de mange varianskomponentmodeller, der ikke kan indlejres i en fejlstratummodel.. p.10/13

Test i fejlstratummodeller Lad L L. Vi ønsker at teste om ξ L. Antag at L står geometrisk ortogonalt på alle strata, og sæt L i = L W i, L i = L W i Antag at L i = L i for alle i i 0 Resultat p. 79 Kvotienttestet kan gennemføres som et F -test i i 0 -stratummet, F = p r i 0 (X) p r i0 (X) 2 /(diml i0 diml i 0 ) r i0 (X) p r i0 (X) 2 /(dimw i0 diml i0 ) der under hypotesen er F -fordelt med (diml i0 diml i 0, dimw i0 diml i0 ) frihedsgrader.. p.11/13

Tosidet variansanalyse med tilfældig blok Fast effekt design: T 1 Tilfældigt effekt design: I B Fælles design: I B T 1 Lad V I, B B, V T, V 1 være den ortogonale dekomposition.. p.12/13

Tosidet variansanalyse med tilfældig blok Strata: Med L = L T er W B = L B = V B + V 1 og W I = L B = V T + V I, L (B) = L W B = (V 1 + V T ) (V 1 + V B ) = V 1 Med L = L 1 er L (I) = L W I = (V 1 + V T ) (V T + V I ) = V T L (B) = L W B = V 1 (V 1 + V B ) = V 1 L (I) = L W I = V 1 (V T + V I ) = (0) Testet kommer til at foregå i I-strataet.. p.13/13