Antal Antal B(770, ) Pl(770, 0.460, 319.1) afvi- stikprøgende

Størrelse: px
Starte visningen fra side:

Download "Antal Antal B(770, ) Pl(770, 0.460, 319.1) afvi- stikprøgende"

Transkript

1 Antal Antal B(770, 0.004) Pl(770, 0.460, 39.) afvi- stikprøgende ver. Forv. (obs forv) (obs forv) Forv. forv forv z i Ialt Man finder ialt z + = 229 i= z i = 254 afvigende låg i de 229 prøver, dvs z + = 254/229 =. afvigende/pr prøve, hvorfor man har h + =./770 = afvigende/pr låg. Man ville umiddelbart modellere fordelingen af antallet af afvigende låg ved en binomialfordeling med n = 770 og den estimerede defektandel p = Man beregner goodness of fit teststørrelsen svarende til en generaliseret lineær model for binomialfordelte målinger (kun interceptled), { G 2 (H I ) = 2 z i ln(h i /h + )+ } (n i z i )ln[( h i )/( h + )] (7.8) i i { [ = 2 n i hi ln(h i /h + )+( h i )ln[( h i )/( h + )] ]}, hvor i h i = z i n i = x i+ og h + = zi ni = x ++ angiver de observerede relative hyppigheder i henholdsvis den i te gruppe og i totalmaterialet. Kvotientteststørrelsen svarer til de vægtede deviansbidrag (med vægtene n i ) d(h i ; h + )=2n i [ hi ln(h i /h + )+( h i )ln[( h i )/( h + )] ] 277

2 Man finder G 2 (H I ) = 273.4, der skal sammenlignes med fraktilerne i i en χ 2 (228)-fordeling. p-værdien er lidt mindre end 5%, så der er indikation af overdispersion i forhold til binomialfordelingen Formulering af hierarkisk model Vi vil modellere variationen af fejlandelen i partiet fra parti til parti ved en Beta-fordeling. X Bet(α, β) hvis tæthedsfunktionen for X er med 0 <αog 0 <β. Der gælder: f X (x) = Γ(α)Γ(β) Γ(α + β) xα ( x) β for 0 x Såfremt Z µ B(n, µ) ogµ Be(α, β), da er den marginale fordeling af Z en Pl(n, α, α + β)-fordeling. (en såkaldt Polya-fordeling). En diskret fordelt stokastisk variabel X, der kan antage værdierne 0,, 2,...,n, siges at følge en Polyafordeling, hvis X har frekvensfunktionen g(x) = ( n x ) Γ(α + x) Γ(α) Γ(β α + n x) Γ(β α) Γ(β) Γ(β + n) hvor α>0ogβ>0 er reelle tal og hvor n er et positivt heltal. for x =0,,2,...,n (7.9) Kort skriver vi X PL(n, α, β) Når Z µ B(n, µ) og µ Be(α, β) finder man momenterne i den marginale fordeling af Z som E[Z] = nπ V[Z] = n π( π) +γ [ + nγ] (7.0) 278

3 med idet π = α/(α + β), γ = α+β E[µ] = π = α α+β αβ V[µ] = (α + β) 2 (α + β +) = π( π) α + β + (7.) (7.2) (7.3) For den relative hyppighed Y = Z/n gælder: E[Y ] = π V[Y ] = π( π) +γ ( γ+ ) n (7.4) hvor faktoren π( π) =E[µ( µ)] = E[V (µ)] +γ udtrykker den gennemsnitlige binomialvarians. 7.3 Hierarkisk model for empiriske varianser for normaltfordelte variable Til illustration af versatiliten af modelapparatet betragter vi her en hierarkisk model for varianser i normalfordelingsmodeller Den systematiske model Betragt et tosidet skema af observationer: X ij, j =,2,...,n i, i=,...,k, og sæt som vanligt n i SAK i = (x ij x i+ ) 2 j= 279

4 med x i+ = n i n i x ij Antag, at X ij (µ i,σi 2) N(µ i,σi 2), og X ij, j =,...,n i er betinget uafhængige givet sættet af (µ i,σi 2 ), i =,...,k. Vi har da, at fordelingen af SAK i er j= SAK i σ 2 i σ 2 i χ 2 (f i ) med f i = n i. SAK,...,SAK k er indbyrdes uafhængige,og fordelingen af SAK i afhænger ikke af µ i. Betragter vi specielt de empiriske varianser har vi at eller, udtrykt ved gammafordelingen: S 2 i = SAK i f i (7.5) S 2 i σ 2 i σ 2 i χ 2 (f i )/f i, S 2 i σ2 i G( f i /2, σ 2 i /(f i/2) ) Behandlingen af fordelingsforholdene for Si 2 er således blot et specialtilfælde af tilsvarende modeller for gammafordelte variable. På grund af den særlige interesse, der knytter sig til de empiriske varianser fra normaltfordelte observationer, vil vi alligevel her give en beskrivelse af fordelingsforholdene i dette specialtilfælde Den tilfældige model Under en tilfældig model vil det være naturligt at betragte hvilket er det samme som σ 2 i σ 2 i RGam(α, β), (7.6) G(α, /β), (7.7) 280

5 Det følger af egenskaberne for den reciprokke gammafordeling, at og E[σ 2 ]= β α V[σ 2 β 2 ]= (α ) 2 (α 2) = E[σ2 ] 2 α 2 Dvs den relative spredning i fordelingen af σ 2 er V[σ2 ]/E[σ 2 ]=/ α 2 (7.8) Fortolkning af parametre i strukturfordelingen af σ 2 I stedet for parametriseringen af fordelingen af σ 2 ved α og β vilviindføre en parametrisering, der er relateret til χ 2 -fordelingen. Der gælder Sætning 7.3. Fortolkning af strukturfordelingen af /σ 2 som en χ 2 -fordeling Antag, at strukturfordelingen af σ 2 er som i (7.7), dvs σ 2 RGam(α, β). Da gælder σ 2 σ0 2 (ν 2) χ2 (ν), (7.9) med σ0 2 = E[σ2 ]ogν=2α. Bevis: Indfører vi ν =2αi (7.6), har vi G(ν/2,/β), (7.20) σ2 28

6 dvs formparameteren er ν/2 og skalaparameteren er /β. Der gælder E[σ 2 ]= hvorfor vi kan udtrykke parameteren β som β ν/2, (7.2) β =(ν 2) σ 2 0 /2, (7.22) hvor vi har sat σ 2 0 = E[σ 2 i ] (7.23) Vi kan udtrykke gammafordelingen (7.6) som en χ 2 -fordeling ved χ 2 (f) G(f/2,2), dvs σ 2 2β χ2 (ν), (7.24) eller, idet vi udtrykker skalaparameteren β ved forventningsværdien, σ0 2 af σ 2 (jvf (7.22)), har vi at σ G( ν/2, 2/[(ν 2)σ ]), (7.25) hvilket er det samme som (7.9). Bemærkning Parameteren ν betegnes undertiden frihedsgraderne i fordelingen af /σ 2 På grund af relationen (7.9) betegner man undertiden parameteren ν som frihedsgraderne i fordelingen af /σ 2. Vi bemærker dog, at parameteren ν ikke behøver være heltallig. Det følger af (7.8), og af relationen ν =2α, at parameteren ν er bestemt ved den relative spredning i fordelingen af σ 2. Figur 7. viser et eksempel på fordelingen af σ Marginal fordeling af stikprøvevariansen Sætning strukturfordeling Såfremt S 2 σ 2 σ 2 χ 2 (f)/f og /σ Den marginale fordeling af S 2 ved reciprok gamma fordeling af S 2 givet ved 282 σ 2 0 (ν 2) χ 2 (ν), da er den marginale

7 Figur 7.: Strukturfordeling af sand varians, σ 2 for ν =4,σ 2 0 = ( S 2 RBet ν/2, f/2, ν 2 f σ 2 0 ) (7.26) hvor RBet angiver en såkaldt reciprok betafordeling. Såfremt ν 2 har fordelingen af S 2 ingen middelværdi. For 2 <νhar fordelingen af S 2 middelværdien E[S 2 ]=E[σ 2 ]=σ 2 0 (7.27) For ν 4 har fordelingen ingen varians. Såfremt 4 <ν, har fordelingen af 283

8 S 2 variansen V[S 2 ]= (σ2 0 )2 ν/2 2 [ + ] 2(ν/2 ) f (7.28) Den simultane fordeling af variansen, σ 2, og af stikprøvevariansen (den empiriske varians), S 2, er illustreret i figur 7.2 Figur 7.2: Simultan fordeling af empirisk varians, S 2, bestemt i stikprøve på n = 5 og sand varians σ 2 (Strukturfordeling af σ 2 som i figur 7..) Figur 7.3 viser den betingede fordeling af den empiriske varians, S 2, svarende til en givet værdi af σ 2,(σ 2 = ), og figur 7.4 viser den marginale fordeling af den empiriske varians, s 2, svarende til fordelingen i figur 7.2. Det ses, at 284

9 den marginale fordeling af S 2 har tykkere haler, end den betingede fordeling ifigur7.3. Figur 7.3: Betinget fordeling af empirisk varians, S 2, bestemt i stikprøve på n = 5 for en sand varians, σ 2 =. Bemærkning Den marginale fordeling af S 2 udtrykt ved F-fordelingen Ved at udnytte relationen mellem RBet-fordelingen og F-fordelingen finder man, at der gælder S 2 ν (ν 2)σ 2 0 F(ν, f), (7.29) 285

10 Figur 7.4: Marginal fordeling af empirisk varians, S 2, bestemt i stikprøve på n =5 (Strukturfordeling af σ 2 som i figur 7..) hvor F(ν, f) angiver en stokastisk variabel, der følger en F-fordeling med frihedsgraderne (ν, f). 7.4 Normalfordelingsmodeller med tilfældigt varierende varians. Som et ikke-trivielt eksempel på en hierarkisk model betragter vi normalfordelingsmodellen 286

11 hvor hvor σ 2 i Y i σi 2 N(µ, σ2 i ) (7.30) /σi 2 G(α, /β) (7.3) er indbyrdes uafængige. Da gælder, at den marginale fordeling af Y i er sådan, at Y i µ t(2α) β/α hvor t(2α) er en t-fordeling med 2αfrihedsgrader, dvs en fordeling med tykkere haler end normalfordelingen. 7.5 Generel formulering af hierarkiske modeller for exponentielle dispersionsfamilier Den ide, der lå bag formuleringen af (apriori) fordelingen af µ i de betragtede situationer, var at kernen i likelihoodfunktionen for µ også optrådte i den valgte tæthed for µ. Ideen kommer tydeligere frem, hvis vi betragter repræsentationen ved den kanoniske parameter. Betragt en eksponentiel dispersionsfamilie som indført i (4.5) f Y (y; θ, λ) =c(y, λ)exp[λ{θy κ(θ)}] for θ Ω (7.32) med middelværdirum M = τ(ω) og variansfunktion V (µ). Lad m Mog betragt g θ (θ; m, γ) = exp{[θm κ(θ)]/γ} (7.33) C(m, γ) med integrationskonstanten C(m, γ) = exp{[θm κ(θ)]/γ} dθ for all (positive) values of γ for which the integral converges. Ω 287

12 Udtrykket (7.33) definerer en tæthedsfunktion for en sandsynlighedsfordeling for θ. Den herved definerede fordeling kaldes den standard konjugerede fordeling for θ svarende til (7.32). Begrebet har sin rod i teorien for Bayesiansk inferens, hvor begrebet benyttes til at beskrive en familie af apriorifordelinger, hvis tæthed har samme struktur som likelihood-kernen (se Consonni and Veronese [28]) Når variansfunktionen for familien (7.32) er højst kvadratisk, svarer den standard konjugerede fordeling for µ til den standard konjugerede fordeling for θ. For den inverse Gauss fordeling er den standard konjugerede fordeling for µ en udartet fordeling (se [37]). Når variansfunktionen for familien (7.32) er højst kvadratisk har parametrene m og γ en simpel fortolkning ved middelværdiparameteren µ = τ(θ), nemlig m = E [µ] (7.34) γ = V [µ] E [V (µ)], (7.35) hvor µ = E [Y θ], og hvor V (µ) angiver variansfunktionen. For et bevis se fx. Pukelsheim [27]. The parametrization of the natural conjugate distribution for µ by the parameters m and γ has the advantage that location and spread are described by separate parameters. Thus, letting γ 0, the distribution of µ will converge towards a degenerate distribution with all its mass in m. Specifically, we shall consider the following hierarchical model: Conditional on the subgroup mean, µ i, the measurements, Y ij are iid with Y ij ED(µ i,v(µ i )/λ) The subgroup means, µ i are iid random variables following the natural conjugate distribution on µ. It then follows that the marginal mean of Y ij is E [Y ij ]=E[E[Y ij µ]] = E [µ] =m (7.36) 288

13 and furthermore the marginal variance of Y ij is V [Y ij ]=E[V[Y ij µ]] + V [E [Y ij µ]] = E [V (µ)]/λ + V [µ] (7.37) Thus, the parameter, γ, in the distribution of the group means reflects the usual decomposition of total variation into within-subgroup and betweensubgroup variation. As the variation, V (µ), within a specific subgroup depends on the subgroup mean, µ, the within-subgroup variation is understood as an average within-subgroup variation, E [V (µ)]. The marginal distribution of the subgroup means, Y i, has mean and variance E [Y i ] = E [E [Y i µ]] = E [µ] =m (7.38) V [Y i ] = E [V(µ)](γ + )=E[V(µ)](γ + σ2 ), λn i n i (7.39) where we have introduced the dispersion parameter, σ 2 =/λ for the withingroup distribution. Thus, the variance in the marginal distribution generally exceeds the average variance in the within group distributions (i.e. whenever V [µ] > 0]). This phenonemon is sometimes referred to as overdispersion. Measurements, Y ij and Y ik in the same subgroup are correlated with intragroup correlation ρ w = COV [Y ij,y ik ] V [Y ij ] = V [µ] E [V (µ)]/λ + V [µ] = γ /λ + γ (7.40) Introducing the dispersion parameter, σ 2 =/λ for the within-group distribution, the intragroup correlation (7.40) may be expressed in terms of the within group dispersion parameter, σ 2, and the between group dispersion parameter, γ, ρ w = γ (7.4) σ 2 + γ and hence, γ = ρ w σ 2 (7.42) ρ w The variance in the marginal distribution of group averages may thus be expressed in terms of either within group variance, σw 2 and intergroup cor- 289

14 relation, or between group variance, σb 2 and intergroup correlation as ( ρw V [Y i ] = E [V(µ)] + ) ρ w n ( i = V [µ] + ρ ) w ρ w n i Now, consider the between group sum of squares, (7.43) (7.44) SSQ B = N n i (Y i Y ) 2 (7.45) i= with Y denoting the usual (weighted) average of the subgroup averages, Y = i n iy i / i n i. It may be shown that E [SSQ B ]=(k )E [V (µ)](σ 2 + n 0 γ), (7.46) with ( i n 0 = n 2 i) n 2 i (k ) i n (7.47) i denoting an effective average sample size. Thus, a natural candidate for a method of moments estimate of the between-group dispersion, γ, is with expected value N S2 2 = n i (Y i Y ) /(N 2 ) (7.48) i= E [S 2 2 ]=E[V(µ)](σ2 + n 0 γ)=σ 2 E[V(µ)] + n 0 V [µ], (7.49) 7.6 Aposteriorifordeling Vi fortsætter stilen fra det foregående afsnit og starter i afsnit 7.6. med en generel formulering af aposterifordelinger for kanoniske parametre efter observation af X,X 2,...,X n frembragt af samme θ. Essensen i afsnittet er, at man opdaterer apriorifordelingsparametrene m og γ ved relationen (7.55), og så følger prædiktive fordelinger etc ved at mixe med denne opdaterede fordeling. Opdateringen er resumeret i tabellerne side 298 til

15 7.6. Generelle resultater vedrørende aposteriorifordelinger Sætning 7.6. Aposteriorifordeling svarende til konjugeret apriorifordeling for sædvanlige dispersionsmodeller Lad X,X 2,...,X n være uafhængige (for givet θ), frembragt med samme θ og med tæthed g(x θ) =d(x)exp{[θx κ(θ)]/σ 2 }, (7.50) og lad apriorifordelingen af θ være den konjugerede fordeling med tæthed w(θ; m, γ) = exp{[θm κ(θ)]/γ} (7.5) C(m, γ) Da afhænger aposteriorifordelingen af θ efter observation af X = x,...,x n =x n alene af n og x. Tætheden i aposteriorifordelingen af θ efter observation af X = x,...,x n = x n er med ( w θ ) X i /n = x = C(m,γ ) exp{[θm κ(θ)]/γ } (7.52) m/γ + n x/σ2 m = m apost = (7.53) /γ + n/σ 2 γ = γ apost = (7.54) /γ + n/σ 2 Aposteriorifordelingen for θ er således af samme form som apriorifordelingen. Der er blot foretaget en opdatering af parametrene m og γ. Bevis: Følger umiddelbart ved opskrivning af udtrykket for aposteriorifordelingen, 29

16 og benyttelse af at Z = X i er sufficient for θ i den betingede fordeling af X,...,X n for givet θ. Bemærkning Opdatering af apriorifordelingens parametre Vi bemærker, at aposteriorifordelingen af θ er af samme form som apriorifordelingen. Der er blot foretaget en opdatering af parametrene m og γ. Opdateringen er af formen: γ apost = γ apriori + n/σ 2 m apost γ apost = m apriori γ apriori + n x/σ 2 (7.55) hvor x = z/n = x i /n. Idet vi erindrer (sætning??), at parameteren /γ = E[V (µ)]/v[µ] er et udtryk for den relative præcision i fordelingen af θ i forhold til præcisionen i fordelingen af målestøjen, finder vi således, idet at γ apost = V[µ x] E[V (µ) x], (7.56) den relative præcision i aposteriorifordelingen er summen af den relative aprioripræcision og den relative stikprøvepræcision, hvor den relative præcision af stikprøven måles som antallet af stikprøveenheder divideret med dispersionsparameteren σ 2. Groft sagt, kan man altså fortolke parameteren /γ i apriorifordelingen som den aprioripræcision, der svarer til en stikprøve af størrelsen σ 2 /γ fra en given gruppe. For γ =, d.v.s. /γ = 0 har man en ikke-informativ apriorifordeling. Sammenholder vi (7.55) og (7.56) ser vi, at 292

17 forholdet mellem aposteriorivariansen V[µ x] af µog aposteriorimiddelværdien E[V (µ) x] af variansfunktionen V (µ) afhænger alene af stikprøvestørrelsen n (og aprioriforholdet γ apriori ), men ikke af det aktuelle stikprøveresultat x. Vi kan således bestemme aposteriorivariansen V[µ x] ud fra aposteriorimiddelværdien E[V (µ) x] af variansfunktionen V (µ) ved V[µ x]=γ apost E[V (µ) x] = E[V(µ) x] /γ apriori + n/σ 2 (7.57) Bemærkning 2 : Aposteriorifordelingen af µ nærmer sig en etpunktsfordeling Vi ser, at γ apost 0 for n Endvidere finder vi, at m apost = m apriori/γ apriori + n x/σ 2 x for n /γ apriori + n/σ 2 For store stikprøvestørrelser vil aposteriorifordelingen af µ således nærme sig en étpunktsfordeling omkring stikprøvegennemsnittet x. Bemærkning 3 : Den prædiktive fordeling af nye observationer fra samme gruppe Lad X,X 2,...,X n og X være sådan, at for fastholdt θ er X,X 2,...,X n,x uafhængige og identisk fordelte med en tæthed g( θ) givet ved (7.50), dvs. X er frembragt af det samme θ som X erne, og lad apriorifordelingen af θ være den konjugerede med tætheden w(θ; m, γ) givet ved (7.5). Den prædiktive fordeling af X er af samme form som den marginale fordeling af X. Der er blot foretaget en opdatering af parametrene m og γ. 293

18 Lad X,...,X r angive et sæt nye observationer, der er uafhængige og identisk fordelte, og med samme fordeling som X,...,X n, dvs specielt frembragt med samme værdi af θ. Lad Z = r j= X j angive summen af disse nye observationer, og lad X = Z /r = r X j /r j= angive gennemsnittet. Den prædiktive fordeling af Z og af X er af samme form som fordelingen af hhv Z = X i og X. Der er blot foretaget en opdatering af parametrene m og γ. Vi kan derfor benytte (7.38) og (7.39) til beskrivelse af momenterne i den prædiktive fordeling af Z og X, og vi finder at momenterne i den prædiktive fordeling af gennemsnittet X af r fremtidige observationer er: E[X + x] = m apost (7.58) ) V[X + x] = E[V(µ) x] (γ apost + σ2 (7.59) r Tilsvarende har vi for den prædiktive fordeling af summen Z af r fremtidige observationer E[Z x] = rm apost (7.60) V[Z x] = r E[V(µ) x](σ 2 + rγ apost ) (7.6) 294

19 Bemærkning 4 : Forventningsværdien i den prædiktive fordeling er et vejet gennemsnit Forventningsværdien i den prædiktive fordeling af X er Der gælder m apost = E[X X = x,x 2 =x 2,...,X n =x n ]= m apost = E[V (µ)] m + nv[µ] x/σ2 E[V (µ)] + nv[µ]/σ 2 m/γ + n x/σ2 /γ + n/σ 2 Aposterioriforventningsværdien af en fremtidig observation fra den givne gruppe er således et vejet gennemsnit mellem aprioriforventningsværdien, m, og stikprøvegennemsnittet x, hvor vægtene er de tilsvarende komponenter i opspaltningen af den totale variation. med w n = m apost = w n m apriori +( w n ) x (7.62) σ 2 σ 2 + nγ og w n = nγ σ 2 + nγ Parameteren γ i den prædiktive fordeling af X er γ apost = σ2 n ( w n) (7.63) Bemærkning 5 : Fortolkning af den prædiktive forventningsværdi som lineær prædiktor Lad situationen være som i den foregående bemærkning. Da kan forventningsværdien i den prædiktive fordeling af X fortolkes som regressionen af X på xved udtrykket: m apost = m +( w n )( x m) (7.64) med w n = σ 2 σ 2 + nγ og w n = 295 nγ σ 2 + nγ

20 Vi kan fortolke vægten w n = nγ σ 2 + nγ = COV[X,X ] V[X] som koefficienten til x i regressionen af X på xi den simultane fordeling af X og X. Jo større værdi af nγ, d.v.s jo mindre aprioripræcision, /γ, (eller jo større stikprøvestørrelse, n), desto større vægt får stikprøvekorrektionen, ( x m) til aprioriforventningsværdien, m, ved fastsættelsen af aposterioriforventningsværdien. 7.7 Aposteriorifordeling for Poisson Gamma model Vi betragter modellen fra afsnit 7..2, dvs vi betragter Z µ P(nµ), hvor fordelingen af µ er en G(α, β)-fordeling. Aposteriorifordelingen af µ efter observation af Z = z fås da af h(µ z) = f µ,z(µ, z; α, β) g Z (z; α, β) hvor f µ,z (µ, z; α, β) er den simultane tæthed for µ og Z, f µ,z (µ, z; α, β) =f Z µ (z;µ)f µ (µ;α, β) og g Z (z; α, β) angiver den marginale sandsynlighed for Z = z. Idet f Z µ = (nµ)y y! f µ (µ; α, β) = βγ(α) exp( nµ) ( ) α µ exp( µ/β) β finder man ved at betragte faktorerne, der indeholder µ h(µ z) = C(n, z, α, β) (nµ) y exp( nµ)µ α exp( µ/β) = C (n, z, α, β) µ z+α exp( µ(n +/β)) 296

21 der identificeres som kernen i en G(z + α, /(n +/β)) fordeling, og så ved man jo godt, hvordan normeringskonstanten C (n, z, α, β) skal se ud. Det væsentlige er, at man har konstateret at aposteriorifordelingen af µ efter observation af Z = z er en G(z + α, /(n +/β))- fordeling, for så vedman også at E[µ z]= i overensstemmelse med (7.53). α+z /β + n = m/γ + n(z/n) /γ + n 7.8 Normalfordelingen som miksturfordeling I stedet for at benytte den standard konjugerede fordeling som miksturfordeling ser man undertiden at man modellerer den tilfældige variation ved en normalfordeling af den kanoniske parameter (for binomialmodel, altså normalfordeling af logit erne). En sådan fremgangsmåde kaldes ofte en generaliseret lineær mixed model, mens brugen af en standard konjugeret fordeling kaldes en hierarkisk generaliseret lineær model, jvf Lee, Y. and Nelder, J. A. (996) Hierarchical Generalized Linear Models (with discussion). Journ. Roy. Statist. Soc. B, 58, og Lee, Y. and Nelder, J. A. (200) Hierarchical Generalised Linear Models: A Synthesis of Generalised Linear Models, Random-Effect Models and Structured Dispersions. Biometrika, 88,

22 E[X + ]=m; ( V[X + ]=E[V(µ)] γ + ) n Stikprøvefordeling af X i θ µ = E[X θ] V (µ) Strukturfordeling w( ) m = E[µ] E[V (µ)] γ = V[µ] E[V (µ)] Reference 298 B(,p) p µ( µ) p Be(α, β) π = α α + β Geo(,p) p p µ( + µ) p Be(α, β) ψ = β α π( π) +γ ψ( + ψ) γ α+β α Afsn. 6.2 Afsn. 6.3 P(µ) µ µ µ G(α, /β) m = α β m β Afsn. 6.4 Ex(µ) µ µ 2 µ RGam(α, /β) m = β α m 2 γ α Afsn. 6.5 N(µ, σ 2 ) µ σ 2 N(m, σ 2 b ) m σ2 σ 2 b /σ2 Afsn. 5.3

23 Momenter i de marginale fordelinger ved hierarkisk variation Z = X + X 2 + +X n ; Y =Z/n E[Y ]=m ( V[Y]=E[V(µ)] γ + ) n Stikprøvefordeling af Z Strukturfordeling w( ) Marginal fordeling af Z µ = E[X θ] V (µ) m = E[µ] γ = V[µ] E[V (µ)] E[V (µ)] 299 B(n, p) p Be(α, β) Pl(n, α, α + β) p µ( µ) π = α α + β α + β V (π) +γ NB(n, p) p Be(α, β) NPl(n, β, α + β) p p µ( + µ) ψ = β α α V (ψ) γ P(nµ) µ G(α, /β) NB(α, β/(β + n)) µ µ m = α β G(n, µ) µ RGam(α, /β) RBet(α, n, β) µ µ 2 m = β α Tabel 7.: Momenter i de marginale fordelinger ved hierarkisk variation β α V (m) V (m) γ

24 Stikprøvefordeling af Z µ Strukturfordeling w( ) Aposteriorifordeling af µ efter observation af Z = z Prædiktiv fordeling af Z Reference Z p B(n, p) p Be(α, β) Be(α + z, β + n z) Pl(r, α + z, α + β + n) Afsn Z p NB(n, p) p Be(α, β) Be(α + n, β + z) NPl(r, β + z, α + β + n + z) Afsn Z µ P(nµ) µ G(α, /β) G(α + z, /(β + n)) NB(α + z, (β + n)/(β + n + r)) Afsn Z µ G(nµ) µ RGam(α, β) RGam(α + n, β + z) RBet(α + n, r, β + z) Afsn µ N(m,σ2 ) Z µ N(nµ, nσ 2 ) µ N(m, σb 2) m = m/γ + z N(nm,rσ2 +r2σ2 ) Afsn /γ + n /σ 2 =/σ2 b + n/σ2 Z σ 2 σ 2 χ 2 (f) σ 2 RGam(α, β) σ 2 RGam(α + f/2,β+z/2) RBet(α + f/2,r/2,z+2β) Aposteriorifordelinger for endimensionale eksponentielle familier med naturlige konjugerede strukturfordelinger I linien for σ 2 χ 2 -fordelingen angiver Z en kvadratafvigelsessum med r frihedsgrader.

25 Kapitel 8 sasdata Nedenstående data (fra Danmarks Statistik) angiver antallet af fødsler i hvert af årene 963 til 976 samt antallet af disse, hvor barnet var dødfødt. Registreringerne er opdelt efter hvorvidt moderen var gift, eller ugift på tidspunktet for barnets fødsel. Vurder udviklingen i andel af dødfødte børn i denne periode. OPTIONS LINESIZE=75 PAGESIZE=58; TITLE Andel dodfodte born ; DATA FODSL; INPUT aar STA$ fodsl dod; IF STA= ugift THEN STATUS=0; IF STA = gift THEN STATUS = ; ANDEL = DOD/FODSL; MYAAR = AAR -963 ; CARDS; 963 ugift ugift ugift ugift ugift ugift ugift ugift

26 97 ugift ugift ugift ugift ugift ugift gift gift gift gift gift gift gift gift gift gift gift gift gift gift RUN; PROC LOGISTIC; MODEL DOD/fodsl = MYAAR; OUTPUT OUT= alle PRED= FIT RESCHI = CHIRES RESDEV=DEVRES ; RUN; PROC PRINT DATA = ALLE; VAR MYAAR ANDEL FIT CHIRES DEVRES; PROC SUMMARY DATA = alle ; VAR CHIRES DEVRES; OUTPUT OUT=SUMMOD USS=SUMCHI SUMDEV; PROC PRINT; PROC SORT DATA=FODSL ; BY STATUS; PROC LOGISTIC; MODEL DOD/fodsl = MYAAR; OUTPUT OUT= opdelt PRED= FIT RESCHI = CHIRES RESDEV=DEVRES ; 302

27 BY STATUS; RUN; PROC PRINT DATA = opdelt; VAR MYAAR ANDEL FIT CHIRES DEVRES; PROC SUMMARY DATA = opdelt; VAR CHIRES DEVRES; OUTPUT OUT=SUMMOD2 USS=SUMCHI SUMDEV; BY STATUS; RUN; PROC PRINT; RUN; * tex/stat3/udg02/bustilf.sas * DATA sasdata.bustilfr ; INPUT fors mutil util bog tilf mtilf ialt; Utilfr = mutil + util ; andel = Utilfr/ialt ; logit = log(andel/(-andel)); CARDS; ; 303

28 Litteratur [] Ronald Christensen: Plane Answers to Complex Questions. Springer Verlag. [2] Page, Luigi and Salvan, Allessandra: Principles of Statistical Inference - from a Neo-Fisherian Perspective, World Scientific 997 [3] Bickel, Peter and Doksum, Kjell: Mathematical Statistics - Basic Ideas and Selected Topics, Vol., 2nd ed. Prentice Hall 200. [4] Jørgensen, Bent: The Theory of Dispersion Models, Chapman & Hall 997 [5] Jørgensen, Bent: The Theory of Linear Models, Chapman & Hall 993 [6] McCullagh, P. and Nelder, J. : Generalized Linear Models, Chapman and Hall (.udg 983, 2. stærkt udvidede udgave 989). [7] Lee, Y. and Nelder, J: Two ways of modelling overdispersion in nonnormal data. Applied Statistics 49, (2000), pp [8] Fahrmeir and Tutz: Multivariate Statistical Modelling Based on Generalized Linear Models, 2nd edition, Springer 200, [9] Lindsey, J. K.: Parametric Statistical Inference, Oxford University Press (996) [0]Lindsey,J.K.:Applying Generalized Linear Models, Springer 997. Anvendelsesorienteret, indeholder også overlevelsesmodeller, modeller for tælleprocesser, modeller for spatielle data, dynamiske modeller [] McCulloch and Searle : Generalized, linear and mixed models Wiley, 200) 304

29 [2] Myers, R. H., Montgomery, D. C. and Vining G. G.: Generalized Linear Models with Applications in Engineering and the Sciences, Wiley 2002 [3] Shao, Jun: Mathematical Statistics, Springer Verlag 999. [4] Barndorff-Nielsen, O.E. (978): Information and Exponential Families. Wiley, Chichester. [5] Letac, G. (992): Lectures on Natural Exponential Families and Their Variance Functions. Monografias de Matematica 50. Instituto de Matematica Pura e Aplicada. Rio de Janeiro. [6] Morris, C.N. (982): Natural exponential families with quadratic variance functions. Ann. Statist. 0, [7] Seshadri, V. (993)The Inverse Gaussian Distribution. Clarendon Press, Oxford [8] Wilkinson, G. N., and Rogers, C. E. (973), Symbolic description of factorial models for analysis of variance, Applied Statistics, 22, [9] Stein, C. (955): Inadmissibility of the Usual Estimator for the Mean of a Multivariate Normal Distribution. Proceedings of the Third Berkeley Symposium, University of California Press, pp [20] C.K.Hansen og P.Thyregod (996): Modelling and Estimation of Wafer Yields and Defect Densities from Microelectronics Test Structure Data, Quality and Reliability Engineering International, 2, pp 9-7. [2] Dorfman an Alf: Maximum likelihood estimation of parameters of signal detection theory - a direct solution, Psychometrika 33 (968), pp 7-24 [22] Dorfman and Alf: Maximum likelihood estimation of parameters of signal detection theory and determination of confidence intervals - rating method data. Journal of Mathematical Psych. 6 (969) pp [23] Zhang, D.D, Zhou,X-H, Freeman D.H and Jean L. Freeman: A nonparametric method for the comparison of partial areas under ROC curves and its application to large health care data sets, Statistics in Medicine 2 (2002) pp [24] Agresti: Categorical Data Analysis, Wiley, New York (990) 305

30 [25] Y. Pawitan: In All Likelihood, Statistical Modelling and Inference Using Likelihood, Oxford Science Publications (200). [26] José C. Pinheiro and Douglas M. Bates: Mixed-Effects Models in S and S-plus, Springer New York (2000) [27] Müller-Funk, U. and Pukelsheim, F. (987) How Regular are Conjugate Exponential Families? Statistics & Probability Letters [28] Consonni, G. and Veronese, P. (992) Conjugate priors for Exponential Families Having Quadratic Variance Functions. Journal of the American Statistical Association [29] Breslow, N.R. and Clayton, D.G. (993): Approximate inference in generalized linear mixed models. Journal of the American Statistical Asssociation, 88, pp [30] Lee og Nelder (2000): Two ways of modelling overdispersion in nonnormal data. Applied Statistics 49, pp [3] Wolfinger, R. and O Connell, M. (993): Generalized linear models: a pseudo-likelihood approach. Journ.Statist.Comput.Simul., 48, [32] Pawitan, Y. (200) Two-staged Estimation of Variance Components in Generalized Linear Mixed Models. Journal of Statistical Computation and Simulation 69-7 [33] Belsley, D.A., Kuh, E. and Welsh, R.E. (2004): Regression Diagnostics: Identifying Influential Data and Sources of Collinearity, Wiley, New York [34] Cook,R.D. and Weisberg, S (982): Residuals and Influence in Regression Kluwer Academic Publishers [35] Cameron, J.M.: The use of Components of Variance in preparing schedules for sampling of baled wool. Biometrics 7, (95) pp [36].Price, C.J., Kimmel,C.A., George,J.D. and Marr, M.C.: The developmental toxity of diethylene glycol dimethyl ether in mice. Fund. Appl. Toxicol. 8, (987), pp [37] Gutiérez-Peña, E. and Smith, A.F.M: Conjugate Parametrizations for Natural Exponential Families, Journ. Amer. Statist. Assoc., 90 (995)

Poul Thyregod, 2. maj Specialkursus vid.stat. foraar exp µ β/(1 + β), som netop er kernen i en Gammafordeling med formparameteren

Poul Thyregod, 2. maj Specialkursus vid.stat. foraar exp µ β/(1 + β), som netop er kernen i en Gammafordeling med formparameteren Hierarkisk model for Poisson fordeling med overdispersion Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller Eksempel: hierarkisk Poissonfordelingsmodel Eksempel: hierarkisk

Læs mere

Vi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle.

Vi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle. Modellens parametre Mandag den 25 april Hierarkiske normalfordelingsmodeller Dagens program: Resume af ensidet variansanalysemodel med tilfældig effekt estimation af tilfældige effekter, fortolkning som

Læs mere

Overdispersion, dispersionsparameter: Dagens program, Mandag den 4. april :

Overdispersion, dispersionsparameter: Dagens program, Mandag den 4. april : Overdispersion, dispersionsparameter: Dagens program, Mandag den 4. april : udvidelse til modeller med overdispersion, quasi-likelihood, dvs alle knapperne i Metode menuen Hierarkiske normalfordelingsmodeller

Læs mere

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005 Hierarkiske generaliserede lineære modeller Lee og Nelder, Biometrika (21) 88, pp 987-16 Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller - Afslutning Hierarkisk generaliseret

Læs mere

Noter til Specialkursus i videregående statistik

Noter til Specialkursus i videregående statistik Noter til Specialkursus i videregående statistik Poul Thyregod IMM, februar 2005 Indhold Forord 6 1 Momenter og flerdimensionale stokastiske variable 7 1.0 Indledning............................. 7 1.1

Læs mere

Generelle lineære mixede modeller

Generelle lineære mixede modeller Kapitel 6 Generelle lineære mixede modeller 6.0 Introduktion De hierarkiske lineære normalfordelingsmodeller, vi betragtede i det foregående afsnit, er specialtilfælde af en generel klasse af modeller,

Læs mere

Lidt om fordelinger, afledt af normalfordelingen

Lidt om fordelinger, afledt af normalfordelingen IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Dagens program: Andel døde musefostre som fkt af indgivet konc.: Eksponentielle familier af fordelinger: Toxitetsvurdering for kølevæske:

Dagens program: Andel døde musefostre som fkt af indgivet konc.: Eksponentielle familier af fordelinger: Toxitetsvurdering for kølevæske: Dagens program: Mandag den 8. februar Generaliserede lineære modeller Motiverende eksempel, logistisk regression Eksponentielle dispersionsfamilier Generaliseret lineær model Estimation, fordeling af residualer

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

DoodleBUGS (Hands-on)

DoodleBUGS (Hands-on) DoodleBUGS (Hands-on) Simple example: Program: bino_ave_sim_doodle.odc A simulation example Generate a sample from F=(r1+r2)/2 where r1~bin(0.5,200) and r2~bin(0.25,100) Note that E(F)=(100+25)/2=62.5

Læs mere

2 Opgave i hierarkiske normalfordelingsmodeller

2 Opgave i hierarkiske normalfordelingsmodeller IMM, 2005-04-04 Poul Thyregod Flere rotter Datasættet Metal indeholder resultaterne fra en forsøgsserie, der havde til formål at bestemme toxiteten af et metalsalt (Nikkel). Ved forsøget benyttede man

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler

Læs mere

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering Landmålingens fejlteori Lektion 3 Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition: Middelværdi og

Læs mere

Introduktion til GLIMMIX

Introduktion til GLIMMIX Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.

Læs mere

hvor a og b er konstanter. Ved middelværdidannelse fås videre

hvor a og b er konstanter. Ved middelværdidannelse fås videre Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den

Læs mere

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k Dagens program: Likelihoodfunktion, begreber : Mandag den 4. februar Den generelle lineære model score-funktion: første afledede af log-likelihood har middelværdien nul observeret information: anden afledede

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

Sandsynlighed og Statistik

Sandsynlighed og Statistik 36 Sandsynlighed og Statistik 6.1 Indledning Denne note beskriver de statistiske begreber og formler som man med rimelig sandsynlighed kan komme ud for i eksperimentelle øvelser. Alt er yderst korfattet,

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges

Læs mere

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X

Læs mere

Uge 10 Teoretisk Statistik 1. marts 2004

Uge 10 Teoretisk Statistik 1. marts 2004 1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ. Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.

Læs mere

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Demo af PROC GLIMMIX: Analyse af gentagne observationer

Demo af PROC GLIMMIX: Analyse af gentagne observationer Demo af PROC GLIMMIX: Analyse af gentagne observationer Kristina Birch, seniorkonsulent, PS Banking Agenda Uafhængige vs. afhængige observationer Analyse af uafhængige vs. afhængige observationer Lille

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US Generalized Probit Model in Design of Dose Finding Experiments Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US Outline Motivation Generalized probit model Utility function Locally optimal designs

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable IMM, 00--6 Poul Thyregod Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable Todimensionale stokastiske variable Lærebogens afsnit 4 introducerede sandsynlighedsmodeller formuleret

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål Program Statistik og Sandsynlighedsregning Sandsynlighedstætheder og kontinuerte fordelinger på R Varians og middelværdi Normalfordelingen Susanne Ditlevsen Uge 48, tirsdag Tætheder og fordelingsfunktioner

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Om hypoteseprøvning (1)

Om hypoteseprøvning (1) E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1

Læs mere

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8 Landmålingens fejlteori Repetition - Fordeling af slutfejl Lektion 8 - tvede@math.aau.dk http://www.math.aau.dk/ tvede/teaching/l4 Institut for Matematiske Fag Aalborg Universitet 15. maj 2008 1/13 Fordeling

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2003 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Multivariate Extremes and Dependence in Elliptical Distributions

Multivariate Extremes and Dependence in Elliptical Distributions Multivariate Extremes and Dependence in Elliptical Distributions Filip Lindskog, RiskLab, ETH Zürich joint work with Henrik Hult, KTH Stockholm I II III IV V Motivation Elliptical distributions A class

Læs mere

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Binomialfordelingen. X ~ bin(n,p): X = antal succeser i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20. Foldning af sandsnlighedsmål Lad µ og ν være to sandsnlighedsmål på (R, B). Fortolkning Lad φ : R R være φ(, ) = + for (, ) R. Lad X og Y være to reelle stokastiske variable defineret på (Ω, F, P). Definition

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed... Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30 Områdeestimator X (Ω, F) (X, E) x 01 01 P θ ν θ θ Θ 0000 1111 000000 111111 0000 1111 0000 1111 C(x) En områdeestimator er en afbildning C : X P(Θ).. p.1/30 Konfidensområde En områdestimator C : X P(Θ)

Læs mere

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3 Landmålingens fejlteori Repetition - Kontinuerte stokastiske variable Lektion 4 - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf10 Institut for Matematiske Fag Aalborg Universitet 29. april

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Kontinuerte fordelinger Simultane fordelinger Kovarians og korrelation Uafhængighed Betingede fordelinger - Middelværdi og varians - Sammenhæng med uafhængighed 1 Figur 1: En tæthedsfunktion

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n. Simple fejlforplantningslov Landmålingens fejlteori Lektion 6 Den generelle fejlforplantningslov Antag X, X,, X n er n uafhængige stokastiske variable, hvor Var(X )σ,, Var(X n )σ n Lad Y g(x, X,, X n ),

Læs mere

Basic statistics for experimental medical researchers

Basic statistics for experimental medical researchers Basic statistics for experimental medical researchers Sample size calculations September 15th 2016 Christian Pipper Department of public health (IFSV) Faculty of Health and Medicinal Science (SUND) E-mail:

Læs mere