Generelle lineære mixede modeller

Størrelse: px
Starte visningen fra side:

Download "Generelle lineære mixede modeller"

Transkript

1 Kapitel 6 Generelle lineære mixede modeller 6.0 Introduktion De hierarkiske lineære normalfordelingsmodeller, vi betragtede i det foregående afsnit, er specialtilfælde af en generel klasse af modeller, de såkaldte generelle lineære mixede modeller (General linear mixed models). I det følgende skitseres for referenceformål den generelle teori for denne modelklasse. For en mere udførlig beskrivelse henvises til Pawitan [32] eller Pinheiro og Bates [26]. 6.1 Formulering af den generelle lineære mixed model Modellen Y = Xβ + ZU + ɛ (6.1) hvor X og Z er kendte matricer, og hvor ɛ N(0, R) ogu N(0, D) er uafhængige, kaldes en generel lineær mixed model. I det generelle tilfælde antages variansmatricerne R og D at afhænge af nogle ukendte parametre, θ, som også skal estimeres. 261

2 Parametrene β kaldes systematiske parametre (fixed effects), mens størrelserne U kaldes tilfældige effekter (random effects). På grund af uafhængigheden mellem U og ɛ har vi [( )] ( ) ɛ R 0 D = U 0 D Modellen kan også opfattes som en hierarkisk model med tæthederne og f U (u; θ) = f Y u (y; β) = for y R N U N(0, D) (6.2) Y U = u N(Xβ + Zu, R) (6.3) [ ] 1 1 ( 2π) q det(d) exp 2 u D 1 u for u R q (6.4) [ ] 1 1 ( 2π) N det(r) exp 2 (y Xβ Zu) R 1 (y Xβ Zu) Det følger da, at den marginale fordeling af Y er en normalfordeling med (6.5) E[Y] = Xβ (6.6) D[Y] = R+ZDZ (6.7) Vi indfører symbolet V for dispersionsmatricen i den marginale fordeling af Y, dvs V=R+ZDZ (6.8) Matricen V kan let svulme op og blive vanskelig at håndtere Eksempel: Envejs model med tilfældig effekt Envejsmodellen med tilfældig effekt: Y ij = µ + U i + e ij 262

3 som vi betragtede tidligere, udtrykkes som med Y = Xβ + ZU + ɛ (6.9) X = 1 N β = µ U = (U 1,U 2,...,U q ) R = σ 2 I N D = σ 2 bi q hvor 1 N er en søjle af ettaller. Det i, j te element i den N q dimensionale matrix Z er lig med 1, hvis y ij kommer fra den i te gruppe, ellers er det nul. 6.2 Estimation Estimation af fixed effects og variansparametre Fixed-effects parametrene β og variansparametrene θ estimeres fra den marginale fordeling af Y. Log-likelihood en for fixed-effects parametrene bliver l(β, θ; y) = 1 2 log V 1 2 (y Xβ) V 1 (y Xβ) Så for fastholdt θ bliver scorefunktionen mht β jvf (3.17) på side 46 l β (β;θ)=x [ V 1 y V 1 Xβ ] (6.10) Profillikelihood en for variansparameteren θ er da l(θ) = 1 2 log V 1 2 (Y X β) V 1 (Y X β) (6.11) hvor β er bestemt ved at sætte (6.10) lig med nul. Den observerede Fisher information for β er I( β) =X V 1 X (6.12) hvorfra man kan bestemme et estimat for dispersionsmatricen for β 263

4 For at bestemme estimater for variansparametrene θ modificeres profillikelihood en (6.11) for θ for at tilgodese estimationen af β. Den modificerede profillikelihood bliver l m (θ) = 1 2 log V 1 2 log X V 1 X 1 2 (Y X β) V 1 (Y X β) (6.13) Modifikationen svarer til at bestemme REML (residual maximum likelihood estimatet) for variansparametrene θ. Hvis β afhænger af θ er det nødvendigt at bestemme løsningen ved iteration. (Det kan undertiden være ganske kompliceret at bestemme et analytisk udtryk for (6.13)). Pawitan [25] angiver i afsnit 17.5 en simplere fremgangsmåde, der ikke kræver bestemmelse af V Estimation af de tilfældige effekter Log-likelihood en for alle parametrene bygger på den simultane tæthed for (Y, U), der fremkommer som f(y, u; β, θ) =f Y u (y;β)f U (u;θ) hvor f Y u (y; β) ogf U (u;θ) er givet ved (6.4) og (6.5). Man får derfor l(β, θ, u) = 1 2 log R 1 2 (y Xβ Zu) R 1 (y Xβ Zu) 1 2 log D 1 2 u D 1 u (6.14) hvorfor u l(β, θ, u) =Z R 1 (y Xβ Zu) D 1 u (6.15) Ved at sætte den afledede lig nul og løse med hensyn til u finder man, at estimatet û er løsning til (Z R 1 Z + D 1 )u = Z R 1 (y Xβ) (6.16) hvor man indsætter estimatet β i stedet for β. Løsningen til (6.16) er BLUPestimatet (best linear unbiased predictor). 264

5 Den anden afledede af log-likelihood en med hensyn til u er 2 u u l(β, θ, u) = Z R 1 Z D 1 hvorfor man har, at den observerede Fisher information mht b er I(û) =(Z R 1 Z+D 1 ) der kan benyttes til bestemmelse af usikkerheden på û Samtidig estimation af β og u Estimaterne for β og for u er netop de værdier, der samtidigt maksimerer l(β, θ, u) (6.14) for et fast θ. Man har nemlig af (6.14) β l(β, θ, u) =X R 1 (y Xβ Zu) Kombineres dette med (6.15) og sættes lig med nul får man de såkaldte mixed model equations ( X R 1 X X R 1 Z Z R 1 X Z R 1 Z+D 1 )( β u ) = ( X R 1 y Z R 1 y ) (6.17) Estimaterne fra disse simultane ligninger er netop de estimater, der fremkommer fra (6.10) og (6.16). Ligningerne gør det muligt at estimere β og u uden at beregne den marginale varians V, eller dens inverse. Estimationen kan foretages ved en iterativ backfitting algoritme som følger: 1. Start med et estimat for β, for eksempel det sædvanlige mindste kvadraters estimat β =(X X) 1 X y og iterer mellem nedenstående trin 2 og 3 indtil der er opnået konvergens 265

6 2. Beregn en korrigeret observation y kor = y X β og estimer u fraentilfældigmodely kor = Zu + ɛ ved (Z R 1 Z + D 1 )u = Z R 1 y kor 3. Genberegn en korrigeret observation y kor = y Zu og estimer β fra en fixed effects model y kor = Xβ + ɛ ved (X R 1 X)β = X R 1 y kor Det er imidlertid et problem, at variansparametrene sædvanligvis indgår i matricerne R og D. Det vil derfor være nødvendigt at bestemme estimater R og D (fx ved REML), og derefter løse mixed model ligningerne: ( ( ) X R 1 X Z R 1 X X R 1 Z Z R 1 Z+ D 1 ) ( β b ) = X R 1 y Z R 1 y i stedet for (6.17). Derefter bestemmes reviderede estimater R og D. Processen gentages indtil der er opnået konvergens Empirisk Bayes-fortolkning Det ses af (6.16) (Z R 1 Z + D 1 )u = Z R 1 (y X β) at estimatet û for de tilfældige effekter er krympet mod nul, idet det er et vejet gennemsnit mellem det direkte estimat (y X β) og apriorimiddelværdien 0, hvor vægten er præcisionen D 1 i fordelingen af U. 266

7 6.3 SAS-proceduren PROC MIXED Proceduren er dedikeret til behandling af modellen (6.1) Y = Xβ + ZU + ɛ hvor X angiver designmatricen for de systematiske ( fixed ) effekter, og Z tilsvarende angiver designmatricen for de tilfældige ( random ) effekter. Proceduren giver mulighed for en række forskellige varians-kovarians forhold R og D for ɛ og U. Sætningerne er i en vis udstrækning analoge til sætningerne i PROC GLM. Således specificeres modellen i MODEL, RANDOM og REPEATED sætninger. Der er dog den forskel, at i PROC MIXED beskriver MODEL sætningen alene fixed effects. MODEL sætningen definerer X matricen. Strukturen for R er som default en enhedsmatrix. Ved brug af en Repeated sætning kan man imidlertid frembringe blokmatricer med en hel række forskellige strukturer. Subject = definerer blokkene i R og Type= definerer strukturen i blokkene. RANDOM sætningen definerer Z- matricen og benyttes endvidere til at angive strukturen for D. I RANDOM sætningen konstrueres design matricen for de tilfældige effekter. Optionen SUBJECT = identificerer de uafhængige gentagelser af de tilfældige effekter. Således bevirker SUBJECT = at D matricen bliver en blok-diagonal matrix med identiske blokke, en for hvert subject. Brug af SUBJECT= optionen indebærer at Z-matricen evt bliver modificeret for at respektere blok-diagonaliteten, det vil sige at eventuelle andre tilfældige effekter bliver underordnet subject-effekten. Strukturen for D bestemmes som en option TYPE= i RANDOM sætningen (efter en slash). Default optionen er varianskomponent, dvs en diagonalmatrix med forskellige værdier for de forskellige effekter Eksempel på brug af PROC MIXED Programstumpen 267

8 data ramus ; input dreng$ alder ald = alder ; cards; A A A A B B B B C C C C D D D D E E E E ; indlæser ramushøjderne ved aldrene 8, 8.5, 9, 9.5 år for fem drenge, A,B,C,D og E. Programmet PROC MIXED DATA=ramus ; CLASS DRENG; MODEL ramus = ald /solution outp=pred; RANDOM int ald /subject = dreng solution type=un; run; analyserer den model for tilfældige regressionslinier, der blev betragtet i afsnit , side 251. Sætningen MODEL ramus = ald /solution outp=pred; beskriver den systematiske del (fixed effekt), nemlig et intercept og en koefficient til alderen, og nøgleordet solution bevirker at disse koefficienter bliver udskrevet. Endelig bevirker nøgleordet outp=pred at de prædikterede værdier for hver observation (under den tilfældige model) udskrives i datasættet pred. Sætningen RANDOM int ald /subject = dreng solution type=un; beskriver den tilfældige del (random effekt), nemlig et tilfældigt intercept og en tilfældig hældning, der begge varierer omkring nul (det er derfor vi også havde brug for at specificere det systematiske bidrag i MODEL sætningen). Nøgleordet subject = dreng angiver at observationer fra forskellige drenge er uafhængige. Da øvrige tilfældige effekter er underordnet subject indebærer det, at det tilfældige intercept og hældning, der er knyttet til den enkelte dreng, opfattes som en todimensional variabel for den enkelte dreng, mens 268

9 gentagelser (en ny dreng) er uafhængige. Nøgleordet type = uns (unstructured) angiver, at der ikke er påtvunget nogen kovariansstruktur for denne todimensionale variabel. 269

10 Kapitel 7 Hierarkisk variation for exponentielle dispersionsfamilier 7.0 Indledning, modellering af overdispersion En karakteristisk egenskab ved de generaliserede lineære modeller var, at variansen, V[Y ] i fordelingen af responset var en kendt funktion, V (µ), der alene afhænger af middelværdien µ, nemlig V[Y i ]=λ i V(µ)= σ2 V(µ) w i hvor w i udtrykker en kendt vægt, knyttet til den i te observation, og hvor σ 2 udtrykker en dispersionsparameter fælles for alle observationer. Dispersionsparameteren σ 2 benyttes som beskrevet i afsnit 4.12 til at udtrykke overdispersion i situationer, hvor residualdeviansen er større end hvad der kan forklares ved variansfunktionen V (µ) og kendte vægte w i. I dette afsnit vil vi beskrive en alternativ fremgangsmåde til modellering af overdispersion, nemlig ved hierarkiske modeller analoge til normalfordelingsmodellerne i afsnit 5. Se også Lee og Nelder, Two ways of modelling overdispersion in non-normal data. Applied Statistics 49, (2000), pp , [30] for en diskussion af de to forskellige fremgangsmåder. 270

11 Ved en hierarkiske modellering tager man udgangspunkt i at fordelingen af støjen modelleres ved en eksponentiel dispersionsfamilie (binomial, Poisson, etc) og det drejer sig da om at vælge en passende (apriori) fordeling af middelværdiparameteren µ. Det vil være naturligt at vælge en fordeling, hvis støtte netop er middelværdirummet M, snarere end at vælge en normalfordeling, hvis støtte jo er hele den reelle akse. I dette kapitel vil vi indføre de såkaldte konjugerede fordelingsfamilier til eksponentielle dispersionsfamilier til modellering af variationen af middelværdiparameteren µ. Ved gennemgangen vil vi først beskrive nogle eksempler, Poisson-gamma, Binomial Beta, etc. i afsnittene 7.1 til 7.4 I afsnit 7.5 indføres den mere generelle formulering, og bestemmelsen af aposteriorifordeling beskrives generelt i afsnit 7.6 og eksemplificeres for Poissonfordelingssituationen i afsnit Hierarkisk Poisson Gamma model Eksempel, Variation mellem episoder af tordenvejr ved Cape Kennedy Nedenstående tabel ( efter Williford et al. (1974)) viser fordelingen af antal daglige tordenvejrsepisoder ved Cape Kennedy, Florida i månederne juni, juli og august for 10-års perioden , ialt 920 døgn. Fordelingen af antal dage med 0,1,2 eller flere episoder af tordenvejr ved Cape Kennedy Antal Antal Poisson episoder dage forventet z i # i Alle observationsperioder er på n i = 1 dag. 271

12 For Poissonfordelingen er variansfunktionen V (µ) = µ,og såfremt observationerne er uafhængige og identisk fordelte skal variansen således være lig med middelværdien. Man finder det gennemsnitlige antal tordenvejr y + =0.15 og den fundne varians er s 2 =0.1769, der er noget større end gennemsnittet. Det ses også, at den observerede fordeling har tykkere haler end Poissonfordeling. Man kunne således få en mistanke om overdispersion. En sådan overdispersion kunne eventuelt forklares ved at antallet af tordenvejr på en given dag varierer som en Poisson fordelt variabel, men at Poisson-intensiteten varierer mellem dagene. I det følgende vil vi beskrive en sådan model med varierende intensitet Formulering af hierarkisk model Simpel hierarkisk model Der gælder Lad fordelingen af Y givet µ være en Poissonfordeling Y P(µ), og lad fordelingen af µ være en Gammafordeling G(α, β), da er den marginale fordeling af Y en negativ binomialfordeling, Y NB(α, 1/(1+β)) fordeling. Bevis For illustrationens skyld anføres beviset: Vi har frekvensfunktionen for fordelingen af Y givet µ f Y µ (y; µ) = µy y! exp( µ) (7.1) og tæhedsfunktionen for fordelingen af µ f µ (µ; α, β) = 1 βγ(α) ( ) µ α 1 exp( µ/β) (7.2) β 272

13 Da bestemmes frekvensfunktionen for den marginale fordeling af Y af g Y (y; α, β) = = µ=0 µ=0 f Y µ (y; µ)f µ (µ; α, β)dµ (7.3) µ y y! 1 exp( µ) βγ(α) ( ) µ α 1 exp( µ/β)dµ β 1 = β α µ y+α 1 exp( µ(β +1)/β) dµ y!γ(α) µ=0 Det ses, at integranden netop er kernen for tæthedsfunktionen for en gammafordeling, G(y + α, β/(β + 1)). Da tætheden skal integrere til et ettal, har vi altså ved at betragte normeringskonstanten, at hvorfor vi får g Y (y; α, β) = µ=0 µ y+α 1 exp( µ/[β/(β +1)])dµ = βy+α Γ(y + α) (β +1) y+α Γ(y + α) y!γ(α) hvor vi har benyttet konventionen ( ) z = y for z reel og y heltallig. β y ( y+α 1 (β +1) y+α = y Γ(z +1) Γ(z +1 y)y! ) ( ) 1 β y (β+1) α (7.4) β+1 Det ses at (7.4) netop er frekvensfunktionen for en NB(α, 1/(1 + β)) fordeling jvf oversigtstabellen side 23. På tilsvarende måde kan man vise: Såfremt Z µ P(nµ), og fordelingen af µ er en G(α, β) fordeling, da er den marginale fordeling af Z en NB(α, 1/(1 + nβ)) fordeling. I stedet for at parametrisere fordelingen af µ ved formparameter α og skalaparameter β for gammafordelingen kan man vælge at parametrisere ved den reciprokke formparameter, og middelværdi m = αβ, dvs k = 1/α (7.5) m = αβ (7.6) 273

14 Resultatet kan da udtrykkes som Såfremt Z µ P(nµ), og fordelingen af µ er en G(1/k, mk) fordeling, da er den marginale fordeling af Z en NB(1/k, 1/(1 + nmk)) fordeling. Vi har hvorfor hvorfor vi har for Y = Z/n E[Z µ] = nµ V[Z µ] = nµ E[µ] = m V[µ] = m 2 k E[Z] = ne[µ]=nm V[Z] = E µ [V[Y µ]] + V µ [E[Y µ]] = E[nµ]+V[nµ] =ne[µ]+n 2 V[µ] = nm + n 2 m 2 k E[Y ] = m Indfører vi signal/støj forholdet γ = V[Y] = 1 n 2 V[Z]=m n +m2 k V[µ] E[V P (µ)] = V[µ] E[µ] = m2 k m ses, at vi kan udtrykke formparameteren α som = mk (7.7) α = 1 k = m γ Parametriseringen ved k =1/α indebærer at parameterpområdet 0 <α< føres over i området 0 <k<, og specielt har vi for α vil k 0og G(1/k, mk) fordelingen vil nærme sig en etpunktsfordeling med hele massen 274

15 i µ = m og tilsvarende vil NB(1/k, 1/(1 + nmk)) fordelingen nærme sig en Poissonfordeling med middelværdi nm. Tilsvarende vil signal/støj forholdet γ nærme sig nul. Med disse fortolkninger er formlerne således også gyldige for k = 0, og man kan teste for overdispersion ved at teste om k = SAS PROC GENMOD SAS proceduren PROC GENMOD har fordelingsoptionen DIST = NEGBIN med logaritmisk link som tilhørende default linkfunktion. I lighed med de eksponentielle dispersionsmodeller benyttes notationen Y NB(1/k, 1/(1 + kµ)) med E[Y ]=µ V[Y]=µ(1 + kµ) svarende til frekvensfunktionen f Y (y; µ, k) = Γ(y +1/k) y! Γ(1/k) (kµ) 1/k (1 + kµ) y+1/k for y =0,1,2,... I SAS-outputtet kaldes parameteren k dispersionsparameter selv om k ikke er dispersionsparameter i en generaliseret lineær model, idet enhedsvariansfunktionen for den negative binomialfordeling jo er V NB (µ)=µ(1 + µ) jvf Tabel 4.1 på side 115. Opfattet som marginal fordeling af Y svarende til den hierarkiske model i det foregående afsnit benyttes parameteren m i stedet for µ, og parameteren n sættes lig 1, sådan at man har E[Y ] = m V[Y] = m+m 2 k Eksempel, tordenvejr igen Ved numerisk maksimering af likelihoodfunktionen finder man m = [tordenvejr/dag] og k =1.3022, dvs α =1/k = og signal/støjforhold γ = m/α = mk =

Poul Thyregod, 2. maj Specialkursus vid.stat. foraar exp µ β/(1 + β), som netop er kernen i en Gammafordeling med formparameteren

Poul Thyregod, 2. maj Specialkursus vid.stat. foraar exp µ β/(1 + β), som netop er kernen i en Gammafordeling med formparameteren Hierarkisk model for Poisson fordeling med overdispersion Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller Eksempel: hierarkisk Poissonfordelingsmodel Eksempel: hierarkisk

Læs mere

Vi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle.

Vi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle. Modellens parametre Mandag den 25 april Hierarkiske normalfordelingsmodeller Dagens program: Resume af ensidet variansanalysemodel med tilfældig effekt estimation af tilfældige effekter, fortolkning som

Læs mere

Noter til Specialkursus i videregående statistik

Noter til Specialkursus i videregående statistik Noter til Specialkursus i videregående statistik Poul Thyregod IMM, februar 2005 Indhold Forord 6 1 Momenter og flerdimensionale stokastiske variable 7 1.0 Indledning............................. 7 1.1

Læs mere

Overdispersion, dispersionsparameter: Dagens program, Mandag den 4. april :

Overdispersion, dispersionsparameter: Dagens program, Mandag den 4. april : Overdispersion, dispersionsparameter: Dagens program, Mandag den 4. april : udvidelse til modeller med overdispersion, quasi-likelihood, dvs alle knapperne i Metode menuen Hierarkiske normalfordelingsmodeller

Læs mere

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005

µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005 Hierarkiske generaliserede lineære modeller Lee og Nelder, Biometrika (21) 88, pp 987-16 Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller - Afslutning Hierarkisk generaliseret

Læs mere

Introduktion til GLIMMIX

Introduktion til GLIMMIX Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.

Læs mere

Dagens program: Andel døde musefostre som fkt af indgivet konc.: Eksponentielle familier af fordelinger: Toxitetsvurdering for kølevæske:

Dagens program: Andel døde musefostre som fkt af indgivet konc.: Eksponentielle familier af fordelinger: Toxitetsvurdering for kølevæske: Dagens program: Mandag den 8. februar Generaliserede lineære modeller Motiverende eksempel, logistisk regression Eksponentielle dispersionsfamilier Generaliseret lineær model Estimation, fordeling af residualer

Læs mere

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k Dagens program: Likelihoodfunktion, begreber : Mandag den 4. februar Den generelle lineære model score-funktion: første afledede af log-likelihood har middelværdien nul observeret information: anden afledede

Læs mere

2 Opgave i hierarkiske normalfordelingsmodeller

2 Opgave i hierarkiske normalfordelingsmodeller IMM, 2005-04-04 Poul Thyregod Flere rotter Datasættet Metal indeholder resultaterne fra en forsøgsserie, der havde til formål at bestemme toxiteten af et metalsalt (Nikkel). Ved forsøget benyttede man

Læs mere

Lidt om fordelinger, afledt af normalfordelingen

Lidt om fordelinger, afledt af normalfordelingen IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,

Læs mere

Demo af PROC GLIMMIX: Analyse af gentagne observationer

Demo af PROC GLIMMIX: Analyse af gentagne observationer Demo af PROC GLIMMIX: Analyse af gentagne observationer Kristina Birch, seniorkonsulent, PS Banking Agenda Uafhængige vs. afhængige observationer Analyse af uafhængige vs. afhængige observationer Lille

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Normalfordelingens venner og bekendte Helle Sørensen Uge 9, onsdag SaSt2 (Uge 9, onsdag) Normalfordelingens venner 1 / 20 Program Resultaterne fra denne uge skal bruges

Læs mere

Den todimensionale normalfordeling

Den todimensionale normalfordeling Den todimensionale normalfordeling Definition En todimensional stokastisk variabel X Y siges at være todimensional normalfordelt med parametrene µ µ og når den simultane tæthedsfunktion for X Y kan skrives

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

hvor a og b er konstanter. Ved middelværdidannelse fås videre

hvor a og b er konstanter. Ved middelværdidannelse fås videre Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2003 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable IMM, 00--6 Poul Thyregod Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable Todimensionale stokastiske variable Lærebogens afsnit 4 introducerede sandsynlighedsmodeller formuleret

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Hvorfor bøvle med MIXED

Hvorfor bøvle med MIXED Hvorfor bøvle med MIXED E. Jørgensen 1 1 Genetik og Bioteknologi Danmarks Jordbrgsforskning Forskergrppe for Statistik og besltningsteori Årslev 18/01/2006 MIXED vs. GLM Lidt baggrnd Generel Lineær Model

Læs mere

Introduktion til generaliserede lineære modeller

Introduktion til generaliserede lineære modeller Kapitel 4 Introduktion til generaliserede lineære modeller 4.0 Oversigt Gennemgangen indledes med et motiverende eksempel (logistisk regression) i afsnit 4.2. Efter den indledende abstrakte gennemgang

Læs mere

Karakteristiske funktioner og Den Centrale Grænseværdisætning

Karakteristiske funktioner og Den Centrale Grænseværdisætning E6 efterår 1999 Notat 10 Jørgen Larsen 20. oktober 1999 Karakteristiske funktioner og Den Centrale Grænseværdisætning Karakteristiske funktioner som er nære slægtninge til Fourier-transformationen) er

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Den hændelse, der ikke indeholder

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20.

Fortolkning. Foldning af sandsynlighedsmål. Foldning af tætheder. Foldning af Γ-fordelinger Eksempel: Hvis X og Y er uafhængige og. Sætning (EH 20. Foldning af sandsnlighedsmål Lad µ og ν være to sandsnlighedsmål på (R, B). Fortolkning Lad φ : R R være φ(, ) = + for (, ) R. Lad X og Y være to reelle stokastiske variable defineret på (Ω, F, P). Definition

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Antal Antal B(770, ) Pl(770, 0.460, 319.1) afvi- stikprøgende

Antal Antal B(770, ) Pl(770, 0.460, 319.1) afvi- stikprøgende Antal Antal B(770, 0.004) Pl(770, 0.460, 39.) afvi- stikprøgende ver. Forv. (obs forv) (obs forv) Forv. forv forv z i 0 3 75.47 40.85 30.64 0.00 38 83.83 25.06 42.52 0.48 2 28 46.50 7.36 2.96.66 3 7.7

Læs mere

Lineære normale modeller (4) udkast

Lineære normale modeller (4) udkast E6 efterår 1999 Notat 21 Jørgen Larsen 2. december 1999 Lineære normale modeller (4) udkast 4.5 Regressionsanalyse 4.5.1 Præsentation 1 Regressionsanalyse handler om at undersøge hvordan én målt størrelse

Læs mere

Uge 10 Teoretisk Statistik 1. marts 2004

Uge 10 Teoretisk Statistik 1. marts 2004 1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Center for Statistik. Multipel regression med laggede responser som forklarende variable Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Sandsynlighed og Statistik

Sandsynlighed og Statistik 36 Sandsynlighed og Statistik 6.1 Indledning Denne note beskriver de statistiske begreber og formler som man med rimelig sandsynlighed kan komme ud for i eksperimentelle øvelser. Alt er yderst korfattet,

Læs mere

Sandsynlighedsregning

Sandsynlighedsregning Mogens Bladt www2.imm.dtu.dk/courses/02405 21. September, 2007 Lidt om binomialkoefficienter n størrelsen af en mængde/population. Vi ønsker at udtage en sub population af størrelse r. To sub populationer

Læs mere

Den lineære normale model

Den lineære normale model Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ. Statistiske modeller (Definitioner) Statistik og Sandsynlighedsregning 2 IH kapitel 0 og En observation er en vektor af tal x (x,..., x n ) E, der repræsenterer udfaldet af et (eller flere) eksperimenter.

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Lineære transformationer, middelværdi og varians Helle Sørensen Uge 8, onsdag SaSt2 (Uge 8, onsdag) Lineære transf. og middelværdi 1 / 15 Program I formiddag: Fordeling

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Binomialfordelingen. X ~ bin(n,p): X = antal succeser i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):

Læs mere

Betingning med en uafhængig variabel

Betingning med en uafhængig variabel Betingning med en uafhængig variabel Sætning Hvis X er en reel stokastisk variabel med første moment og Y er en stokastisk variabel uafhængig af X, så er E(X Y ) = EX. Bevis: Observer at D σ(y ) har formen

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n. Simple fejlforplantningslov Landmålingens fejlteori Lektion 6 Den generelle fejlforplantningslov Antag X, X,, X n er n uafhængige stokastiske variable, hvor Var(X )σ,, Var(X n )σ n Lad Y g(x, X,, X n ),

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Simpel Lineær Regression: Model

Simpel Lineær Regression: Model Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

Normalfordelingsmodeller med hierarkisk variation

Normalfordelingsmodeller med hierarkisk variation Kapitel 5 Normalfordelingsmodeller med hierarkisk variation Hidtil har vi hovedsageligt kun betragtet modeller med ét niveau af tilfældig variation (gentagelsesvariation). I mange af de situationer, man

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation

Læs mere

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kombinant. En kombinant er en afbildning. hvor (Y, K) er endnu et målbart rum. Typisk taler vi om reelle kombinanter, hvor Y = R.

Kombinant. En kombinant er en afbildning. hvor (Y, K) er endnu et målbart rum. Typisk taler vi om reelle kombinanter, hvor Y = R. Kombinant Lad (ν θ ) θ Θ være en statistisk model på (X, E). En kombinant er en afbildning hvor (Y, K) er endnu et målbart rum. R : X Θ Y Typisk taler vi om reelle kombinanter, hvor Y = R. Som regel forsøger

Læs mere

Noter til Specialkursus i videregående statistik

Noter til Specialkursus i videregående statistik Noter til Specialkursus i videregående statistik Poul Thyregod IMM, februar 2005 Indhold Forord 6 1 Momenter og flerdimensionale stokastiske variable 7 1.0 Indledning............................. 7 1.1

Læs mere

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30

Områdeestimator. X x. P θ. ν θ. Θ C(x) En områdeestimator er en afbildning C : X P(Θ). . p.1/30 Områdeestimator X (Ω, F) (X, E) x 01 01 P θ ν θ θ Θ 0000 1111 000000 111111 0000 1111 0000 1111 C(x) En områdeestimator er en afbildning C : X P(Θ).. p.1/30 Konfidensområde En områdestimator C : X P(Θ)

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Om hypoteseprøvning (1)

Om hypoteseprøvning (1) E6 efterår 1999 Notat 16 Jørgen Larsen 11. november 1999 Om hypoteseprøvning 1) Det grundlæggende problem kan generelt formuleres sådan: Man har en statistisk model parametriseret med en parameter θ Ω;

Læs mere

Elementær sandsynlighedsregning

Elementær sandsynlighedsregning Elementær sandsynlighedsregning Sandsynlighedsbegrebet Et udfaldsrum S er mængden af alle de mulige udfald af et eksperiment. En hændelse A er en delmængde af udfaldsrummet S. Et sandsynlighedsmål er en

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Den lineære normale model

Den lineære normale model Den lineære normale model Ingredienser: V : N-dimensionalt vektorrum. X : Ω V : stokastisk variabel. L : ægte underrum af V, dimension k., : fundamentalt indre produkt på V. Vi laver en hel familie af

Læs mere

Statistiske principper

Statistiske principper Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1TS Teoretisk statistik Den skriftlige prøve Sommer 2002 3 timer - alle hjælpemidler tilladt Det er tilladt at skrive

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006 Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål

Momenter som deskriptive størrelser. Hvad vi mangler fra onsdag. Momenter for sandsynlighedsmål Hvad vi mangler fra onsdag Momenter som deskriptive størrelser Sandsynlighedsmål er komplicerede objekter de tildeler numeriske værdier til alle hændelser i en σ-algebra. Vi har behov for simplere, deskriptive

Læs mere

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag.

Hvad vi mangler fra onsdag. Vi starter med at gennemgå slides fra onsdag. Hvad vi mangler fra onsdag Vi starter med at gennemgå slides 34-38 fra onsdag. Slide 1/17 Niels Richard Hansen MI forelæsninger 6. December, 2013 Momenter som deskriptive størrelser Sandsynlighedsmål er

Læs mere

Program. Longitudinale data. Vægtudvikling af geder. Individuelle profiler og gennemsnitsprofiler

Program. Longitudinale data. Vægtudvikling af geder. Individuelle profiler og gennemsnitsprofiler Program Longitudinale data eller gentagne målinger Helle Sørensen Anvendt Statistik, 4. marts 2009 Intro om data og tegninger: vægtudvikling for 28 afrikanske geder Lidt generelt om longitudinala data

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Sandsynlighedsregning Oversigt over begreber og fordelinger

Sandsynlighedsregning Oversigt over begreber og fordelinger Tue Tjur Marts 2007 Sandsynlighedsregning Oversigt over begreber og fordelinger Stat. MØK 2. år Kapitel : Sandsynlighedsfordelinger og stokastiske variable En sandsynlighedsfunktion på en mængde E (udfaldsrummet)

Læs mere