µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005

Størrelse: px
Starte visningen fra side:

Download "µ = κ (θ); Kanonisk link, θ = g(µ) Poul Thyregod, 9. maj Specialkursus vid.stat. foraar 2005"

Transkript

1 Hierarkiske generaliserede lineære modeller Lee og Nelder, Biometrika (21) 88, pp Dagens program: Mandag den 2. maj Hierarkiske generaliserede lineære modeller - Afslutning Hierarkisk generaliseret lineær model Lidt mere om andre likelihood er og censurerede observationer Lidt om repræsentatitivitet Slut Ingredienser: Betinget fordeling af Y for givet θ følger en exponentiel dispersionsparameterfamilie på grundform f Y (y; θ, λ) =c(y, λ)exp[λ{θy κ(θ)}] for θ Ω Middelværdirum M (for µ) - kanonisk parameterrum Ω (for θ) µ = κ (θ); Kanonisk link, θ = g(µ) konjugeret fordeling af kanonisk parameter, θ 1 g θ (θ; m, γ) = exp{[θm κ(θ)]/γ} C(m, γ) og tilsvarende konjugeret fordeling af middelværdiparameter, µ Eks: f Y (y) Poisson, g µ (µ) Gamma, link= log, dvs g(µ) = log(µ) 1 3 ɛ N(, R) og U N(, D) Vi husker en Generel lineær mixed model Y = Xβ + ZU + ɛ Hierarkiske generaliserede lineære modeller Vi har responser y 1,y 2,...,y k ( M)oguobserverede tilstandsvariable u 1,u 2,...,u q ( M) med de tilsvarende uobserverede kanoniske variable v i = g(u i ). ( Ω) Fixed effects β (designmatrix X ) Random effects U (designmatrix Z ) E[Y u] =µ=xβ+zu Mixed effect ligningerne ( X R 1 X X R 1 Z Z R 1 X Z R 1 Z+D 1 )( ) β = u løses ved iteration - og iterativ bestemmelse af parametre i R og D ( ) X R 1 y Z R 1 y Lineær prædiktor θ = g(µ v) =Xβ+Zv Fordeling af v Ω er konjugeret fordeling til kanonisk parameter θ. Fordeling af U Mer den tilsvarende konjugerede fordeling til middelværdiparameter µ. E[U] =ψ og så bliver fordelingen af Y den tilsvarende marginale fordeling. For Y µ Poisson vælges fordeling af v så u =ln(v)er gamma med middelværdi ψ =1,også bliver fordelingen af Y en negativ binomialfordeling med parametre bestemt af Xβ og af Zv. Estimaterne for u er BLUP-estimater. Varianser estimeres sævanligvis ved REML Estimation ved en udvidet generaliseret lineær model for y, ψ, se Lee og Nelder. 2 4

2 Indskud: Lidt mere om likelihood er Estimation i hierarkisk generaliseret lineær model Estimation af middelværdiparametre β og v ( X Σ 1 X X Σ 1 Z Z Σ 1 X Z Σ 1 Z+Σ 1 1 )( ) ( β = v X Σ 1 z Z Σ 1 z +Σ 1 1 z 1 hvor z = η +(y µ )( η / µ ) og z 1 = v 1 +(ψ 1 ) u)(dv 1 /du) er de justerede afhængige variable hhv for fordelingen af y givet v og og af v. ) Likelihoodfunktion defineret ved simultan tæthed af observationerne som funktion af parametre. Udtrykker grad af overensstemmelse mellem parameter og data. Der kan vises en række gode egenskaber for maksimum-likelihood estimat. Vi opfandt quasi-likelihood til situationer, hvor vi minimerede devians (defineret ved en variansfunktion), og så bort fra normeringskonstanten og når vi havde overdispersion (udtrykt ved en dispersionsparameter) Løses ved iteration Når man opfinder en variant af likelihoodbegrebet skal man principielt eftervise at en række gode egenskaber (konvergens mod sand værdi for voksende stikprøvestørrelse) stadig gælder 5 7 Generaliseret lineær mixed model Indskud: nok en likelihoodvariant En hybrid Eksempel tælleprocesser (levetider) θ = g(µ v) =Xβ+Zv Fordeling af v Ω modelleres som en normalfordeling. 91 komponenter under test. Efter et år er 8 af komponenterne fejlede, mens de resterende 83 stadig virker. dvs vi har 8 levetider, t 1,t 2,...,t 8 og viden om at de resterende 83 levetider er større end et år. Censurerede observationer. Giver anledning til en anden udvidelse af likelihoodbegrebet, partial likelihood Vi vil ikke diskutere dette begreb, men vi vil lige se nogle begreber, der optræder i forbindelse med levetidsmodeller Fordelingen af den mindste blandt 91 er anderledes end fordelingen af en tilfældig af de

3 Tælleprocesser, hazardfunktion Positiv stokastisk variabel, T. Tæthedsfunktion f T (t), kumuleret fordeling F T (t) =P[T t]= t f T (x)dx Overlevelsesfunktion (survival function) R T (t) =1 F T (t)=p[t>t] Hazardfunktion λ T (t) = f T(t) 1 F T (t) = dlog R T(t) dt ssh for at dø netop til tid t, når man har overlevet op til t ( t ) ( ) R T (t) =exp λ T (u)du =exp Λ(t) hvor Λ(t) angiver den kumulerede hazard Λ(t) = t λ T (u)du log-lineære modeller, modeller med proportionale hazards

4 Der udvælges en stikprøve tilfældigt blandt personer i Danmark, og man spørger, hvor mange personer, der bor i deres husstand. Man får et gennemsnit på 3.8 personer. Er dette udtryk for at den gennemsnitlige husstandsstørrelse er på ca. 3.8 personer?? Konkurrerende risici Eksempel: opholdstid på DTU 14 16

5 Oversigt Udgangspunkt generel lineær model (normalfordeling, konstant varians) µ = Xβ Likelihood metode svarer til mindste kvadraters metode, projektioner i vektorrum (pga linearitet) Udvidelse, generalisering i to retninger: til andre responsfordelinger, generaliserede lineære modeller varians afhænger af middelværdi. Ved estimation vægtes observationer med deres præcision til hierarkiske modeller, generel lineær mixed model Observationer korrelerede, BLUP-estimation, empirisk Bayes, krympning mod fælles gennemsnit Analoge situationer Rejsehyppighed/længde for buspassagerer liggedage på hospitaler Fiberlængde i garn 18

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable IMM, 00--6 Poul Thyregod Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable Todimensionale stokastiske variable Lærebogens afsnit 4 introducerede sandsynlighedsmodeller formuleret

Læs mere

Lær nemt! Statistik - Kompendium

Lær nemt! Statistik - Kompendium David Brink Lær nemt! Statistik - Kompendium Ventus wwwventusdk Lær nemt! Statistik - Kompendium 005 David Brink Nielsen og Ventus Download kompendiet gratis på wwwventusdk ISBN 87-7681-01-7 Ventus Falkoner

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse.

Skriv punkternes koordinater i regnearket, og brug værktøjet To variabel regressionsanalyse. Opdateret 28. maj 2014. MD Ofte brugte kommandoer i Geogebra. Generelle Punktet navngives A Geogebra navngiver punktet Funktionen navngives f Funktionen navngives af Geogebra Punktet på grafen for f med

Læs mere

Uafhængighed et eksempel på en rød tråd i statistikken

Uafhængighed et eksempel på en rød tråd i statistikken Uafhængighed et eksempel på en rød tråd i statistikken Statistiknoter til TI-Nspire CAS version 3.1 Bjørn Felsager Revideret November 2011 329 Uafhængighed et eksempel på en rød tråd i statistikken Chi-i-anden-testen

Læs mere

Differential- regning

Differential- regning Differential- regning del () f () m l () 6 Karsten Juul Indhold Tretrinsreglen 59 Formler for differentialkvotienter64 Regneregler for differentialkvotienter67 Differentialkvotient af sammensat funktion7

Læs mere

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres)

Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Grupperede observationer et eksempel. (begreber fra MatC genopfriskes og varians og spredning indføres) Til Gribskovløbet 006 gennemførte 118 kvinder 1,4 km distancen. Fordelingen af kvindernes løbstider

Læs mere

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp.

Løs nu opgaverne i a) brug alt materialet her samt evt. regnearkene i Fronter som hjælp. Udarbejdet af Thomas Jensen og Morten Overgård Nielsen Indhold Introduktion til materialet. s. 2 Introduktion til chi i anden test. s. 4 Et eksempel hastighed og ulykker på motorveje s. 8 Sådan udregnes

Læs mere

Sådan gør du i GeoGebra.

Sådan gør du i GeoGebra. Sådan gør du i GeoGebra. Det første vi skal prøve er at tegne matematiske figurer. Tegne: Lad os tegne en trekant. Klik på trekant knappen Klik på punktet ved (1,1), (4,1) (4,5) og til sidst igen på (1,1)

Læs mere

Mini-formelsamling. Matematik 1

Mini-formelsamling. Matematik 1 Indholdsfortegnelse 1 Diverse nyttige regneregler... 1 1.1 Regneregler for brøker... 1 1.2 Potensregneregler... 1 1.3 Kvadratsætninger... 2 1.4 (Nogle) Rod-regneregler... 2 1.5 Den naturlige logaritme...

Læs mere

En statistikstuderendes bekendelser Søren Wengel Mogensen

En statistikstuderendes bekendelser Søren Wengel Mogensen Oplysning 23 En statistikstuderendes bekendelser Søren Wengel Mogensen Om at skrive BSc-opgave i anvendt statistik. Der findes matematikere (i hvert fald matematikstuderende), der mener, at den rene matematik

Læs mere

Bevægelse i to dimensioner

Bevægelse i to dimensioner Side af 7 Bevægelse i to dimensioner Når man beskriver bevægelse i to dimensioner, som funktion af tiden, ser man bevægelsen som var den i et almindeligt koordinatsystem (med x- og y-akse). Ud fra dette

Læs mere

Indvandringen til Danmark har det kostet danskere deres arbejde?

Indvandringen til Danmark har det kostet danskere deres arbejde? Søkelys på Norden Nikolaj Malchow-Møller, Jakob Roland Munch og Jan Rose Skaksen Indvandringen til Danmark har det kostet danskere deres arbejde? Den relativt store indvandring til Danmark gennem de sidste

Læs mere

Kom i gang med JMP. Jens E. Overø. Gorm Gabrielsen. Statistik og analyse for økonomistuderende. Lektor i statistik. Lektor i statistik

Kom i gang med JMP. Jens E. Overø. Gorm Gabrielsen. Statistik og analyse for økonomistuderende. Lektor i statistik. Lektor i statistik Gorm Gabrielsen Lektor i statistik Jens E. Overø Lektor i statistik Kom i gang med JMP Statistik og analyse for økonomistuderende Copyright 2011 SAS Institute A/S, Copenhagen Denmark ISBN 978-87-984612-1-0

Læs mere

Hvad er meningen? Et forløb om opinionsundersøgelser

Hvad er meningen? Et forløb om opinionsundersøgelser Hvad er meningen? Et forløb om opinionsundersøgelser Jette Rygaard Poulsen, Frederikshavn Gymnasium og HF-kursus Hans Vestergaard, Frederikshavn Gymnasium og HF-kursus Søren Lundbye-Christensen, AAU 17-10-2004

Læs mere

En differentiabel funktion hvis afledte ikke er kontinuert Søren Knudby

En differentiabel funktion hvis afledte ikke er kontinuert Søren Knudby 24 En differentiabel funktion hvis afledte ikke er kontinuert Søren Knudby Det er velkendt for de fleste, at differentiabilitet af en reel funktion f medfører kontinuitet af f, mens det modsatte ikke gælder

Læs mere

Oversigt over Procent, absolut og relativ tilvækst samt indekstal

Oversigt over Procent, absolut og relativ tilvækst samt indekstal Oversigt over Procent, absolut og relativ tilvækst samt indekstal Indhold Oversigt over Procent, absolut og relativ tilvækst samt indekstal... 1 Procent... 1 Hvad er én procent?... 1 Procentsatser over

Læs mere

Arealet af en trekant Der er mange formler for arealet af en trekant. Den mest kendte er selvfølgelig

Arealet af en trekant Der er mange formler for arealet af en trekant. Den mest kendte er selvfølgelig Arealet af en trekant Der er mange formler for arealet af en trekant. Den mest kendte er selvfølgelig som også findes i en trigonometrisk variant, den såkaldte 'appelsin'-formel: Men da en trekants form

Læs mere

Jeg er bare den logerende

Jeg er bare den logerende Jeg er bare den logerende Arbejdsopgaver til grundskolen (8.-10.klasse) til kortfilm af Lone Scherfig Se filmen på aiu.dk/mediehandbogen/opgaver/pressens-rolle Det er en god ide at begynde arbejdet med

Læs mere

INDHOLDSFORTEGNELSE. Side Indledning 2. Kapitel 1 Introduktion til funktioner af 2 variable 3 Niveaukurver 5

INDHOLDSFORTEGNELSE. Side Indledning 2. Kapitel 1 Introduktion til funktioner af 2 variable 3 Niveaukurver 5 INDHOLDSFORTEGNELSE Side Indledning Kapitel 1 Introduktion til funktioner af variable 3 Niveaukurver 5 Kapitel Partiel differentiation og gradienten 7 Kapitel 3 Differentialet 1 Fejlvurdering 13 Tangentplan

Læs mere

Her er et spørgsmål, du måske aldrig har overvejet: kan man finde to trekanter med samme areal?

Her er et spørgsmål, du måske aldrig har overvejet: kan man finde to trekanter med samme areal? Her er et spørgsmål, du måske aldrig har overvejet: kan man finde to trekanter med samme areal? Det er ret let at svare på: arealet af en trekant, husker vi fra vor kære folkeskole, findes ved at gange

Læs mere

En Introduktion til Statistik

En Introduktion til Statistik En Introduktion til Statistik Bind 1A Knut Conradsen 7. udgave Lyngby 1999 IMM 2 Forord Med denne (foreløbige) udgave af En Introduktion til Statistik er der påbegyndt en mere gennemgribende revision af

Læs mere

Produktivitetsforskelle mellem danske virksomheder - afhængighed af brancheforhold

Produktivitetsforskelle mellem danske virksomheder - afhængighed af brancheforhold Produktivitetsforskelle mellem danske virksomheder - afhængighed af brancheforhold Erik Strøjer Madsen 1,2 Tor Eriksson 1 Valdemar Smith 3,2 Mogens Dilling-Hansen 4,2 Abstract The paper examines the dispersion

Læs mere

HER ER FAMILIEN DANMARK

HER ER FAMILIEN DANMARK HER ER FAMILIEN DANMARK Der er cirka 800.000 børnefamilier i Danmark, men en børnefamilie er faktisk et vidt begreb, og det kan man for alvor få syn for, hvis man dykker ned i Danmarks Statistiks tal om

Læs mere

2. Modellen og dens brug

2. Modellen og dens brug 2. Modellen og dens brug Kapitel 2. Modellen og dens brug 11 ADAM er en empirisk makroøkonomisk model af den danske økonomi. En makroøkonomisk model er en forenklet, matematisk beskrivelse af de centrale

Læs mere

Den sociale arv er ligeså stærk som for 20 år siden

Den sociale arv er ligeså stærk som for 20 år siden Den sociale arv er ligeså stærk som for år siden Forældrenes uddannelsesniveau er helt afgørende for, om børnene får en uddannelse. Jo højere forældrenes uddannelse er, desto større er sandsynligheden

Læs mere

Medlemsrabat og særlige dækninger. Forsikringer der giver dig mere tryghed i hverdagen

Medlemsrabat og særlige dækninger. Forsikringer der giver dig mere tryghed i hverdagen Medlemsrabat og særlige dækninger Forsikringer der giver dig mere tryghed i hverdagen 2015 Indhold: SÆRLIGE MEDLEMSFORDELE Indboforsikring Bilforsikring Husforsikring Øvrige private forsikringer Lønforsikring

Læs mere

Kapital- og rentesregning

Kapital- og rentesregning Rentesregning Rettet den 28-12-11 Kapital- og rentesregning Kapital- og rentesregning Navngivning ved rentesregning I eksempler som Niels Oles, hvor man indskyder en kapital i en bank (én gang), og banken

Læs mere

Kvinder trækker læsset i hjemmet mænd prioriterer jobbet

Kvinder trækker læsset i hjemmet mænd prioriterer jobbet Morten Bue Rath og Martin Hornstrup Januar 2010 Kvinder trækker læsset i hjemmet mænd prioriterer jobbet Betragter man den samlede ugentlige på arbejdsmarkedet og i hjemmet, arbejder mænd og kvinder stort

Læs mere

Metoder og instrumenter til resultatmåling af indsatser over for demente psykometriske begreber

Metoder og instrumenter til resultatmåling af indsatser over for demente psykometriske begreber Metoder og instrumenter til resultatmåling af indsatser over for demente psykometriske begreber Charlotte Horsted Terkel Christiansen Health Economics Papers 2004:3 Indhold Instrumenter til måling af sundhedsstatus

Læs mere