Program. Longitudinale data. Vægtudvikling af geder. Individuelle profiler og gennemsnitsprofiler
|
|
- Daniel Hald
- 7 år siden
- Visninger:
Transkript
1 Program Longitudinale data eller gentagne målinger Helle Sørensen Anvendt Statistik, 4. marts 2009 Intro om data og tegninger: vægtudvikling for 28 afrikanske geder Lidt generelt om longitudinala data Analyse af afledte størrelser Model med tilfældige effekter Seriel korrelation Diverse småting (måske) Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 1 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 2 / 20 Vægtudvikling af geder Individuelle profiler og gennemsnitsprofiler Forsøget: 28 voksne geder, syv i hver af fire behandlingsgrupper Gederne vejet ved forsøgets start samt efter 26, 45, 61, 91 dage Alle geder fik hø og majs, gruppe 1, 2 og 3 desuden blade fra forskellige vildtvoksende træer, gruppe 4 solsikkekerner (kontrol). Interesseret i effekten af fodertype på vægtudviklingen Kort serie, kunne naturligvis være længere. Tegn altid data, fx. tilvækster fra dag 0: Individuelle profiler (en per ged) Gennemsnitsprofiler (en per behandling) Hvis tidsækvidistante obs. er interaction.plot meget nyttig. weight w indiv. profiles Average increment average profiles Betydelig variation fra ged til ged (ikke overraskende), også fra start. Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 3 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 4 / 20
2 Longitudinale data/gentagne målinger Longitudinale data/gentagne målinger (2) Gededata er fra fra et designet forsøg (eksperiment), som er typisk for biologiske og medicinske anvendelser. Der er målt flere gange på hvert individ gentagne målinger eller longitudinale data. For gededata er formålet at kunne beskrive forløb over tid. Skal tage højde for korrelation mellem observationer fra samme individ i analysen Kan skelne ændringer over tid indenfor individer og forskelle mellem gruppe af individer: alders- og kohorteefekter. Eksempel: Alder og læsning (Diggle side 2). Observationelle studier kan også være longitudinale: individer følges over tid men uden at der interveneres. Divserse eksempler på longitudinale data: Store household panels hvor man registrerer arbejdsløshed, indkomst, forbrug og... på husholdningsniveau over en årrække. Studier hvor skoleelever følges over en årrække mht. matematik- eller læsekundskaber. Tag hensyn til klasser og skoler. Ernæring: glukosekoncentration i blodet i timerne efter forskellige måltid, fx. målt hvert kvarter. Hestehalthed: halthedsmålinger i timerne/dagene efter induktion af ledbetændelse i et af forknæene. Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 5 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 6 / 20 Longitudinale data/gentagne målinger (3) Referencer Gentagelserne behøver ikke være over tid: målinger i flere jorddybder eller forskellige steder på tarmen eller... Datatyper: Kvantitative normalfordelingsmodeller (husk modelkontrol!) Binære, ordinale, tælledata generaliseringer af generaliserede lineære modeller Tidsrækker vs. longitudinale data: Tidsrækker: én lang observationsserie (ingen gentagelser) Longitudinale data: flere (kortere) observationsserier Diggle, Heagerty, Liang, Zeger: Analysis of Longitudinal Data, second edition, 2002 Weiss: Modeling Longitudinal Data, 2005 Pinheiro and Bates: Mixed-Effects Models in S and S-plus, Indenfor samfundsvidenskab (økonomi) kaldes longitudinale data ofte for paneldata. Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 7 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 8 / 20
3 Analyse af afledte variable Analyse af tilvækster fra dag 0 til 91 Simpel analyse: Reducér for hver ged profilen til én observation 28 uafhængige observationer alm. lineær model Simpel, ikke-forkert, robust analyse men udnytter ikke alle data. Det vanskelige er at finde en god, relevant variabel at analysere. Gededata: Forslag til afledte variable? Model? Model for tilvækster, Y = w 91 w 0 : Resultater: Y i = α(feed i ) + βw 0,i + e i, e i iid. N(0, σ 2 ) Klart signifikant effect af fodertypen (p < ) Fodertype 1 og 3 giver størst vækst (ikke signifikant forskellige), efterfulgt af 2, mens 4 giver mindst vækst Fodertype 4 giver negativ vækst for alle relevante værdier af w 0 Forventet vækst for ged med startvægt på 13 kg: 1.79, 0.87, 1.89 hhv kg. Husk at lave modelkontrol... Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 9 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 10 / 20 Model for (næsten) alle data Model for (næsten) alle data (2) Flere forskellige rimelige modeller at bruge... Vælger at bruge startvægten som baselinemåling, dvs. som forklarende variabel i modellen. Altså betinget analyse givet startvægten. Kun vægte fra dag 26, 45, 61, 91 som responser. Lader faktoren goat indgå som tilfældig effekt: Hvis systematisk: en middelværdiparameter (et niveau) for hver ged Når goat tilfældig: et tilfældigt N-fordelt niveau for hver ged Ikke interesseret i netop disse 28 geder, tænker på gederne som tilfældigt udvalgt fra en population Genererer korrelation mellem obs. fra samme ged Kan teste for effekt af foder selvom der er effekt af ged Koordinatvis: Y i = γ(feed i ) + βw 0,i + u(goat i ) + e i hvor u(1),..., u(28) N(0, ν 2 ), e i N(0, σ 2 ), alle uafhængige. På matrixform: Y = X β + Zu + e hvor X og Z er designmatricer, Var u = ν 2 g I 28, Var e = σ 2 I 112. Variansmatricen for Y er en blok-diagonal matrix, svarende til at obs. fra forskellige geder er uafhængige. VarY i = ν 2 + σ 2 og Cov(Y i, Y j ) = ν 2 for to forskellige obs. i og j fra samme ged. Modellen kaldes ofte compound symmetry eller random intercepts. Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 11 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 12 / 20
4 Estimation og test Resultater R: lme fra nlme-pakken eller lmer fra lme4-pakken lmer er mest trendy visse funktioner, fx. estimable kun implementeret for lme Estimation, ML vs. REML: Foretrækker generelt REML-estimaterne... men ved LR-test i middelværdistruktur skal ML bruges! Test af middelværdistrukturen: for visse hypoteser kan vi lave eksakte F -test... men ikke for alle hypoteser lav derimod likelihood ratio test, dvs. fit model under og udenfor hypotese med ML og sammenlign 2(log L M log L H ) med χ 2 -fordeling kan lave simulationsbaserede p-værdier hvis der er usikkerhed om χ 2 approksimationen Modelkontrol gav ikke grund til bekymring Klart signifikant vekselvirkning ml. dag og foder (p < ) Lineær relation mellem dag og vægt mellem dag 26 og 91 kan ikke afvises (p = 0.66) Klart signifikant forskellige hældninger (p < ) og intercepts (p = ) Ingen påviselig forskel på fodertyper 1 og 3 (prøv selv!) Figur: forventede profiler for w 0 = 13. Fodertype 1 og 3 giver størst vækst, derefter 2 og endelig 4 der giver negativ vækst. Præcis som for analyse af tilvækst! Varianskomponenter: ˆν = og ˆσ = svarende til korrelation på 0.73 mellem obs. fra samme ged. Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 13 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 14 / 20 Forventet vægt for ged med startvægt på 13 kg Korrelationsstrukturer expected weight expected weight if w0= NB. Prædiktionen dur ikke alt for tæt på 0, pga. baseline Alternativ model: tilfældig skæring og tilfældig hældning Modellen fra før tog højde for variation mellem individer (u) og variation indenfor individer (e). Samme korrelation for alle par af observationer fra samme individ uanset tidsforskellen mellem dem. Ikke nødvendigvis rimeligt: måske mere rimeligt at antage at tætte obs. ligner hinanden mere end fjerne obs. Mere relevant ved længere observationsrækker. Forskellige korrelationsstrukturer dvs. ikke længere Var e = σ 2 I. Unstructured: Corr(Y i, Y j ) = ρ ti t j ingen restriktioner Diverse parametriske modeller: Corr(Y i, Y j ) = ρ(t i t j ) Compound symmetry fra før: Corr(Y i, Y j ) = ρ ens for alle i, j Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 15 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 16 / 20
5 Korrelationsstrukturer (2) Korrelationsstrukturer (3) Eksempel, Diggle-modellen : Var(Y i ) = ν 2 + σ 2 + τ 2 Cov(Y i, Y j ) = 0 hvis i og j fra forskellige geder Cov(Y i, Y j ) = ν 2 + σ 2 exp( (t i t j ) 2 /φ), fra samme ged, men i j Svarende til tre variationskilder : individer, seriel korrelation, målefejl. Modelkontrol: variogram, sammenligning af empirisk og modelbaseret korrelationsstruktur, eller rettere af 1 Corr(Y i, Y j u). Diggle-modellen er blot en blandt mange modeller med seriel korrelation! R har mindst 10, SAS vist cirka 30. Sammenligning af forskellige korrelationsstrukturer: Hvis modellerne er nestede så kan vi i princippet udføre test, men fordeling af LR er ofte ikke χ 2 -fordelt Hvis modellerne ikke er nestede benyttes ofte informationskriteriet AIC = 2 log L + 2 antal parametre i modellen. Straf for at bruge mange parametre, smaller is better Alternativ: fit unstructured model og se om der et mønster. Fornemmelse: vigtigt at tage højde for seriel korrelation hvis den er der, men nok mindre vigtigt præcis hvilken model der bruges Gededata: Diggle-modellen har lavest AIC, men næppe meget vigtigt for denne korte serie. Prøv selv at se om det gør en forskel for resultaterne. Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 17 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 18 / 20 Quasi-likelihood eller GEE GEE = generalized estimating equation. Alternativ til at lave en egentlig model for kovariansstrukture af data indenfor individ. Robusthed! Ideen er følgende: estimér middelværdiparametrene under en arbejdsantagelse fx. antagelse om uafhængighed vel vidende at den er forkert. Dette fører til en estimationsfunktion (quasi-scorefunktion) Estimatorerne er konsistente (men inefficiente) Variansmatricen for estimatoren estimeres vha. data ( sandwich-estimator ): variationen indenfor individ kan estimeres fordi vi har flere individer. Binære data Hvad hvis responsen er binær? Hvis vi for eksempel kun havde observeret om geden havde taget på siden sidst eller ej? Hvis vi kunne antage at alle observationer var uafhængige, ville vi typisk bruge en logistisk regressionsmodel: Y 1,..., Y n uafhængige med ( ) pi P(Y i = 1) = p i, log = α(feed i ) 1 p i Urimeligt observationer fra samme individ er næsten altid korrelerede! Tilfældig effekt på logit-skalaen introducerer en sådan korrelation: ( ) pi log = α(feed i ) + u(goat 1 p i ) i hvor u erne er iid. og normalfordelte. Evt. seriel korrelationsstruktur. Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 19 / 20 Helle Sørensen (IMF, KU) Longitudinale data Anv. Statistik 20 / 20
Longitudinale data. eller gentagne målinger. Helle Sørensen, Statistik, KU-LIFE. Anvendt Statistik, 5. marts 2008
Longitudinale data eller gentagne målinger Helle Sørensen, Statistik, KU-LIFE Anvendt Statistik, 5. marts 2008 Helle Sørensen (KU-LIFE) Longitudinale data Anv. Statistik 1 / 20 Dagens dataeksempler To
Læs mereIntroduktion til GLIMMIX
Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereRegressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Læs mereDemo af PROC GLIMMIX: Analyse af gentagne observationer
Demo af PROC GLIMMIX: Analyse af gentagne observationer Kristina Birch, seniorkonsulent, PS Banking Agenda Uafhængige vs. afhængige observationer Analyse af uafhængige vs. afhængige observationer Lille
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007 KM2: F22 1 Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: Manglende observationer
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereMuligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.
Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereDagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereNoter til Specialkursus i videregående statistik
Noter til Specialkursus i videregående statistik Poul Thyregod IMM, februar 2005 Indhold Forord 6 1 Momenter og flerdimensionale stokastiske variable 7 1.0 Indledning............................. 7 1.1
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereLogistisk regression
Logistisk regression Anvendt statistik Anders Tolver Jensen Institut for Grundvidenskab og Miljø Onsdag d. 25/2-2009 ATJ (IGM KU-LIFE) Logistisk regression Anvendt statistik 25/2-2009 1 / 12 (Multinomial)
Læs mereProgram. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12
Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt
Læs mereFejlstrata. Vi forestiller os at V har. 1) Et underrum L. 2) Et indre produkt, 3) En ortogonal dekomposition V = W W m
Fejlstrata Vi forestiller os at V har 1) Et underrum L 2) Et indre produkt, 3) En ortogonal dekomposition V = W 1 +... + W m Underrummene W i kaldes fejlstrata. Typisk eksempel på en fejlstratumdekomposition:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereOR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere
Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereModul 12: Regression og korrelation
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................
Læs mereKvantitative metoder 2
Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereKapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mereLøsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
Læs mereDagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22
Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som
Læs mereModul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Læs mereØkonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.
Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. 1 / 32 Motivation Eksempel: Savings = β 0 + β 1 Income + u Vi ved allerede, hvordan vi estimerer regresseionlinjen:
Læs mereVi sætter. (Signal støj- forhold) Poul Thyregod, 25. april Specialkursus vid.stat. foraar Lad Y i angiver observationer fra i te udtagne balle.
Modellens parametre Mandag den 25 april Hierarkiske normalfordelingsmodeller Dagens program: Resume af ensidet variansanalysemodel med tilfældig effekt estimation af tilfældige effekter, fortolkning som
Læs mereProgram. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Læs mereFaculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng
Læs mereUge 13 referat hold 4
Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer
Læs mereLineære normale modeller (4) udkast
E6 efterår 1999 Notat 21 Jørgen Larsen 2. december 1999 Lineære normale modeller (4) udkast 4.5 Regressionsanalyse 4.5.1 Præsentation 1 Regressionsanalyse handler om at undersøge hvordan én målt størrelse
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereProgram. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereMotivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser
Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren
Læs mereLogistisk regression
Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller
Læs mereNATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.
NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,
Læs mereØkonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006
Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences APPENDIX Basal Statistik - SPSS Korrelerede målinger. Lene Theil Skovgaard 8. april 2019 med instruktioner til SPSS-analyse svarende til nogle af slides Plots: s. 3, 4, 7, 11-12
Læs mereBasal Statistik - SPSS
Faculty of Health Sciences Basal Statistik - SPSS Korrelerede målinger. Lene Theil Skovgaard 8. april 2019 1 / 21 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Plots: s. 3, 4,
Læs mereØkonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereBenchmarking af kommunernes sagsbehandling antagelser, metode og resultater
Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mereHvorfor bøvle med MIXED
Hvorfor bøvle med MIXED E. Jørgensen 1 1 Genetik og Bioteknologi Danmarks Jordbrgsforskning Forskergrppe for Statistik og besltningsteori Årslev 18/01/2006 MIXED vs. GLM Lidt baggrnd Generel Lineær Model
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereEstimation og konfidensintervaller
Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,
Læs mereSimpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Læs mereOR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model
Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereØkonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007
Dagens program: Økonometri 1 Afslutningsforelæsning 23. maj 2007 6-trins procedure til IV estimation. Afrunding af IV: Rygning og fødselsvægt. Afrunding og perspektivering af Kvant 2. Opfølgning af introduktionsforelæsningen.
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereFlerniveau modeller. Individuelt studieforløb. Efterårssemesteret 2002. Folkesundhedsvidenskab ved Københavns Universitet
Individuelt studieforløb Efterårssemesteret 2002 Flerniveau modeller Folkesundhedsvidenskab ved Københavns Universitet Vejleder: Jørgen Holm Petersen Eksamensnummer 20 Indholdsfortegnelse 1. Indledning...3
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereSusanne Ditlevsen Institut for Matematiske Fag susanne
Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller
Læs mereInstitut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/33
Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,
Læs mereKvantitative metoder 2
Gentagne tværsnit og paneldata Kvantitative metoder 2 Gentagne tværsnit og panel data II 9. maj 2007 I dag: To-periode panel data: Følger de samme individer over to perioder (13.3-4) Unobserved effects
Læs mereKorrelation Pearson korrelationen
-9- Eidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Korrelation Kliniske målinger - Kliniske målinger og variationskilder - Estimation af størrelsen
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereForsøgsplanlægning Stikprøvestørrelse
Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder
Læs mereØkonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I
Oversigt Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I Info om prøveeksamen Mere om proxyvariabler og målefejl fra sidste gang. Selektion og dataproblemer Intro til nyt emne: Observationer
Læs mereMPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Læs mereModule 12: Mere om variansanalyse
Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........
Læs mereModule 3: Statistiske modeller
Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med
Læs mereLogistisk regression. Basal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc
Læs mereØkonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006
Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mere