Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

Relaterede dokumenter
2 Logaritme- og eksponentialfunktion 6

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

1 Multipel lineær regression

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Multipel lineær regression

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Statistik II 1. Lektion. Analyse af kontingenstabeller

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II 4. Lektion. Logistisk regression

Morten Frydenberg 14. marts 2006

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

1 Regressionsproblemet 2

Statistiske Modeller 1: Kontingenstabeller i SAS

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Morten Frydenberg 26. april 2004

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Opgavebesvarelse, Basalkursus, uge 3

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Postoperative komplikationer

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller

Konfidensintervaller og Hypotesetest

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Lineær og logistisk regression

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Basal Statistik Kategoriske Data

Logistisk regression

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Opgavebesvarelse, Basalkursus, uge 3

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

1 Hb SS Hb Sβ Hb SC = , (s = )

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Forelæsning 11: Kapitel 11: Regressionsanalyse

Dag 6: Interaktion. Overlevelsesanalyse

Eksamen i Statistik for biokemikere. Blok

9. Chi-i-anden test, case-control data, logistisk regression.

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Hver anden vil benytte øget åbningstid i dagtilbud

Træningsaktiviteter dag 3

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Personlig stemmeafgivning

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Opgavebesvarelse, Basalkursus, uge 3

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Vejledende besvarelser til opgaver i kapitel 14

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Logistisk Regression - fortsat

Logistisk regression

Vejledende løsninger kapitel 9 opgaver

Opgavebesvarelse, Basalkursus, uge 3

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Løsning til eksaminen d. 14. december 2009

Generelle lineære modeller

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Multipel Lineær Regression

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Module 4: Ensidig variansanalyse

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Kapitel 12 Variansanalyse

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Løsning til opgave i logistisk regression

Løsning til eksamen d.27 Maj 2010

Transkript:

1 Kontingenstabeller Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test 2 Logaritme- og eksponentialfunktion 3 Logistisk regression Sammenligning af odds for 2 grupper Konfidensinterval for effekt Test for effekt Beregninger i Stata Multiple prediktorer Effektmodifikation Sammenligning af flere grupper Regression på intervalvariabel Effektmodifikation af intervalvariabel PSE (I17) FSV1 Statistik - 4. lektion 1 / 34

Kontingenstabeller Krydstabeller 2 dikotome variable Vi skal studere sammenhænge mellem kategoriske variable, hvor vi først betragter situationen med dikotome variable. Aktuelt kigger vi på eksemplet med placebo/vaccine og influenza(ja/nej). Data er indtastet i Stata, hvor vi for hver kombination af faktorerne(flu og vac) angiver, hvor mange(ant) vi observerer for denne kombination. PSE (I17) FSV1 Statistik - 4. lektion 2 / 34

Kontingenstabeller Krydstabeller Krydstabel Statistics Summaries,... Frequency... Two-way... Under Main fanen fortælles, at vi vil krydstabulere vac og flu beregne Pearsons teststatistik for ingen sammenhæng de forventede antal, når der ikke er sammenhæng PSE (I17) FSV1 Statistik - 4. lektion 3 / 34

Kontingenstabeller Krydstabeller Krydstabel I Weights-fanen fortælles at de enkelte kombinationer af faktorerne vac of flu skal vægtes med deres antal (ant). Ellers tælles de som forekommende 1 gang! Dvs vi får en tabel med 4 et-taller. PSE (I17) FSV1 Statistik - 4. lektion 4 / 34

Kontingenstabeller Krydstabeller Krydstabel PSE (I17) FSV1 Statistik - 4. lektion 5 / 34

Kontingenstabeller Forventede under nulhypotesen Vi skal betragte nulhypotesen H 0 : Der er ingen sammenhæng mellem de 2 faktorer. Aktuelt: Sandsynligheden for at få influenza skal være den samme for placebo og vaccine. Under nulhypotesen er vort estimat for denne sandsynlighed ˆπ = 100 460. Da 240 vaccineres forventer vi under nulhypotesen at se E = 240ˆπ = 240 100 460 = 52.2 vaccinerede og influenzaramte. På tilsvarende vis beregnes forventede for de øvrige kombinationer af faktorerne. PSE (I17) FSV1 Statistik - 4. lektion 6 / 34

Kontingenstabeller Forventede under nulhypotesen Forventede under nulhypotesen Hvis E angiver det forventede antal i en indgang i tabellen kan dette beregnes via formlen E = rækketotal søjletotal tabeltotal Vi skal sammenligne dette forventede billede med værdierne O i den observerede tabel. Dette gøres ved at beregne Ki-kvadrat afstanden mellem de 2 tabeller Aktuelt X 2 = (O E) 2 E (20 52.2) 2 52.2 + (80 47.8)2 47.8 + (220 187.8)2 187.8 + (140 172.2)2 172.2 = 53.09 Er denne afstand stor? PSE (I17) FSV1 Statistik - 4. lektion 7 / 34

Kontingenstabeller Ki-kvadrat test Ki-kvadrat test Når H 0 er sand og alle indgange i den forventede tabel er mindst 5, så kan det vises at X 2 approsimativt følger en såkaldt χ 2 (ki-i-anden)-fordeling med df = (r 1)(c 1) frihedsgrader r: antal rækker og c: antal søjler Middeltallet af X 2 er df og standardfejlen er 2df. Vi skal altså beregne p-værdien, som den øvre halesandsynlighed i denne fordeling. Aktuelt er df = 1 hvilket betyder at X 2 = 53.09 er en exorbitant stor værdi, dvs klar evidens mod nulhypotesen. PSE (I17) FSV1 Statistik - 4. lektion 8 / 34

Kontingenstabeller Residualanalyse Residualer Forskellen O E mellem det observerede og det forventede kaldes residualet. Når denne divideres med E fås Pearson residualet pres = O E E Hvis nulhypotesen er sand kan vi tænke på pres som en z-værdi, dvs hovedparten af disse skal ligge mellem ±2. Desværre er disse ikke umiddelbart tilgængelige i Stata. Men de kan opnås ved at installere tabchi som beskrevet nedenfor. PSE (I17) FSV1 Statistik - 4. lektion 9 / 34

Kontingenstabeller Residualanalyse Residualer Tast kommandoen findit tabchi i kommandovinduet under Results-vinduet og tast Enter. Hvorefter du forhåbentlig ser Klik på tab chi linket, hvorefter du ser hvor du klikker på (click here to install) PSE (I17) FSV1 Statistik - 4. lektion 10 / 34

Kontingenstabeller Residualanalyse Residualer I kommandovinduet taster du tabchi vac flu [fw=ant], p efterfulgt af Enter. Det observerede antal med influenza i placebogruppen ligger 4.7 standardfejl over det forventede. Altså signifikant for mange. Vi kan konkludere at vaccine har en signifikant positiv effekt. PSE (I17) FSV1 Statistik - 4. lektion 11 / 34

Kontingenstabeller Eksakt test Eksakt test Hvis ikke alle indgange i den forventede tabel er mindst 5, så er χ 2 -testet dubiøst. I dette tilfælde kan man i stedet bruge Fisher s eksakte test. Dette aktiveres i Stata ved i Main-fanen at vælge Fisher s exact test i stedet for Pearson s chi-squared. PSE (I17) FSV1 Statistik - 4. lektion 12 / 34

Logaritme- og eksponentialfunktion Eksponentialfunktionen Eksponentialfunktionen defineres ud fra tallet e = 2.7182818 e u betyder e multipliceret med sig selv u gange Eksempelvis e 3 = e e e = 20.09. Der gælder at e (u+v) = e u e v Højresiden af lighedstegnet fortæller at vi multiplicerer e med sig selv hhv u og v gange og når disse multipliceres får vi et produkt, hvor e er multipliceret med sig selv u + v gange. Eksempelvis e 2 e 3 = (e e) (e e e) = e 5 PSE (I17) FSV1 Statistik - 4. lektion 13 / 34

Logaritme- og eksponentialfunktion Eksponentialfunktionen Eksponentialfunktion defineres også for negative potenser via e u = 1 e u Eksempelvis e 3 = 1 e 3 = 1 20.09 = 0.05. Eksponentialfunktionen kan udvides til også at gælde for skæve potenser ved at vedtage at e (u+v) = e u e v skal gælde for alle tal. Eksempelvis ser vi så at e 0.5 e 0.5 = e (0.5+0.5) = e hvorfor der må gælde at e 0.5 = e = 1.65 Endvidere følger at e 0 = e (1 1) = e e 1 = e e = 1 PSE (I17) FSV1 Statistik - 4. lektion 14 / 34

Logaritme- og eksponentialfunktion Logaritmefunktion Fundamentale egenskaber ved eksponentialfunktionen: e u > 0 e (u+v) = e u e v e 0 = 1 Hvis x = e u så kaldes u for logaritmen til x og betegnes log(x). Så der gælder eksempelvis log(1) = 0. Fundamentale egenskaber ved logaritmefunktionen: log(x) er kun defineret for x > 0. log(x y) = log(x) + log(y) log(x n ) = n log(x) log(1) = 0 Eksempelvis log(10 n ) = n log(10) = n 2.3, dvs hver gang vi 10-dobler forøges logaritmen blot med 2.3. Fex log(1000) log(100) = log(10) log(1) = 2.3 PSE (I17) FSV1 Statistik - 4. lektion 15 / 34

Sammenligning af odds for 2 grupper Sammenligning af odds for 2 grupper Vi vender tilbage til eksperimentet, hvor responsen er dikotom(binær), dvs der er 2 mulige udfald. Vi vil kode de 2 mulige udfald med D: Som kunne betyde syg(desased) H: Som kunne betyde rask(healthy) Ud over responsen har vi en dikotom forklarende variabel(fex behandling/eksponering), som deler populationen i 2 grupper (kaldet 0 og 1). Vi er interesseret i at sammenligne sygdomsodds for de 2 delpopulationer Odds 0 (D) = π 0 1 π 0, hvor π 0 er andelen i gruppe 0, som har status lig med D. Odds 1 (D) = π 1 1 π 1, hvor π 1 er andelen i gruppe 1, som har status lig med D. PSE (I17) FSV1 Statistik - 4. lektion 16 / 34

Sammenligning af odds for 2 grupper Sammenligning af odds for 2 grupper Vi skal basere sammenligningen på odds for gruppe1 relativt til odds fra gruppe0, det såkaldte odds ratio OR 1,0 (D) = Odds 1(D) Odds 0 (D) Hvis eksempelvis OR 1,0 (D) = 1.5, så er odds for sygdom 50% større i gruppe 1 end i gruppe 0. Ligningen ovenfor kan også skrives Odds 1 (D) = Odds 0 (D) OR 1,0 (D) Hvis gruppe1 svarer til exposure og gruppe0 kaldes baseline, så kan det udtrykkes som OddsExposure = OddsBaseline OR(Exposure) PSE (I17) FSV1 Statistik - 4. lektion 17 / 34

Sammenligning af odds for 2 grupper logodds Vi opnår den mest valide analyse ift konfidensintervaller og hypotesetest ved at transformere til log-skala: log(oddsexposure) = log(oddsbaseline) + log(or(exposure)) Vi skal indføre notationen: β 0 = log(oddsbaseline) β 1 = log(or(exposure)) Bemærk at β 1 = log(oddsexposure) log(oddsbaseline) dvs β 1 måler effekten af exposure ift baseline. Hypotesen om ingen effekt undersøges således ved at teste H 0 : β 1 = 0. PSE (I17) FSV1 Statistik - 4. lektion 18 / 34

Sammenligning af odds for 2 grupper Eksempel Med Savanne som baseline kan vi estimere logodds for baseline: ˆβ 0 = log(281/267) = 0.0511 Effekten på logodds ved at flytte til regnskoven estimeres til ˆβ 1 = log(541/213) log(281/267) = 0.881 Er denne effekt signifikant? PSE (I17) FSV1 Statistik - 4. lektion 19 / 34

Konfidensinterval for effekt Konfidensinterval Når vi skal vurdere om ˆβ 1 er signifikant større end nul, så har vi brug for dens standardfejl. Vi overlader beregningen til Stata, som rapporterer at se( ˆβ 1 ) = 0.118 Vi kan så bestemme 95% konfidensintervallet ˆβ 1 ± 1.96 se( ˆβ 1 ) som giver grænser 0.650 og 1.112, dvs effekten er tydelig. Effekten på odds findes via exponentialfunktionen: Nedre grænse: e 0.65 = 1.92, dvs vi forventer at odds forøges med mindst 92%. Øvre grænse: e 1.112 = 3.04, dvs 3-dobling. PSE (I17) FSV1 Statistik - 4. lektion 20 / 34

Test for effekt Signifikanstest Vi skal betragte nulhypotesen H 0 : β 1 = 0. På basis af ˆβ 1 og se( ˆβ 1 ) kan vi beregne z = ˆβ 1 se( ˆβ 1 ) som approksimativt følger en standard normalfordeling, hvis nulhypotesen er sand. Vi kan så på sædvanlig vis beregne den tilhørende p-værdi. Aktuelt z = 0.881 0.118 = 7.5 - langt over 3, så pværdi=0. PSE (I17) FSV1 Statistik - 4. lektion 21 / 34

Beregninger i Stata Stata Statistics Binary outcomes Logistic regression, reporting coefficients Vi skal specificere outcome (mf) og prædiktor (area). PSE (I17) FSV1 Statistik - 4. lektion 22 / 34

Beregninger i Stata Stata Vi genkender -cons svarer til area=0, dvs logodds for savanne er ˆβ 0 = 0.051. area giver effekten af area, dvs når vi går fra 0=savanne til 1=skov. Forskellen i logodds er ˆβ 1 = 0.881. Vi kan også genkende konfidensintervallet. Og klar signifikans med z = 7.49. PSE (I17) FSV1 Statistik - 4. lektion 23 / 34

Multiple prediktorer Model Når x 1 angiver dummykodning af gruppevariablen (eksponering/behandling) kan vi formulere modellen på denne måde som læses logodds = β 0 + β 1 x 1 Når x 1 = 0(baseline) er logodds β 0 Når x 1 = 1(exposure) er logodds β 0 + β 1 dvs β 1 er kontrasten/forskellen i logodds og måler effekten af eksponering. På helt samme måde som ved multipel lineær regression kan vi udvide modellen til at inkludere effekten af flere prediktorer. inkluderer effekt af x 1, x 2 og x 3. logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 PSE (I17) FSV1 Statistik - 4. lektion 24 / 34

Multiple prediktorer Eksempel Lad os inkludere køn som prediktor dvs logodds = β 0 + β 1 x 1 + β 2 x 2 x 2 = 0 for mænd og x 2 = 1 for kvinder, dvs β 2 måler forskellen fra mænd til kvinder. I Statas Model-fane: Independent variables: area sex, dvs hovedvirkning af begge faktorer. PSE (I17) FSV1 Statistik - 4. lektion 25 / 34

Multiple prediktorer Eksempel Signifikante effekter af både sex og area. Vi kan se Estimeret logodds for kvinder er ˆβ 2 = 0.484 lavere end for mænd. Konfidensintervallet -.717 til -.25 svarer til en faktor mellem e 0.717 = 0.49 og e 0.25 = 0.78 på oddsskalaen. Vi skønner altså at odds for kvinderne er mellem 1 0.78 = 22% og 1 0.49 = 51% lavere end for mænd. PSE (I17) FSV1 Statistik - 4. lektion 26 / 34

Effektmodifikation Eksempel Lad os udvide modellen til logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 LogOdds for mand på savannen(x 1 = x 2 = 0): β 0. LogOdds for mand i skoven(x 1 = 1,x 2 = 0): β 0 + β 1. SkovEffekt for mand: β 1. LogOdds for kvinde på savannen(x 1 = 0,x 2 = 1): β 0 + β 2. LogOdds for kvinde i skoven(x 1 = 1,x 2 = 1): β 0 + β 1 + β 2 + β 3. SkovEffektfor kvinde: β 1 + β 3. Forskel i skoveffekt for mænd og kvinder: β 3. Parameteren β 3 fortæller hvordan skoveffekten modificeres, når vi skifter køn fra mand til kvinde. PSE (I17) FSV1 Statistik - 4. lektion 27 / 34

Effektmodifikation Eksempel - Stata I Statas Model-fane: Independent variables: area##sex, dvs vekselvirkning/effektmodifikation mellem de 2 faktorer. Der er ikke signifikant effektmodifikation, idet ˆβ 3 = 0.401 ikke afviger signifikant fra nul (p-værdi 9.3%). Vi fastholder altså den tidligere model, hvor der er effekt af køn og en skoveffekt, som er ens for mænd og kvinder. PSE (I17) FSV1 Statistik - 4. lektion 28 / 34

Sammenligning af flere grupper Eksempel Respondenterne i vores flodblindhed undersøgelse er inddelt i aldersgrupper. Hvis x i er dummy variabel for aldersgruppe nr i, i = 1, 2, 3 skal vi kigge på modellen logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 Der gælder altså at x i = 1 hvis du tilhører aldersgruppe nr i og ellers er x i = 0, hvor i kan være 1, 2, 3. Vi kan fortolke parametrene: β 1 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 1. β 2 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 2. β 3 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 3. PSE (I17) FSV1 Statistik - 4. lektion 29 / 34

Sammenligning af flere grupper Eksempel Præfikset i. fortæller at agegrp skal dummykodes. Ellers tror Stata at det er målinger på intervalskala. PSE (I17) FSV1 Statistik - 4. lektion 30 / 34

Sammenligning af flere grupper Eksempel Vi kan konstatere at alle aldersgrupper ligger signifikant højere end baseline. Faktisk ser det ud til at ændringen i logodds er proportional med ændringen i aldersgruppe. Lad os forfølge dette med en simpel lineær regression, hvor vi betragter aldersgruppe som intervaldata. PSE (I17) FSV1 Statistik - 4. lektion 31 / 34

Regression på intervalvariabel Eksempel - Stata I Statas Model-fane: Independent variables: agegrp, der nu opfattes som metrisk. Stigningen i logodds når vi går en aldersgruppe op er signifikant med konfidensgrænser 0.805 0g 1.055. På odds skala er dette e 0.805 = 2.24 og e 1.055 = 2.87. Stigningen i odds for flodfeber er således mellem 124% og 187%, når vi bliver en aldersgruppe ældre. PSE (I17) FSV1 Statistik - 4. lektion 32 / 34

Effektmodifikation af intervalvariabel Effektmodifikation Ud over alderseffekten har vi set en effekt af area, som måske kan bortforklares af alderseffekten, hvis alderssammensætningen er forskellig på savanne og skov. Hvis skovbefolkningen generelt er ældre, så vil de have en højere sygelighed. Lad os kigge på en model med effekt af begge variable. Hvis begge variable har effekt er det også interessant at undersøge om aldereffekten er forskellig på savanne og skov. I Statas Model-fane: Independent variables: area##c.agegrp, hvor nu præfix c. fortæller at variablen er metrisk. PSE (I17) FSV1 Statistik - 4. lektion 33 / 34

Effektmodifikation af intervalvariabel Effektmodifikation LogOdds for aldersgruppe 0 på savannen er -1.443. På savannen vokser LogOdds med 0.799, når aldersgrp går 1 op. Skoveffekten i aldersgruppe 0 estimeres til 0.480. Denne er ikke signifikant. LogOdds for forskel på alderseffekten på skov og savanne er 0.343, hvilket er signifikant. Konklusion: Skov og savanne har samme odds i aldersgruppe 0. Til gengæld vokser LogOdds signifikant hurtigere med alderen i skoven(0.799+0.343=1.142) end på savannen(0.799). PSE (I17) FSV1 Statistik - 4. lektion 34 / 34