2 Logaritme- og eksponentialfunktion 6
|
|
- Lasse Michelsen
- 7 år siden
- Visninger:
Transkript
1 Indhold 1 Kontingenstabeller Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test Logaritme- og eksponentialfunktion 6 3 Logistisk regression Sammenligning af odds for 2 grupper Konfidensinterval for effekt Test for effekt Beregninger i Stata Multiple prediktorer Effektmodifikation Sammenligning af flere grupper Regression på intervalvariabel Effektmodifikation af intervalvariabel
2 1 Kontingenstabeller 1.1 Krydstabeller 2 dikotome variable Vi skal studere sammenhænge mellem kategoriske variable, hvor vi først betragter situationen med dikotome variable. Aktuelt kigger vi på eksemplet med placebo/vaccine og influenza(ja/nej). Data er indtastet i Stata, hvor vi for hver kombination af faktorerne(flu og vac) angiver, hvor mange(ant) vi observerer for denne kombination. Krydstabel Statistics Summaries,... Frequency... Two-way... Under Main fanen fortælles, at vi vil krydstabulere vac og flu beregne Pearsons teststatistik for ingen sammenhæng de forventede antal, når der ikke er sammenhæng Krydstabel 2
3 I Weights-fanen fortælles at de enkelte kombinationer af faktorerne vac of flu skal vægtes med deres antal (ant). Ellers tælles de som forekommende 1 gang! Dvs vi får en tabel med 4 et-taller. Krydstabel 3
4 1.2 Forventede under nulhypotesen Vi skal betragte nulhypotesen H 0 : Der er ingen sammenhæng mellem de 2 faktorer. Aktuelt: Sandsynligheden for at få influenza skal være den samme for placebo og vaccine. Under nulhypotesen er vort estimat for denne sandsynlighed ˆπ = 100. Da 240 vaccineres 460 forventer vi under nulhypotesen at se E = 240ˆπ = = 52.2 vaccinerede og influenzaramte. På tilsvarende vis beregnes forventede for de øvrige kombinationer af faktorerne. Forventede under nulhypotesen Hvis E angiver det forventede antal i en indgang i tabellen kan dette beregnes via formlen rækketotal søjletotal E = tabeltotal Vi skal sammenligne dette forventede billede med værdierne O i den observerede tabel. Dette gøres ved at beregne Ki-kvadrat afstanden mellem de 2 tabeller Aktuelt X 2 = (O E) 2 ( ) ( ) ( ) ( ) = Er denne afstand stor? 1.3 Ki-kvadrat test Ki-kvadrat test Når H 0 er sand og alle indgange i den forventede tabel er mindst 5, så kan det vises at X 2 approsimativt følger en såkaldt 4 E
5 χ 2 (ki-i-anden)-fordeling med df = (r 1)(c 1) frihedsgrader r: antal rækker og c: antal søjler Middeltallet af X 2 er df og standardfejlen er 2df. Vi skal altså beregne p-værdien, som den øvre halesandsynlighed i denne fordeling. Aktuelt er df = 1 hvilket betyder at X 2 = er en exorbitant stor værdi, dvs klar evidens mod nulhypotesen. 1.4 Residualanalyse Residualer Forskellen O E mellem det observerede og det forventede kaldes residualet. Når denne divideres med E fås Pearson residualet pres = O E E Hvis nulhypotesen er sand kan vi tænke på pres som en z-værdi, dvs hovedparten af disse skal ligge mellem ±2. Desværre er disse ikke umiddelbart tilgængelige i Stata. Men de kan opnås ved at installere tabchi som beskrevet nedenfor. Residualer Tast kommandoen findit tabchi i kommandovinduet under Results-vinduet og tast Enter. Hvorefter du forhåbentlig ser Klik på tab chi linket, hvorefter du ser 5
6 hvor du klikker på (click here to install) Residualer I kommandovinduet taster du tabchi vac flu [fw=ant], p efterfulgt af Enter. Det observerede antal med influenza i placebogruppen ligger 4.7 standardfejl over det forventede. Altså signifikant for mange. Vi kan konkludere at vaccine har en signifikant positiv effekt. 1.5 Eksakt test Eksakt test Hvis ikke alle indgange i den forventede tabel er mindst 5, så er χ 2 -testet dubiøst. I dette tilfælde kan man i stedet bruge Fisher s eksakte test. Dette aktiveres i Stata ved i Main-fanen at vælge Fisher s exact test i stedet for Pearson s chi-squared. 2 Logaritme- og eksponentialfunktion Eksponentialfunktionen 6
7 Eksponentialfunktionen defineres ud fra tallet Eksempelvis e 3 = e e e = Der gælder at e = e u betyder e multipliceret med sig selv u gange e (u+v) = e u e v Højresiden af lighedstegnet fortæller at vi multiplicerer e med sig selv hhv u og v gange og når disse multipliceres får vi et produkt, hvor e er multipliceret med sig selv u + v gange. Eksempelvis e 2 e 3 = (e e) (e e e) = e 5 Eksponentialfunktionen Eksponentialfunktion defineres også for negative potenser via Eksempelvis e 3 = 1 e 3 = = e u = 1 e u Eksponentialfunktionen kan udvides til også at gælde for skæve potenser ved at vedtage at e (u+v) = e u e v skal gælde for alle tal. Eksempelvis ser vi så at hvorfor der må gælde at e 0.5 = e = 1.65 Endvidere følger at e 0.5 e 0.5 = e ( ) = e e 0 = e (1 1) = e e 1 = e e = 1 Logaritmefunktion Fundamentale egenskaber ved eksponentialfunktionen: e u > 0 e (u+v) = e u e v e 0 = 1 7
8 Hvis x = e u så kaldes u for logaritmen til x og betegnes log(x). log(1) = 0. Fundamentale egenskaber ved logaritmefunktionen: Så der gælder eksempelvis log(x) er kun defineret for x > 0. log(x y) = log(x) + log(y) log(x n ) = n log(x) log(1) = 0 Eksempelvis log(10 n ) = n log(10) = n 2.3, dvs hver gang vi 10-dobler forøges logaritmen blot med 2.3. Fex log(1000) log(100) = log(10) log(1) = Logistisk regression 3.1 Sammenligning af odds for 2 grupper Sammenligning af odds for 2 grupper Vi vender tilbage til eksperimentet, hvor responsen er dikotom(binær), dvs der er 2 mulige udfald. Vi vil kode de 2 mulige udfald med D: Som kunne betyde syg(desased) H: Som kunne betyde rask(healthy) Ud over responsen har vi en dikotom forklarende variabel(fex behandling/eksponering), som deler populationen i 2 grupper (kaldet 0 og 1). Vi er interesseret i at sammenligne sygdomsodds for de 2 delpopulationer Odds 0 (D) = π 0 1 π 0, hvor π 0 er andelen i gruppe 0, som har status lig med D. Odds 1 (D) = π 1 1 π 1, hvor π 1 er andelen i gruppe 1, som har status lig med D. Sammenligning af odds for 2 grupper Vi skal basere sammenligningen på odds for gruppe1 relativt til odds fra gruppe0, det såkaldte odds ratio OR 1,0 (D) = Odds 1(D) Odds 0 (D) 8
9 Hvis eksempelvis OR 1,0 (D) = 1.5, så er odds for sygdom 50% større i gruppe 1 end i gruppe 0. Ligningen ovenfor kan også skrives Odds 1 (D) = Odds 0 (D) OR 1,0 (D) Hvis gruppe1 svarer til exposure og gruppe0 kaldes baseline, så kan det udtrykkes som OddsExposure = OddsBaseline OR(Exposure) logodds Vi opnår den mest valide analyse ift konfidensintervaller og hypotesetest ved at transformere til log-skala: log(oddsexposure) = log(oddsbaseline) + log(or(exposure)) Vi skal indføre notationen: β 0 = log(oddsbaseline) β 1 = log(or(exposure)) Bemærk at β 1 = log(oddsexposure) log(oddsbaseline) dvs β 1 måler effekten af exposure ift baseline. Hypotesen om ingen effekt undersøges således ved at teste H 0 : β 1 = 0. Eksempel Med Savanne som baseline kan vi estimere logodds for baseline: 9
10 ˆβ 0 = log(281/267) = Effekten på logodds ved at flytte til regnskoven estimeres til ˆβ 1 = log(541/213) log(281/267) = Er denne effekt signifikant? 3.2 Konfidensinterval for effekt Konfidensinterval Når vi skal vurdere om ˆβ 1 er signifikant større end nul, så har vi brug for dens standardfejl. Vi overlader beregningen til Stata, som rapporterer at se( ˆβ 1 ) = Vi kan så bestemme 95% konfidensintervallet ˆβ 1 ± 1.96 se( ˆβ 1 ) som giver grænser og 1.112, dvs effekten er tydelig. Effekten på odds findes via exponentialfunktionen: Nedre grænse: e 0.65 = 1.92, dvs vi forventer at odds forøges med mindst 92%. Øvre grænse: e = 3.04, dvs 3-dobling. 3.3 Test for effekt Signifikanstest Vi skal betragte nulhypotesen H 0 : β 1 = 0. På basis af ˆβ 1 og se( ˆβ 1 ) kan vi beregne z = ˆβ 1 se( ˆβ 1 ) som approksimativt følger en standard normalfordeling, hvis nulhypotesen er sand. Vi kan så på sædvanlig vis beregne den tilhørende p-værdi. Aktuelt z = = langt over 3, så pværdi=0. 10
11 3.4 Beregninger i Stata Stata Statistics Binary outcomes Logistic regression, reporting coefficients Vi skal specificere outcome (mf) og prædiktor (area). Stata Vi genkender -cons svarer til area=0, dvs logodds for savanne er ˆβ 0 = area giver effekten af area, dvs når vi går fra 0=savanne til 1=skov. Forskellen i logodds er ˆβ 1 = Vi kan også genkende konfidensintervallet. Og klar signifikans med z = Multiple prediktorer Model Når x 1 angiver dummykodning af gruppevariablen (eksponering/behandling) kan vi formulere modellen på denne måde logodds = β 0 + β 1 x 1 11
12 som læses Når x 1 = 0(baseline) er logodds β 0 Når x 1 = 1(exposure) er logodds β 0 + β 1 dvs β 1 er kontrasten/forskellen i logodds og måler effekten af eksponering. På helt samme måde som ved multipel lineær regression kan vi udvide modellen til at inkludere effekten af flere prediktorer. inkluderer effekt af x 1, x 2 og x 3. Eksempel logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 Lad os inkludere køn som prediktor dvs logodds = β 0 + β 1 x 1 + β 2 x 2 x 2 = 0 for mænd og x 2 = 1 for kvinder, dvs β 2 måler forskellen fra mænd til kvinder. I Statas Model-fane: Independent variables: area sex, dvs hovedvirkning af begge faktorer. Eksempel Signifikante effekter af både sex og area. Vi kan se 12
13 Estimeret logodds for kvinder er ˆβ 2 = lavere end for mænd. Konfidensintervallet til -.25 svarer til en faktor mellem e = 0.49 og e 0.25 = 0.78 på oddsskalaen. Vi skønner altså at odds for kvinderne er mellem = 22% og = 51% lavere end for mænd. 3.6 Effektmodifikation Eksempel Lad os udvide modellen til logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 LogOdds for mand på savannen(x 1 = x 2 = 0): β 0. LogOdds for mand i skoven(x 1 = 1,x 2 = 0): β 0 + β 1. SkovEffekt for mand: β 1. LogOdds for kvinde på savannen(x 1 = 0,x 2 = 1): β 0 + β 2. LogOdds for kvinde i skoven(x 1 = 1,x 2 = 1): β 0 + β 1 + β 2 + β 3. SkovEffektfor kvinde: β 1 + β 3. Forskel i skoveffekt for mænd og kvinder: β 3. Parameteren β 3 fortæller hvordan skoveffekten modificeres, når vi skifter køn fra mand til kvinde. Eksempel - Stata I Statas Model-fane: Independent variables: area##sex, dvs vekselvirkning/effektmodifikation mellem de 2 faktorer. 13
14 Der er ikke signifikant effektmodifikation, idet ˆβ 3 = ikke afviger signifikant fra nul (p-værdi 9.3%). Vi fastholder altså den tidligere model, hvor der er effekt af køn og en skoveffekt, som er ens for mænd og kvinder. 3.7 Sammenligning af flere grupper Eksempel Respondenterne i vores flodblindhed undersøgelse er inddelt i aldersgrupper. Hvis x i er dummy variabel for aldersgruppe nr i, i = 1, 2, 3 skal vi kigge på modellen logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 Der gælder altså at x i = 1 hvis du tilhører aldersgruppe nr i og ellers er x i = 0, hvor i kan være 1, 2, 3. Vi kan fortolke parametrene: β 1 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 1. β 2 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 2. β 3 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 3. Eksempel 14
15 Præfikset i. fortæller at agegrp skal dummykodes. Ellers tror Stata at det er målinger på intervalskala. Eksempel Vi kan konstatere at alle aldersgrupper ligger signifikant højere end baseline. Faktisk ser det ud til at ændringen i logodds er proportional med ændringen i aldersgruppe. Lad os forfølge dette med en simpel lineær regression, hvor vi betragter aldersgruppe som intervaldata. 3.8 Regression på intervalvariabel Eksempel - Stata I Statas Model-fane: Independent variables: agegrp, der nu opfattes som metrisk. 15
16 Stigningen i logodds når vi går en aldersgruppe op er signifikant med konfidensgrænser g På odds skala er dette e = 2.24 og e = Stigningen i odds for flodfeber er således mellem 124% og 187%, når vi bliver en aldersgruppe ældre. 3.9 Effektmodifikation af intervalvariabel Effektmodifikation Ud over alderseffekten har vi set en effekt af area, som måske kan bortforklares af alderseffekten, hvis alderssammensætningen er forskellig på savanne og skov. Hvis skovbefolkningen generelt er ældre, så vil de have en højere sygelighed. Lad os kigge på en model med effekt af begge variable. Hvis begge variable har effekt er det også interessant at undersøge om aldereffekten er forskellig på savanne og skov. I Statas Model-fane: Independent variables: area##c.agegrp, hvor nu præfix c. metrisk. fortæller at variablen er Effektmodifikation LogOdds for aldersgruppe 0 på savannen er På savannen vokser LogOdds med 0.799, når aldersgrp går 1 op. 16
17 Skoveffekten i aldersgruppe 0 estimeres til Denne er ikke signifikant. LogOdds for forskel på alderseffekten på skov og savanne er 0.343, hvilket er signifikant. Konklusion: Skov og savanne har samme odds i aldersgruppe 0. Til gengæld vokser LogOdds signifikant hurtigere med alderen i skoven( =1.142) end på savannen(0.799). 17
Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test
1 Kontingenstabeller Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test 2 Logaritme- og eksponentialfunktion 3 Logistisk regression Sammenligning af odds for 2 grupper
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereOverlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.
1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen
Læs mere1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2
Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier
Læs mereBetinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary
1 Kontingenstabeller Betinget fordeling Uafhængighed 2 Chi-kvadrat test for uafhængighed Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary
Læs mereHvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver
Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver -
Læs mere1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...
Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................
Læs mere1 Multipel lineær regression
Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R
Læs mereHvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau
Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi
Læs mere1 Multipel lineær regression
1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereOversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens
Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mereIndhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9
Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereStatistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004
Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs merePostoperative komplikationer
Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereMantel-Haenszel analyser. Stratificerede epidemiologiske analyser
Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereLogistisk regression
Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk 21. marts 2013 Dagens program Chi-i-anden (χ 2 )-testet Sandsynligheder,
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereBasal Statistik Kategoriske Data
Basal Statistik Kategoriske Data 8 oktober 2013 E 2013 Basal Statistik - Kategoriske data Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereLogistisk regression
Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/regression2012/
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereStatistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereOpsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller
Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende
Læs mereDag 6: Interaktion. Overlevelsesanalyse
Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereAnvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele
Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om
Læs mereTænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.
Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og
Læs mere9. Chi-i-anden test, case-control data, logistisk regression.
Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereHvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller
Hvad skal vi lave? 1 Kovariansanalyse Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning 2 Sammenligning af modeller 3 Mere generelle modeller PSE (I17) ASTA - 14. lektion
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereTræningsaktiviteter dag 3
Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk
Læs merePersonlig stemmeafgivning
Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereLogistisk regression
Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18 Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereLogistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Læs mereVejledende løsninger kapitel 9 opgaver
KAPITEL 9 OPGAVE 1 a) Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H 1 : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Ny metode Gammel metode
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereLogistisk regression. Basal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc
Læs mere13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...
Modul 13: Exercises 13.1 Substrat.......................... 1 13.2 Polynomiel regression.................. 3 13.3 Biomasse.......................... 4 13.4 Kreatinin.......................... 7 13.5 Læsefærdighed......................
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mere13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 13: Exercises 13.1 Substrat........................................ 1 13.2 Polynomiel regression................................
Læs mereHvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereVejledende besvarelser til opgaver i kapitel 14
Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereVi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.
Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i
Læs mereTrin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse
Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereLøsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereOR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere
Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver
Læs mereBenchmarking af kommunernes sagsbehandling antagelser, metode og resultater
Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold
Læs mereProgram. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Læs mereStastistik og Databehandling på en TI-83
Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Læs mere