Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test"

Transkript

1 1 Kontingenstabeller Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test 2 Logaritme- og eksponentialfunktion 3 Logistisk regression Sammenligning af odds for 2 grupper Konfidensinterval for effekt Test for effekt Beregninger i Stata Multiple prediktorer Effektmodifikation Sammenligning af flere grupper Regression på intervalvariabel Effektmodifikation af intervalvariabel PSE (I17) FSV1 Statistik - 4. lektion 1 / 34

2 Kontingenstabeller Krydstabeller 2 dikotome variable Vi skal studere sammenhænge mellem kategoriske variable, hvor vi først betragter situationen med dikotome variable. Aktuelt kigger vi på eksemplet med placebo/vaccine og influenza(ja/nej). Data er indtastet i Stata, hvor vi for hver kombination af faktorerne(flu og vac) angiver, hvor mange(ant) vi observerer for denne kombination. PSE (I17) FSV1 Statistik - 4. lektion 2 / 34

3 Kontingenstabeller Krydstabeller Krydstabel Statistics Summaries,... Frequency... Two-way... Under Main fanen fortælles, at vi vil krydstabulere vac og flu beregne Pearsons teststatistik for ingen sammenhæng de forventede antal, når der ikke er sammenhæng PSE (I17) FSV1 Statistik - 4. lektion 3 / 34

4 Kontingenstabeller Krydstabeller Krydstabel I Weights-fanen fortælles at de enkelte kombinationer af faktorerne vac of flu skal vægtes med deres antal (ant). Ellers tælles de som forekommende 1 gang! Dvs vi får en tabel med 4 et-taller. PSE (I17) FSV1 Statistik - 4. lektion 4 / 34

5 Kontingenstabeller Krydstabeller Krydstabel PSE (I17) FSV1 Statistik - 4. lektion 5 / 34

6 Kontingenstabeller Forventede under nulhypotesen Vi skal betragte nulhypotesen H 0 : Der er ingen sammenhæng mellem de 2 faktorer. Aktuelt: Sandsynligheden for at få influenza skal være den samme for placebo og vaccine. Under nulhypotesen er vort estimat for denne sandsynlighed ˆπ = Da 240 vaccineres forventer vi under nulhypotesen at se E = 240ˆπ = = 52.2 vaccinerede og influenzaramte. På tilsvarende vis beregnes forventede for de øvrige kombinationer af faktorerne. PSE (I17) FSV1 Statistik - 4. lektion 6 / 34

7 Kontingenstabeller Forventede under nulhypotesen Forventede under nulhypotesen Hvis E angiver det forventede antal i en indgang i tabellen kan dette beregnes via formlen E = rækketotal søjletotal tabeltotal Vi skal sammenligne dette forventede billede med værdierne O i den observerede tabel. Dette gøres ved at beregne Ki-kvadrat afstanden mellem de 2 tabeller Aktuelt X 2 = (O E) 2 E ( ) ( ) ( ) ( ) = Er denne afstand stor? PSE (I17) FSV1 Statistik - 4. lektion 7 / 34

8 Kontingenstabeller Ki-kvadrat test Ki-kvadrat test Når H 0 er sand og alle indgange i den forventede tabel er mindst 5, så kan det vises at X 2 approsimativt følger en såkaldt χ 2 (ki-i-anden)-fordeling med df = (r 1)(c 1) frihedsgrader r: antal rækker og c: antal søjler Middeltallet af X 2 er df og standardfejlen er 2df. Vi skal altså beregne p-værdien, som den øvre halesandsynlighed i denne fordeling. Aktuelt er df = 1 hvilket betyder at X 2 = er en exorbitant stor værdi, dvs klar evidens mod nulhypotesen. PSE (I17) FSV1 Statistik - 4. lektion 8 / 34

9 Kontingenstabeller Residualanalyse Residualer Forskellen O E mellem det observerede og det forventede kaldes residualet. Når denne divideres med E fås Pearson residualet pres = O E E Hvis nulhypotesen er sand kan vi tænke på pres som en z-værdi, dvs hovedparten af disse skal ligge mellem ±2. Desværre er disse ikke umiddelbart tilgængelige i Stata. Men de kan opnås ved at installere tabchi som beskrevet nedenfor. PSE (I17) FSV1 Statistik - 4. lektion 9 / 34

10 Kontingenstabeller Residualanalyse Residualer Tast kommandoen findit tabchi i kommandovinduet under Results-vinduet og tast Enter. Hvorefter du forhåbentlig ser Klik på tab chi linket, hvorefter du ser hvor du klikker på (click here to install) PSE (I17) FSV1 Statistik - 4. lektion 10 / 34

11 Kontingenstabeller Residualanalyse Residualer I kommandovinduet taster du tabchi vac flu [fw=ant], p efterfulgt af Enter. Det observerede antal med influenza i placebogruppen ligger 4.7 standardfejl over det forventede. Altså signifikant for mange. Vi kan konkludere at vaccine har en signifikant positiv effekt. PSE (I17) FSV1 Statistik - 4. lektion 11 / 34

12 Kontingenstabeller Eksakt test Eksakt test Hvis ikke alle indgange i den forventede tabel er mindst 5, så er χ 2 -testet dubiøst. I dette tilfælde kan man i stedet bruge Fisher s eksakte test. Dette aktiveres i Stata ved i Main-fanen at vælge Fisher s exact test i stedet for Pearson s chi-squared. PSE (I17) FSV1 Statistik - 4. lektion 12 / 34

13 Logaritme- og eksponentialfunktion Eksponentialfunktionen Eksponentialfunktionen defineres ud fra tallet e = e u betyder e multipliceret med sig selv u gange Eksempelvis e 3 = e e e = Der gælder at e (u+v) = e u e v Højresiden af lighedstegnet fortæller at vi multiplicerer e med sig selv hhv u og v gange og når disse multipliceres får vi et produkt, hvor e er multipliceret med sig selv u + v gange. Eksempelvis e 2 e 3 = (e e) (e e e) = e 5 PSE (I17) FSV1 Statistik - 4. lektion 13 / 34

14 Logaritme- og eksponentialfunktion Eksponentialfunktionen Eksponentialfunktion defineres også for negative potenser via e u = 1 e u Eksempelvis e 3 = 1 e 3 = = Eksponentialfunktionen kan udvides til også at gælde for skæve potenser ved at vedtage at e (u+v) = e u e v skal gælde for alle tal. Eksempelvis ser vi så at e 0.5 e 0.5 = e ( ) = e hvorfor der må gælde at e 0.5 = e = 1.65 Endvidere følger at e 0 = e (1 1) = e e 1 = e e = 1 PSE (I17) FSV1 Statistik - 4. lektion 14 / 34

15 Logaritme- og eksponentialfunktion Logaritmefunktion Fundamentale egenskaber ved eksponentialfunktionen: e u > 0 e (u+v) = e u e v e 0 = 1 Hvis x = e u så kaldes u for logaritmen til x og betegnes log(x). Så der gælder eksempelvis log(1) = 0. Fundamentale egenskaber ved logaritmefunktionen: log(x) er kun defineret for x > 0. log(x y) = log(x) + log(y) log(x n ) = n log(x) log(1) = 0 Eksempelvis log(10 n ) = n log(10) = n 2.3, dvs hver gang vi 10-dobler forøges logaritmen blot med 2.3. Fex log(1000) log(100) = log(10) log(1) = 2.3 PSE (I17) FSV1 Statistik - 4. lektion 15 / 34

16 Sammenligning af odds for 2 grupper Sammenligning af odds for 2 grupper Vi vender tilbage til eksperimentet, hvor responsen er dikotom(binær), dvs der er 2 mulige udfald. Vi vil kode de 2 mulige udfald med D: Som kunne betyde syg(desased) H: Som kunne betyde rask(healthy) Ud over responsen har vi en dikotom forklarende variabel(fex behandling/eksponering), som deler populationen i 2 grupper (kaldet 0 og 1). Vi er interesseret i at sammenligne sygdomsodds for de 2 delpopulationer Odds 0 (D) = π 0 1 π 0, hvor π 0 er andelen i gruppe 0, som har status lig med D. Odds 1 (D) = π 1 1 π 1, hvor π 1 er andelen i gruppe 1, som har status lig med D. PSE (I17) FSV1 Statistik - 4. lektion 16 / 34

17 Sammenligning af odds for 2 grupper Sammenligning af odds for 2 grupper Vi skal basere sammenligningen på odds for gruppe1 relativt til odds fra gruppe0, det såkaldte odds ratio OR 1,0 (D) = Odds 1(D) Odds 0 (D) Hvis eksempelvis OR 1,0 (D) = 1.5, så er odds for sygdom 50% større i gruppe 1 end i gruppe 0. Ligningen ovenfor kan også skrives Odds 1 (D) = Odds 0 (D) OR 1,0 (D) Hvis gruppe1 svarer til exposure og gruppe0 kaldes baseline, så kan det udtrykkes som OddsExposure = OddsBaseline OR(Exposure) PSE (I17) FSV1 Statistik - 4. lektion 17 / 34

18 Sammenligning af odds for 2 grupper logodds Vi opnår den mest valide analyse ift konfidensintervaller og hypotesetest ved at transformere til log-skala: log(oddsexposure) = log(oddsbaseline) + log(or(exposure)) Vi skal indføre notationen: β 0 = log(oddsbaseline) β 1 = log(or(exposure)) Bemærk at β 1 = log(oddsexposure) log(oddsbaseline) dvs β 1 måler effekten af exposure ift baseline. Hypotesen om ingen effekt undersøges således ved at teste H 0 : β 1 = 0. PSE (I17) FSV1 Statistik - 4. lektion 18 / 34

19 Sammenligning af odds for 2 grupper Eksempel Med Savanne som baseline kan vi estimere logodds for baseline: ˆβ 0 = log(281/267) = Effekten på logodds ved at flytte til regnskoven estimeres til ˆβ 1 = log(541/213) log(281/267) = Er denne effekt signifikant? PSE (I17) FSV1 Statistik - 4. lektion 19 / 34

20 Konfidensinterval for effekt Konfidensinterval Når vi skal vurdere om ˆβ 1 er signifikant større end nul, så har vi brug for dens standardfejl. Vi overlader beregningen til Stata, som rapporterer at se( ˆβ 1 ) = Vi kan så bestemme 95% konfidensintervallet ˆβ 1 ± 1.96 se( ˆβ 1 ) som giver grænser og 1.112, dvs effekten er tydelig. Effekten på odds findes via exponentialfunktionen: Nedre grænse: e 0.65 = 1.92, dvs vi forventer at odds forøges med mindst 92%. Øvre grænse: e = 3.04, dvs 3-dobling. PSE (I17) FSV1 Statistik - 4. lektion 20 / 34

21 Test for effekt Signifikanstest Vi skal betragte nulhypotesen H 0 : β 1 = 0. På basis af ˆβ 1 og se( ˆβ 1 ) kan vi beregne z = ˆβ 1 se( ˆβ 1 ) som approksimativt følger en standard normalfordeling, hvis nulhypotesen er sand. Vi kan så på sædvanlig vis beregne den tilhørende p-værdi. Aktuelt z = = langt over 3, så pværdi=0. PSE (I17) FSV1 Statistik - 4. lektion 21 / 34

22 Beregninger i Stata Stata Statistics Binary outcomes Logistic regression, reporting coefficients Vi skal specificere outcome (mf) og prædiktor (area). PSE (I17) FSV1 Statistik - 4. lektion 22 / 34

23 Beregninger i Stata Stata Vi genkender -cons svarer til area=0, dvs logodds for savanne er ˆβ 0 = area giver effekten af area, dvs når vi går fra 0=savanne til 1=skov. Forskellen i logodds er ˆβ 1 = Vi kan også genkende konfidensintervallet. Og klar signifikans med z = PSE (I17) FSV1 Statistik - 4. lektion 23 / 34

24 Multiple prediktorer Model Når x 1 angiver dummykodning af gruppevariablen (eksponering/behandling) kan vi formulere modellen på denne måde som læses logodds = β 0 + β 1 x 1 Når x 1 = 0(baseline) er logodds β 0 Når x 1 = 1(exposure) er logodds β 0 + β 1 dvs β 1 er kontrasten/forskellen i logodds og måler effekten af eksponering. På helt samme måde som ved multipel lineær regression kan vi udvide modellen til at inkludere effekten af flere prediktorer. inkluderer effekt af x 1, x 2 og x 3. logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 PSE (I17) FSV1 Statistik - 4. lektion 24 / 34

25 Multiple prediktorer Eksempel Lad os inkludere køn som prediktor dvs logodds = β 0 + β 1 x 1 + β 2 x 2 x 2 = 0 for mænd og x 2 = 1 for kvinder, dvs β 2 måler forskellen fra mænd til kvinder. I Statas Model-fane: Independent variables: area sex, dvs hovedvirkning af begge faktorer. PSE (I17) FSV1 Statistik - 4. lektion 25 / 34

26 Multiple prediktorer Eksempel Signifikante effekter af både sex og area. Vi kan se Estimeret logodds for kvinder er ˆβ 2 = lavere end for mænd. Konfidensintervallet til -.25 svarer til en faktor mellem e = 0.49 og e 0.25 = 0.78 på oddsskalaen. Vi skønner altså at odds for kvinderne er mellem = 22% og = 51% lavere end for mænd. PSE (I17) FSV1 Statistik - 4. lektion 26 / 34

27 Effektmodifikation Eksempel Lad os udvide modellen til logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 LogOdds for mand på savannen(x 1 = x 2 = 0): β 0. LogOdds for mand i skoven(x 1 = 1,x 2 = 0): β 0 + β 1. SkovEffekt for mand: β 1. LogOdds for kvinde på savannen(x 1 = 0,x 2 = 1): β 0 + β 2. LogOdds for kvinde i skoven(x 1 = 1,x 2 = 1): β 0 + β 1 + β 2 + β 3. SkovEffektfor kvinde: β 1 + β 3. Forskel i skoveffekt for mænd og kvinder: β 3. Parameteren β 3 fortæller hvordan skoveffekten modificeres, når vi skifter køn fra mand til kvinde. PSE (I17) FSV1 Statistik - 4. lektion 27 / 34

28 Effektmodifikation Eksempel - Stata I Statas Model-fane: Independent variables: area##sex, dvs vekselvirkning/effektmodifikation mellem de 2 faktorer. Der er ikke signifikant effektmodifikation, idet ˆβ 3 = ikke afviger signifikant fra nul (p-værdi 9.3%). Vi fastholder altså den tidligere model, hvor der er effekt af køn og en skoveffekt, som er ens for mænd og kvinder. PSE (I17) FSV1 Statistik - 4. lektion 28 / 34

29 Sammenligning af flere grupper Eksempel Respondenterne i vores flodblindhed undersøgelse er inddelt i aldersgrupper. Hvis x i er dummy variabel for aldersgruppe nr i, i = 1, 2, 3 skal vi kigge på modellen logodds = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 Der gælder altså at x i = 1 hvis du tilhører aldersgruppe nr i og ellers er x i = 0, hvor i kan være 1, 2, 3. Vi kan fortolke parametrene: β 1 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 1. β 2 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 2. β 3 er kontrast i logodds mellem aldersgruppe 0 og aldersgruppe 3. PSE (I17) FSV1 Statistik - 4. lektion 29 / 34

30 Sammenligning af flere grupper Eksempel Præfikset i. fortæller at agegrp skal dummykodes. Ellers tror Stata at det er målinger på intervalskala. PSE (I17) FSV1 Statistik - 4. lektion 30 / 34

31 Sammenligning af flere grupper Eksempel Vi kan konstatere at alle aldersgrupper ligger signifikant højere end baseline. Faktisk ser det ud til at ændringen i logodds er proportional med ændringen i aldersgruppe. Lad os forfølge dette med en simpel lineær regression, hvor vi betragter aldersgruppe som intervaldata. PSE (I17) FSV1 Statistik - 4. lektion 31 / 34

32 Regression på intervalvariabel Eksempel - Stata I Statas Model-fane: Independent variables: agegrp, der nu opfattes som metrisk. Stigningen i logodds når vi går en aldersgruppe op er signifikant med konfidensgrænser g På odds skala er dette e = 2.24 og e = Stigningen i odds for flodfeber er således mellem 124% og 187%, når vi bliver en aldersgruppe ældre. PSE (I17) FSV1 Statistik - 4. lektion 32 / 34

33 Effektmodifikation af intervalvariabel Effektmodifikation Ud over alderseffekten har vi set en effekt af area, som måske kan bortforklares af alderseffekten, hvis alderssammensætningen er forskellig på savanne og skov. Hvis skovbefolkningen generelt er ældre, så vil de have en højere sygelighed. Lad os kigge på en model med effekt af begge variable. Hvis begge variable har effekt er det også interessant at undersøge om aldereffekten er forskellig på savanne og skov. I Statas Model-fane: Independent variables: area##c.agegrp, hvor nu præfix c. fortæller at variablen er metrisk. PSE (I17) FSV1 Statistik - 4. lektion 33 / 34

34 Effektmodifikation af intervalvariabel Effektmodifikation LogOdds for aldersgruppe 0 på savannen er På savannen vokser LogOdds med 0.799, når aldersgrp går 1 op. Skoveffekten i aldersgruppe 0 estimeres til Denne er ikke signifikant. LogOdds for forskel på alderseffekten på skov og savanne er 0.343, hvilket er signifikant. Konklusion: Skov og savanne har samme odds i aldersgruppe 0. Til gengæld vokser LogOdds signifikant hurtigere med alderen i skoven( =1.142) end på savannen(0.799). PSE (I17) FSV1 Statistik - 4. lektion 34 / 34

2 Logaritme- og eksponentialfunktion 6

2 Logaritme- og eksponentialfunktion 6 Indhold 1 Kontingenstabeller 2 1.1 Krydstabeller....................................... 2 1.2 Forventede under nulhypotesen............................. 4 1.3 Ki-kvadrat test......................................

Læs mere

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary 1 Kontingenstabeller Betinget fordeling Uafhængighed 2 Chi-kvadrat test for uafhængighed Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk 21. marts 2013 Dagens program Chi-i-anden (χ 2 )-testet Sandsynligheder,

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/regression2012/

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller Hvad skal vi lave? 1 Kovariansanalyse Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning 2 Sammenligning af modeller 3 Mere generelle modeller PSE (I17) ASTA - 14. lektion

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

9. Chi-i-anden test, case-control data, logistisk regression.

9. Chi-i-anden test, case-control data, logistisk regression. Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde... Modul 13: Exercises 13.1 Substrat.......................... 1 13.2 Polynomiel regression.................. 3 13.3 Biomasse.......................... 4 13.4 Kreatinin.......................... 7 13.5 Læsefærdighed......................

Læs mere

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde... Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 13: Exercises 13.1 Substrat........................................ 1 13.2 Polynomiel regression................................

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Vejledende løsninger kapitel 9 opgaver

Vejledende løsninger kapitel 9 opgaver KAPITEL 9 OPGAVE 1 a) Hypoteser H 0 : Der er uafhængighed (ingen sammenhæng) i kontingenstabellen H 1 : Der er afhængighed (sammenhæng) i kontingenstabellen Observerede værdier Ny metode Gammel metode

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Træningsaktiviteter dag 3

Træningsaktiviteter dag 3 Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Logistisk regression

Logistisk regression Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18 Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Stastistik og Databehandling på en TI-83

Stastistik og Databehandling på en TI-83 Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Statistik i GeoGebra

Statistik i GeoGebra Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken

Læs mere

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. 1 / 32 Motivation Eksempel: Savings = β 0 + β 1 Income + u Vi ved allerede, hvordan vi estimerer regresseionlinjen:

Læs mere

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere