Statistik og skalavalidering. Opgave 1
|
|
- Adam Sommer
- 7 år siden
- Visninger:
Transkript
1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk formål, der typisk både drejer sig om at lære hvordan man kan få SPSS til at foretage de beregninger, som man har brug for, og om at lære at læse det output som SPSS producerer. Og for det andet et metodisk formål, der drejer sig om at gennemføre en fornuftig statistisk analyse, der kan give løsning på en række fagligt motiverede problemer. Datamaterialet til denne øvelse stammer fra en spørgeskemaundersøgelse af arbejdsmiljøet i den danske folkeskole i slutningen af 90 erne. I det datamateriale, som hører til øvelsen, er der inkluderet demografiske oplysninger (køn og alder), oplysninger om helbred (angivet ved antal sygeperioder), oplysninger om det fysiske arbejdsmiljø, oplysninger om dagligt forbrug af alkohol- og tobak samt oplysninger om forbrug af fire forskellige type af medicin. Det overordnede formål er at finde ud af, hvilken betydning de faktorer, der er inkluderet i datamaterialet, har for forbruget af medicin under hensyntagen til eventuel konfounding og effektmodifikation. For at løse det problem, skal der opstilles en statistisk model med medicinforbrug som afhængig variabel og nogle af datamaterialets øvrige variable som uafhængige (forklarende) variable. Der er to krav til en god løsning. Det ene er, at der er tale om en enkel model, der ikke indeholder mere end nødvendigt, således at tolkningen af det, som modellen fortæller, ikke bliver for kompliceret. Det andet krav er, at modellen ikke er udtryk for en overforenkling, således at resultaterne af den statistiske analyse er konfoundede. Et af de praktisk/tekniske formål med øvelsen er, at give jer en mulighed for at repetere det, I lærte på bachelorkurset om logistisk regression ved hjælp af SPSS. 1
2 Et andet teknisk formål er at lære, hvordan man foretager likelihood-analyser ved hjælp af SPSS. For at kunne gøre det, skal I dels lære at læse noget mere af det output, som SPSS producerer i forbindelse med disse analyser, og dels vide, hvordan I får SPSS til at beregne likelihood ratio test som supplement til de Wald test, I ellers har brugt. For at besvare det overordnede problem skal I opstille og kontrollere en statistisk model, i dette tilfælde en logistisk regressionsmodel, der beskriver hvorledes en af medicin variablene afhænger af andre variable i materialet. For at kunne gøre det, skal I kunne bruge de faciliteter til logistisk regression, som SPSS stiller til rådighed, men SPSS løser ikke alle problemerne for jer: 1) Skal alle andre variable afprøves? Og hvis ikke: hvilke variable kan udelades fra starten? 2) Visse variable foreligger i flere versioner. Hvilke af disse variable skal bruges? Kontinuert eller kategoriseret alder? Tobak og alkohol med to, tre eller fire kategorier? 3) Skal der inkluderes interaktioner i modellerne? Hvorfor eller hvorfor ikke? Skal alle interaktioner med eller kun nogle (hvilke)? 4) Hvordan skal resultaterne tolkes? 5) Hvilke resultater skal rapporteres? For at hjælpe jer med dette vil vi dele opgaven op i flere trin. De første skal hjælpe jer med det rent spss-tekniske, mens de sidste i højere grad handler om det metodiske. Følgende variable skal bruges i denne opgave: Afhængig variabel: berolmid Uafhængige variable: køn, alder, sygeperioder, tobak, alkohol (Vi har altså taget stilling til de to første problemer i ovenstående liste for at I kan komme i gang med øvelsen. I praksis kan valget af variable til analyserne være alt afgørende. Hvis I vil overbevises om det kan I jo prøve at gennemføre analyserne med alderen opdelt i forskellige kategorier og med dikotomiserede alko- og tobaksvariable). 2
3 Formålet med opgaven er at undersøge om det er nødvendigt at tage højde for effektmodifikation i den model, der skal beskrive effekten af de uafhængige variable på forbruget af beroligende midler. For at undersøge det, er det nødvendigt at regne tingene igennem for en model uden interaktionsled og en model med alle de interaktionsled som kan komme på tale., og derefter at sammenligne resultaterne af de to analyser ved hjælp af et likelihood ratio test. Analysen forløber derfor i følgende fire trin, hvor det første trin blot er den form for deskriptiv analyse, som man altid starter med for at sætte sig ind i hvilke variable, der er til rådighed for analyserne. Trin 1: Foretag en univariat deskriptiv analyse (frekvenstabeller og/eller søjlediagrammer) af alle variablene i datamaterialet Trin 2: a) Gennemfør en logistisk regressionsanalyse ved hjælp af ovenstående variable, men uden interaktioner. Husk at angive hvilke variable, der er kategoriale, og hvilke kategorier, der skal være referencekategorier. For at tvinge SPSS til også at beregne likelihood ratio test for hver enkelt variabel skal I sætte Method til Backwards LR og Removal = 1.00 i Options 1. Likelihood ratio testene vil blive skrevet i en output-tabel med overskriften Model if term removed b) Find tabellen med estimater af parametre og odds-ratio værdier. Kan I huske hvad tallene er udtryk for? Er der signifikant effekt af alle variable? c) Find tabellen med likelihood ratio testene. Sammenlign med Wald testene. Er der forskelle? Hvis der er forskel skal I tro mere på likelihood ratio testet end på Wald testet. d) Udfyld skema1. Oplysningerne kan findes i outputtet. 1 Hvis removal ikke sættes lig med 1,00 vil SPSS starte en automatisk backwards modelsøgning, hvilket ikke er hensigten på dette tidspunkt. 3
4 Skema 1: Resultater vedrørende model med hovedvirkninger for all variable uden interaktioner Resultat Afsnit i outputtet Antal personer i analysen 1754 Case processing Summary Antal ukendte parametre i modellen 11 Lig med df i tabellen med Omnibus Tests of Model Coefficients (Block 1) Test af den tomme model mod modellen med all hovedvirkninger Chi-square og Sig. For Model i Omnibus tests -2 log likelihood Fra model summary (Block 1) Trin 3: e) Gennemfør en logistisk regressionsanalyse på samme måde som i Trin 2, men nu med en model, hvor der er to-vejs interaktioner mellem samtlige variable. Er der nogle af to-vejs interaktionerne, der er signifikante? (husk at lægge mærke til forskellen på Wald-testene og likelihood ratio testene. De er slående). f) Udfyld skema 2. Oplysningerne kan findes i outputtet. Skema 2: Resultater vedrørende model med hovedvirkninger for all variable med interaktioner Resultat Afsnit i outputtet Antal personer i analysen 1754 Case processing Summary Antal ukendte parametre i modellen 54 Lig med df i tabellen med Omnibus Tests of Model Coefficients (Block 1) Test af den tomme model mod modellen med all hovedvirkninger Chi-square og Sig. For Model i Omnibus tests -2 log likelihood Fra model summary (Block 1) Bemærk, at antallet af ukendte parametre er større end i skema 1, men at -2 log likelihood er mindre. Hvorfor? Trin 4: g) Kontroller, at antallet af personer er det samme i de to skemaer. h) Beregn likelihood ratio test størrelsen med modellen uden interaktioner som nul-hypotese og modellen med interaktioner som alternativ. (træk -2log likelihood fra skema 2 fra den tilsvarende værdi i skema 1). LR = = 64.4, df=54-11=43 i) Antallet af frihedsgrader er lig med forskellen på antallet af parametre i de to modeller. Beregn p-værdien for likelihood ratio testet ved hjælp af syntaks-filen pchi.sps. Kan 4
5 modellen uden interaktioner accepteres? p = Modellen uden vekselvirkninger bliver derfor forkastet. Der er med andre ord signifikant evidens for, at der er tale om en eller anden form for effekt modifikation. Resultatet er følgende SPSS-syntaksen i pchi.sps udfyldes på følgende måde temporary. n of cases 1. compute chi= compute df= compute pvalue=1.0-cdf.chisq(chi,df). format chi(f8.1) / df(f3) / pvalue(f8.5). LIST VARIABLES= chi df pvalue. chi df pvalue 64,4 43,01881 Number of cases read: 1 Number of cases listed: 1 Trin 5 (eventuelt): Hvis modellen forkastes må der være tale om en eller anden form for interaktion. Undersøg i output-tabellen med Model if term removed, om der er nogle interaktionsled, der er signifikante og fjern alle de insignifikante led. Kontroller den reducerede model mod modellen med alle interaktionsled på samme måde som i trin 3. Kan denne model accepteres? Der er tre signifikante interaktionsled: - køn*tobak (p = 0.007) - alkohol*sygeperioder (p = 0.014) - alkohol*tobak (p = 0.024) 5
6 Et test af en model med disse tre interaktionsled accepterer modellen. Beregningen af teststørrelsen er som følger: LR = = 22.7 df = = 19 p = 0.25 Trin 6 (eventuelt): Hvis modellen ikke accepteres, er det nødvendigt at foretage en trinvis elimination af interaktionsled fra modellen med alle interaktioner. Til dette formål skal I bruge likelihood ratio test i stedet for Wald test. Dette gøres ved at vælge backward LR i method og ved at sætte Removal = 1,00 i Options (for at sikre at modelsøgningen bliver manuel). Kontroller slutmodellen. Modellen blev accepteret, så dette trin skal springes over Trin 7. Foretag en trinvis manuel modelsøgning fra den reducerede model på samme måde som I gjorde på bachelorkurset. Husk principperne for hierarkiske modeller. Kontroller slutmodellen i forhold til modellen med alle interaktionsled, og fortolk alle parametrene. Bemærk: Når man foretager et likelihood ratio test af en model i forhold til en anden er det vigtigt, at antallet af personer er det samme i de to analyser, hvor -2*loglikelihood beregnes. For at sikre, at det er tilfældet skal i beregne en variabel, der angiver antallet af missing values blandt de variable, der indgår i den mest komplicerede model, og derefter foretager analyserne for de variable, hvor antallet af missing values er lig med 0. (brug Select cases i datamenuen). For at holde styr på hvad der sker i løbet af modelsøgningen, inklusiv den løbende kontrol i forhold til den mættede model med samtlige to-faktor vekselvirkninger, er det en god ide, at samle resultaterne op i en tabel svarende til skemaet på næste side. 6
7 Mættet model: (altså modellen med alle to-faktor vekselvirkninger) Antal personer = 1754 Antal parametre = 54-2 * log likelihood = Modelsøgning Oplysninger om modellen efter elimination af en interaktion eller en variabel Antal personer Oplysninger om modellen efter elimination af en interaktion eller en variabel Antal parametre -2 * loglike LR df p Elimineret p- værdi køn*tobak , køn alko*tobak Forsøget med at slette alko*tobak fører til en model, der lige akkurat forkastes i forhold til modellen med alle to-faktor vekselvirkninger. Alko*tobak interaktionen kan altså ikke fjernes fra modellen. Der er intet andet, der kan elimineres pga. det hierarkiske princip. Ifølge analysen afhænger forbruget af beroligende midler derfor af alder, sygeperioder, tobak og alkohol. Effekten af alkohol modificeres af tobak og sygeperioder. Hvis man skulle få lyst til at fjerne alko*tobak fra modellen fordi en p-værdi på ikke er særlig overbevisende fortsætter modelsøgningen indtil der kun er alder og sygeperioder tilbage. Et test af denne model i forhold til modellen med to-faktor vekselvirkninger bliver klart forkastet. Den er klart et udtryk for overforenkling. 7
8 Hvad betyder interaktionerne? Det er naturligvis kompliceret, men så heller ikke værre. Et 3d-søjlediagram, der viser andelen, der bruger beroligende midler i forhold til alko og tobak ser således ud. Der er en påfaldende stor andel af personer, der tidligere har drukket, og som ikke ryger, som bruger beroligende midler. 8
9 Appendiks Medicin-2010.sav Nedenstående tabel indeholder en oversigt over alle de variable, som findes i datamaterialet til denne øvelse. Bemærk, at de korte spss-labels er skrevet med fed skrift samt at visse variable (alder samt jævnligt tobaks- og alkoholforbrug findes i flere forskellige variationer). Descriptive Statistics N Minimum Maximum køn Køn alder Alder rengøring Generes af utrilstrækkelig rengøring vedligehold Generes af manglende vedligeholdelse af lokaler træk Generes af træk ventilation Generes af dårlig ventilation, tør luft m.m sygeperioder Antal sygeperioder 1873,00 16,00 tobak Jævnligt tobaksforbrug 1902,00 4,00 alkohol Jævnligt alkoholforbrug 1921,00 4,00 alder10 Alder i 10-årsgrupper ,00 6,00 berolmid jvt. forbrug af beroligende midler sovemid Jvt. forbrug af sovemedicin smrtstil jvt. forbrug af smertestillende midler stoffer jvt forbrug af stærkere stoffer tobak3 Tobaksforbrug i tre kategorier 1902,00 2,00 alko3 Alkohold i tre kategorier 1921,00 2,00 tobak2 Tobaksforbrug i to kategorier 1902,00 1,00 alko2 Alkohol i to kategorier 1921,00 1,00 Valid N (listwise)
Logistisk regression
Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf
Læs mereRegressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereVi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.
Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i
Læs mereIntroduktion til SPSS
Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger
Læs mereEksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab
D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs mereOplæg til den første skalavalideringsøvelse. Eksamens opgaven i 2004
Oplæg til den første skalavalideringsøvelse Eksamens opgaven i 2004 validering af skala til måling af tilfredshed med fysiske forhold i danske folkeskoler Items: a) Om lokalerne var uhensigtsmæssigt indrettede
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereSynopsis til eksamen i Statistik
Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereMantel-Haenszel analyser. Stratificerede epidemiologiske analyser
Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereOpsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller
Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende
Læs mereFaculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng
Læs mereIndvandrere og efterkommere i foreninger er frivillige i samme grad som danskere
Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere Bilag I afrapportering af signifikanstest i tabeller i artikel er der benyttet følgende illustration af signifikans: * p
Læs mereStatistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45
Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af
Læs mereØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression
! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine
Læs mereProgram. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs mereProgram dag 2 (11. april 2011)
Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;
Læs mereSYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING
SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE
Læs mereStatistik & Skalavalidering
å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereEksamen i statistik 2009-studieordning
Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mereINDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4
Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal
Læs mereSammenhængen mellem elevernes trivsel og elevernes nationale testresultater.
Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereEt psykisk belastende arbejde har store konsekvenser for helbredet
Flere gode år på arbejdsmarkedet 5. maj 2017 Et psykisk belastende arbejde har store konsekvenser for helbredet Risikoen for at have et dårligt psykisk helbred mere end fordobles for personer med et belastende
Læs mereØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression
! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine
Læs mereEksamen i Statistik og skalavalidering
Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereEt fysisk hårdt arbejdsliv har store konsekvenser for helbred og tilbagetrækning
Flere gode år på arbejdsmarkedet 5. maj 2017 Et fysisk hårdt arbejdsliv har store konsekvenser for helbred og tilbagetrækning Et hårdt arbejdsliv har store konsekvenser for helbredet og tilknytningen til
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereRegressionsanalyse i SurveyBanken
Først vælges datasættet De Kommunale Nøgletal. Klik på Variable Description og derefter De Kommunale Nøgletal 2010. De enkelte variable i datasættet bliver nu oplistet og kan vælges. Klik herefter på Analysis
Læs mereStatistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004
Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod
Læs mereSynopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab
Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende
Læs mereEksamen Efterår 2013
Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)
Læs mereLøsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereØvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test
Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs mereMan indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:
1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereVejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)
Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A) Opgave 1 I nedenstående tabel ses resultaterne af samtlige hjerteklapoperationer i 007-08 ved Odense Universitetshospital (OUH) sammenlignet
Læs mereTest og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008
Indholdsfortegnelse 1 INDLEDNING OG PROBLEMSTILLING... 2 1.1 OVERVÆGT SOM CASE... 2 2 ANALYSEFORBEREDELSER... 4 2.1 HEPRO-UNDERSØGELSEN... 4 2.2 DEN AFHÆNGIGE VARIABEL VIGTIGHED AF ÆNDRINGEN AF VÆGT...
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereDagens program. Praktisk information:
Dagens program Praktisk information: Husk hjemmeopgaven i statistik Hypoteseprøvning kap. 11.2,11.3 og 11.8 Eksempel på test Styrkefunktionen kap. 11.2 Stikprøvens størrelse kap. 11.3 Likelihood ratio
Læs mereMATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012
MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver
Læs mereEksamen i Statistik for biokemikere. Blok
Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mereKursets hjemmeside: http://staff.pubhealth.ku.dk/~skm/fsvpage/index.html
Kursets hjemmeside: http://staff.pubhealth.ku.dk/~skm/fsvpage/index.html 1 Kandidatkursus i statistik efteråret 2010 Planen er sidst revideret den 6.9.2010 Oversigt over kursets forløb Periode Emne 7/9
Læs mereKursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereTræningsaktiviteter dag 3
Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk
Læs mere1 Multipel lineær regression
1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet
Læs mereDet kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.
1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereØkonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006
Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereØkogården. Virksomheds- og situationsbeskrivelse. Problemformuleringer. Økogården
Økogården Økogården Virksomheds- og situationsbeskrivelse I 2008 besluttede 8 landmænd at lave et kooperativ, der som nicheproduktion skulle producere og forhandle økologiske madvarer direkte til forbrugeren.
Læs mereTIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03.
05:2009 ARBEJDSPAPIR Mette Deding Trine Filges APPENDIKS TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03. FORSKNINGSAFDELINGEN
Læs mereKORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER
ANALYSERAPPORT KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER Denne rapport samt bilag indeholder den endelige database af spørgeskemaet Anvendelsen af digitale ressourcer
Læs mereChi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller
Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles
Læs mereØvelse 2. SPSS og sandsynlighedsregning
Øvelse 2 SPSS og sandsynlighedsregning Der er flere forskellige formål med opgaverne i denne øvelse. Det væsentligste formål er at arbejde lidt med sandsynlighedsregningen, binomialfordelingen og de store
Læs mere1 Multipel lineær regression
Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R
Læs mereUge 13 referat hold 4
Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereBilag 12 Regressionsanalysens tabeller og forklaringer
Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler
Læs mereRalph Bøge Jensen 20. december 2010. Lønligningen. Resumé:
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Ralph Bøge Jensen 20. december 2010 Lønligningen Resumé: Dette papir skal ses som et supplement til den nye Dec09- ADAM dokumentation, hvor nogle af de beregninger,
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereSupplerende dokumentation af boligligningerne
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Ralph Bøge Jensen 13. september 2010 Supplerende dokumentation af boligligningerne Resumé: Papiret skal ses som et supplement til den nye Dec09-ADAM dokumentation
Læs mereMultipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).
Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression
Læs mereMPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme
MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes
Læs mereBasal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30.
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder
Læs mereAdgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)
Økonometri 1 Forår 2003 Ugeseddel 13 Program for øvelserne: Gruppearbejde Opsamling af gruppearbejdet og introduktion af SAS SAS-øvelser i computerkælderen Øvelsesopgave 6: Hvem består første årsprøve
Læs mere25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes
25. april 2. gang: Introduktion til Logistisk Regression Morten Frydenberg 22 Institut for Biostatistik, Århus Universitet MPH. studieår specialmodul Cand. San. uddannelsen. studieår Hvorfor logistisk
Læs mereStatistik Lektion 17 Multipel Lineær Regression
Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x
Læs mereLogistisk regression. Basal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc
Læs mereBrugervejledning til udskriften ReproAnalyse
Brugervejledning til udskriften ReproAnalyse Tilgængelighed Udskriften ReproAnalyse er tilgængelig i Dairy Management System (DMS) under fanebladet Analyse og lister > Analyseudskrifter. Husk at vælge
Læs mereIntroduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mere