Opgavebesvarelse, logistisk regression
|
|
- Else Lauritsen
- 5 år siden
- Visninger:
Transkript
1 Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med kommandoen: PROC IMPORT OUT=work.rop DATAFILE= C:\stinavne\rop.xls DBMS=XLS REPLACE; /* NB: Nye variable tilføjes med: */ DATA rop; SET rop; gaweeks = floor(ga/7); ga29weeks = ga/7-29; Vi tilføjer i samme ombærding to nye variable til data gaweeks der er gestationsalderen afrundet til hele antal uger og ga29weeks der er gestationsalderen i uger (decimaltal) og "flyttet"så nulpunktet ligger ved 29 uger. Variablene skal bruges til at løse opgave 1.1 og 1.4. Foruden resultatet af screeningen (rop ja/nej) indeholder data oplysninger om børnenes køn (dreng=1, pige=2), gestationsalder (i dage), fødselsvægt (i gram) og fødselsvægt relativ til gestationsalderen (z-score målt i standard deviationer). For at få et hurtigt overblik tegner vi data op (fødselsvægt vs gestationsalder) med drenge og piger hver for sig og med ROP-tilfælde markeret med rødt. Bemærk for at få delt op efter køn og ROP-status er det nødvendigt først at sortere data efter disse variable, hvilket vi gør med proc sort i SAS: PROC SORT DATA=rop; BY sex rop ga birthweight; SYMBOL1 i=none v=dot color= blue ; SYMBOL2 i=none v=dot color= red ; PROC GPLOT DATA=rop; BY sex; PLOT birthweight*ga=rop / FRAME; 1
2 2
3 Del 1 Spørgsmål 1 Find den totale frekvens af rop-tilfælde i data og udregn også de relative frekvenser for gestationsalder 22 til 31 uger. Er der noget der overrasker? Her skal vi bruge variablen gaweeks der angiver gestaionsalderen afrundet til hele uger. Tabellering af data med proc freq i SAS giver: PROC FREQ DATA=rop; TABLES gaweeks*rop / NOCOL NOPERCENT; The FREQ Procedure Table of gaweeks by ROP gaweeks ROP(ROP) Frequency Row Pct 0 1 Total Total Vi ser at 115 ud af 2832 børn har ROP, hvilket svarer til ca 4%. Risikoen for ROP ser umiddelbart ud til at stige med faldende gestationsalder, men blandt de allertidligst fødte børn (22 og 23 uger) er der ingen ROP-tilfælde. Det kan selvfølgelig være en tilfældighed da der er meget få børn i disse grupper, men det kunne også være tale om en survival of the fittest-effekt idet kun få børn der fødes så tidligt faktisk overlever så længe at de kan nå at udvikle ROP. Vi vil imidlertid ikke forfølge problemet, men modellere risikoen for ROP som monoton funktion af gestationsalderen. 3
4 Spørgsmål 2 Fit en simpel logistisk regression med ga som forklarende variabel. Angiv estimaterne for α og β og giv en fortolkning af dem. Tegn den estimerede risiko som funktion af gestationsalderen. Fra proc logistic i SAS får vi følgende estimater: ODS GRAPHICS ON; PROC LOGISTIC DATA=rop DESCENDING PLOTS=EFFECT; MODEL rop = ga; ODS GRAPHICS OFF; The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 GA <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits GA Parameterestimatet for interceptet er ˆα = Havde det en fortolkning skulle det svare til log(odds) for ROP for et levendefødt barn med gestationsalder 0 uger!! Regressionskoefficienten estimeres med ˆβ = Tager man exponential funktionen til ˆβ får man OR= exp( ˆβ) = svarende til at odds for ROP falder med en estimeret faktor 0.92 (eller 8%) for hver dag gestationsalderen stiger. Vi aflæser 95%-konfidensintervallet for odds ratio til at være (0.910, 0.933). Effekten af gestationsalder er højsignifikant (P < ). Ved at angive argumentet PLOTS=EFFECT får vi SAS til at tegne grafen med den estimerede risiko som funktion af gestationsalder. Grafen viser som forventet moderat høj risiko for de yngste gestationsaldre og lav risiko for de ældste gestationsaldre (se næste side). 4
5 Spørgsmål 3 Find OR for et fald i gestationsalder på én uge. Angiv 95%-konfidensinterval for estimatet. Odds ratio associeret med et fald i gestationsalderen på en uge (= syv dage) er OR 7 = exp( 7 ˆβ) = Vi ved at 95%-konfidensintervallet for β er ˆβ ± 2 s.e = ± = ( , ), så vi ganger endepunkterne med -7 og tager eksponentialfunktionen på resultatet, hvilket giver 95%-konfidensnintervallet (1.623,1.945) for OR 7. 5
6 Spørgsmål 4 Find et estimat for risikoen for ROP når gestationsalderen er 29 uger. Find også konfidensinterval for estimatet. Her benytter vi variablen ga29weeks med nulpunkt ved ga=29 uger som forklarende variabel og kan aflæse log(odds for risikoen som intercept: PROC LOGISTIC DATA=rop DESCENDING; MODEL rop = ga29weeks; The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 ga29weeks <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits ga29weeks Vi aflæser ˆα = , hvilket giver Odds= exp( ) = og vi kan transformere videre til et egentligt risiko estimat P= = For at få et konfidensinterval for risiko-estimatet, tranformeres endepunkterne på konfidensintervallet for interceptet, ˆα ± 2 SE = ± = ( , ) på sammen måde. Det giver et øvre grænse på exp( ) 1+exp( ) = og en nedre grænse på exp( ) 1+exp( ) = Altså skønnes risikoen for et barn til gestationsalder 29.0 uger at ligge melem 1.73% og 3.03%. 6
7 Spørgsmål 5 Hvad er frekensen af ROP hos præmature drenge hhv. piger. Beregn odds ratio for forskellen mellem kønnene. Vi tabellerer antallet af ROP-tilfælde blandt drenge og piger med: PROC FREQ DATA=rop; TABLES sex*rop / NOCOL NOPERCENT CHISQ; The FREQ Procedure Table of SEX by ROP SEX(sex) ROP(ROP) Frequency Row Pct 0 1 Total Total Statistics for Table of SEX by ROP Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer s V Umiddelbart er der relativt flere ROP-tilfælde blandt drengene, 1485 = 4.51%, 48 end blandt pigerne hvor der er = 3.56%. Odds ratio for drenge vs piger er på 67/ / = Vi har benyttet chi-square testet på 2x2-tabellen. Det viser at der ikke er signifikant forskel på kønnene (P = 0.20). 7
8 Vi kan dog ikke være sikre på at der ikke er en kønsforskel. Tager man højde for varierende gestationsaldre kønnene imellem, bliver køns-effekten borderline signifikant (P = 0.05) med OR= 1.49 ( ), som det fremgår af output fra proc logistic: PROC LOGISTIC DATA=rop DESCENDING; CLASS sex; MODEL rop = ga sex; Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 GA <.0001 SEX Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits GA SEX 1 vs
9 Spørgsmål 6 Undersøg for piger og drenge hver for sig hvordan risikoen for ROP afhænger af gestationsalderen. Hvordan kan man teste om effekten af ga er kønsafhængig? Vi har allerede tidligere sorteret datasættet efter køn, så vi kan køre proc logistic med en BY sex-option for at få fittet modellen separat for drenge og piger. Vi slår også ODS GRAPHICS til for at få vist de estimerede sammenhænge grafisk med PLOTS=EFFECT. ODS GRAPHICS ON; PROC LOGISTIC DATA=rop DESCENDING PLOTS=EFFECT; BY sex; MODEL rop = ga; ODS GRAPHICS OFF; sex= The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 GA <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits GA sex= The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 GA <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits GA
10 For drengene får vi en odds ratio på (95% CI: ), mens vi for pigerne får en odds ratio på (95% CI: ). Umiddelbart ser der altså ikke ud til at være stor forskel på kønnene. Heller ikke graferne giver indtryk af større forskel på effekten af gestationsalder kønnene imellem, omend der ser ud til at være lidt højere risiko for drengene alt i alt: For at få et formelt test tilføjer vi interaktionsleddet ga*sex til den multiple logistiske regressionmodel for det samlede data: PROC LOGISTIC DATA=rop DESCENDING; CLASS sex; MODEL rop = ga sex ga*sex; Type 3 Analysis of Effects Wald Effect DF Chi-Square Pr > ChiSq GA <.0001 SEX GA*SEX Interaktionsleddet er ikke signifikant så vi finder ingen indikation af at risikoen som funktion af gestationsalderen skulle være kønsafhængig. 10
11 Spørgsmål 7 Inddrag nu også z-score for fødselsvægt i den multiple regression. Har det betydning for risikoen om børnene er store eller små ift deres gestationsalder? Ændrer korrektionen for z-score ved effekterne af ga og køn? Vi tilføjer variablen zscore til den multiple regression: PROC LOGISTIC DATA=rop DESCENDING; CLASS sex; MODEL rop = ga sex zscore; Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 GA <.0001 SEX ZSCORE <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits GA SEX 1 vs ZSCORE Vi ser signifikant effekt af zscore (P < ) og at risikoen falder med voksende værdier af denne (OR=0.67, 95% CI: ). Der er altså en yderligere risiko ved også at have en forholdsvis lav fødselsvægt for sin gestationsalder. Desuden ser vi nu en signifikant effekt af køn (P = 0.015), svarende til at drenge har en højere risiko for ROP end piger født med samme gestationsalder og samme fødseslvægt relativ til det forventede for gestationsalderen. 11
12 Spørgsmål 8 Hvad bør man checke ved modelkontrol af den logistiske model? Vi ved ikke om data indeholder tvillinger eller trillinger, men i det store hele må vi gå ud fra at børnene udvikler ROP uafhængigt af hinanden og at observationerne derfor kan antages at være uafhængige. Mulige kilder til misspecifikation er derfor ikke-linearitet og oversete interaktioner. Vi har allerede testet interaktionen mellem køn og gestationsalder, men mangler at checke om log(odds) faktisk er en lineær funktion af gestationsalderen. I mangel af bedre tester vi relationen mod et tredjegradspolynomium ved at tilføje variable gaw2 og gaw3 svarende til anden- og tredjepotenser til data (bemærk vi benytter variablen ga29weeks med nulpunkt ved 29 uger fremfor ga for at få numerisk stabile resultater): DATA rop; SET rop; gaw2 = ga29weeks**2; gaw3 = ga29weeks**3; PROC LOGISTIC DATA=rop DESCENDING; CLASS sex; MODEL rop = ga29weeks gaw2 gaw3 sex zscore; Under Model Fit Statistics finder vi deviance som -2 Log L = for polynomial-modellen mod en deviance på i modellen med lineær effekt af ga. Forskellen deviance= = skal sammenholdes med en χ 2 -fordeling med 2 frihedsgrader. Ved tabelopslag finder vi P < altså en højsignifikant ikke-linearitet. Måske er det survival of the fittesteffekten fra spm. 1 vi ser -? For ikke at gøre opgaven unødigt kompliceret vælger vi i det følgende at ignorere (!) den ikke-lineære effekt, men det skal bemærkes at Slidsborg et al faktisk ender med en 5 te grads polynomial model for ga. Modelkontrollen bør gentages for zscore, men er udeladt af pladshensyn. 12
13 Del 2 Spørgsmål 1 Fit en simpel logistisk regression for ROP-risiko med fødselsvægt som forklarende variabel. Tegn den prædikterede risiko som funktion af fødselsvægten. Tegn også ROC-kurven og diskutter om modellen er anvendelig som prædiktionsmodel. Bemærk: I Canada bruges fødselsvægt 1200g som screeningskriterium. Vi kører igen simpel logistisk regression med proc logistic, men denne gang med birthweight som forklarende variabel. For at få tegnet estimeret risiko og ROC-kurve tilføjer vi PLOTS=EFFECT og PLOTS=ROC som options til programmet. Endelig gemmer vi de prædikterede sandsynligheder i et OUT-datasæt (vi skal nemlig bruge dem i spm. 2.3). ODS GRAPHICS ON; PROC LOGISTIC DATA=rop DESCENDING PLOTS=EFFECT PLOTS=ROC; MODEL rop = birthweight; OUTPUT OUT=estimated1 predicted=estprob1; ODS GRAPHICS OFF; The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept <.0001 BIRTHWEIGHT <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits BIRTHWEIGHT Der er klart signifikant effekt af fødselsvægt. Det at odds ratio estimatet ligger tæt på en er ikke udtryk for en svag effekt, men derimod for at fødselsvægten er målt i gram. Omprogrammeres birthweight-variablen til 100g fås et mere interessant estimat. 13
14 ROC-kurven viser en rimelig omend langt fra perfekt diskrimination af ROPtilfælde. Sammenholdt med grafen for estimeret risiko ser vi at det ville være en dårlig ide at anvende det Canadiske screeingskriterium på danske børn, da adskillige tilfælde ville blive overset. Men øges screeningsgrænsen til 1500g opnås faktisk 100% sensitivitet i datamaterialet. 14
15 Spørgsmål 2 Tegn ROC-kurven for modellen i opgave 1.7 (med ga, zscore og sex som covariater). Test om z-score og køn reelt forbedrer prædiktionen. Vi kører igen multipel logistisk regression men denne gang med ROC-kurven som output. Herudover tilføjes en linie til programmet for hver af de modeller vi ønsker at sammenligne ROC-kurver for. Det vil sige modellen med alle tre forklarende variable, med køn udeladt, med z-scoren udeladt og med gestationsalderen som enlig forklarende variabel. Endelig angiver ROCCONTRAST-linien at alle disse modeller skal holdes op mod modellen med de tre variable. ODS GRAPHICS ON; PROC LOGISTIC DATA=rop DESCENDING PLOTS=ROC; CLASS sex; MODEL rop = ga sex zscore; OUTPUT OUT=estimated2 predicted=estprob2; ROC All predictors ga sex zscore; ROC without sex ga zscore; ROC without Z-score ga sex; ROC only GA ga; ROCCONTRAST REFERENCE( All predictors ) / ESTIMATE; ODS GRAPHICS OFF; Standard 95% Wald Pr > Contrast Estimate Error Confidence Limits Chi-Square ChiSq Model - All predictors without sex - All predictors without Z-score - All predictors only GA - All predictors Modellen prædiktive evne forværres ikke væsentligt hvis køn droppes fra modellen. Tilgengæld er det en dårlig ide at se bort fra z-scoren. 15
16 16
17 Spørgsmål 3 Sammenlign de individueele risiko-estimater baseret på de to konkurrerende prædiktionsmodeler. Er der forskel? Hvor stor er forskellene typisk? Vi fletter output-datasættene fra de to forgående spm sammen og beregner forskellene mellem de individuelle prædikterede sandsynligheder med. Det er en dårlig ide at printe hele det store datasæt, så for at få et overblik over forskellene bruger vi proc univariate, der bl.a. giver udvalgte fraktiler for fordelingen: DATA estimated; MERGE estimated1 estimated2; estdif = estprob1-estprob2; PROC UNIVARIATE DATA=estimated; VAR estdif; Quantiles (Definition 5) Quantile Estimate 100% Max % % % % Q % Median % Q % % % % Min Risiko-estimaterne fra de to konkurrerende modeller kan være ret forskellige - helt op til 28% i absolut forskel! For de fleste børns vedkommende stemmer risikoestimaterne dog godt overens; 50% holder sig indenfor ±0.5%, 90% indenfor ±4%, men også 2% med absolutte forskelle på over 10%. 17
18 Spørgsmål 4 Hvordan undersøger man hvilken af de to modeller der prædikterer bedst? Modellerne kan ikke direkte sammenlignes da de ikke er nestede, men vi kan teste begge modeller op mod en udviddet model med ga, sex, zscore og birthweight som forklarende variable: ODS GRAPHICS ON; PROC LOGISTIC DATA=rop DESCENDING; CLASS sex; MODEL rop = ga sex zscore birthweight; ROC All predictors ga sex zscore birthweight; ROC Three predictors ga sex zscore; ROC Birthweight birthweight; ROCCONTRAST REFERENCE( All predictors ) / ESTIMATE; ODS GRAPHICS OFF; ROC Contrast Rows Estimation and Testing Results Standard 95% Wald Pr > Contrast Estimate Error Confidence Limits Chi-Square ChiSq Model - All predictors Three predictors - All predictors Birthweight - All predictors Modellen med de tre forklarende variable prædikterer ikke væsentligt ringere en den udviddede model, mens fødselsvægten alene giver signifikant dårligere diskrimination. Modellen fra spm. 1.7 er altså den bedste prædiktionsmodel (og evt kunne køn droppes, da den trods sin signifikans ikke forbedrer prædiktionerne væsentligt). 18
Postoperative komplikationer
Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.
Læs mereMPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme
MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes
Læs mereFaculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng
Læs mereDet kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.
1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;
Læs mereAfdeling for Anvendt Matematik og Statistik December 2006
Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 i SAS (Zar kapitel 23) PROC FREQ PROC CATMOD
Læs mereLøsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
Læs mereLogistisk regression. Basal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc
Læs mereLineær regression i SAS. Lineær regression i SAS p.1/20
Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereFaculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018
Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære
Læs mereSimpel og multipel logistisk regression
Faculty of Health Sciences Logistisk regression Simpel og multipel logistisk regression 16. Maj 2012 Analyse af en binær responsvariabel. syg/rask, død/levende, ja/nej... Ud fra en eller flere forklarende
Læs mereVejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014
Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke
Læs mereMPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme
MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med
Læs mereVi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.
Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereProgram. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereVejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013
Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.
Læs mereUge 13 referat hold 4
Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer
Læs mereVejledende besvarelse af hjemmeopgave, forår 2017
Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag
Læs mereVi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.
Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereMan indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:
1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14
Læs mereKursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
Læs mereBasal Statistik Kategoriske Data
Basal Statistik Kategoriske Data 8 oktober 2013 E 2013 Basal Statistik - Kategoriske data Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereTræningsaktiviteter dag 3
Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereKøn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE
Økonomisk Kandidateksamen Teoretisk Statistik Eksamenstermin: Sommer 2004, dato: 3. juni 4 timers prøve med alle hjælpemidler, besvarelse på Dansk Opgave En simpel tilfældig stikprøve på 500 udtrukket
Læs mereKommentarer til øvelser i basalkursus, 2. uge
Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mereVejledende besvarelse af hjemmeopgave, efterår 2015
Vejledende besvarelse af hjemmeopgave, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder i Massachusetts (ref.) søger
Læs mereLogistisk regression og prædiktion
Faculty of Health Sciences Introduktion Logistisk regression og prædiktion 16. Maj 2012 Julie Forman Biostatistisk Afdeling, Københavns Universitet Hvad er en god diagnostisk model? En model med god overensstemmelse
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereBasal Statistik Logistisk Regression. Dagens Tekst E Sædvanlig Linear Regression (Repetition) Basal Statistik - Logistisk regression 1
Basal Statistik Logistisk Regression Judith L. Jacobsen, PhD. Lene Theil Skovgaard http://staff.pubhealth.ku.dk/~lts/basal13_ jlj@statcon.dk Dagens Tekst Logistisk regression Binære data Logit transformation
Læs mereReeksamen i Statistik for biokemikere. Blok
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er
Læs mereStatistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004
Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereMultipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Læs mereOpgavebesvarelse, Basalkursus, uge 3
Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereRegressionsanalyse i SAS
Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereMPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.
MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene
Læs mereAdgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)
Økonometri 1 Forår 2003 Ugeseddel 13 Program for øvelserne: Gruppearbejde Opsamling af gruppearbejdet og introduktion af SAS SAS-øvelser i computerkælderen Øvelsesopgave 6: Hvem består første årsprøve
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereVejledende besvarelse af hjemmeopgave
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereBesvarelse af juul2 -opgaven
Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium
Læs mereVejledende besvarelse af hjemmeopgave, forår 2017
Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag
Læs mereVejledende besvarelse af hjemmeopgave, efterår 2018
Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og
Læs mereLogistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Læs mereVejledende besvarelse af hjemmeopgave, forår 2016
Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau
Læs mereBesvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
Læs mereLøsning til øvelsesopgaver dag 4 spg 5-9
Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereHjemmeopgave. I bedes benytte sidste side fra denne opgavetekst i udfyldt stand som forside på jeres opgavebesvarelse. Siden findes også på nettet.
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2012 Udleveret 2. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober-1. november) I Secher et al. (1986) estimeres referencekurver
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mere9. Chi-i-anden test, case-control data, logistisk regression.
Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/
Læs mereOpgavebesvarelse, korrelerede målinger
Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereBasal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs merek normalfordelte observationsrækker (ensidet variansanalyse)
k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mere(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i
Da er r i = e i ˆσ ei t(n 3) (tæt på N(0,1) hvis n ikke alt for lille). Program 1. lineær regression: opgave 3 og 13 (sukker-temperatur). 2. studentiserede residualer, multipel regression. Tommelfinger-regel:
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mere1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
Læs mereAfdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier
Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier
Læs mereHypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereØkonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.
Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. 1 / 32 Motivation Eksempel: Savings = β 0 + β 1 Income + u Vi ved allerede, hvordan vi estimerer regresseionlinjen:
Læs mere