Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Størrelse: px
Starte visningen fra side:

Download "Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences"

Transkript

1 Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 5. november 2018 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox regression Modelkontrol og udvidede modeller Hjemmesider: / 92 2 / 92 Eksempel: Lungecancer blandt krigsveteraner Forklarende variable = Kovariater Outcome Dikotom Kategorisk Kvantitativ Kategoriske og kvantitative Dikotom 2*2-tabeller χ 2 -test Logistisk regression parret Mc Nemar svært, mixed models Mixed models Kategorisk Kontingenstabeller/χ 2 -test Generaliseret logistisk regression Ordinale svært, f.eks. proportional odds modeller Kvantitativ Mann-Whitney Kruskal-Wallis Robust multipel parret Wilcoxon signed rank Friedman regression Normalfordelte T-test Variansanalyse Kovariansanalyse residualer uparret/parret ensidet/tosidet Multipel regression Censureret Log-rank test Cox regression Korrelerede Varianskomponent- Modeller for kvantitative modeller gentagne målinger Nf. residualer Mixed models 3 / krigsveteraner med diagnosen inoperabel lungecancer, af 4 forskellige typer (1:squamous, 2:smallcell, 3:adeno, 4:other) følges frem til død (vi glemmer lige et øjeblik, at 9 af dem faktisk endnu er i live ved tidspunktet for analysen) De er randomiseret til enten standard behandling (treat=0, n=69) ny test behandling (treat=1, n=68) Vi vil gerne sammenligne disse to behandlinger...og så har vi nogle kovariater (udover behandling og type), som vi vender tilbage til 4 / 92

2 Valg af tidsskala Valg af tidsskala, fortsat Der skal vælges en tidsskala for levetiden, dvs. et nulpunkt. Typiske muligheder er: alder kalendertid tid siden diagnose tid siden randomisering (vælges her) Man kan f.eks. få diagnosen som 40-årig, indgå i undersøgelsen fra dette tidspunkt og dø som 72-årig... få diagnosen som 50-årig, randomiseres til undersøgelsen som 55-årig og dø som 65-årig... Ofte er der flere muligheder, og valget er ikke altid helt oplagt: Der skal være en grund til at tro, at den valgte tidsskala afspejler risikoen ens for alle individer (pånær diverse kovariater), altså at der som funktion af tiden ses samme form på risikoen. Eksempelvis kunne man vælge For kroniske sygdomme: Alder: Fordi behandlingen formodentlig ikke ændrer radikalt ved prognosen For stærkt behandlingskrævende sygdomme: Tid siden behandling: iden man kan formode, at en vellykket behandling på afgørende vis ændrer prognosen 5 / 92 6 / 92 Sammenligning af behandlinger Hvad er nyt? Hvis alle var fulgt indtil død, kunne vi lave T-test el.lign. Outcome: Tid fra et veldefineret nulpunkt og indtil en bestemt begivenhed (sædvanligvis død) indtræffer. Her: Levetid i dage siden randomisering, angivet som y i. Det er her, der sker noget nyt, fordi det ikke er alle, der er døde endnu Vi kalder det for censurerede observationer Her er der kun 9 af sådanne, men ofte er der mange flere T-test på log-skala: P=0.50, men men men... Mann-Whitney: P=0.35 Kovariater: Behandling, cancertype, alder, etc. etc. Ikke noget essentielt nyt her... 7 / 92 8 / 92

3 Notation for outcome Illustration af data t i : Det tidspunkt (regnet fra nulpunktet), der er tilknyttet det i te individ, og som angiver enten død eller censureringstidspunkt. d i : Status ved tid t i : 0: censureret, dvs. stadig i live 1: død y i : Tid til død for i te patient 9 / 92 er så ikke observeret for alle: Hvis en patient dør til tid t i, så er y i = t i og d i = 1 Hvis man mister kontakten til en patient til tid t i, så er y i > t i og d i = 0 Hvis analysen laves til tid t i, inden patient i dør, så er y i > t i og d i = 0 treat=0, treat=1 Cirklerne angiver censurerede observationer 10 / 92 Hvad ved vi? Kaplan-Meier: Overlevelseskurve Vi vil opfatte tiden som dynamisk, i den forstand, at vi for hvert tidspunkt t ser på, hvilken information vi har om den enkelte, nemlig status for overlevelse: S i (t) = I (y i > t) Hvis alle er observeret til død, er overlevelseskurven S(t) blot gennemsnittet af disse, altså til hvert tidspunkt blot fraktionen, der stadig er i live. Den kaldes Kaplan-Meier kurven 11 / / 92

4 Men når vi har censureringer? Vigtigt - Uafhængige censureringer? så ved vi ikke, hvad der sker med funktionen S i (t) = I (y i > t) efter det tidspunkt t i, hvor vi sidst ser patienten i live. Vi ved så kun, at deres levetid er større end t i, men ikke hvor meget større. En meget vigtig antagelse om censureringer: De skal være uafhængige af prognosen, dvs. Det faktum, at en patient censureres ved tid t i må på ingen måde være relateret til den fremtidige risiko for at dø Censureringer, der muligvis ikke opfylder dette kriterium: Patienter, der overflyttes til et andet hospital: De har formentlig en dårligere prognose Patienter, der flytter udenlands pga nyt job: De har formentlig en bedre prognose Og hvad, hvis patienten bliver kørt over? 13 / / 92 Kaplan-Meier kurver, I Håndtering af censureringer Når der er censureringer, kan vi ikke tage gennemsnittet af de individuelle S i er, fordi vi ikke kender dem alle. Men hvis censureringerne er uafhængige, kan vi estimere den del, vi ikke kender til blot at være ligesom dem, vi ser, altså antage, at disse patienter dør i samme takt som de øvrige Det er netop det, der ligger i uafhængig censurering. Så hvis det, at man bliver kørt over, tyder på, at man har det dårligt (har fået recidiv), så har man nok på dette tidspunkt en værre prognose end de, der ikke blev kørt over...? 15 / 92 Hvorfor kan vi ikke bare... Smide de censurerede individer helt væk? Vi kender jo ikke deres levetid, så der er vel tale om missing values? Nej, for vi ved noget om deres levetid, nemlig at den er mindst t i, og hvis vi smider dem ud, laver vi derfor bias i overlevelseskurven Lade som om alle t i er er dødsfald? Fordi så ser det jo ud som om de dør alt for hurtigt, så her bliver også bias Vi er nødt til at håndtere censureringer på en dynamisk måde, dvs. ved at se på situationen til et givet tidspunkt og et kort tidsrum herefter. 16 / 92

5 Kaplan-Meier kurver, II når der er censureringer: Vi deler tidsaksen op ved hvert tidspunkt t 1 < t 2 < t 3... (her sker der noget, enten et dødsfald, eller en censurering) For hvert interval, f.eks. (t 3, t 4 ) ser vi på, hvor mange, der var i risiko i starten (n 3 ) og hvor stor en del af disse, der overlevede tidsintervallet, nemlig brøken { 1 hvis t4 er en censurering R 4 = n 3 1 n 3 hvis t 4 er et dødsfald Kaplan-Meier kurven fås nu ved successiv sammengangning af disse brøker: 17 / 92 1 R 1 R 2 R 3 R 4... Praktisk håndtering af censurering Til programmering er outcome 2-delt: t i d i Observationstiden for i te patient (time) som kan være enten død (status=1), eller en censurering (status=0). Indikator for død (status), dvs. 1, hvis patienten faktisk er død, og 0, hvis vedkommende er censureret Begge disse variable skal angives som (todelt) outcome I SAS gøres dette ved at benytte skrivemåden time*status(0)=... i model-sætningen, idet 0 et efter status angiver koden for censurering 18 / 92 Kaplan-Meier kurver i SAS Kaplan-Meier kurver, S(t) kan tegnes med proceduren PHREG: fra PHREG i SAS (se kode s. 19. SPSS, se app. s.3) proc phreg plots(overlay=row cl)=survival data=a1; model time*status(0)= ; strata treat; Grupperingen styres af variablen i strata, og bemærk, at selve modellen er tom (ingen kovariater) plots(overlay=row cl)=survival angiver, at vi ønsker survival kurver, lagt oveni hinanden, og med konfidensgrænser. Figuren ses s / 92 Til ethvert tidspunkt kan vi aflæse den forventede procentdel af patienter, der stadig er i live - for hver behandlingsgruppe 20 / 92

6 Kumulativ incidens Til et hvert tidspunkt angiver dette sandsynligheden for at have fået et event, dvs. (i dette tilfælde) at være død. Denne er blot CI (t) = 1 S(t) Kode til figuren ses s. 84 (SPSS: app. s. 4) Pas på i tilfælde af competing risks (se s ) 21 / 92 Er der forskel på de to behandlinger? De to overlevelseskurver (s. 20) krydser lidt frem og tilbage over hinanden. De eksperimentelt behandlede dør hurtigst til at starte med, men efter ca. 100 dage ser det ud til at vende (bedømt på hældningen af kurverne). Hvordan kan vi sammenligne?: log-rank test: giver en P-værdi for test af identitet Cox proportional hazard model: giver estimat for forskel (ratio) mellem dødsrater under forudsætning af proportionale rater (kommer om lidt...) 22 / 92 Log-rank testet for H 0 : ens dødelighed Log-rank testet i praksis Et non-parametrisk test til sammenligning af overlevelseskurver uden antagelser om formen af disse Til hvert tidspunkt ser man på forskellen mellem observeret og forventet antal døde (under H 0 ) i de to grupper. Forskellen mellem disse, passende normeret, giver et χ 2 -test med G 1 frihedsgrader (G er antallet af grupper, her G = 2) Det er ikke så stærkt, hvis forskellen på kurverne ændrer sig markant over tid. Her giver testet P = 0.93 (se s. 25), altså ingen påviselig forskel Testet fås som et såkaldt score-test (teknisk: det har at gøre med tangenthældningen på likelihoodfunktionen). I SAS PHREG kræver det at man benytter ties=discrete: proc phreg data=a1; class treat(ref="0") / param=glm; model time*status(0)=treat / ties=discrete rl; Det fås også direkte fra SAS LIFETEST, se s. 85 SPSS, se app. s / / 92

7 Output fra Log-rank test Rater = hazards = intensiteter The PHREG Procedure Model Information Data Set WORK.A1 Dependent Variable time Censoring Variable status Censoring Value(s) 0 Ties Handling DISCRETE Number of Observations Used 137 Summary of the Number of Event and Censored Values Total Event Censored Percent Censored Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Score <---log-rank test Der er absolut ikke signifikant forskel - men hvad med kvantificering af forskellen? 25 / 92 Vi har set, at levetiden ikke dur som outcome, fordi en sådan ikke altid observeres. I stedet vil vi gerne modellere hvor hurtigt overlevelseskurven går ned ad bakke, altså en mere dynamisk beskrivelse, i form af den umiddelbare risiko for død (rater, hazards eller intensiteter): Givet, at jeg er i live lige nu, hvad er så min risiko for at dø indenfor det næste år? Eller næste måned? Næste dag/næste time... Hazard funktion h(t): den umiddelbare risiko for at dø i det næste korte interval t er h(t) t h(t) er en rate, ikke en sandsynlighed 26 / 92 Hazard funktionen Eksempler på hazard-funktioner h(t) er ikke så god at estimere, fordi den hopper op og ned (andel døde i hvert lille tidsrum er enten 0 eller et ret lille tal) estimer i stedet kumuleret hazard, H(t) Matematikken kan vise, at H (t) = log(s(t)) Hældningen af H(t) afspejler den umiddelbare risiko/rate/hazard h(t) for at dø: stejl hældning: stor risiko lille hældning: lav risiko Teknisk note: H (t) = S (t) S(t), dvs. det er altså den relative ændring af overlevelseskurven, vi modellerer. Umiddelbar farlig behandling: Alder som mest betydende: Gavnlig behandling, med senfølger: 27 / / 92

8 Kumulerede hazard-funktioner H(t) Overlevelseskurver S(t) Umiddelbar farlig behandling: Umiddelbar farlig behandling: Gavnlig behandling, med senfølger: Gavnlig behandling, med senfølger: Alder som mest betydende: Alder som mest betydende: 29 / / 92 Kumulerede hazard funktioner Cox proportional hazards model i vores eksempel om krigsveteraner proc phreg data=a1 plots(overlay=row cl)=cumhaz; model time*status(0)= ; strata treat; Er de ens? Hvis de ikke er ens, er de så proportionale? (de starter jo begge i 0) SPSS, se app. s. 4 En såkaldt Cox model specificerer alle hazard-funktioner til at være proportionale. Her har vi bare to grupper, så vi antager h 1 (t) = k h 0 (t) Men baseline hazard funktionen h 0 (t) specificeres ikke nærmere, dvs. vi antager ikke noget om afhængigheden af tiden Vi vil gerne estimere proportionalitetskonstanten k, hvis modellen altså holder..., dvs. hvis der er additivitet på log-skala: log(h 1 (t)) = log(k) + log(h 0 (t)) 31 / / 92

9 Estimat for behandlingseffekt under antagelse af proportionale intensiteter, som antages, når treat sættes som kovariat i model-sætningen (se kode s. 24): The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq treat treat Parameterestimatet er her differensen mellem grupperne på log-hazard skala, og den skal tilbagetransformeres til en faktor, kaldet hazard ratio eller rate ratio. Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits Label treat treat 1 treat 0... treat 0 SPSS: se app. s / 92 Fortolkning af behandlingseffekten Effekten af eksperimentel behandling (treat=1 vs. treat=0) er at øge hazard med faktoren 1.017, altså en forøgelse på 1.7%. Dette er dog på ingen måde signifikant (P=0.93), idet konfidensintervallet er CI=(0.71, 1.45), og altså indeholder effekter lige fra en forøgelse af hazard med 45% til en formindskelse af hazard med 29%. Dette er den simplest tænkelige Cox-model med kun en enkelt kategorisk kovariat på 2 niveauer (2 grupper), og raterne antages altså at være proportionale. 34 / 92 Proportionale rater/hazards Eksempel på proportionale rater/hazards I tilfælde af to grupper har vi h 1 (t) = k h 0 (t) og dermed parallellitet på log-skala, også for de kumulerede rater: i 4 grupper (4 værdier af en kategorisk kovariat): log(h 1 (t)) = log(k) + log(h 0 (t)) Da der gælder H (t) = log(s(t)), svarer det til, at log( log(s 1 (t))) = log(k) + log( log(s 0 (t))) og man siger derfor, at der er parallellitet på loglogs-skala, eller på cloglog-skala. Dette kan kontrolleres Grafisk: se s. 37 og 40 Numerisk: se s / 92 Figuren af log H (t) mod log(t) nederst til højre viser tydeligt parallelle kurver, dvs. proportional hazards (PH) 36 / 92

10 Har vi PH i vores eksempel? Check af proportionale rater For at lave den relevante figur, gemmer vi log(h (t)) og regner videre, se s. 87: SPSS, se appendix s. 7-8 Er disse to parallelle? Ikke synderligt... Grafisk: Her er to muligheder: 1. Check parallellitet af H(t) erne i grupperne, på loglogs-skala, som vist s Benyt de såkaldte kumulerede score-residualer via assess-statement i PHREG, se s. 40 Numerisk: Her er også 2 muligheder: 1. Den ovenfor omtalte assess-sætning i PHREG kan benyttes til et numerisk test, baseret på simulationer, se s En sværere metode: Inkluder en tidsafhængig effekt af kovariaten, se mere s. 72ff 37 / / 92 Score residualer (Schoenfeld) Grafisk check af proportionale rater Benyt nedenstående sætning i PHREG (se også s. 88): Til hvert tidspunkt for event, f.eks. t i for individ i ser vi på vedkommendes kovariat x i og spørger: Er det "den forventede" person, der dør? x i x(t i, β) Disse kumuleres over tid og standardiseres (standardized score process) og kan afsløre, om betydningen af x er den samme over tid (svarende til proportional hazards): assess ph / resample seed=106165; Tallet i seed er jeres valg... Hvis f.eks. folk med høje værdier af kovariaten dør for tidligt i starten, vil processen starte med at være positiv, for derefter at synke ned mod / 92 Bemærkninger næste side 40 / 92

11 Numerisk check af proportionale rater Antagelsen om proportionale intensiteter er ikke opfyldt Supremum Test for Proportionals Hazards Assumption Maximum Absolute Pr > Variable Value Replications Seed MaxAbsVal treat Baseret på 1000 simulationer ser vores proces ud til at være ret aparte (P=0.024), så antagelsen om proportional hazards er ikke helt god. Figuren s. 40 viser, at det i starten er patienter med høje værdier af variablen treat1 (dvs. personer med 1-taller for indikatoren for treat=1, altså de eksperimentelt behandlede), der dør for tidligt. Dette svarer også til, hvad vi har set på overlevelseskurven (s. 20) og kumuleret hazard funktion (s. 37). 41 / 92 Det betyder at: Forskellen på behandlingerne er ikke er konstant over tid. Hazard-funktionerne har ikke samme form for de to grupper Hvad gør vi så? Overvejer, om vi har glemt nogle vigtige kovariater: Fik vi svaret på det rigtige? Benytter tidsafhængige kovariater Dette er svært, så vi udskyder det til s. 72ff 42 / 92 Har vi andre kovariater? Regressionsmodeller i overlevelsesanalyse Jada, vi har adskillige: celltype: 1:squamous, 2:smallcell, 3:adeno, 4:other karno: Karnofsky performance score (0-100, 100 er godt): 10-30: hospitaliseret 40-60: delvist hospitaliseret 70-90: tager vare på sig selv diagtime: Måneder fra diagnose til randomisering/behandling age: Personens alder i år prior: Er der givet tidligere behandling? 0:nej, 1:ja Vi forsøger os med en model, der (ud over treat) tager højde for celltype og karno, dvs. en model med to kategoriske og en enkelt kvantitativ kovariat. 43 / 92 i daglig tale: Cox modeller: Da hazard-funktioner er positive, h(t) > 0, vil log(h(t)) kunne antage alle værdier, og det er derfor naturligt at modellere effekten af kvantitative kovariater (x, f.eks. karno) på denne skala: log(h(t x)) = log(h 0 (t)) + βx således at effekten bliver multiplikativ på selve hazard-skalaen. Her er h 0 (t) baseline hazard, svarende til x = 0 (altså en generaliseret form for intercept), og β er regressionskoefficienten hørende til kovariaten x. Bemærk, at β er uafhængig af tiden, og at exp(β) netop er proportionalitetskonstanten k fra s / 92

12 Hazard-funktioner For hver kombination af kovariater har vi til hvert tidspunkt en vis umiddelbar rate for død, som har det multiplikative udtryk: Eksempel på hazard-funktioner for 4 forskellige ækvidistante værdier (0, 1, 2 og 3) af en kvantitativ kovariat x: h(t x) = h 0 (t) exp(βx) Hazard funktionen (raten) er altså en funktion af to (eller flere) variable: tiden og kovariaten (kovariaterne): Proportional hazards: er en antagelse om afhængigheden af tiden, nemlig at denne afhængighed er den samme for alle kovariat-værdier, pånær en multiplikativ effekt (en faktor) Linearitet: er en antagelse om afhængigheden af hver af de kvantitative kovariater, nemlig at der for hver givet tidspunkt er linearitet (på log-skala) 45 / 92 Her er både proportional hazards og linearitet (det første ses ved parallellitet, og det sidste fordi afstanden mellem kurverne er ækvidistant) 46 / 92 Eksempel på hazard-funktioner Eksempel på hazard-funktioner for 4 forskellige værdier af en kvantitativ kovariat x: for 4 forskellige ækvidistante værdier (0, 1, 2 og 3) af en kvantitativ kovariat x: Her er både proportional hazards og linearitet (det første ses ved parallellitet, og det sidste fordi afstanden mellem kurverne afspejler de ikke-ækvidistante kovariat-værdier) 47 / 92 Her er proportional hazards, men ikke linearitet (kurverne er parallelle, men ikke ækvidistante) 48 / 92

13 Eksempel på hazard-funktioner Model med 3 kovariater for 4 forskellige ækvidistante værdier (0, 1, 2 og 3) af en kvantitativ kovariat x: treat: Behandlingen celltype: De 4 cancertyper karno: kvantitativ Karnofsky score proc phreg data=a1; class treat(ref="0") celltype / param=glm; model time*status(0)=treat celltype karno / rl; estimate "effekt af 10 karno" karno 10 / exp cl; hazardratio karno / unit=10; hazardratio celltype / diff=all; assess var=(karno) ph / resample seed=106165; baseline out=ud loglogs=logcumrate survival=_all_; Her er hverken proportional hazards, eller linearitet 49 / 92 SPSS, se appendix s / 92 Bemærkninger til modelsætningerne s. 50 Output fra model med 3 kovariater Kode s. 50 giver outputtet: estimate-sætning er velkendt, her blot for at få effekten af 10 enheder af karno. Denne kan her også skrives som den første af de to hazardratio-sætninger hazardratio celltype / diff=all: Her beder vi om parvise sammenligninger mellem de 4 celletyper, se output s. 54 assess-sætning er udbygget med var=(karno), som checker linearitetsantagelsen for den kvantitative kovariat karno, se output s The PHREG Procedure Type 3 Tests Wald Effect DF Chi-Square Pr > ChiSq karno <.0001 treat celltype Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq karno <.0001 treat treat celltype adeno <.0001 celltype large celltype smallcel celltype squamous / / 92

14 Output fra model med 3 kovariater, fortsat Output fra model med 3 kovariater, fortsat Tilbagetransformerede estimater: Output fra hazardratio-sætningerne fra kode s. 50: Analysis of Maximum Likelihood Estimates Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits Label karno treat treat 1 treat 0... treat 0 celltype adeno celltype adeno celltype large celltype large celltype smallcel celltype smallcel celltype squamous... celltype squamous Se fortolkning s Hazard Ratios for karno Point 95% Wald Confidence Description Estimate Limits karno Unit= Hazard Ratios for celltype Point 95% Wald Confidence Description Estimate Limits celltype adeno vs large celltype adeno vs smallcel celltype adeno vs squamous celltype large vs smallcel celltype large vs squamous celltype smallcel vs squamous / / 92 Fortolkning af output fra de forrige sider Fortolkning af rate ratioer Der er stærkt signifikant negativ effekt af karno-score (P < ) Der er stærkt signifikant forskel på cancertyperne, med adeno og smallcell som de farligste (de har de største positive afvigelser fra referencegruppen squamous) Behandlingseffekten er fortsat ikke signifikant, P=0.20 For at forstå selve estimaterne, skal vi se på rate ratioerne (hazard ratios), som det ses s. 53. Effekten af 1 enhed på karno-skalaen er et fald i dødsraten på 3.1%, CI=(2.1%, 4.0%), se dog også næste side, hvor vi har effekten af 10 enheder Umiddelbart er den eksperimentelle behandling dårlig, med en forøget rate på 29.3%, men CI viser, at det ligeså godt kunne være en formindsket rate (12.7% lavere), eller muligvis helt op til næsten dobbelt så stor rate (91.7% højere) adeno-typen estimeres til at være ca. 3 gange så farlig som referencen squamous, dog med betydelig usikkerhed, svarende til faktorer mellem 1.77 og / / 92

15 Output fra estimate-sætningen, s. 50 Modelcheck The PHREG Procedure Estimate Standard Label Estimate Error z Value Pr > z Alpha effekt af 10 karno < Label Lower Upper Exponentiated effekt af 10 karno Exponentiated Exponentiated Label Lower Upper effekt af 10 karno Fortolkning: Effekten af en øgning på 10 enheder på karno-skalaen er et fald i dødsraten på 26.74%, CI=(18.93%, 33.79%) For kategoriske kovariater: Her drejer det sig om treat og celltype: Her skal antagelsen om Proportional hazards checkes: ved at sætte kovariaten i strata i stedet for i model-sætning, for derefter at tegne log H (t), se det tidligere check af treat, s. 37, og det nuværende på s. 59 For kovariaten celltype finder vi her figuren på s. 60 benytte PH-option i assess-statement, se kode s. 50 med output s. 61 og / / 92 Modelkontroltegninger for treat Modelkontroltegninger for celltype i denne nye model med 3 kovariater. Da dette er en kategorisk variabel, sætter vi den i stedet i strata-statement for at kunne tegne kumulerede rater, på log-skala, se kode for tilsvarende figur på s. 87. Til brug for denne figur, er det celltype, der sættes i strata-statement for at kunne tegne kumulerede rater, på log-skala, se tilsvarende kode s. 87 Det ses, at det netop er referencegruppen squamous, der opfører sig anderledes end de andre, med lavere hældning 59 / / 92

16 Proportional hazards via assess, I Proportional hazards via assess, II Numeriske tests af modeltilpasning fra assess-sætning: The PHREG Procedure Supremum Test for Functional Form Maximum Absolute Pr > Variable Value Replications Seed MaxAbsVal karno Supremum Test for Proportionals Hazards Assumption Maximum Absolute Pr > Variable Value Replications Seed MaxAbsVal karno <.0001 treat celltypeadeno celltypelarge celltypesmallcel / / 92 Bemærkning vedrørende Proportional hazards Bemærkning vedrørende Proportional hazards, II Og så for kovariaten celltype: Først for kovariaten treat: Det numeriske test giver nu P=0.42, dvs. vi har ikke mere anledning til at betvivle proportionaliteten Bemærk, at vi tidligere (s ) havde P=0.024, og de proportionale intensiteter er altså opnået ved at tilføje vigtige ekstra kovariater Det numeriske test er her 3-delt, idet alle typer sammenlignes til reference-typen squamous. Det ses, at alle P-værdierne er signifikante (den ene dog lige på , men alligevel). Her har vi altså et problem, og fra figuren s. 60 ses det, at netop celletypen squamous adskiller sig fra de øvrige ved at have et fladere forløb, svarende til en større dødelighed fra start, efterfulgt af lavere dødelighed senere. Havde vi valgt en anden referencegruppe, havde vi rimeligvis kun set problemer i forhold til sammenligningen med squamous. 63 / / 92

17 Modelcheck for kvantitative kovariater Check af modelforudsætninger for karno Her drejer det sig kun om karno: Her skal der checkes to antagelser: 1. Linearitet på log(hazard)-skala Her kan man benytte Kumulerede Martingal residualer: For hver kovariatværdi x ser man på, i hvor høj grad personer med kovariatværdier < x levede for længe (positive værdier) eller døde for tidligt (negative værdier). Fås i SAS ved at skrive var=(karno) i en assess-sætning, se s. 50 Metoden er dog ikke særligt sensitiv 2. Proportional hazards: checkes (næsten) som for kategoriske kovariater, nemlig via assess Lineariteten: Proportional hazards: 65 / / 92 Linearitetsantagelsen for karno Effekt af karno som lineær spline Figuren til venstre s. 66 og det tilhørende test s. 62 viser, at lineariteten er rimelig (P=0.34). Alternative checks af lineariteten kunne være: Såvel karno som log(karno) som kovariater En lineær spline i karno, hvor vi f.eks. tillader knæk ved karno=40 og karno=80: proc phreg data=a1; class treat(ref="0") celltype / param=glm; model time*status(0)=karno karno40 karno80 treat celltype / rl; output out=tegn xbeta=spline; Testlinearitet: TEST karno40=karno80=0; Test af ingen knæk i spline n: Linear Hypotheses Testing Results Wald Label Chi-Square DF Pr > ChiSq Testlinearitet Se mere s. 90, samt dele af output næste side 67 / / 92

18 Check af proportional hazards for karno Vi prøver at forstå problemet Testet for proportionale intensiteter for karno (s. 62) viser, at denne antagelse er helt gal (P < ). Denne manglende proportionalitet ses også på figuren til højre på s. 66, hvor den standardiserede score-process (se s. 39) ses at afvige fra de simulerede. Dette betyder: Effekten af karno er ikke er konstant over tid. Hazard-funktionerne har ikke samme form for alle værdier af karno På figuren s. 66 ses, at de med små værdier af karno i højere grad dør i starten af perioden i forhold til, hvad modellen siger Effekten af karno er i sig selv negativ, således at små værdier af karno altid vil formodes at dø først - de gør det bare endnu mere i starten Det betyder, at effekten af karno er størst i starten, men aftager efterhånden som tiden går Hvad gør vi så?? 69 / / 92 Hvis vi nu grupperer karno-kovariaten Tidsafhængige kovariater og sætter den ind i strata: Her ser vi ligeledes, at kurverne afviger en del i starten (svarende til stor effekt af karno), men efterhånden nærmer sig hinanden (svarende til næsten ingen effekt) Vi har altså set, at antagelsen om proportionale intensiteter hazards ikke holdt for kovariaten karno. Det betyder, at den prognostiske værdi af karno ændrer sig med tiden, og vi fortolkede det som at effekten af karno er stærkest i starten. Hvad gør vi så? Vi kan opdele tiden i intervaller, og estimere en proportionalitetsfaktor for hvert interval for sig. Vi kan f.eks. opdele tiden efter kvartilerne for de døde: 23, 62 og dage 71 / / 92

19 Tidsafhængige kovariater i praksis For at få effekten af 10 karno-enheder direkte, skifter vi karno-variablen ud med karno10=karno/10, således at 1 enhed af karno10 svarer til 10 enheder af karno. Dernæst indfører vi separate effekter af karno10 ved direkte i PHREG at definere separate kovariater i de forskellige tidsrum: proc phreg data=a1; class treat(ref="0") celltype / param=glm; model time*status(0)=treat celltype karno1 karno2 karno3 karno4 / rl; if time<=23 then karno1=karno10; else karno1=0; if 23<time<=62 then karno2=karno10; else karno2=0; if 62<time<=147.5 then karno3=karno10; else karno3=0; if 147.5<time then karno4=karno10; else karno4=0; NumCheck: test karno1=karno2=karno3=karno4; 73 / 92 Output fra tidsafhængig effekt af karno Analysis of Maximum Likelihood Estimates Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits Label treat treat 1 treat 0... treat 0 celltype adeno celltype adeno celltype large celltype large celltype smallcel celltype smallcel celltype squamous... celltype squamous karno karno karno karno Linear Hypotheses Testing Results Wald Label Chi-Square DF Pr > ChiSq NumCheck Se fortolkning næste side 74 / 92 Fortolkning af tidsafhængig effekt Effekten af karno aftager med tiden: Rate-ratioerne nærmer sig 1, ganske som vi fandt det tidligere på kontroltegningen s. 71. Det kunne have den simple forklaring, at karno var målt ved indgang i studiet. Vi får et alternativt test for konstant effekt af karno, med P = , altså (igen) forkastelse. Kan der være interaktioner med celltype? Man kunne forestille sig en differentieret effekt af behandlingen for de 4 celletyper, altså interaktionen treat*celltype (se kode s. 92): Type 3 Tests Wald Effect DF Chi-Square Pr > ChiSq treat celltype treat*celltype karno <.0001 karno <.0001 karno karno Der er ikke tilstrækkelig evidens for en interaktion (P=0.10) 75 / / 92

20 Interaktioner med celltype, fortsat Problemstillinger, I: Forsinket indgang Estimater for behandlingen, opdelt efter celletype: Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square celltype adeno celltype large celltype smallcel celltype squamous treat*celltype 1 adeno treat*celltype 1 large treat*celltype 1 smallcel treat*celltype 1 squamous treat*celltype 0 adeno treat*celltype 0 large treat*celltype 0 smallcel treat*celltype 0 squamous karno karno karno karno Forsinket indgang = left-truncation Når vi skal sammenligne behandlinger, kan patienterne naturligvis først tælle med, når de blev randomiseret til en af disse og derfor er en del af risikogruppen. Hvis vi benytter en tidsskala, der hedder tid siden diagnose, kan vi have et problem, idet nogle kan være døde efter diagnose og inden randomisering, således at de, der indgår i studiet er selekterede, måske forskelligt i de to behandlingsgrupper. Hvad gør vi så? Vi konstruerer en variabel (f.eks. indgang), der indeholder det tidspunkt, som patienten skal tælle med fra, og så skriver vi f.eks. model time*status(0)=treat celltype / entry=indgang; 77 / / 92 Problemstillinger, II: Competing risks Competing risks = konkurrerende dødsårsager/afgangsårsager: Hvis man f.eks. studerer tid til tilbagefald efter behandling, har man det problem, at folk stadig kan dø, inden de får tilbagefald. Hvad gør man så? 1. Man analyserer det sammensatte endepunkt: tid til enten tilbagefald eller censurering, hvad der så end kommer først 2. Man opfatter død som censureringer I første tilfælde er der intet problem, men i tilfælde 2 får man problemer: Man kan stadig godt Udregne hazard-funktioner, og estimere i Cox-modeller for tilbagefald=recidiv, ved blot at opfatte død som en censurering 79 / 92 Competing risks, fortsat men man kan ikke fortolke overlevelseskurver (Kaplan-Meier), se s. 20 fordi det ikke giver nogen mening at antage, at de censurerde patienter (som jo er døde) ville få recidiv i samme takt som de ucensurerede, se s. 15. beregne kumulerede incidenser, altså sandsynligheder for at opleve recidiv (som vist s. 21) I stedet kan man benytte de såkaldte Fine and Gray modeller, der direkte modellerer kumulative incidenser 80 / 92

21 Ofte stillede spørgsmål: FAQ APPENDIX Hvorfor bruger vi ikke bare logistisk regression af f.eks. 1-års mortaliteten? Fordi vi mister en masse information, og fordi vi mister muligheden for at håndtere censureringer Hvorfor bruger vi ikke bare normalfordelingsmodeller på tiden fra randomisering til død? Fordi fordelingen ofte er ganske anderledes end en normalfordeling, og igen fordi vi mister muligheden for at håndtere censureringer Overlevelsesanalyse er den stærkeste måde at håndtere overlevelsesdata på! med SAS-programbidder svarende til nogle af slides Kaplan-Meier kurver, s. 83 Kumulerede incidenser, s. 84 Log-rank test, s. 85 Kumulerede hazards, s. 86 Check af proportional hazards, s Model med 3 kovariater og modelkontrol, s Tidsafhængige kovariater, s. 91 Interaktioner, s / / 92 Kaplan-Meier kurver i SAS Kumulerede incidenser, med figur Slide 20 Slide 21 Figur af 2 Kaplan-Meier overlevelseskurver, svarende til 2 værdier af variablen treat, med konfidensgrænser. Grupperingen styres af variablen i strata, og bemærk, at selve modellen er tom (ingen kovariater) proc phreg plots(overlay=row cl)=survival data=a1; model time*status(0)= ; strata treat; proc phreg data=a1; model time*status(0)= ; strata treat; baseline out=ud survival=_all_; data ud1; set ud; cif=1-survival; log2time=log2(time); proc sgplot data=ud1; step Y=cif X=time / group=treat; 83 / / 92

22 Log-Rank test Figur af kumulerede hazards Slide 24 med PHREG: title log-rank test ; proc phreg data=a1; class treat(ref="0") / param=glm; model time*status(0)=treat / ties=discrete rl; eller med LIFETEST: proc lifetest notable plots=(survival(atrisk) logsurv) data=a1; time time*status(0); strata treat; Slide 31 Grupperingen styres af variablen i strata, og bemærk, at selve modellen er tom (ingen kovariater) proc phreg data=a1 plots(overlay=row cl)=cumhaz; model time*status(0)= ; strata treat; 85 / / 92 Check af Proportional hazards, figur Numerisk check af proportionale rater Slide 37 proc phreg plots(overlay=row cl)=(survival cumhaz) data=a1; model time*status(0)= ; strata treat; baseline out=ud loglogs=logcumrate; data ud1; set ud; log2time=log2(time); proc sgplot data=ud1; series Y=logCumrate X=log2time / group=treat; Slide proc phreg data=a1; class treat(ref="0") / param=glm; model time*status(0)= treat / ties=discrete rl; assess ph / resample seed=106165; 87 / / 92

23 Model med 3 kovariater Slide 50 proc phreg data=a1; class treat(ref="0") celltype / param=glm; model time*status(0)=karno treat celltype / rl; estimate "effekt af 10 karno" karno 10 / exp cl; assess var=(karno) ph / resample seed=106165; hazardratio celltype / diff=all; hazardratio karno / unit=10; Kovariat modelleret som spline Slide Definitionerne af de to ekstra kovariater er karno40=(karno>40)*(karno-40); karno80=(karno>80)*(karno-80); og de ekstra sætninger i koden har følgende betydning: output out=tegn xbeta=spline; Variablen spline i datasættet tegn indeholder den estimerede effekt af karno, altså den knækkede linie, for hver af de indgående grupper. Disse kan så efterfølgende tegnes vha f.eks. sgplot Testlinearitet: TEST karno40=karno80=0; Vi tester, om begge de to ekstra led kan undværes samtidig, altså om effekten af karno kan beskrives ved simpel linearitet 89 / / 92 Tidsafhængige kovariater Interaktion Slide 72ff i model med tidsafhængige kovariater. Slide 76 proc phreg data=a1; class treat(ref="0") celltype / param=glm; model time*status(0)=treat celltype karno1 karno2 karno3 karno4 / rl; if time<=23 then karno1=karno10; else karno1=0; if 23<time<=62 then karno2=karno10; else karno2=0; if 62<time<=147.5 then karno3=karno10; else karno3=0; if 147.5<time then karno4=karno10; else karno4=0; NumCheck: test karno1=karno2=karno3=karno4; proc phreg data=a1; class treat(ref="0") celltype / param=glm; model time*status(0)=treat celltype treat*celltype karno1 karno2 karno3 karno4 / rl; if time<=23 then karno1=karno10; else karno1=0; if 23<time<=62 then karno2=karno10; else karno2=0; if 62<time<=147.5 then karno3=karno10; else karno3=0; if 147.5<time then karno4=karno10; else karno4=0; NumCheck: test karno1=karno2=karno3=karno4; 91 / / 92

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019 Faculty of Health Sciences Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 1. april 2019 1 / 92 Overlevelsesanalyse Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

Dag 6: Interaktion. Overlevelsesanalyse

Dag 6: Interaktion. Overlevelsesanalyse Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard & Susanne Rosthøj 1. april 2019 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Overlevelsesanalyse. Faculty of Health Sciences

Overlevelsesanalyse. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Program Overlevelsesdata Kaplan-Meier estimatoren

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen. 1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik ... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual Faculty of Health Sciences Selve sproget Basal statistik Lille SAS Manual Lene Theil Skovgaard 5. september 2017 Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017 Faculty of Health Sciences Basal statistik Lille SAS Manual Lene Theil Skovgaard 31. januar 2017 1 / 42 Selve sproget Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion . februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 ( Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 1. oktober 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Basal Statistik Kategoriske Data

Basal Statistik Kategoriske Data Basal Statistik Kategoriske Data 8 oktober 2013 E 2013 Basal Statistik - Kategoriske data Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993. Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993. 1. Det anføres, at OR for maorier vs. ikke-maorier er 3.81.

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Introduktion til GLIMMIX

Introduktion til GLIMMIX Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Simpel og multipel logistisk regression

Simpel og multipel logistisk regression Faculty of Health Sciences Logistisk regression Simpel og multipel logistisk regression 16. Maj 2012 Analyse af en binær responsvariabel. syg/rask, død/levende, ja/nej... Ud fra en eller flere forklarende

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 ( Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (28.-30. oktober) En stor undersøgelse søger at afdække forhold

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2013 Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.april) I forbindelse med reagensglasbehandling blev 100 par randomiseret

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Faculty of Health Sciences Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Forsøgsplanlægning Sammenligning af to grupper : Hvor mange personer skal vi bruge? Det kommer

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til

Læs mere

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22. Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 11. februar 2019 med instruktioner til SPSS-analyse svarende til nogle

Læs mere