Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Størrelse: px
Starte visningen fra side:

Download "Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder"

Transkript

1 Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse med logaritmer Kovariansanalyse: Eksempel om baseline og follow-up Sammenligning af hældninger Interaktion - igen Hjemmesider: ltsk@sund.ku.dk 1 / 84 2 / 84 Nyt eksempel vedr. sammenligning af målemetoder Scatter plot af de to metoder (jvf. eksemplet MF vs. SV fra første forelæsning) To forskellige metoder til bestemmelse af glucosekoncentration. Ref: R.G. Miller et.al. (eds): Biostatistics Casebook. Wiley, 1980 REFE: Farvetest, der kan forurenes af urinsyre TEST: Enzymatisk test, mere specifikt for glucose. nr. REFE TEST X SD Det ser jo pænt ud..., eller? 3 / 84 4 / 84

2 Parret sammenligning Limits of agreement Naturligt at se på differenser (dif) Test om middelværdien kan være 0: Systematisk forskel? Kvantificer individuelle differenser: Limits of agreement The MEANS Procedure Variable N Mean Std Dev t Value Pr > t dif < Med en P-værdi < er der stærk indikation af bias På basis af en normalfordelingsantagelse på differenserne finder vi referenceintervallet (normalområdet): 9.89 ± = ( 9.51, 29.29) med fortolkningen: Når vi måler med begge metoder på samme person, vil differensen typisk ligge i intervallet (-9.5, 29.3) På tegningen ses, at dette er en dårlig beskrivelse, idet differenserne stiger med niveauet (repræsenteret ved gennemsnittet) variationen stiger også med niveauet 5 / 84 6 / 84 Bland-Altman plot Scatter plot Plot af differenser mod gennemsnit (af de to målinger på samme person): efter logaritmetransformation (her den naturlige ) Store afvigelser ved høje målinger, dvs. relative afvigelser Så er det smart at se på logaritmer 7 / 84 8 / 84

3 Bemærk Bland-Altman plot for logaritmer Det er de oprindelige målinger, der skal logaritmetransformeres, ikke differenserne! Det er ligegyldigt, hvilken logaritmefunktion, der vælges (der er proportionalitet mellem alle logaritmer) Efter logaritmering gentages proceduren med differenser og konstruktion af limits of agreement Der er en tydelig outlier (den mindste observation) 9 / / 84 Vi udelader en outlier... En slags konklusion og laver igen et Bland-Altman plot The MEANS Procedure Variable N Mean Std Dev t Value Pr > t ldif < Limits of agreement på logaritmisk skala: ± = ( 0.018, 0.150) som bliver acceptabelt / 84 Det betyder, at der i 95% af tilfældene vil gælde < log(refe) log(test) = log( REFE TEST ) < Men hvad kan vi bruge det til? 12 / 84

4 Konklusion på brugbar facon Limits of agreement Vi kan tilbagetransformere med anti-logaritmen (her er det eksponentialfunktionen exp()) og få exp( 0.018) = < TEST REFE < = exp(0.150) eller omvendt < TEST REFE < tilbagetransformeret til oprindelig skala Det betyder: TEST ligger typisk mellem 14% under og 2% over REFE. 13 / / 84 Regninger direkte på ratio-skala Limits of agreement på ratio-skala Med definitionen ratio = refe test får vi: The MEANS Procedure Variable N Mean Std Dev Std Error ratio svarende til limits of agreement: ± = (0.979, 1.159) altså refe fra 2% under til 16% over test, på 2 decimaler identisk med resultatet for logaritmerne Dette er ikke altid tilfældet!! 15 / / 84

5 Terminologi for kvantitativt outcome, f.eks. vitamin D Regressionsanalyse: Kovariaterne er også kvantitative Simpel (lineær) regression: kun en enkelt kovariat Multipel (lineær) regression: to eller flere kovariater Variansanalyse: Kovariaterne er kategoriske (grupper) Ensidet variansanalyse: kun en enkelt kovariat Tosidet variansanalyse: to kovariater Generel lineær model GLM: Begge typer kovariater i samme model Kovariansanalyse: Netop en kvantitativ og en kategorisk kovariat 17 / 84 Sammenligning af to grupper - som ikke er helt sammenlignelige, pga en confounder: En variabel, som har en effekt på outcome er relateret til gruppen (dvs. der er forskel på værdierne i de to grupper) Herved kan opstå bias. 18 / 84 Gruppe/behandling Confounder Outcome Eksempel: vægt blandt mænd og kvinder Eksemplet om sædkvalitet fra øvelserne Mulig confounder: Højde To forskellige sammenligninger: T-test: Er der forskel på middel vægt blandt mænd og kvinder? Kovariansanalyse: Er der forskel på middel vægt for mænd og kvinder, med samme højde? Kønseffekten korrigeres for forskel i højde: To grupper skal sammenlignes: SAS-ansatte vs. økologisk landmænd, men abstinenstiden (1: kort, 2: mellem, 3:lang) er en mulig confounder To forskellige videnskabelige spørgsmål 19 / / 84

6 Repetition: Tosidet varians-analyse Interaktion i eksemplet om sædkvalitet To Class-variable (her sas_ansat og abstid) med hhv k 1 og k 2 niveauer (her 2 hhv. 3), dvs. k 1 k 2 (her 6) grupper. Default parametrisering: Et niveau (intercept) for referencegruppen (sidste niveau af samtlige indgående faktorer) (k 1 1) parametre, der beskriver forskelle til sidste niveau af faktor nr. 1 (k 2 1) parametre, der beskriver forskelle til sidste niveau af faktor nr. 2 Faktorerne kan indgå additivt eller med interaktion Når interaktionen er med i modellen, tilføjes yderligere (k 1 1)(k 2 1) = (2 1)(3 1) = 2 interaktionsparametre, der beskriver: hvordan effekten af den ene faktor modificeres, når vi går fra referencegruppen for den anden faktor til et af de andre niveauer Interaktionen repræsenterer synergi-effekten mellem kovariat 1 og 2, og er et symmetrisk begreb. I epidemiologiske termer: Kovariat 1 modificerer effekten af kovariat 2 (og vice versa) og kaldes derfor også en effekt modifikator. 21 / / 84 Antal, gennemsnit og (spredning) Valg af skala? abstinenstid gruppe 1:kort 2:mellem 3:lang Landmænd (47.0) (55.6) (105.5) SAS-ansatte (63.5) (67.7) (75.4) Plot af spredninger mod gennemsnit: Er der nogen sammenhæng her? svært at sige... Valg af skala? Confounding? Interaktion? Se på variationen (og evt. fordeling) Se på antallene Se på gennemsnittene Man kan også efterfølgende se på modelkontrollen. 23 / / 84

7 Modelkontrol for sædkoncentration i model med interaktion Logaritmetransformerede data (her er brugt log10): På denne skala ser både normalfordelingsantagelse og varianshomogenitet suspekte ud. 25 / / 84 Modelkontrol på logaritmeskala Mulig confounding (gruppe og abstinenstid)? Er der samme fordeling af abstinenstider i de to grupper? sas_ansat abstid Frequency Row Pct Total ja nej Total Statistic DF Value Prob Chi-Square På denne skala ser antagelserne noget bedre ud, men med tydelige tendenser til overtransformation. 27 / 84 Næsten, dog lidt forskel på abstinenstid 1 og 2. Svag confounding mulig, hvis der er effekt af abstinenstid. 28 / 84

8 Interaktion? Vekselvirkning (interaktion) Vi kan jo starte med at se på medianer: Tænkt eksempel: To inddelingskriterier: køn og rygestatus Outcome: FEV 1 Der kunne måske se ud til at være interaktion... men vi kan jo ikke se spredningerne her 29 / 84 Effekten af rygning afhænger af køn Forskellen på kønnene afhænger af rygestatus 30 / 84 Mulige forklaringer Eksempel: Rygnings effekt på fødselsvægt biologisk kønsforskel på effekt af rygning holder vist ikke i praksis, men eksemplet er jo også blot tænkt måske ryger kvinderne ikke helt så meget antal pakkeår confounder for køn måske virker rygningen som en relativ (%-vis) nedsættelse af FEV 1 kunne undersøges ved en longitudinel undersøgelse 31 / / 84

9 Analyse af log(sædkoncentration) Model med interaktion: Source DF Type III SS Mean Square F Value Pr > F Interaktion/vekselvirkning mellem mængden og varigheden af rygningen Der er effekt af mængden, men kun hvis man har røget længe. Der er effekt af varigheden, og denne effekt øges med mængden. Effekten af mængden afhænger af... og effekten af varigheden afhænger af / 84 sas_ansat abstid sas_ansat*abstid Bemærk: Når der er interaktion, giver det ikke mening at tolke de marginale effekter, dvs. effekten af den ene kovariat, uden samtidig at angive hvad niveauet af den anden er. 34 / 84 Altså: Output med interaktion, fortsat Vi kan ikke spørge: Hvor stor forskel er der på SAS-ansatte og økologer? uden samtidig at sige, hvilken abstinenstid, vi betragter. Først når (den insignifikante) interaktion er udeladt af modellen (fra s. 45), kan vi komme med et enkelt estimat for forskellen mellem SAS-ansatte og økologer. Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 sas_ansat ja B sas_ansat nej B... abstid B abstid B abstid B... sas_ansat*abstid ja B sas_ansat*abstid ja B sas_ansat*abstid ja B... sas_ansat*abstid nej B... sas_ansat*abstid nej B... sas_ansat*abstid nej B / / 84

10 Fortolkning af estimater Udregning af predikterede=fittede værdier For mænd med lang abstinenstid (niveau 3) har økologiske landmænd et niveau, der ligger over de SAS-ansattes. Hvordan ændres denne forskel, når vi ser på f.eks. mellem abstinenstid (niveau 2)? Den øges med til i alt = Alt sammen på logaritmisk (log10) skala! abstinenstid erhverv 1:kort 2:mellem 3:lang sas-ansatte = = = landmænd = = reference 37 / / 84 Tilbagetransformation Sådan ser de fittede værdier (ŷ) ud rent grafisk Outcome var jo logaritmetransformeret! Vi skal transformere tilbage: sas_ansat abstid på log 10 -skala tilbagetransformeret 1: kort ja 2: mellem : lang : kort nej 2: mellem : lang Log-skala Original skala 39 / / 84

11 SAS-udregning af forskelle for hver abstinenstid Udelad faktoren sas_ansat fra modelsætningen (men bibehold interaktionen). Dette ændrer ikke modellen, kun præsentationsmåden: Source DF Type III SS Mean Square F Value Pr > F abstid sas_ansat*abstid Nu repræsenterer sas_ansat*abstid de 3 differenser mellem grupperne, dvs. effekten af sas_ansat samlet for de 3 abstinenstider. Output, fortsat og estimaterne for sas_ansat*abstid angiver nu effekten af sas_ansat for de enkelte værdier af abstid: Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 abstid B abstid B abstid B... sas_ansat*abstid ja B sas_ansat*abstid ja B sas_ansat*abstid ja B sas_ansat*abstid nej B... sas_ansat*abstid nej B... sas_ansat*abstid nej B / / 84 Alternativ: Estimate-sætninger (svært at vænne sig til) Tilbagetransformation proc glm data=oeko; class sas_ansat abstid; model lkonc=sas_ansat abstid sas_ansat*abstid / solution clparm; estimate sas vs. oeko, abstid 1 sas_ansat 1-1 sas_ansat*abstid ; estimate sas vs. oeko, abstid 2 sas_ansat 1-1 sas_ansat*abstid ; estimate sas vs. oeko, abstid 3 sas_ansat 1-1 sas_ansat*abstid ; run; Standard Parameter Estimate Error t Value Pr > t sas vs. oeko, abstid sas vs. oeko, abstid sas vs. oeko, abstid Parameter 95% Confidence Limits sas vs. oeko, abstid sas vs. oeko, abstid sas vs. oeko, abstid / 84 På den oprindelige skala kan vi nu udregne effekten af at være SAS-ansat, for hver abstinenstid for sig, ved at benytte ovenstående estimater som potens med grundtal 10 (fordi vi oprindeligt tog 10-tals logaritmer): Niveau 1: = 0.98 Niveau 2: = 0.54 Niveau 3: = 0.61 altså svarende til en reduktion på hhv. 2, 46 og 39% for SAS-ansatte i forhold til økologiske landmænd. 44 / 84

12 Tosidet variansanalyse uden interaktion i SAS Output, fortsat Outcome er stadig "Sædkvalitet", efter transformation med 10-tals logaritmen: The GLM Procedure Class Level Information Class Levels Values sas_ansat 2 ja nej abstid Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 sas_ansat ja B sas_ansat nej B... abstid B abstid B abstid B... Number of Observations Used 188 Parameter 95% Confidence Limits Source DF Type I SS Mean Square F Value Pr > F sas_ansat abstid Source DF Type III SS Mean Square F Value Pr > F sas_ansat abstid / 84 Intercept sas_ansat ja sas_ansat nej.. abstid abstid abstid / 84 Fortolkning Fittede værdier (ŷ) i den additive model SAS-ansatte har en signifikant lavere sædkoncentration end økologer med samme abstinenstid. Forskellen på logaritmisk-skala er 0.187, svarende til at de SAS-ansattes sædkoncentration generelt kun udgør = 0.65, dvs. 65% af økologernes koncentrationsniveau. 95% sikkerhedsintervallet for denne forskel er angivet af SAS til ( 0.332, 0.042), og når dette tilbagetransformeres, fås: ( , ) = (47%; 91%) Log-skala Original skala 47 / / 84

13 Simpel sammenligning af SAS-ansatte og økologiske landmænd, ved hjælp af T-test: The TTEST Procedure Variable: lkonc sas_ansat N Mean Std Dev Std Err Minimum Maximum ja nej Diff (1-2) sas_ansat Method Mean 95% CL Mean Std Dev ja nej Diff (1-2) Pooled Diff (1-2) Satterthwaite Kvantificeringer af effekt af økologi Økologiske landmænd vs. SAS-ansatte Logaritme- Tilbage- Metode Utransformeret transformerede transformeret til ratio T-test (5.464, ) (0.040, 0.332) (1.10, 2.15) Tosidet variansanalyse (5.793, ) (0.042, 0.332) (1.10, 2.15) Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F / 84 Meget små forskelle på de to analysemetoder, da der ikke er meget confounding fra abstinenstiden. 50 / 84 Normalfordelingsantagelsen var suspekt Valg af skala både på oprindelig skala og på logaritmisk skala. Hvad gør man så? Man glæder sig over, at man (forhåbentlig) ikke er interesseret i at diagnosticere lav sædkvalitet, men kun er interesseret i forskningsmæssige aspekter, dvs. sammenligning af grupper Man kan overveje at lave median regression (proc quantreg i SAS) Da der er et rimeligt antal individer i de fleste grupper, betyder en mindre afvigelse fra normalfordelingen ikke så meget Men hvilken skala skal man så vælge? er ikke altid oplagt... Man kan lade det afhænge af, hvordan man helst vil præsentere sit resultat: som en forskel i enheden antal/ml, eller som en relativ forskel, i % Set fra et normalfordelingssynspunkt, er den optimale skala en kubikrodstranformation (f (konc) = konc 1/3 ). Konklusionerne ændres dog ikke. Til gengæld kan parametrene i den nye model ikke direkte fortolkes (forskellene kan ikke kvantificeres på en enkel måde). 51 / / 84

14 Kovariansanalyse - den simpleste GLM Eksempel om lungekapacitet, TLC er blot en (historisk betinget) betegnelse for en model med netop én kategorisk kovariat (gruppe, Class-variabel) og netop én kvantitativ kovariat. Formålet kan være (ganske som i tosidet ANOVA) at Undersøge effekten af begge kovariater fjerne bias, f.eks at korrigere for en evt. højdeforskel ved sammenligning af lungefunktion for rygere og ikke-rygere øge styrken i en randomiseret klinisk undersøgelse ved at nedbringe den uforklarede del af variationen, f.eks. ved at inddrage alder som kovariat Men husk, at man derved besvarer et andet videnskabeligt spørgsmål 53 / patienter skal have foretaget hjerte/lunge transplantation TLC: Total Lung Capacity Er der forskel på mænd og kvinder? P= / 84 Kan højden forklare forskellen på mænd og kvinder? Køn Lungekapacitet Højde Sammenligning af to grupper - som ikke er helt sammenlignelige, pga en confounder (x): En variabel, som har en effekt på outcome er relateret til gruppen (der er forskel på værdierne i de to grupper) Herved kan opstå bias. Gruppe/behandling Outcome Eller er der tillige en ægte kønseffekt? Confounder x 55 / / 84

15 Illustration af confounding og kovariansanalyse Men læg mærke til følgende: Selv om fordelingen af kovariaten er ens i de to grupper, kan det være af stor betydning at medtage den i analysen. Gruppe/behandling Det giver større styrke! Kovariat Outcome 57 / / 84 Simuleret eksempel Metoder til at undgå bias Uden x i modellen: Ingen særlig forskel på grupperne...? Med x i modellen: Tydelig forskel på grupperne (her den lodrette afstand mellem linierne) 59 / 84 Matchning. Dvs. udvælge individer, således at de er nogenlunde ens med hensyn til de vigtige forstyrrende kovariater. Husk at tage matchningsvariablen med som kovariat ellers kan man skabe bias pga umålte confoundere (men lad være med at fortolke dens effekt) Randomisering. Dvs. trække lod om behandling (gruppe) NB: Dette kan naturligvis kun lade sig gøre, hvis grupperne er noget, man selv bestemmer over. og det sikrer ikke ens fordelinger i den enkelte undersøgelse Korrektion Dvs. at medtage den (muligvis skævt fordelte) variabel som kovariat, også somme tider i randomiserede undersøgelser 60 / 84

16 Metoder til at øge styrken Relation mellem TLC og HEIGHT flere observationer/personer benytte fornuftige inklusions- eller eksklusionskriterier inddrage vigtige forklarende variable (kovariater) udelade irrelevante kovariater Men pas på med at gå for meget på fisketur!! og husk at fortolkningen afhænger af modellen 61 / / 84 Kovariansanalyse Vekselvirkning=Interaktion Sammenligning af parallelle regressionslinier: Model: Men skal linierne nødvendigvis være parallelle? Mere generel model: y gi = α g + β g x gi + ɛ gi g = 1, 2; i = 1,..., n g y gi = α g + βx gi + ɛ gi g = 1, 2; i = 1,..., n g Og hvad er det så, der sker, hvis vi glemmer x i modellen? 1. Bias: Hvis x 1 x 2, bliver forskellen forkert vurderet. 2. Inefficiens: Selv om x 1 = x 2, mister vi styrke (spredning for stor). Når β 1 β 2, siger vi, at der er vekselvirkning = interaktion. Det betyder: Effekten af højde (x) afhænger af kønnet (g) Forskellen på kønnene afhænger af højden Her kan man ikke udtale sig om en generel effekt af hverken højde eller køn. 63 / / 84

17 Transformation I forsøg på at skaffe varianshomogenitet, logaritmerer vi tlc... men det bliver ikke rigtigt godt... Specifikation af model i SAS Model med vekselvirkning: proc glm data=tlc; classes sex; model ltlc=height sex sex*height / solution clparm; run; 65 / / 84 Output Output, fortsat: Dependent Variable: ltlc Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total Source DF Type I SS Mean Square F Value Pr > F height <.0001 sex height*sex Source DF Type III SS Mean Square F Value Pr > F height sex height*sex Standard Parameter Estimate Error t Value Pr > t Intercept B height B sex F B sex M B... height*sex F B height*sex M B... Interaktionsparameteren angiver forskellen på hældninger i de to grupper 67 / / 84

18 Omregning til de to linier: SAS-udregning af de to linier Linie for mænd: log10(lung capacity) = height Linie for kvinder: log10(lung capacity) = ( 0.281) + ( ) height = height proc glm data=tlc; classes sex; model ltlc=sex sex*height / noint solution clparm; run; Output: Dependent Variable: ltlc Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Uncorrected Total / / 84 Output, fortsat: Udregning med brug af Estimate-sætninger Source DF Type III SS Mean Square F Value Pr > F sex height*sex Standard Parameter Estimate Error t Value Pr > t sex F sex M height*sex F height*sex M Her er der angivet to intercept-estimater og to hældningsestimater. proc glm data=tlc; classes sex; model ltlc=sex height sex*height / solution clparm; estimate intercept, male intercept 1 sex 0 1; estimate intercept, female intercept 1 sex 1 0; estimate slope, male height 1 sex*height 0 1; estimate slope, female height 1 sex*height 1 0; run; Standard Parameter Estimate Error t Value Pr > t intercept, male intercept, female slope, male slope, female / / 84

19 Modelreduktion Vi kunne ikke se nogen vekselvirkning og udelader den af modellen Output, fortsat: proc glm data=tlc; classes sex; model ltlc=sex height / solution clparm; run; Dependent Variable: ltlc Sum of Mean Source DF Squares Square F Value Pr > F Model Error Corrected Total R-Square C.V. Root MSE LTLC Mean Source DF Type I SS Mean Square F Value Pr > F sex height / 84 Source DF Type III SS Mean Square F Value Pr > F sex height Standard Parameter Estimate Error t Value Pr > t Intercept B sex F B sex M B... height Bemærk: Nu er kønseffekten helt forsvundet! Højden kunne altså godt forklare den...måske 74 / 84 Ancova-fit (parallelle linier) Er der så en kønseffekt eller ej? Ja for mænd og kvinder har jo ikke samme niveau af lungekapacitet men forskellen i niveau kan forklares udfra den højdeforskel, der generelt er mellem mænd og kvinder måske men vi kan ikke påvise forskel mellem en mand og en kvinde med samme højde Højde er en mellemkommende (intermediate) variabel for effekten af køn på lungekapacitet 75 / / 84

20 Husk modelkontrol: Fortolkning I dette eksempel så vi Den observerede forskel i (log 10 ) lungekapacitet mellem mænd og kvinder kunne godt tilskrives højdeforskellen mellem kønnene. Der kan dog stadig være en kønsforskel op til ± = ( 0.030, 0.114), svarende til intervallet (0.933, 1.300) for ratio en, dvs. op til en 30% øget lungefunktion hos mænd 77 / / 84 Et typisk eksempel Baseline og Follow-up på et før-og-efter studie: Vickers, A.J. & Altman, D.G.: Analysing controlled clinical trials with baseline and follow-up measurements. British Medical Journal 2001; 323: : 52 patienter med skuldersmerter randomiseres til enten Akupunktur (n=25) Placebo (n=27) Smerte vurderes på en 100-trins skala både før og efter behandling Høje scorer er gode 79 / 84 Behandling Outcome Baseline måling Der er fokus på sammenligning af behandlingerne: Er placebo ligeså godt som akupunktur? Det lægger op til et simpelt T-test, men: Hvad nu, hvis de to grupper ikke er helt identiske fra start, selv om der er randomiseret? 80 / 84

21 Resultater vedr. skuldersmerter Udvikling i smerter, faktisk og forventeligt Sammenligninger af de to grupper: Gennemsnitlig smertescore Behandlinseffekt placebo akupunktur differens (n=27) (n=25) (95% CI) P-value Baseline 53.9 (14.0) 60.4 (12.3) Analyse: Follow-up 62.3 (17.9) 79.6 (17.1) 17.3 (7.5; 27.1) Ændringer* 8.4 (14.6) 19.2 (16.1) 10.8 (2.3; 19.4) Ancova 12.7 (4.1; 21.3) * resultater publiceret i Kleinhenz et.al. Pain 1999; 83: / / 84 Udlægning af resultater, I Udlægning af resultater, II Baseline Akupunktur gruppen ligger lidt højere end placebo Follow-up Vi vil forvente, at akupunktur gruppen stadig ligger det samme stykke højere end placebo gruppen efter behandlingen, selv hvis behandlingen ikke virker (fuldt optrukket rød linie). Det er derfor urimeligt blot at afgøre behandlingens effekt ved at sammenligne follow-up værdier (forskellen bliver for stor i dette tilfælde) 83 / 84 Differenser/ændringer Lav baseline værdi giver forventning om stor positiv ændring (regression to the mean) Derfor forventes placebogruppen at stige mest, og akupunkturgruppen lidt mindre (den stiplede røde linie) og en direkte sammenligning af ændringer er derfor ikke rimelig (forskellen bliver for lille i dette tilfælde) Ancova vurderer forskellen under hensyntagen til, at baseline forklarer noget, men ikke al forskellen ved follow-up: Vi sammenligner personer, der har fået forskellig behandling, men som starter samme sted. 84 / 84

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 4. oktober 2016 Parret sammenligning, målemetoder med

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 12. februar 2018 1 / 88 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 Parret sammenligning af målemetoder,

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 1 / 92 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Kovariansanalyse, Interaktion, i R Lene Theil Skovgaard 4. marts 2019 Parret sammenligning af målemetoder, med logaritmer

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013 Faculty of Health Sciences Basal Statistik T-tests. Lene Theil Skovgaard 17. september 2013 1 / 67 En- og to-stikprøve problemer One- and two-sample problems: Sammenligning af to situationer: Parret t-test

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences Faculty of Health Sciences En- og to-stikprøve problemer One- and two-sample problems: Basal Statistik T-tests. Lene Theil Skovgaard 17. september 2013 1 / 67 Sammenligning af to situationer: Parret t-test

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.sav på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 ( Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.dat er en let modificeret udgave af oeko.txt på hjemmesiden, blot med variabelnavnet sas.ansat i stedet for sas_ansat.

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Basal statistik. 16. september 2008

Basal statistik. 16. september 2008 Basal statistik 16. september 2008 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Basal statistik 19. september Eksempel: To metoder, som forventes at skulle give samme resultat:

Basal statistik 19. september Eksempel: To metoder, som forventes at skulle give samme resultat: En- og to-stikprøve problemer, september 2006 1 Basal statistik 19. september 2006 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 1. oktober 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Overlevelsesanalyse. Faculty of Health Sciences

Overlevelsesanalyse. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Program Overlevelsesdata Kaplan-Meier estimatoren

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Basal statistik. 18. september 2007

Basal statistik. 18. september 2007 Basal statistik 18. september 2007 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2015

Vejledende besvarelse af hjemmeopgave, efterår 2015 Vejledende besvarelse af hjemmeopgave, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder i Massachusetts (ref.) søger

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Basal statistik. 18. september 2007

Basal statistik. 18. september 2007 Basal statistik 18. september 2007 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Eksempel: To metoder, som forventes at skulle give samme resultat: MF: Transmitral volumetric flow, bestemt ved Doppler ekkokardiografi

Eksempel: To metoder, som forventes at skulle give samme resultat: MF: Transmitral volumetric flow, bestemt ved Doppler ekkokardiografi En- og to-stikprøve problemer 1 En- og to-stikprøve problemer 2 Basal statistik 13. februar 2007 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Restsaltmængdernes afhængighed af trafikken,

Restsaltmængdernes afhængighed af trafikken, Restsaltmængdernes afhængighed af trafikken, Thomas Glue, marts 2. Trafikintensitet...2 Indledende definitioner...2 Regressionsanalyser på trafikintensiteten...6 Justering af restsaltmængder i henhold

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Multipel regression 22. Maj, 2012

Multipel regression 22. Maj, 2012 Data: Det færøske kviksølv-studie Simpel linær regression Confounding Multipel lineær regression Fortolkning af parametre Vekselvirkning Kollinearitet Modelkontrol Multipel regression 22. Maj, 2012 Esben

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere