Basal statistik. 21. oktober 2008

Størrelse: px
Starte visningen fra side:

Download "Basal statistik. 21. oktober 2008"

Transkript

1 Basal statistik 21. oktober 2008

2 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse

3 Esben Budtz-Jørgensen, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet Slides af Lene Theil Skovgaard og Esben findes på,

4 Den generelle lineære model, oktober Repetition af multipel regressionsanalyse Outcome: Y Forklarende variable, kovariater: X 1,, X k Model: Y = β 0 + β 1 x β k x k + ǫ (Generel) lineær model: En model, der kan skrives op som ovenfor, med hvad som helst som x er. SAS Analyst: Statistics/ANOVA/Linear models SAS programmering: GLM

5 Den generelle lineære model, oktober Eksempel: Ensidet varians-analyse Identifikation af k grupper vha dummy variable: x 1 er 1 hvis person er i første gruppe og 0 ellers x 2 er 1 hvis person er i anden gruppe og 0 ellers. x k 1 er 1 hvis person er i k-1 gruppe og 0 ellers Model: Y = β 0 + β 1 x β k 1 x k 1 + ǫ

6 Den generelle lineære model, oktober Med denne kodning vil β 0 svare til niveauet for k te gruppe; β 1 er forskel i niveau mellem første og k te gruppe; β 2 er forskel i niveau mellem anden og k te gruppe; osv... Det er netop den kodning der bruges i SAS, når gruppe-variabel angives som kategorisk ( Statistics/Anova/Linear Models/Class ). Bemærk: Ved omkodning af grupper kan man få vilkårlige forskelle frem! Dette skrives som en NOTE i SAS-outputtet.

7 Den generelle lineære model, oktober SAS output fra øvelsesopgaven Alder ved gang Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 grp B grp B grp B grp B... NOTE: The X X matrix has been found to be singular, and a generalized inverse was used to solve the normal equations. Terms whose estimates are followed by the letter B are not uniquely estimable. Denne NOTE er altså ikke farlig!

8 Den generelle lineære model, oktober Eksempel: Tosidet varians-analyse (uden interaktion) k 1 k 2 grupper, identificeret ved to Class-variable med hhv k 1 og k 2 niveauer. Default parametrisering: Et niveau (intercept) for referencegruppen (sidste niveau af samtlige indgående faktorer) (k 1 1) parametre, der beskriver forskelle til sidste niveau af faktor nr. 1 (k 2 1) parametre, der beskriver forskelle til sidste niveau af faktor nr. 2 Faktorerne indgår additivt

9 Den generelle lineære model, oktober Tosidet variansanalyse uden interaktion i SAS SAS output fra øvelsesopgaven Sædkvalitet, efter transformation med 10-tals logaritmen: The GLM Procedure Class Level Information Class Levels Values sas_ansat 2 ja nej abstid Number of Observations Used 188 Source DF Type III SS Mean Square F Value Pr > F sas_ansat abstid

10 Den generelle lineære model, oktober Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 sas_ansat ja B sas_ansat nej B... abstid B abstid B abstid B...

11 Den generelle lineære model, oktober Fortolkning: SAS-ansatte har en signifikant lavere sædkoncentration end økologer med samme abstinenstid. Forskellen på logaritmisk-skala er 0.187, svarende til at de SAS-ansattes sædkoncentration generelt kun udgør = 65% af økologernes koncentrationsniveau. 95% sikkerhedsintervallet for denne forskel er angivet af SAS til ( 0.332, 0.042), og når dette tilbagetransformeres, fås: ( , ) = (47%; 91%)

12 Den generelle lineære model, oktober Fittede værdier (ŷ) Bemærk: forskel mellem SAS-ansatte og landmænd er her uafhængig af abstinenstider

13 Den generelle lineære model, oktober Vekselvirkning (interaktion), tænkt eksempel: To inddelingskriterier: køn og rygestatus Outcome: FEV 1 Effekten af rygning afhænger af køn Forskellen på kønnene afhænger af rygestatus

14 Den generelle lineære model, oktober Eksempel: Rygnings effekt på fødselsvægt

15 Den generelle lineære model, oktober Interaktion/vekselvirkning mellem mængden og varigheden af rygningen Der er effekt af mængden, men kun hvis man har røget længe. Der er effekt af varigheden, og denne effekt øges med mængden. Effekten af mængden afhænger af varigheden og effekten af varigheden afhænger af mængden

16 Den generelle lineære model, oktober Interaktion i eksemplet om sædkvalitet Her tilføjes to interaktionsparametre, der beskriver: hvordan effekten af den ene faktor modificeres, når vi går fra referencegruppen for den anden faktor til et af de andre niveauer Interaktionen repræsenterer synergi-effekten mellem variabel 1 og 2, og er et symmetrisk koncept. I epidemiologiske termer: Variabel 1 modificerer effekten af variabel 2 og kaldes derfor også en effekt modifikator.

17 Den generelle lineære model, oktober For eksemplet med sædkoncentration: Source DF Type III SS Mean Square F Value Pr > F sas_ansat abstid sas_ansat*abstid Bemærk: Når der er interaktion, giver det ikke længere mening at tolke de marginale effekter (dvs. effekten af den ene variable, uden samtidig at angive hvad niveauet af den anden er)

18 Den generelle lineære model, oktober Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 sas_ansat ja B sas_ansat nej B... abstid B abstid B abstid B... sas_ansat*abstid ja B sas_ansat*abstid ja B sas_ansat*abstid ja B... sas_ansat*abstid nej B... sas_ansat*abstid nej B... sas_ansat*abstid nej B...

19 Den generelle lineære model, oktober Modellen tillader at niveauet i hver gruppe varierer frit. Som I kan se af outputtet bruger SAS en kompliceret parametrisering ved beskrivelse disse gruppeniveauer. Det skal forstås som følger: For lang abstinenstid (niveau 3) er den estimerede forskel mellem SAS-ansatte og økologiske landmænd: Hvordan er denne forskel ved mellem-lang abstinenstid (niveau 2)? Den øges med til i alt = Ved niveau 1? Den øges med til i alt =

20 Den generelle lineære model, oktober Udregning af det estimerede niveau i hver celle abstinenstid erhverv 1:kort 2:mellem 3:lang sas-ansatte = = = landmænd = = reference

21 Den generelle lineære model, oktober Direkte udregning af disse estimater i SAS: Udelad begge faktorerne sas_ansat og abstid fra modellen (men bibehold interaktionen). Kryds af i no intercept Dette ændrer ikke modellen, kun måden, den præsenteres på: Source DF Type III SS Mean Square F Value Pr > F sas_ansat*abstid <.0001 Standard Parameter Estimate Error t Value Pr > t sas_ansat*abstid ja <.0001 sas_ansat*abstid ja <.0001 sas_ansat*abstid ja <.0001 sas_ansat*abstid nej <.0001 sas_ansat*abstid nej <.0001 sas_ansat*abstid nej <.0001

22 Den generelle lineære model, oktober Fortolkning af p-værdien for vekselvirkningsleddet Udelad begge faktorerne sas_ansat og abstid fra modellen (men bibehold interaktionen). Kryds af i no intercept Source DF Type III SS Mean Square F Value Pr > F sas_ansat*abstid <.0001 Nu er vekselvirkningen stærkt signifikant? Fortolkning af p-værdien for vekselvirkningsleddet ændres når hovedvirkningerne udelades. Ovenstående F-test tester ikke kun vekselvirkningen. Der testes om niveauet i alle celler er nul - dvs en meget kraftigere reduktion af modellen.

23 Den generelle lineære model, oktober Men: Outcome var jo logaritmetransformeret Vi skal transformere tilbage: sas_ansat abstid på log 10 -skala tilbagetransformeret 1: kort ja 2: mellem : lang : kort nej 2: mellem : lang

24 Den generelle lineære model, oktober Sådan ser de fittede værdier (ŷ) ud grafisk

25 Den generelle lineære model, oktober Fittede værdier (ŷ) i den reducerede model uden interaktion

26 Den generelle lineære model, oktober SAS-udregning af forskelle for hver abstinenstid: Udelad faktoren sas_ansat fra modellen (men bibehold interaktionen). Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 abstid B abstid B abstid B... sas_ansat*abstid ja B sas_ansat*abstid ja B sas_ansat*abstid ja B sas_ansat*abstid nej B... sas_ansat*abstid nej B... sas_ansat*abstid nej B...

27 Den generelle lineære model, oktober På den oprindelige skala kan vi nu udregne effekten af at være SAS-ansat, for hver abstinenstid for sig, ved at benytte ovenstående estimater som potens med grundtal 10 (fordi vi oprindeligt tog 10-tals logaritmer): Niveau 1: = 0.98 Niveau 2: = 0.54 Niveau 3: = 0.61 altså svarende til en reduktion på hhv. 2, 46 og 39% for SAS-ansatte i forhold til økologiske landmænd.

28 Den generelle lineære model, oktober Fortolkning af p-værdien for vekselvirkningsleddet Udelad faktoren sas_ansat fra modellen (men bibehold interaktionen). Dette ændrer ikke modellen, kun måden, den præsenteres på: Source DF Type III SS Mean Square F Value Pr > F abstid sas_ansat*abstid test af sas-ansat*abstid: vekselvirkningsmodel mod model der kun tillader responsen at afhænge af abstid. dvs udover vekselvirkningen prøver vi at fjerne hovedvirkningen af sas-ansat.

29 Den generelle lineære model, oktober Forskellige parametriseringer i SAS Udelad faktor (men bibehold interaktionen) Modellen ændres ikke Smart fordi outputtet nu indeholder relevante effekter MEN testet for interaktion findes kun i det output hvor begge hovedvirkninger er med

30 Den generelle lineære model, oktober Modelreduktion - kvadratsummer For generelle lineære modeller er det ikke altid tilstrækkeligt at lave t-test på regressionskoefficienter. I stedet bruges F test til sammenligning af kvadratsummer. Modelkvadratsum, SS model = i (ŷ i ȳ) 2 Forklaret variation: Hvor meget varierer de predikterede værdier? (stort er godt, men pas på fortolkningen af selve størrelsen!) Residualkvadratsum SS resid = i (y i ŷ i ) 2 Tilbageblevet variation: Hvor store er modelafvigelserne? (småt er godt, og her kan størrelsen fortolkes!)

31 Den generelle lineære model, oktober Modelreduktion - F test Vi skal sammenligne to modeller: Den oprindelige (nr. 1) og den simplere (hypotesen, nr. 2) Kan vi forsvare at bruge den simpleste af dem? Beskriver den data tilstrækkeligt godt? NB: Modellerne skal være nestede, dvs. den ene fremkommer af den anden, typisk ved at sætte parametre til nul ( fjerne effekter ). Se på ændring i model-kvadratsum: Hvor meget mindre forklares af den simplere model? SS = SS(Model 1 ) SS(Model 2 )

32 Den generelle lineære model, oktober Flere parametre kan forklare (lidt) mere variation: SS > 0 Spørgsmålet er: Hvor meget mere? Hvor stor må SS blive, inden vi erklærer testet signifikant?

33 Den generelle lineære model, oktober Størrelsen af SS skal ses i forhold til ændringen i antallet af parametre: DF = DF 2 DF 1 og vurderes i forhold til den allerede eksisterende residualvariation MS(Residual): MS = SS/ DF F = MS MS(Residual) F( DF, DF 1)

34 Den generelle lineære model, oktober Tosidet anova Dependent Variable: lkonc Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total Model 1: med interaktion DF 1 = 182

35 Den generelle lineære model, oktober Model 1: med interaktion Hypotesen, model 2: uden interaktion MS = , DF = 2, DF 1 = 182 Source DF Type I SS Mean Square F Value Pr > F sas_ansat abstid sas_ansat*abstid Source DF Type III SS Mean Square F Value Pr > F sas_ansat abstid sas_ansat*abstid F = = 0.84 F(2, 182)

36 Den generelle lineære model, oktober Bemærk at der er 2 slags kvadratsummer! De sikre råd: Brug altid Type III med mindre du er helt sikker på, hvad du gør Test kun en relevant virkning af gangen Hvis reduceret model accepteres, lav da ny analyse for denne model. Se ikke på hovedvirkninger, der indgår i vekselvirkninger!

37 Den generelle lineære model, oktober Fittede værdier (ŷ) i den reducerede model uden interaktion

38 Den generelle lineære model, oktober Fittede værdier (ŷ) i model med interaktion

39 Den generelle lineære model, oktober Et nyt begreb: Kovariansanalyse er blot en (historisk betinget) betegnelse for en generel lineær model med netop en gruppering (Class-variabel) og netop en kvantitativ variabel (kovariat, forklarende variabel). Formålet med at inddrage en ekstra kovariat fjerne bias f.eks at korrigere for en evt. højdeforskel ved sammenligning af lungefunktion for rygere og ikke-rygere øge styrken ved at nedbringe den uforklarede del af variationen, f.eks. ved at inddrage alder som kovariat i en randomiseret undersøgelse

40 Den generelle lineære model, oktober Bias ved sammenligning af grupper forekommer hvis der er i grupperne er forskel på fordelingen af en betydningsfuld kovariat (kaldes ofte en confounder) Gruppe/behandling Outcome Conf ounder

41 Den generelle lineære model, oktober Eksempel om lungekapacitet, TLC 32 patienter skal have foretaget hjerte/lunge transplantation TLC (Total Lung Capacity) bestemmes ved hjælp af helkrops plethysmografi Er der forskel på mænd og kvinder? OBS SEX AGE HEIGHT TLC 1 F F M M M M

42 Den generelle lineære model, oktober Tydelig kønsforskel for såvel TLC som HEIGHT Kan højdeforskellen alene forklare forskellen i lungekapacitet?

43 Den generelle lineære model, oktober Relation mellem tlc og height: sex height lung capacity Eller er der også en selvstændig kønseffekt?

44 Den generelle lineære model, oktober Kovariansanalyse: Sammenligning af parallelle regressionslinier Model: y gi = α g + βx gi + ε gi g = 1, 2; i = 1,, n g α 2 α 1 er den forventede forskel i respons mellem de to grupper for fastholdt værdi af x. Vi har justret for x.

45 Den generelle lineære model, oktober Hvad sker der, hvis vi glemmer x i modellen?

46 Den generelle lineære model, oktober Kovariansanalyse: Model: y gi = α g + βx gi + ǫ gi g = 1, 2; i = 1,...,n g Og hvad er det så, der sker, hvis vi glemmer x i modellen? 1. Bias. Hvis x 1 x 2, bliver forskellen forkert vurderet. 2. Inefficiens. Selv om x 1 = x 2, mister vi styrke (spredning for stor).

47 Den generelle lineære model, oktober Men skal linierne nødvendigvis være parallelle? Mere generel model: y gi = α g + β g x gi + ε gi Når β 1 β 2, siger vi, at der er vekselvirkning = interaktion. Det betyder: Effekten af højde (x) afhænger af kønnet (g) Forskellen på kønnene afhænger af højden Her kan man ikke udtale sig om en generel effekt af højde eller køn.

48 Den generelle lineære model, oktober I forsøg på at skaffe varianshomogenitet, logaritmerer vi tlc... men det bliver ikke rigtigt godt...

49 Den generelle lineære model, oktober Specifikation af model Model med vekselvirkning: I SAS Analyst: Statistics/ANOVA/Linear models indsætte height som kvantitativ variabel indsætte sex som kategorisk (Class-variabel) Under Model-knap kan man indsætte cross -led

50 Den generelle lineære model, oktober Output Dependent Variable: ltlc Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE ltlc Mean Source DF Type I SS Mean Square F Value Pr > F sex height height*sex

51 Den generelle lineære model, oktober Source DF Type III SS Mean Square F Value Pr > F sex height height*sex Standard Parameter Estimate Error t Value Pr > t Intercept B sex F B sex M B... height B height*sex F B height*sex M B...

52 Den generelle lineære model, oktober Omregning til de to linier: Linie for mænd (reference gruppen): log10(lung capacity) = height Linie for kvinder: log10(lung capacity) = ( 0.281) + ( ) height = height

53 Den generelle lineære model, oktober SAS-udregning af de to linier Bibehold interaktionen sex*height Udelad den marginale effekt height Udelad intercept (under Model) Source DF Type III SS Mean Square F Value Pr > F sex height*sex Standard Parameter Estimate Error t Value Pr > t sex F sex M height*sex F height*sex M

54 Den generelle lineære model, oktober Fortolkning af p-værdien for vekselvirkningsleddet Bibehold interaktionen sex*height Udelad den marginale effekt height Udelad intercept Source DF Type III SS Mean Square F Value Pr > F sex height*sex Nu er vekselvirkningen stærkt signifikant? Fortolkning af p-værdien for vekselvirkningsleddet ændres når en af hovedvirkningerne udelades. Ovenstående F-test tester ikke kun vekselvirkningen. Der testes ned til en model der kun tillader at responsniveauet at afhænge af sex.

55 Den generelle lineære model, oktober Forskellige parametriseringer i SAS Udelad height, men bibehold interaktionen: height*sex Modellen ændres ikke Smart fordi outputtet angiver de to regressionslinjer direkte MEN testet for interaktion findes kun i det output hvor begge hovedvirkninger er med

56 Den generelle lineære model, oktober Modelreduktion Vi kunne ikke se nogen vekselvirkning og udelader den af modellen Source DF Type III SS Mean Square F Value Pr > F sex height Standard Parameter Estimate Error t Value Pr > t Intercept B sex F B sex M B... height Bemærk: Nu er kønseffekten forsvundet

57 Den generelle lineære model, oktober I dette eksempel så vi Fortolkning Den observerede forskel i (log 10 ) lungekapacitet mellem mænd og kvinder kunne godt tilskrives højdeforskellen mellem kønnene. Der kan dog stadig være en kønsforskel op til ± = ( 0.030, 0.114), svarende til intervallet (0.933, 1.300) for ratio en, dvs. op til en 30% øget lungefunktion hos mænd

58 Den generelle lineære model, oktober Husk modelkontrol:

59 Den generelle lineære model, oktober Det kan også forekomme, at Tilsyneladende ens grupper (f.eks. blodtryk hos mænd og kvinder) udviser forskelle, når der bliver korrigeret for inhomogeniteter (f.eks. fedmegrad) Man skal huske alle variable med potentiel betydning for outcome!... uden at gå for meget på fisketur!!

60 Den generelle lineære model, oktober Eksempel: Fedmegrad og blodtryk obese: vægt/idealvægt bp: systolisk blodtryk obs sex obese bp 1 male male male male female female

61 Den generelle lineære model, oktober Illustration af blodtryk vs. fedmegrad

62 Den generelle lineære model, oktober Marginale sammenligninger af kønnene (t-tests): Først outcome, logaritmeret blodtryk, lbp Statistics Lower CL Upper CL Lower CL Variable sex N Mean Mean Mean Std Dev Std Dev lbp female lbp male lbp Diff (1-2) T-Tests Variable Method Variances DF t Value Pr > t lbp Pooled Equal lbp Satterthwaite Unequal Equality of Variances Variable Method Num DF Den DF F Value Pr > F lbp Folded F Vi ser ikke nogen signifikant forskel på mænd og kvinder.

63 Den generelle lineære model, oktober og så kovariaten, logaritmeret fedmegrad, lobese Statistics Lower CL Upper CL Lower CL Variable sex N Mean Mean Mean Std Dev Std Dev lobese female lobese male lobese Diff (1-2) T-Tests Variable Method Variances DF t Value Pr > t lobese Pooled Equal <.0001 lobese Satterthwaite Unequal <.0001 Equality of Variances Variable Method Num DF Den DF F Value Pr > F lobese Folded F Her ses en signifikant forskel i fedmegrad for mænd og kvinder, så hvis fedmegrad også hænger sammen med blodtryk...

64 Den generelle lineære model, oktober Og der er en sammenhæng mellem fedmegrad og blodtryk: sex=female sex=male Spearman Correlation Coefficients, N = 58 Prob > r under H0: Rho=0 Spearman Correlation Coefficients, N = 44 Prob > r under H0: Rho=0 bp obese bp obese bp <.0001 obese <.0001 bp obese

65 Den generelle lineære model, oktober Når vi sammenligner blodtryk kønnene imellem, må vi må derfor korrigere for fedmegrad, først med vekselvirkning: Dependent Variable: lbp R-Square Coeff Var Root MSE lbp Mean Source DF Type I SS Mean Square F Value Pr > F lobese sex lobese*sex Source DF Type III SS Mean Square F Value Pr > F lobese sex lobese*sex

66 Den generelle lineære model, oktober Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 lobese B sex female B sex male B... lobese*sex female B lobese*sex male B... Ingen signifikant vekselvirkning, vi udelader den.

67 Den generelle lineære model, oktober Model uden vekselvirkning (parallelle linier): Dependent Variable: lbp Source DF Type I SS Mean Square F Value Pr > F lobese sex Source DF Type III SS Mean Square F Value Pr > F lobese <.0001 sex Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 lobese <.0001 sex female B sex male B... Så kom der pludselig en signifikant kønsforskel

68 Den generelle lineære model, oktober Illustration af blodtryk vs. fedmegrad

69 Den generelle lineære model, oktober Metoder til at undgå bias Matchning. Dvs. udvælge individer, således at de er nogenlunde ens med hensyn til de vigtige forstyrrende kovariater. (Dette kan gøres parvist eller i større grupper) Randomisering. Dvs. trække lod om behandling (gruppe) NB: Dette kan naturligvis kun lade sig gøre, hvis grupperne er noget, man selv bestemmer over. Korrektion Dvs. at medtage den skævt fordelte variabel som kovariat, altså: en kovariansanalyse

70 Den generelle lineære model, oktober Metoder til at øge styrken flere observationer/personer øg spredning i eksponeringen design-ændring (f.eks fra uparret til parret) inddrage vigtige forklarende variable (kovariater) Men pas på med at gå for meget på fisketur!!

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 4. oktober 2016 Parret sammenligning, målemetoder med

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Multipel regression 22. Maj, 2012

Multipel regression 22. Maj, 2012 Data: Det færøske kviksølv-studie Simpel linær regression Confounding Multipel lineær regression Fortolkning af parametre Vekselvirkning Kollinearitet Modelkontrol Multipel regression 22. Maj, 2012 Esben

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 Parret sammenligning af målemetoder,

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 1 / 92 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 12. februar 2018 1 / 88 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE Økonomisk Kandidateksamen Teoretisk Statistik Eksamenstermin: Sommer 2004, dato: 3. juni 4 timers prøve med alle hjælpemidler, besvarelse på Dansk Opgave En simpel tilfældig stikprøve på 500 udtrukket

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.sav på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Dagens Tekst. Sammenligning Flere Grupper F Basal Statistik Variansanalyse. Basal Statistik - Variansanalyse 1

Dagens Tekst. Sammenligning Flere Grupper F Basal Statistik Variansanalyse. Basal Statistik - Variansanalyse 1 Basal Statistik Variansanalyse Judith L. Jacobsen, PhD. Lene Theil Skovgaard http://staff.pubhealth.ku.dk/~lts/basal09_1/ jlj@statcon.dk Dagens Tekst ANOVA Ikke-parametriske test Fordelingsantagelse En-sidet

Læs mere

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller Hvad skal vi lave? 1 Kovariansanalyse Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning 2 Sammenligning af modeller 3 Mere generelle modeller PSE (I17) ASTA - 14. lektion

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere