Vejledende besvarelse af hjemmeopgave, efterår 2016

Størrelse: px
Starte visningen fra side:

Download "Vejledende besvarelse af hjemmeopgave, efterår 2016"

Transkript

1 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for normal nedbrydning af flere af de muskelafslappende midler, der benyttes under bedøvelse. Visse lægemidler, såsom astmamidlet bambuterol, kan hæmme aktiviteten af kolinesterase, og i så fald må man påregne forlænget virkningsvarighed af medikamenterne, med deraf følgende risiko for komplikationer efter bedøvelsen. På hjemmesiden ligger data fra 80 personer, der har været bedøvet. Der er 4 variable for hver person, og forslag til variabelnavne er angivet i 1. linie. Disse er: idnr: Observationsnummer (blot til brug for identifikation) bambuterol: 0 (normal), eller 1 (bambuterol) ke: Aktiviteten af kolinesterase (enhed ukendt) fer: First evoked response, dvs. tid (i minutter) til genkomst af et bestemt tegn på muskelaktivitet Der er i nedenstående besvarelse ikke udeladt nogen observationer. Der er anvendt ods graphics i mange sammenhænge, hvor det (for nogle) ikke vil være nødvendigt at skrive dette. Opgaven er at beskrive sammenhængen mellem kolinesterase aktivitet og tiden til first evoked response, samt at udtale sig om forskelle mellem de to grupper (normale og bambuterol-brugere). Først må vi jo indlæse vores data, og vi benytter de samme variabelbetegnelser som angivet ovenfor: data a1; infile 1

2 " URL firstobs=2; input idnr bambuterol ke fer; if bambuterol=1 then gruppe="bambuterol"; if bambuterol=0 then gruppe="normal"; logke=log10(ke); logfer=log10(fer); under200=(ke<200); label ke="kolinesterase" fer="first Evoked Response" logke="log10(kolinesterase)" logfer="log10(first Evoked Response)"; proc sort data=a0; by descending gruppe descending ke; data a1; set a0; nr=_n_; Udover indlæsningen har vi også lavet et par nye variable, dels en redefinition af gruppen, så det altid vil være klart, hvilken der refereres til, og dels nogle logaritmetransformationer, som vi får brug for i det følgende. Vi har endvidere sorteret datasættet, i omvendt alfabetisk orden (option descending), så den normale gruppe kommer først, og således at de højeste kolinesterase-værdier kommer først indenfor hver gruppe. Efterfølgende er data lagt i datasættet a1, og variablen nr er tilføjet som nummeret på observationen. Det er fordi vi har brug for denne sortering til en speciel figur i spørgsmål 1c. Der er tillige defineret nogle labels, som bare sørger for, at der kommer nogle mere sigende navne på udskrifterne (i stedet for blot ke og fer). I spørgsmål 1-3 ser vi udelukkende på den normale gruppe, altså patienter, der ikke anvender Bambuterol: 1. Beskriv fordelingen af aktiviteten af kolinesterase i denne gruppe. (a) Lav først en grafisk illustration. 2

3 Da der kun er tale om en enkelt gruppe, vælges et histogram, som supperes ved et fraktildiagram for også at kunne vurdere en normalfordelingstilpasning: title SPM 1 ; title2 SPM 1A ; proc sgplot data=a1; where gruppe="normal"; histogram ke; proc univariate noprint data=a1; where gruppe="normal"; qqplot ke; Her ser vi, at de typiske værdier af kolinesteraseaktivitet ligger på ca , men at der også forekommer nogle temmelig høje værdier, der giver en anelse skævhed i fordelingen. Fraktildiagrammet bekræfter denne skævhed, idet der ses en tendens til hængekøjefacon i stedet for en helt ret linie: 3

4 (b) Udregn dernæst passende valgte summary statistics, som om du skulle lave en Tabel 1 til en artikel, og forklar kort hvorfor du vælger netop disse. Selv om der kun efterspørges værdier for den normale gruppe, er begge grupper medtaget nedenfor, da dette er ligeså let. I første omgang benytter vi bare de default-værdier, som SAS mener er fornuftige, når man benytter proc means: title2 SPM 1B ; proc means data=a1; class gruppe; var ke; og får outputtet: SPM 1B The MEANS Procedure Analysis Variable : ke Kolinesterase N gruppe Obs N Mean Std Dev Minimum Maximum bambuterol normal Af disse summary statistics ses, at spredningen er temmelig stor i forhold til gennemsnittet, således at man ved direkte udregning 4

5 af et normalområde ville være tæt på 0: ± = (72.6, ), et interval, der ses ikke at passe ret godt med minimum og maximum. Vi vil derfor hellere benytte median og kvartiler til vores beskrivelse: proc means N median Q1 Q3 data=a1; class gruppe; var ke; og får så i stedet outputtet: SPM 1B The MEANS Procedure Analysis Variable : ke Kolinesterase N Lower Upper gruppe Obs N Median Quartile Quartile bambuterol normal I tabellen ovenfor bemærkes skævheden i fordelingen ved den manglende symmetri i fraktilerne svarende til 25% (Q1), 50% (median) og 75% (Q3), idet Q3 ligger noget længere væk fra medianen end Q1. Det vil derfor nok være disse værdier, man bør sætte i Tabel 1, og ikke gennemsnit og spredning. Det giver ikke så meget mening at forsøge sig med 2.5% og 97.5% fraktilerne, da 2.5% af 70 svarer til under 2 observationer. (c) Kan man sige, at det er usædvanligt lavt med en kolinesterase aktivitet på 200? Hvor mange har en værdi under dette? Vi bemærkede ovenfor, at det ikke giver mening at udregne empiriske fraktiler på så lille et datasæt. Hvis vi forsøgsvis skal udregne et referenceområde (normalområde), skal det altså gøres ved hjælp 5

6 af en normalfordelingsantagelse, og så må det pga skævheden i fordelingen gøres på logaritmisk skala. Vi undersøger lige, hvordan fordelingen ser ud på denne skala, blot ved igen at tegne histogram og fraktildiagram: title2 SPM 1C ; proc sgplot data=a1; where gruppe="normal"; histogram logke; proc univariate noprint data=a1; where gruppe="normal"; qqplot logke; og får figurerne Fordelingen ser mere symmetrisk ud (baseret på fraktildiagrammet, for histogrammet ser ret skævt ud til den modsatte side), kan 6

7 vi måske bedre tillade os at udregne gennemsnit og spredning på denne skala proc means data=a1; class gruppe; var logke; hvorved vi får SPM 1C The MEANS Procedure Analysis Variable : logke log10(kolinesterase) N gruppe Obs N Mean Std Dev Minimum Maximum bambuterol normal Herudfra udregner vi nu et normalområde på log 10 -skala ved ± = (2.470, 3.298) som tilbagetransformeres til intervallet ( , ) = (295.1, ) Ud fra dette område ser det usandsynligt ud at have en kolinesteraseværdi så lav som 200. Lad os se på de faktiske forhold: Vi definerede ovenfor en indikatorvariabel under200=(ke<200); Denne vil have værdien 1 for alle kolinesteraseværdier under 200, og 0 ellers, så for at finde antallet af observationer under 200, behøver vi blot at tabellere denne: 7

8 proc freq data=a1; where gruppe="normal"; table under200 / list; hvorved vi får tabellen SPM 1C The FREQ Procedure Cumulative Cumulative under200 Frequency Percent Frequency Percent Der er altså kun 2 af de 68 personer, der har så lav en kolinesteraseværdi, hvormed vi må konkludere, at det er ret usædvanligt. Det er dog et lille datamateriale, og hvis vi ser på 2 ud af 70 som en binomialfordeling, finder vi godt nok ˆp = 2 = , men 70 konfidensgrænserne er ret brede proc freq data=a1; where gruppe="normal"; tables under200 / binomial; exact binomial; SPM 1C Binomial Proportion under200 = 0 Proportion (P) Exact Conf Limits 95% Lower Conf Limit % Upper Conf Limit Sample Size = 70 Nu skal vi bare lige vende det om for at få andelen af 0 er: = , med konfidensinterval ( , ) = (0.0035, ), dvs. når vi betragter problemet ud fra en simpel optælling, kan vi ikke afvise, at op imod 10% i den normale gruppe kan have så lave værdier. 8

9 Vi kan også lave en grafisk fremstilling af fordelingen, som er lidt anderledes end sædvanligt, idet vi først sorterer data med de højeste kolinesteraseværdier først (dette gjorde vi faktisk allerede i forbindelse med indlæsningen), og derefter tegner op mod observationsnummeret: proc sgplot data=a2; where gruppe="normal"; needle X=nr Y=ke / markers; lineparm x=0 y=200 slope=0 / lineattrs=(color=red); Ovenfor er der også indlagt en vandret linie i ke=200, så man får et umiddelbart visuelt indtryk af, hvor usædvanlig denne værdi er: 2. Vi skal nu se på relationen mellem kolinesterase og first evoked response for den normale gruppe: (a) Lav et scatterplot af first evoked response mod kolinesterase for denne gruppe. Ser det rimeligt lineært ud? Vi vælger med det samme at lægge en ret linie ind på plottet (selv om til en vis grad ødelægger chancen for at se den krumme tendens): title SPM 2 ; title2 SPM 2A ; proc sgplot data=a1; where gruppe="normal"; reg Y=fer X=ke; 9

10 og vi får figuren: På trods af det besnærende i den rette linie, kan man godt fornemme, at der er tendens til krumning (det, man i skolen kaldte en glad parabel), idet punkterne fortrinsvis ligger over linien for lave og høje værdier af kolinesterase, og under linien for de moderate værdier. Vi vil altså forvente et krumt forløb, når residualer plottes op mod kolinesterase, og vi burde derfor ikke fortsætte med nedenstående spørgsmål. Uanset svaret på spm. 2a ønskes nedenstående spørgsmål besvaret for de utransformerede data: (b) Lav en lineær regression, og udfør passende modelkontrol og diagnostics. Sørg også for at få en figur af fittet med. Nogen indvendinger mod modelantagelserne? I så fald hvilke? For at lave en regressionsanalyse kan man benytte enten reg eller glm, jeg plejer at bruge glm, fordi man så ikke skal skifte, hvis det viser sig, at der også skal kategoriske kovariater i modellen. Sammen med regressionsanalysen anvendes tre estimate-sætninger og en output-sætning, som vi får brug for i det følgende: title2 SPM 2B ; proc glm plots=plots=(fitplot DiagnosticsPanel Residuals(smooth)) data=a1; where gruppe="normal"; 10

11 model fer=ke / solution clparm; estimate "effekt af 100 i ke" ke 100; estimate "ke=500" intercept 1 ke 500; estimate "ke=50" intercept 1 ke 50; output out=ny p=predicted rstudent=normresid; Nedenfor vises en del af output (der er meget, som vi ikke behøver, specielt i en så simpel model som denne) The GLM Procedure Dependent Variable: fer First Evoked Response R-Square Coeff Var Root MSE fer Mean Standard Parameter Estimate Error t Value Pr > t effekt af 100 i ke <.0001 ke= <.0001 ke= <.0001 Parameter 95% Confidence Limits effekt af 100 i ke ke= ke= Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 ke <.0001 Parameter 95% Confidence Limits Intercept ke Samtidig med outputtet fra regressionsanalysen får vi også et plot 11

12 af selve fittet, med konfidens- og prediktionsgrænser: samt modelkontroltegninger, dels det sædvanlige Panel og dels det specifikke til brug for check af lineariteten Vi kan også supplere med en ekstra figur til detektion af varianshomogenitet, nemlig kvadratroden af den numeriske værdi af residualerne, tegnet op mod de predikterede værdier. Så skal vi kun checke, om der er en stigende trend i plottet, ikke om der er trompetfacon. For at kunne lave denne figur, benytter vi datasættet tegn, dannet ud fra output-sætningen ovenfor. Her ligger nemlig de normerede residulare normresid, som vi nu regner videre på: data tegn; 12

13 set ny; num_normresid=abs(normresid); proc sgplot data=tegn; loess Y=num_normresid X=predicted; Fra dette sidste plot, samt fra det øverste venstre hjørne af det sædvanlige Panel ses en tydelig tendens til stigende spredning med niveauet, altså ikke varianshomogenitet. Og endnu værre: På figuren over residualer mod kolinesterase ses en tydelig krumning, så lineariteten er heller ikke god (som vi allerede tidligere har bemærket). Normalfordelingstilpasningen til residualerne er imidlertid nogenlunde, kun en anelse skævhed spores (fra fraktildiagram eller histogram). Alt i alt er vi ikke særligt begejstrede for modellen. (c) Giv en forståelig fortolkning af hældningsestimatet. Hældningsestimatet aflæses fra outputtet ovenfor til ˆβ = Det kan jo synes ret lille, men er alligevel stærkt signifikant forskellig fra 0 (P < , svarende til en tydelig sammenhæng 13

14 mellem kolinestarseaktivitet og first evoked response). Og størrelsen på sådan et hældningsestimat kan da heller ikke vurderes uden enheder! Her betegner det effekten på first evoked response af en ændring i kolinesterase med 1 enhed, og da 1 enhed her ikke er ret meget, så er hældningen selvfølgelig heller ikke ret stor. I stedet for kunne vi spørge, hvad effekten af 100 enheder i kolinesterase betyder for længden af first evoked response, og til dette formål er der tilføjet en estimate-sætning i koden ovenfor estimate "effekt af 100 i ke" ke 100; Denne tager blot hældning og ganger med 100, og tilsvarende for konfidensintervallet, så det kunne vi godt have gjort i hovedet... Vi får resultatet Standard Parameter Estimate Error t Value Pr > t effekt af 100 i ke <.0001 Parameter 95% Confidence Limits effekt af 100 i ke og effekten ses altså at være en nedgang i længden af fe! på 0.36 minutter, med konfidensinterval på (0.26, 0.47). Dette svarer til ca 21 sekunder mindre (16-28) sekunder. (d) Hvad er middelværdien af first evoked response for personer med kolinesterase aktivitet på 500? Og hvad er konfidensintervallet for denne? For at svare på dette spørgsmål, skal vi først gøre os klart, hvilken udregning, vi ville lave, hvis vi skulle gøre det i hånden. Den estimerede linies ligning er FER = KE så for at finde middelværdien svarende til ke=500 skal vi altså udregne =

15 Så vidt, så godt, men det er meget vanskeligt at udregne konfidensintervallet for denne middelværdi selv, så vi beder derfor SAS om at udregne det ved at benytte en estimate-sætning, der udtrykker regnestykket ovenfor, nemlig intercept gange 1 + koefficient til KE gange 500 som i SAS-notation ser således ud: estimate "ke=500" intercept 1 ke 500; Herved får vi outputtet Standard Parameter Estimate Error t Value Pr > t ke= <.0001 Parameter 95% Confidence Limits ke= hvorved vi kan se, at vi regnede rigtigt ovenfor, da den estimerede middelværdi ses at være 7.54 minutter, nu angivet med konfidensinterval (7.01, 8.07) minutter. (e) Angiv et 95% prediktionsinterval for patienter med en kolinesterase aktivitet på 500. Er det usædvanligt at se sådan en person have en first evoked response på kun 5 minutter? Ovenfor fandt vi estimat og konfidensinterval for sådanne patienter med ke=500, men konfidensintervallet er jo det smalle interval om linien, som ikke siger noget om, hvor de enkelte observationer ligger. For at udregne et prediktionsinterval, skal vi bruge spredningen omkring linien, som i SAS er angivet som Root MSE. Vi ser oppe i outputtet, at denne er estimeret til 1.65 (minutter), så vi udregner et 95% prediktionsinterval for ke=500 til 7.54 ± = (4.24, 10.84) 15

16 Da 5 (minutter) er indeholdt i dette interval, er det altså ikke helt usædvanligt (omend ikke så ofte forekommende) at se kombinationen med ke=500 og fer=5. (f) Hvis vi nu vovede en ekstrapolation af relationen fra spørgsmål 2b, hvad ville vi så gætte på, at middelværdien af first evoked response ville være, når kolinesterase var helt nede på 50? Og hvad med usikkerheden på sådan en ekstrapolation? I princippet er dette helt det samme som spørgsmål 3d, blot med ke=500 erstattet af ke=50. Vi skal dog holde for øje, at vi med så lav en kolinesterase-værdi ekstrapolerer ud over det observerede i vores datasæt (den mindste værdi i den normale gruppe er ke=154), når vi benytter sætningen estimate "ke=50" intercept 1 ke 50; og får Standard Parameter Estimate Error t Value Pr > t ke= <.0001 Parameter 95% Confidence Limits ke= altså et estimat for middelværdien af first evoked response på 9.17 minutter, med konfidensinterval (8.3, 10.1) minutter. Hvis det er et prediktionsinterval, vi ønsker, bliver dette ca ± = (5.87, 12.47) I dette telfælde burde vi egentlig ikke benytte den simple formel for prediktionsintervaller, fordi vi ekstrapolerer så langt ud, at grænserne faktisk begymder at blive bredere. Da man ikke overhovedet bør give sig i kast med sådan en prediktion, vil vi dog ikke gå videre med det. 16

17 3. Foretag nu en logaritmetransformation af såvel kolinesterase som first evoked response, og svar på de samme 6 delspørgsmål som ovenfor i spm. 2, samt et ekstra (nedenfor). Logaritmetransformationerne lavede vi allerede i forbindelse med indlæsningen af data. (a) Lav et scatterplot af logaritmen til first evoked response mod logaritmen til kolinesterase for den normale gruppe. Ser det rimeligt lineært ud? Koden er ganske magen til den tidligere for de utransformerede data title SPM 3 ; title SPM 3A ; proc sgplot data=a1; where gruppe="normal"; reg Y=logfer X=logke; og giver figuren Denne ser noget pænere ud end den tilsvarende utransformerede, så her tror vi mere på de resultater, vi finder. (b) Lav en lineær regression, og udfør passende modelkontrol og diagnostics. Sørg også for at få en figur af fittet med. 17

18 Nogen indvendinger mod modelantagelserne? I så fald hvilke? Vi laver regressionsanalysen og medtager også de estimate-sætninger, der skal bruges i den senere spørgsmål, denne gang også med output til et nyt datasæt (vil blive forklaret nedenfor). title2 SPM 3B ; proc glm plots=plots=(fitplot DiagnosticsPanel Residuals(smooth)) data=a1; where gruppe="normal"; model logfer=logke / solution clparm; estimate "ke=500" intercept 1 logke ; estimate "ke=50" intercept 1 logke ; output out=nylog predicted=predicted_log; Outputtet bliver: SPM 3B The GLM Procedure Number of Observations Read 70 Number of Observations Used 70 Dependent Variable: logfer log10(first Evoked Response) R-Square Coeff Var Root MSE logfer Mean Standard Parameter Estimate Error t Value Pr > t ke= <.0001 ke= <.0001 Parameter 95% Confidence Limits ke= ke= Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 logke <.0001 Parameter 95% Confidence Limits Intercept logke med tilhørende figurer (incl. den specielle figur med kvadratroden 18

19 af de numeriske residualer tegnet op mod de predikterede værdier): Det ses, at fittet er en del bedre end før, og at modelkontrollen ikke giver anledning til nogen særlig påtale. 19

20 Dog er der i plottet af residualer mod kovariaten logke en del slinger, og specielt for de høje ke!-værdier synes der at være afvigelse. Dette skyldes dog nok en enkelt observation, og i hvert fald er der ikke den samme systematik i afvidelserne, som vi fandt det i analysen på den utransfornerede skala. (c) Giv en forståelig fortolkning af hældningsestimatet. Nu bliver det lidt vanskeligere, for hældningsestimatet angiver effekten af 1 enheds ændring i log10(ke), hvilket svarer til en tidobling af kolinesterase. Dette er en noget urimelig ting at angive, og vi kunne i stedet have valgt en anden logaritme. Nu er det imidlertid sådan, at når begge variable logaritmeres, så fitter man i virkeligheden en potensrelation FER = α KE β hvor α = 10 α betegner det tilbagetransformerede intercept (som ikke rigtigt interesserer os), medens hældningen β er potensen. Og denne hældning vil blive estimeret fuldstændigt ens, uanset hvilken logaritme, man har benyttet! Det betyder også, at vi nemt kan regne ud, hvad effekten af en fordobling af kolinesterase er, eller hvad effekten af en 10% stigning i kolinesterase er, nemlig Fordobling af KE: En faktor 2 β = = 0.704, altså en 29.6% reduktion af first evoked response 10% forøgelse af KE: En faktor 1.1 β = = 0.953, altså en 4.7% reduktion af first evoked response I princippet skulle vi gøre det samme med konfidensgrænserne... (d) Hvad er middelværdien af first evoked response for personer med kolinesterase aktivitet på 500? Og hvad er konfidensintervallet for denne? I lyset af den i spørgsmål 2d angivne forklaring af estimate-sætningen, kan vi nu umiddelbart benytte koden 20

21 estimate "ke=500" intercept 1 logke ; idet værdien angiver 10-tals logaritmen af 500. Vi finder, dels det direkte output, og dels de tilbagetransformerede værdier, incl. konfidensinterval: Standard Parameter Estimate Error t Value Pr > t ke= <.0001 Parameter 95% Confidence Limits ke= Obs Parameter estimat lower upper 2 ke= Vi kan således se, at den estimerede middelværdi på log-skala er 0.868, som tilbagetransformeres til = 7.38 minutter, med konfidensinterval (6.87, 7.93) minutter, altså meget tæt på det, vi fandt for den utransformerede analyse. (e) Angiv et 95% prediktionsinterval for patienter med en kolinesterase aktivitet på 500. Er det usædvanligt at se sådan en person have en first evoked response på kun 5 minutter? I den logaritmerede analyse har vi Root MSE=0.097, så på logskala finder vi prediktionsintervallet ± = (0.674, 1.072) og vi tilbagetransformerer dette til ( , ) = (4.72, 11.53) minutter, igen rimeligt tæt på, hvad vi fandt for den utransformerede relation. Igen må vi konstatere, at en værdi på 5 minutter for first evoked response ikke er helt urealistisk, omend ikke så ofte forekommende. Bemærk, at det er vigtigt, at man først tilbagetransformerer, når udregningen er helt færdi! Ikke noget med at tilbagetransformere Root MSE. 21

22 (f) Hvis vi nu vovede en ekstrapolation af relationen fra spørgsmål 2b, hvad ville vi så gætte på, at middelværdien af first evoked response ville være, når kolinesterase var helt nede på 50? Og hvad med usikkerheden på sådan en ekstrapolation? Ovenfor havde vi også en estimate-sætning svarende til ke=50 (idet værdien angiver 10-tals logaritmen af 50): estimate "ke=50" intercept 1 logke ; som gav outputtet Standard Parameter Estimate Error t Value Pr > t ke= <.0001 Parameter 95% Confidence Limits ke= og ved tilbagetransformation fik vi Obs Parameter estimat lower upper 3 ke= altså en estimeret (ekstrapoleret!) middelværdi på 23.7 minutter, med konfidensgrænser (17.4, 32.4) minutter. Vi bemærker nu, at dette estimat er helt forskelligt fra det, vi fik fra den utransformerede analyse. Selv om de to fit stemmer rimeligt godt overnes for de observerede data, behøver det altså ikke at betyde, at de også stemmer overens for helt andre patienter. Prediktionsgrænserne for denne værdi af kolinesterase bliver (på log 10 -skala): ± = (1.181, 1.569) og vi tilbagetransformerer dette til ( , ) = (15.17, 37.07) minutter, som ses at være ret så forskelligt fra, hvad vi fandt for 22

23 den utransformerede relation. (g) Hvilke forskelle ses på fittene for den utransformerede og den logaritmetransformerede relation? Hvilken en vil du foretrække, og hvorfor? Umiddelbart synes fittet på den logaritmerede skala at passe bedst til data. For at sammenligne direkte, er vi imidlertid nødt til at tilbagetransformere selve fittet til den oprindelige skala, hvilket er lidt besværligt. Vi gør det ved at tilføje en output-sætning i den logaritmerede analyse, så vi kan få de predikterede værdier med ud i et nyt datasæt (se også koden ovenfor): output out=nylog predicted=predicted_log; hvorefter vi regner videre (og tegner) med dette nye datasæt data tegn; set nylog; fer_pred=10**predlog; num_normresid=abs(normresid); title SPM 3G ; proc sgplot data=tegn; where gruppe="normal"; reg Y=fer X=ke; loess Y=fer_pred x=ke; lineparm x=50 y=0 slope=. / lineattrs=(color=green); 23

24 som giver os figuren Vi ser, at de to modeller (den utransformerede og den logaritmetransformerede) er rimeligt enige for kolinesterase-værdier mellem ca. 500 og 1500, men stærkt uenige, når vi fjerner os fra dette område. Og det er jo netop, hvad vi gjorde, da vi ekstrapolerede til ke= Vi skal nu sammenligne kolinesterase for de to grupper: (a) Lav en illustration til sammenligning af kolinesterase for den normale gruppe og bambuterol-gruppen, på passende skala. Her er det naturligt at vælge Boxplots, med mindre man går direkte til T-tests og benytter sig af de automatiske figurer, der kommer i denne forbindelse. Vi laver et både med og uden transformation af kolinesterase: title SPM 4 ; title2 SPM 4A ; proc sgplot data=a1; vbox ke / group=gruppe; proc sgplot data=a1; vbox logke / group=gruppe; 24

25 og får figurerne: (b) Er der overhovedet noget overlap mellem de to fordelinger? Vi kan allerede af boxplottene se, at der er overlap mellem fordelingerne. Dette kunne også ses ved at udregne minimum og maximum som i proc means nedenfor, eller med en lille figur, som bygger videre på figuren fra spørgsmål 3C: title2 SPM 4B ; proc means data=a1; class gruppe; var ke; proc sgplot data=a1; needle X=nr Y=ke / group=gruppe markers; Herved får vi Analysis Variable : ke Kolinesterase N gruppe Obs N Mean Std Dev Minimum Maximum bambuterol normal

26 samt figuren Vi ser, at den mindste kolinesterase-værdi for den normale gruppe er 154, medens den største kolinesterase-værdi for bambuterolgruppen er 384, altså er der overlap. Men ikke meget, som det ses af figuren ovenfor. (c) Giv et estimat for den procentuelle reduktion af kolinesterase hos bambuterol patienter, sammenlignet med de normale. Husk at angive konfidensinterval også. Nu skal vi sammenligne de to grupper numerisk, og da resultatet ønskes præsenteret som en procentuel forskel, må vi regne på logaritmisk skala. Vi laver altså et T-test med tilhørende figurer for logke, men for at undgå at tilbagetransformere med håndkraft, lægger vi estimaterne ud i et nyt datasæt (estimater) og laver så tilbagetransformationen i SAS: title2 SPM 4C ; proc ttest data=a1; class gruppe; var logke; ods output ConfLimits=estimater; data regn; set estimater; if Method="Satterthwaite"; keep estimat lower upper; estimat=10**mean; 26

27 lower=10**lowerclmean; upper=10**upperclmean; proc print data=regn; Herved får vi, først resultatet fra T-testet: The TTEST Procedure Variable: logke (log10(kolinesterase)) gruppe N Mean Std Dev Std Err Minimum Maximum bambuterol normal Diff (1-2) gruppe Method Mean 95% CL Mean Std Dev bambuterol normal Diff (1-2) Pooled Diff (1-2) Satterthwaite gruppe Method 95% CL Std Dev bambuterol normal Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal <.0001 Satterthwaite Unequal <.0001 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F og derefter de tilbagetransformerede værdier af middelværdi-differensen, med tilhørende konfidensinterval: SPM 4C Obs estimat lower upper

28 samt figurerne Estimatet for forskellen bambuterol - normal ses at være på log 10 -skala, og tilbagetransformeret giver dette faktoren ca Dette fortæller os, at kolinesterase-værdien for bambuterolgruppen kun er ca. 9% af, hvad den er for de normale, med konfidensgrænser fra 4.6% til 17.8%. Dette svarer til en 91% reduktion (CI: 82.2%-95.4%). P-værdien for sammenligningen er meget lille, P < Selv om der kun er 10 personer i bambuterolgruppen, ser vi et øjeblik på denne alene: (a) Udfør en lineær regression på log-log skala som i spm. 3 Dette er en gentagelse af tidligere kode: 28

29 title2 SPM 5B ; proc sgplot data=a1; where gruppe="bambuterol"; reg Y=logfer X=logke / group=gruppe; proc glm plots=plots=(fitplot DiagnosticsPanel Residuals(smooth)) data=a1; where gruppe="bambuterol"; model logfer=logke / solution clparm; estimate "ke=500" intercept 1 logke ; estimate "ke=50" intercept 1 logke ; ods output Estimates=estimater; data regn; set estimater; drop Dependent Estimate StdErr tvalue Probt LowerCL UpperCL; estimat=10**estimate; lower=10**lowercl; upper=10**uppercl; proc print data=regn; og vi får outputtet: SPM 5B The GLM Procedure Number of Observations Read 10 Number of Observations Used 10 Dependent Variable: logfer log10(first Evoked Response) R-Square Coeff Var Root MSE logfer Mean Standard Parameter Estimate Error t Value Pr > t ke= <.0001 ke= <.0001 Parameter 95% Confidence Limits ke=

30 ke= Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 logke Parameter 95% Confidence Limits Intercept logke SPM 5B Obs Parameter estimat lower upper 1 ke= ke= og tilhørende figurer: 30

31 (b) Predikter værdien af first evoked response for en kolinesteraseværdi på 50, som i spørgsmål 2f. Dette er gjort i koden ovenfor, og vi fandt resultatet (efter tilbagetransformation til de rigtige enheder): Obs Parameter estimat lower upper 2 ke= altså lidt højere end resultatet for den normale gruppe. Hvordan svarer det til prediktionen fra de normale? For de normale havde vi prediktionen 23.73, med konfidensinterval (17.38, 32.39), og med den kæmpe usikkerhed, der er (for bambuterolgruppen pga de få observationer, og for den normale gruppe fordi vi ekstrapolerer), er der ikke nogen bemærkelsesværdig forskel på de to estimater. Ser vi i stedet på et prediktionsinterval, får vi (på log 10 -skala): ± = (1.283, 1.599) som tilbagetransformeret giver grænserne (19.18, 39.72). Til sammenligning fik vi for den normale gruppe intervallet (15.17, 37.07) minutter, altså igen nogenlunde tæt på. (c) Ser hældningerne for de to grupper ud til at være rimeligt ens? Nedenfor ses en lille tabel med de estimerede hældninger: Hældning Estimat for ke=50 Normale (-0.620, ) (17.38, 32.39) Bambuterol (-0.584, ) (23.95, 31.77) Konfidensgrænserne for hældningen i de to grupper er i den grad overlappende, faktisk ligger det ene estimat i konfidensintervallet for den anden, så vi må konstatere, at der ikke er nogen signifikant 31

32 forskel. Vi ser dog mere formelt på det nedenfor: 6. Sammenlign nu de to lineære relationer på log-log skala ved at bygge en model for samtlige personer, inkluderende to forskellige linier. Husk passende illustrationer til analyserne. Vi starter med at se på et simpelt plot med de to linier, en for hver gruppe: title SPM 6 ; title2 ; proc sgplot data=a1; reg Y=logfer X=logke / group=gruppe; hvorved vi får figuren Her ses to temmeligt paralelle linier, uden ret stor lodret afstand. Det mest iøjnefaldende er, at de X-værider (værdier af kolinesterase), der understøtter hver af dem, er yderst forskellige. 32

33 (a) Er der evidens for, at kolinesterase har en forskellig effekt på first evoked response for de to grupper? Hvad kaldes det, hvis dette er tilfældet? Vi skal sammenligne hældningerne i de to grupper, så vi må bygge en model, hvor disse tillades at være forskellige, altså en model med interaktion. For at sammenligne grupperne ved en række konkrete værdier af kolinesterase er der desuden anført nogle ret komplicerede estimate-sætninger, som forklares nærmere nedenfor. title2 SPM 6A ; proc glm plots=plots=all data=a1; class gruppe; model logfer=logke gruppe gruppe*logke / solution clparm; estimate "bamb ved ke=200" intercept 1 logke gruppe 1 0 gruppe*logke ; estimate "normal ved ke=200" intercept 1 logke gruppe 0 1 gruppe*logke ; estimate "bamb vs. normal ved ke=500" gruppe 1-1 gruppe*logke ; estimate "bamb vs. normal ved ke=200" gruppe 1-1 gruppe*logke ; estimate "bamb vs. normal ved ke=50" gruppe 1-1 gruppe*logke ; ods output Estimates=estimater; data regn; set estimater; drop Dependent Estimate StdErr tvalue Probt LowerCL UpperCL; estimat=10**estimate; lower=10**lowercl; upper=10**uppercl; proc print data=regn; 33

34 Herved finder vi outputtet: SPM 6A The GLM Procedure Class Level Information Class Levels Values gruppe 2 bambuterol normal Number of Observations Read 80 Number of Observations Used 80 Dependent Variable: logfer log10(first Evoked Response) Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE logfer Mean Source DF Type I SS Mean Square F Value Pr > F logke <.0001 gruppe logke*gruppe Source DF Type III SS Mean Square F Value Pr > F logke <.0001 gruppe logke*gruppe Standard Parameter Estimate Error t Value Pr > t bamb ved ke= <.0001 normal ved ke= <.0001 bamb vs. normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= Parameter 95% Confidence Limits bamb ved ke= normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 logke B <.0001 gruppe bambuterol B gruppe normal B... logke*gruppe bambuterol B logke*gruppe normal B... Parameter 95% Confidence Limits Intercept

35 logke gruppe bambuterol gruppe normal.. logke*gruppe bambuterol logke*gruppe normal.. samt de tilbagetransformerede størrelser SPM 6A Obs Parameter estimat lower upper 1 bamb ved ke= normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= Ovenfor er medtaget en meget stor del af det resulterende output, fordi der er en del at lægge mærke til her... Først og fremmest svaret på spørgsmålet: testet for identiske hældninger i de to grupper aflæses på linien logke*gruppe, og P- værdien ses at være 0.45, altså langt fra signifikant. Dette er i god overensstemmelse med vores fornemmelse ud fra figuren ovenfor. Modelkontrollen er (næsten) unødvendig her, idet der bare er tale om en sammenbygning af modellerne fra spørgsmål 3 og 5. Det eneste, man kunne interessere sig for var, om spredningerne i de to grupper var ens, men med kun 10 observationer i den ene gruppe, er dette ikke noget, man fornuftigvis kan undersøge (ud over at se på figuren). (b) Kvantificer forskellen på de to grupper ved en kolinesterase aktivitet på 200. Er denne signifikant forskellig fra 0? I koden ovenfor blev denne forskel kvantificeret ved hjælp af estimatesætningen: 35

36 estimate "bamb vs. normal ved ke=200" gruppe 1-1 gruppe*logke ; Begrundelsen for denne noget komplicerede estimate-sætning er som følger: Niveau for: Bambuterol brugere ved ke=200: α 1 + β Normale ved ke=200: α 0 + β Forskel: Forskel: Bambuterol minus normale: (α 1 α 0 ) + (β 1 β 0 ) 200 Resultatet af denne estimate-sætning bliver Standard Parameter Estimate Error t Value Pr > t bamb vs. normal ved ke= Parameter 95% Confidence Limits bamb vs. normal ved ke= samt efter tilbagetransformation: Obs Parameter estimat lower upper 2 bamb vs. normal ved ke= Det umiddelbare estimat giver forskellen på en logaritmisk skala, og vi har derfor transformeret tilbage til en ratio-skala og fået estimatet Dette betyder, at bambuterol-patienterne ligger 28% for højt i forhold til, hvad de normale ville gøre (hvis vi kunne stole på ekstrapolationen), men at konfidensintervallet går fra ca. 2% under de normale (faktoren 0.98) til hele 68% over (faktoren 0.675). Vi ser altså, at forskellen ved ke=200 ikke er signifikant forskellig fra 0 (P=0.065). Ganske tilsvarende har vi fundet forskellen for ke=50 og ke=500, som ses ovenfor. Vi noterer os, at forskellen på de to grupper stiger 36

37 med stigende værdier af kolinesterase, hvilket vi også kunne slutte af figuren først i dette spørgsmål. De ovenstående estimate-sætninger er ganske svære, og man kan komme letter om ved det, hvis man definerer en ny version af logke, hvor man fratrækker log 10 (200) = , altså logke200=logke-log10(200) og så benytter denne som kovariat. I så fald vil forskellen på grupperne ved ke=200 netop blive forskellen på intercepterne. Men når nu interaktionen ikke var signifikant, kunne vi også vælge at slippe nemmere om ved dette spørgsmål ved at udelade den af modellen, og i stedet fitte en additiv model, med to parallelle linier (som jo så vil give samme forskel på de to grupper, uanset hvad kolinesterase-værdien er): proc glm plots=plots=all data=a1; class gruppe; model logfer=logke gruppe / solution clparm; estimate "bamb ved ke=200" intercept 1 logke gruppe 1 0; estimate "normal ved ke=200" intercept 1 logke gruppe 0 1; estimate "bamb vs. normal ved ke=500" gruppe 1-1; estimate "bamb vs. normal ved ke=200" gruppe 1-1; estimate "bamb vs. normal ved ke=50" gruppe 1-1; ods output Estimates=estimater; data regn; set estimater; drop Dependent Estimate StdErr tvalue Probt LowerCL UpperCL; estimat=10**estimate; lower=10**lowercl; upper=10**uppercl; proc print data=regn; Til overflod er der ovenfor angivet 3 ens estimate-sætninger, blot for at slå fast, at forskellen på grupperne er den samme uanset ke-værdi. Vi finder outputtet: 37

38 SPM 6B The GLM Procedure Class Level Information Class Levels Values gruppe 2 bambuterol normal Number of Observations Read 80 Number of Observations Used 80 Dependent Variable: logfer log10(first Evoked Response) Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE logfer Mean Source DF Type I SS Mean Square F Value Pr > F logke <.0001 gruppe Source DF Type III SS Mean Square F Value Pr > F logke <.0001 gruppe Standard Parameter Estimate Error t Value Pr > t bamb ved ke= <.0001 normal ved ke= <.0001 bamb vs. normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= Parameter 95% Confidence Limits bamb ved ke= normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 logke <.0001 gruppe bambuterol B gruppe normal B... Parameter 95% Confidence Limits Intercept logke gruppe bambuterol gruppe normal.. 38

39 samt de tilbagetransformerede størrelser Obs Parameter estimat lower upper 1 bamb ved ke= normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= Her finder vi altså forskellen udtrykt som en faktor 1.26, med konfidensgrænser (0.97, 1.64), meget tæt på det, som vi fandt i interaktionsmodellen. Dette skyldes naturligvis, at der ikke rigtige er nogen interaktion. 39

40 I denne additive model ser fittet således ud: og modelkontrollen bliver Bemærkninger til de foretagne analyser 40

41 7. Hvordan ville sammenligningen af de lineære relationer tage sig ud på den oprindelige (utransformerede) skala? (Dette behøver I kun svare på ud fra en passende figur). Figuren kan blot laves med et sgplot: title SPM 7 ; proc sgplot data=a1; reg Y=fer X=ke / group=gruppe; og vi ser tydeligt, at der her langt fra er tale om ens, endsige parallelle regressionslinier for de to grupper. Vi må altså forvente en kraftig signifikant interaktion på denne skala. Forekomst af interaktion er skala-afhængig! Her gentages interaktionsmodellen fra tidligere, blot med utransformerede variable: proc glm plots=plots=all data=a1; class gruppe; model fer=ke gruppe gruppe*ke / solution clparm; estimate "bamb ved ke=200" intercept 1 ke 200 gruppe 1 0 gruppe*ke 200 0; 41

42 estimate "normal ved ke=200" intercept 1 ke 200 gruppe 0 1 gruppe*ke 0 200; estimate "bamb vs. normal ved ke=500" gruppe 1-1 gruppe*ke ; estimate "bamb vs. normal ved ke=200" gruppe 1-1 gruppe*ke ; estimate "bamb vs. normal ved ke=50" gruppe 1-1 gruppe*ke 50-50; og vi får outputtet SPM 7 The GLM Procedure Class Level Information Class Levels Values gruppe 2 bambuterol normal Number of Observations Read 80 Number of Observations Used 80 Dependent Variable: fer First Evoked Response Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE fer Mean Source DF Type I SS Mean Square F Value Pr > F ke <.0001 gruppe <.0001 ke*gruppe <.0001 Source DF Type III SS Mean Square F Value Pr > F ke <.0001 gruppe <.0001 ke*gruppe <.0001 Standard Parameter Estimate Error t Value Pr > t bamb ved ke= <.0001 normal ved ke= <.0001 bamb vs. normal ved ke= bamb vs. normal ved ke= <.0001 bamb vs. normal ved ke= <.0001 Parameter 95% Confidence Limits bamb ved ke= normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= bamb vs. normal ved ke= Standard 42

43 Parameter Estimate Error t Value Pr > t Intercept B <.0001 ke B <.0001 gruppe bambuterol B <.0001 gruppe normal B... ke*gruppe bambuterol B <.0001 ke*gruppe normal B... Parameter 95% Confidence Limits Intercept ke gruppe bambuterol gruppe normal.. ke*gruppe bambuterol ke*gruppe normal.. samt de tilbagetransformerede størrelser Til forskel fra analysen på den logaritmetransformerede skala, ser vi ganske rigtigt her en stærkt signifikant interaktion mellem gruppe og ke, svarende til, at de to hældninger overhovedet ikke er ens i de to grupper. Da vi tidligere har konstateret alvorlige problemer med modelantagelserne på denne skala, skal vi ikke her komme nærmere ind på modelkontrollen. Egentlig ville jeg også have medtaget et spøgsmål om sammenligning af first evoked response, men det røg på en eller anden måde ud i skyndingen. Her kommenteres alligevel på en sådan sammenligning, helt i stil med sammenligningen af kolinesterase fra spm Vi skal nu sammenligne first evoked response for de to grupper: 43

44 (a) Lav en illustration til sammenligning af first evoked response for den normale gruppe og bambuterol-gruppen, på passende skala. Her er det naturligt at vælge Boxplots, med mindre man går direkte til T-tests og benytter sig af de automatiske figurer, der kommer i denne forbindelse. Vi laver et både med og uden transformation af first evoked response: title SPM 8 ; title2 SPM 8A ; proc sgplot data=a1; vbox fer / group=gruppe; proc sgplot data=a1; vbox logfer / group=gruppe; og får figurerne: (b) Er der overhovedet noget overlap mellem de to fordelinger? Vi kan allerede af boxplottene se, at der er overlap mellem fordelingerne. Dette kunne også ses ved at udregne minimum og maximum som i proc means nedenfor, eller med en lille figur, som bygger videre på figuren fra spørgsmål 3C: title2 SPM 8B ; proc means data=a1; 44

45 class gruppe; var fer; proc sgplot data=a1; needle X=nr Y=fer / group=gruppe markers; Herved får vi Analysis Variable : fer First Evoked Response N gruppe Obs N Mean Std Dev Minimum Maximum bambuterol normal samt figuren Vi ser, at den største first evoked response-værdi for den normale gruppe er 15.5, medens den mindste first evoked response-værdi for bambuterolgruppen er 11.67, altså er der overlap. Men ikke meget, som det ses af figuren ovenfor. (c) Giv et estimat for den procentuelle forøgelse af first evoked response hos bambuterol patienter, sammenlignet med de normale. Husk at angive konfidensinterval også. 45

46 Nu skal vi sammenligne de to grupper numerisk, og da resultatet ønskes præsenteret som en procentuel forskel, må vi regne på logaritmisk skala. Vi laver altså et T-test med tilhørende figurer for logfer, men for at undgå at tilbagetransformere med håndkraft, lægger vi estimaterne ud i et nyt datasæt (estimater) og laver så tilbagetransformationen i SAS: title2 SPM 8C ; proc ttest data=a1; class gruppe; var logfer; ods output ConfLimits=estimater; data regn; set estimater; if Method="Satterthwaite"; keep estimat lower upper; estimat=10**mean; lower=10**lowerclmean; upper=10**upperclmean; proc print data=regn; Herved får vi, først resultatet fra T-testet: The TTEST Procedure Variable: logfer (log10(first Evoked Response)) gruppe N Mean Std Dev Std Err Minimum Maximum bambuterol normal Diff (1-2) gruppe Method Mean 95% CL Mean Std Dev bambuterol normal Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal <.0001 Satterthwaite Unequal <

47 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F og derefter de tilbagetransformerede værdier af middelværdi-differensen, med tilhørende konfidensinterval: SPM 8C Obs estimat lower upper samt figurerne Diff (1-2) Pooled

48 Estimatet for forskellen bambuterol - normal ses at være på log 10 -skala, og tilbagetransformeret giver dette faktoren ca. 4 (egentlig 4.03). Dette fortæller os, at first evoked response-værdien for bambuterolgruppen er 4 gange større end hvad den er for de normale, med konfidensgrænser fra 2.9 gange til 5.7 gange større. P-værdien for sammenligningen er meget lille, P < Vi bemærker, at denne umiddelbare sammenligning mellem first evoked response i de to grupper giver et helt andet resultat end sammenligningen for givet KE-værdi, som vi fandt i spm. 6. Det betyder, at den forskel, vi ser i first evoked response-værdier for en stor dels vedkommende kan tilskrives forskelle i kolinesterase. Det ser således ud til, at bambuterol virker gennem en nedsættelse af kolinesterase. 48

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2015

Vejledende besvarelse af hjemmeopgave, efterår 2015 Vejledende besvarelse af hjemmeopgave, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder i Massachusetts (ref.) søger

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 ( Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (28.-30. oktober) En stor undersøgelse søger at afdække forhold

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 ( Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017 Faculty of Health Sciences Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 26. september 2017 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 1. uge

Phd-kursus i Basal Statistik, Opgaver til 1. uge Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Wright For 17 patienter er der målt peak expiratory flow rate (maksimal udåndingshastighed, i l/min) på to forskellige måder, dels ved at anvende

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 Parret sammenligning af målemetoder,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 1 / 92 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 12. februar 2018 1 / 88 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2019

Vejledende besvarelse af hjemmeopgave, forår 2019 Vejledende besvarelse af hjemmeopgave, forår 2019 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (26. marts.-28. marts). På hjemmesiden http://staff.pubhealth.ku.dk/~lts/basal19_1/hjemmeopgave.html

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30.

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2006. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 6 sider.

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.sav på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 Sammenligning af to grupper: T-test Dimensionering af undersøgelser

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences Faculty of Health Sciences En- og to-stikprøve problemer One- and two-sample problems: Basal Statistik T-tests. Lene Theil Skovgaard 17. september 2013 1 / 67 Sammenligning af to situationer: Parret t-test

Læs mere

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013 Faculty of Health Sciences Basal Statistik T-tests. Lene Theil Skovgaard 17. september 2013 1 / 67 En- og to-stikprøve problemer One- and two-sample problems: Sammenligning af to situationer: Parret t-test

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2013 Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.april) I forbindelse med reagensglasbehandling blev 100 par randomiseret

Læs mere