Opgavebesvarelse, brain weight

Størrelse: px
Starte visningen fra side:

Download "Opgavebesvarelse, brain weight"

Transkript

1 Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus i et kuld) kropsvægt i g hjernevægt i g kuldstørrelse kropsvægt hjernevægt litter body brain Data er indlagt på filen brain.txt med tre kolonner, svarende til de tre variable: litter, body og brain. Disse variabelnavne er anført i øverste linie af datafilen. Vi ønsker at udtale os om hjernevægtens afhængighed af kuldstørrelsen. Først indlæser vi ved at skrive data mus; infile " URL firstobs=2; input litter body brain; Vi har nu 20 observationer, hver med 3 variable, og nedenfor ses de tre plottet parvist mod hinanden. Dette plot kan kun laves med en passende opgraderet version af SAS, ved at skrive: 1

2 proc sgscatter data=mus; matrix _numeric_ / diagonal=(kernel histogram); hvorved vi får: 1. Vurder løseligt udfra en tegning, om forudsætningerne for at foretage lineær regressionsanalyse (med hjernevægt som respons og kuldstørrelsen som forklarende variabel) ser ud til at være opfyldt. I hvilken retning går en evt. sammenhæng? Ovenfor ses (bl.a.) et scatterplot af hjernevægten mod kuldstørrelsen. Hvis vi skal se det separat, skriver vi proc sgplot data=mus; scatter Y=brain X=litter; 2

3 På tegningen spores en negativ afhængighed af kuldstørrelse, således at store kuld fører til mindre hjerner. 2. Bestem estimater for afskæring og hældning i en lineær regressionsanalyse af hjernevægt, med kuldstørrelse som forklarende variabel. Forklar resultatet med ord. Ved hjælp af en simpel lineær regressionsanalyse af hjernevægt, med kuldstørrelse som forklarende variabel, estimerer vi denne relation, og da vi efterfølgende får brug for en estimate-sætning, benytter vi glm til at gøre det: proc glm plots=all data=mus; model brain=litter / solution clparm; estimate "brain for litter=5" intercept 1 litter 5; og finder The GLM Procedure 3

4 Number of Observations Read 20 Number of Observations Used 20 Dependent Variable: brain R-Square Coeff Var Root MSE brain Mean Standard Parameter Estimate Error t Value Pr > t brain for litter= <.0001 Parameter 95% Confidence Limits brain for litter= Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 litter Parameter 95% Confidence Limits Intercept litter Vi ser (svarende til tegningen), at hældningskoefficienten er negativ ˆβ 1 = (0.0012) Dette betyder, at vi for hver ekstra mus i kuldet forventer en hjernevægt på gennemsnitligt 0.004g mindre for hver enkelt mus. Vi indlægger regressionslinien på tegningen ovenfor ved at benytte reg i stedet for scatter: proc sgplot data=mus; reg Y=brain X=litter; 4

5 (a) Hvad er den forventede hjernevægt for en mus fra et kuld på 5? For at svare på dette spørgsmål, inkluderede vi ovenfor en estimatesætning: estimate "brain for litter=5" intercept 1 litter 5; og fik heraf resultatet: Parameter Estimate Error t Value Pr > t brain for litter= <.0001 Parameter 95% Confidence Limits brain for litter= altså et estimat på gram, med konfidensgrænser (0.417, 0.436) gram. (b) Er det usædvanligt at se en hjernevægt på 0.4 g for en sådan mus? Da dette spørgsmål handler om hjernevægten hos en enkelt mus, skal vi se på prediktionsgrænser i stedet for konfidensgrænser, 5

6 og disse dannes ud fra estimatet ved at benytte ±2 gange residualspredningen, som i outputtet ovenfor ses at være (Root MSE). Vi finder derfor grænserne ± = (0.396, 0.458) Det er altså lige på kanten af at være usædvanligt med en hjernevægt på 0.4 g for sådanne mus. 3. Undersøg tilsvarende hjernevægtens afhængighed af kropsvægten. Nu ser vi tilsvarende på hjernevægtens afhængighed af kropsvægten, hvor regressionsanalysen giver nedenstående resultater. Denne gang har vi lavet analysen ved hjælp af reg: proc reg data=mus; model brain=body / clb; 6

7 The REG Procedure Dependent Variable: brain Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model Error Corrected Total Root MSE R-Square Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept <.0001 body Variable DF 95% Confidence Limits Intercept body Vi ser heraf, at store mus har store hjerner, idet en musehjerne i gennemsnit er 0.010g tungere, når musen vejer 1g mere. 4. Er der signifikant korrelation mellem kuldstørrelse og kropsvægt? Vi undersøger nu, ved hjælp af korrelationstest (såvel Pearson som Spearman), om der er signifikant korrelation mellem kuldstørrelse og kropsvægt. Korrelationerne udregnes ved at skrive proc corr pearson spearman data=mus; var litter body; hvorved vi får 7

8 The CORR Procedure 2 Variables: litter body Pearson Correlation Coefficients, N = 20 Prob > r under H0: Rho=0 litter body litter <.0001 body <.0001 Spearman Correlation Coefficients, N = 20 Prob > r under H0: Rho=0 litter body litter <.0001 body <.0001 Hvad enten vi benytter parametrisk (Pearson) eller nonparametrisk (Spearman) korrelation, er der helt klart en sammenhæng mellem kuldstørrelse og kropsvægt. Noget helt andet er så fortolkningen af korrelationskoefficienten. Vi kan i hvert fald ikke gå ud fra, at vores observationer passer med en todimensional normalfordeling, bl.a. fordi der er 2 af hver kuldstørrelse. Det ser ud som om denne litter er valgt på systematisk måde, og den faktiske størrelse af korrelationskoefficienten (hvad enten den er parametrisk eller ej) kan derfor ikke tillægges nogen fornuftig mening (idet korrelationskoefficientens størrelse som bekendt afhænger af samplingmetoden). 8

9 5. Undersøg kropsvægten som funktion af kuldstørrelse og giv en biologisk fortolkning af resultatet. Hvad er den forventede kropsvægt for en mus fra et kuld på 5? Den relevante tegning er proc sgplot data=mus; reg Y=body X=litter; som giver resultatet Da vi igen har brug for en estimate-sætning, benytter vi glm: proc glm data=mus; model body=litter / solution clparm; estimate "body for litter=5" intercept 1 litter 5; og finder 9

10 The GLM Procedure Dependent Variable: body R-Square Coeff Var Root MSE body Mean Standard Parameter Estimate Error t Value Pr > t body for litter= <.0001 Parameter 95% Confidence Limits body for litter= Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 litter <.0001 Parameter 95% Confidence Limits Intercept litter Også for kropsvægten ses en negativ sammenhæng til kuldstørrelsen, idet hældningskoefficienten bliver signifikant negativ (i parentes bemærket er P-værdien præcis den samme, som vi fandt ovenfor i forbindelse med test af den parametriske korrelationskoefficient): ˆβ = 0.441(0.032) Dette betyder, at vi for hver ekstra mus i kuldet forventer en kropsvægt på gennemsnitligt 0.441g (knap et halvt gram) mindre for hver enkelt mus. Estimatet for kropsvægten for mus fra kuld med 5 individer ses udfra estimate-sætningen at være 8.85 g, med konfidensinterval CI=(8.59, 9.11) gram. 6. Foretag en multipel regressionsanalyse med hjernevægt som responsvariabel og såvel kuldstørrelse som kropsvægt som forklarende variable. Vi har nu set, at der er signifikante sammenhænge mellem alle de tre målte størrelser: kropsvægten er negativt relateret til kuldstørrelsen hjernevægten er positivt relateret til kropsvægten 10

11 hjernevægten er negativt relateret til kuldstørrelsen Vi kan nu med rette spørge os selv, om den lavere hjernevægt blandt mus fra store kuld simpelthen er betinget af, at musene som sådan er mindre i store kuld og derfor også har mindre hjerner. For at undersøge denne påstand skulle man ideelt råde over data fra forskellige størrelser musekuld, hvor musene alle var lige tunge. Hvis hjernevægten her også kunne vises at falde med kuldstørrelsen, kunne vi konstatere at kuldstørrelse havde en direkte effekt på hjernevægten og ikke kun en effekt via kropsvægten. Sådanne data har vi naturligvis ikke i praksis, men en multipel regressionsanalyse er præcis designet til at svare på dette spørgsmål, idet de enkelte effekter her netop fortolkes som effekten af den relevante kovariat for fastholdt værdi af alle de øvrige. Vi foretager altså en multipel regressionsanalyse med hjernevægt som responsvariabel og såvel kuldstørrelse som kropsvægt som forklarende variable: proc glm data=mus; model brain=litter body / solution clparm; estimate "body for litter=5, body=10" intercept 1 litter 5 body 10; hvorved vi får The GLM Procedure Number of Observations Used 20 Dependent Variable: brain R-Square Coeff Var Root MSE brain Mean Source DF Type I SS Mean Square F Value Pr > F litter body Source DF Type III SS Mean Square F Value Pr > F litter body

12 Standard Parameter Estimate Error t Value Pr > t body for litter=5, body= <.0001 Parameter 95% Confidence Limits body for litter=5, body= Standard Parameter Estimate Error t Value Pr > t Intercept litter body Parameter 95% Confidence Limits Intercept litter body Vi ser her, at begge kovariater er signifikante (kuldstørrelse er lige på kanten med P=4.8%, medens kropsvægten er tydelig med P=0.2%). (a) Hvad er den forventede hjernevægt for en mus fra et kuld på 5 og en kropsvægt på 10 g? Vores estimate-sætning giver os svaret gram, med konfidensinterval (0.437, 0.473) gram. Prediktionsintervallet for enkeltindivider er ± = (0.431, 0.479) For sådanne mus er det altså stærkt usædvanligt at have en hjernevægt på kun 0.4 g. (b) Forklar forskellen til resultatet fra spørgsmål 2a. I dette spørgsmål ser vi på hjernevægten hos mus, der fra et kuld med 5 individer har opnået en kropsvægt på 10 gram. Dette er ret usædvanlige mus, idet den typiske kropsvægt for sådanne mus var 8.85 g, som vi så det i spørgsmål 5. Prediktionsintervallet (fra spørgsmål 5) for sådanne kropsvægte er 8.85 ± = (8.02, 9.68) og mus fra sådanne kuld når altså sjældent op på 10 gram. 12

13 7. Hvilken biologisk fortolkning har forskellen på koefficienten til litter i model 1 og model 3 i jeres udfyldte skema nedenfor? Vi sammenfatter resultaterne i tabellen: Respons: brain koefficient til Model Kovariater litter body residual % forklaret nr. spredning variation 1 kuldstørrelse (0.001) kropsvægt (0.002) kuldstørrelse (0.003) (0.007) og kropsvægt Bemærk her, at afhængigheden af kuldstørrelse skifter fortegn, idet den er negativ, når body ikke er med i modellen (model nr. 1), men positiv, når body medtages (model nr. 3). Fortolkningen af dette følger nedenfor. Vi kan af dette konkludere at hjernevægten er positivt relateret til kropsvægten Hvis mus A vejer 1g mere end mus B, forventer vi også at mus A s hjerne vejer i gennemsnit 0.010g mere end mus B s (Bemærk, at vi i denne situation typisk har, at mus A kommer fra en mindre kuldstørrelse end mus B) Hvis mus A og B kommer fra to kuld af samme størrelse, forventer vi dog en forskel i hjernevægt i gennemsnit på hele 0.024g, fordi A må betegnes som en usædvanlig stor mus fra en sådan kuldstørrelse. at hjernevægten er relateret til kuldstørrelsen, på følgende måde Hvis mus C kommer fra en kuldstørrelse på en flere end mus D, da forventer vi, at mus C s hjerne vejer lidt mindre, i gen- 13

14 nemsnit 0.004g mindre (Bemærk, at vi i denne situation typisk har, at mus C tillige har en mindre kropsvægt end mus D) Hvis mus C og D alligevel vejer det samme, da vil vi forvente, at mus C s hjerne vejer mest, (nemlig i gennemsnit 0.007g mere end mus D s), fordi mus C er en usædvanlig stor mus fra en sådan kuldstørrelse. Den interessante konklusion er, at hjernevægten hos mus fra store kuld er relativt større set i forhold til kropsvægten end for mus fra små kuld. Den biologiske fortolkning af dette er, at den øgede konkurrence om næringen for store musekuld ikke går ud over hjernen i samme grad som den går ud over kropsvægten. Dette genfindes i øvrigt for mennesker, idet tvillinger (trillinger, firlinger osv.) generelt er mindre og tyndere, men med vitale organer, der er prioriteret, så de ikke er (meget) mindre end hos andre nyfødte. Opgavebesvarelse, biomasse Nedenstående tabel angiver sammenhørende observationer af det kumulerede antal solskinstimer og biomassen af sojabønner over en 8-ugers periode efter spiring. Biomassen er målt som den gennemsnitlige tørvægt i gram af fire uafhængige planter. nr. soltimer biomasse

15 1. Ser det ud til, at der en lineær sammenhæng mellem de to variable? Data indtastes direkte i et SAS-program, og der tegnes: data sol; input soltimer biomasse; datalines; ; proc sgplot data=sol; scatter Y=biomasse X=soltimer; Plottet ser jo rimeligt lineært ud. En nøjere granskning kan evt. foretages som modelkontrol efter fit af modellen, men da der er så få observationer, giver det ikke rigtigt mening. Bemærk, at en høj korrelation (specielt hvis det er en Spearman) ikke sikrer, at sammenhængen er lineær! Under antagelse om en lineær regressionsmodel med normalfordelte afvigelser, ønskes følgende spørgsmål besvaret: 15

16 2. Giv et estimat for hældningen, med tilhørende 95% sikkerhedsinterval. Undersøg, om hældningen kan antages at være 1. Vi skal foretage en sædvanlig lineær regression med biomasse (Y) som respons og soltimer (X) som forklarende variabel: Y i = α + βx i + ε i men først tegner vi lige en linie ind på plottet ved at bruge reg i stedet for scatter: proc sgplot data=sol; scatter Y=biomasse X=soltimer; hvorved vi får Vi udfører dernæst en lineær regression, idet vi samtidig medtager en estimatesætning, vi skal bruge senere: proc glm plots=all data=sol; model biomasse=soltimer / solution clparm; estimate "sol=200" intercept 1 sol 200; 16

17 Vi får outputtet: The GLM Procedure Dependent Variable: biomasse R-Square Coeff Var Root MSE biomasse Mean Standard Parameter Estimate Error t Value Pr > t sol= <.0001 Parameter 95% Confidence Limits sol= Standard Parameter Estimate Error t Value Pr > t Intercept soltimer <.0001 Parameter 95% Confidence Limits Intercept soltimer Vi ser af ovenstående output, at effekten af solskin er stærkt signifikant, idet et test af hældning = 0 giver T=23.06, svarende til en P-værdi, der er mindre end Samme P-værdi får man ved at anvende F-testet, idet F= = F(1,6). Bemærk, at der i outputtet ikke findes noget test for linearitet! Vi er imidlertid ikke blot interesserede i at påvise en effekt af solskin, vi vil kvantificere denne i form af et konfidensinterval for hældningen, som jo er tilvæksten i biomasse forårsaget af en enkelt solskinstime. Estimatet med tilhørende spredning (standard error) er med enheder g/time. ˆβ = (0.0550) Et 95% konfidensinterval fås som estimat ± ca. 2 gange spredningen. Nu er de ca. 2 jo egentlig en t-fraktil, som for store datamaterialer nærmer sig Her har vi kun 8 observationer, og dermed 6 frihedsgrader til estimation af variansen (se også ovenstående output), og t-fraktilen er derfor en del større end 2. Vi kan slå den op i bogen s. 521 og finder værdien 2.447, og vi kan nu udregne konfidensintervallet til: 17

18 ± = (1.13, 1.40) sådan ca. det samme som vi fik i outputtet. Vi kan altså sige, at intervallet (1.13, 1.40) g/time med 95% sandsynlighed indeholder den sande tilvækst i biomasse efter en enkelt solskinstime. Da værdien 1 ikke er indeholdt i dette interval, kan vi med det samme sige, at på et 5% signifikansniveau kan vi ikke acceptere hypotesen om at hældningen er 1 (vi forkaster hypotesen H 0 : β = 1 på et 5% niveau). Vi kan også direkte udregne et test for H 0 : β = 1 ved at omskrive hypotesen til H 0 : β 1 = 0 og udregne teststørrelsen: = 4.89 som helt klart er for stor, svarende til at vi allerede ved, at hypotesen skal forkastes. P-værdien kan slås op i t-tabellen (med sølle 6 frihedsgrader), hvilket giver < P < Man kan også gøre det med SAS ved at indføje en test-sætning i en proc reg: proc reg data=sol; model biomasse=soltimer / clb; test soltimer=1; som vil give det ekstra output Test 1 Results for Dependent Variable biomasse Mean Source DF Square F Value Pr > F Numerator Denominator

19 Nu er der jo egentlig heller ikke rigtigt nogen grund til, at β skulle være 1, så vi burde slet ikke have opstillet sådan en hypotese, bare fordi ˆβ så ud til at være tæt på 1! Der er jo nok ikke nogen, der har indrettet enhederne så viseligt, at timer netop skulle svare til gram Undersøg om interceptet kan antages at være 0. Hvad bliver hældningsestimatet under denne hypotese? Hvad sker der med spredningsestimatet for hældningen ved overgang fra modellen med intercept til modellen uden intercept (dvs. intercept=0)? Fra outputtet svarende til den ovenfor udførte lineære regressionsanalyse finder vi estimatet for afskæringen (interceptet) med tilhørende spredning (standard error) til ˆα = ( ) T-test størrelsen for test af hypotesen H 0 : α = 0 står også i output som -1.39, med en tilhørende P-værdi på 0.21, svarende til, at vi ikke kan forkaste denne hypotese (bemærk at vi ikke hermed har bevist, at α = 0, vi har blot ikke her evidens for det modsatte). Hvis vi antager, at interceptet er 0, skal vi reestimere hældningen ved at foretage en lineær regressionsanalyse gennem (0,0). Modellen hedder nu Y i = βx i + ε i og den kan fittes ved at benytte option noint i model-sætningen: proc glm data=sol; model biomasse=soltimer / noint solution clparm; estimate "sol=200" soltimer 200; Output bliver: 19

20 The GLM Procedure Number of Observations Used 8 Dependent Variable: biomasse R-Square Coeff Var Root MSE biomasse Mean NOTE: No intercept term is used: R-square is not corrected for the mean. Standard Parameter Estimate Error t Value Pr > t sol= <.0001 Parameter 95% Confidence Limits sol= Standard Parameter Estimate Error t Value Pr > t soltimer <.0001 Parameter 95% Confidence Limits soltimer Vore nye hældningsestimat, med tilhørende spredning (standard error) bliver: ˆβ = (0.0341) medens vi i modellen med intercept fik ˆβ = (0.0550) Vi bemærker, at vi ved at tvinge interceptet til at være 0 (større end det oprindelige estimat, som jo var negativt) har fået et mindre hældningsestimat. Dette sker p.g.a. den negative korrelation mellem disse estimater. Vi bemærker endvidere, at spredningen på estimatet er faldet betragteligt (vi vinder generelt præcision ved at smide insignifikante effekter væk, specielt hvis disse er korrelerede med de interessante effekter). Populært kan man sige at vi nu arbejder i en model med større viden, hvilket naturligvis øger vores sikkerhed. 4. Bestem et 95% sikkerhedsinterval for den estimerede biomasse produktion når det kumulerede antal solskinstimer når op på 200, for modellen med hhv. uden intercept. Forklar forskellen. 20

21 Modellen uden intercept er den letteste. Her er den estimerede biomasse ved 200 solskinstimer blot givet ved 200 ˆβ = = og usikkerheden er tilsvarende givet ved s.e.(200 ˆβ) = 200 s.e.( ˆβ) = = 6.82 således at konfidensgrænserne bliver 200 ( ± ) = (225.29, ) Bemærk, at vi her anvender t-fraktilen svarende til 7 frihedsgrader (i stedet for som tidligere 6). Det er naturligvis fordi vi nu kun har en enkelt parameter i modellen. Men vi behøver jo ikke at håndregne, for vi havde allerede resultatet fra estimate-sætningen ovenfor. Konfidensgrænserne kommer til at se således ud: Bemærk her, at konfidensgrænserne er smallest nede ved 0, idet vi har indføjet ekstra viden i vores model, nemlig, at interceptet er 0. 21

22 For modellen med intercept er det vanskeligt at udregne grænserne med håndkraft, men der har vi også ovenfor set resultatet fra estimatesætningen, nemlig et estimat på med konfidensintervallet (195.37, ). De tilhørende konfidensgrænser fremgår af nedenstående figur: Vi ser, at modellen uden intercept giver et noget højere predikteret udbytte ved 200 solskinstimer ( mod i modellen med intercept), svarende til, at vi stadig er i nærheden af 0, hvor linien jo er blevet løftet ved at smide (det negative) intercept ud. Konfidensgrænserne er tillige væsentligt smallere, igen på grund af den øgede præcision i en model med kun en parameter. 22

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017 Faculty of Health Sciences Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 26. september 2017 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345) Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Faculty of Health Sciences. Regressionsanalyse. Simpel lineær regression, Lene Theil Skovgaard. Biostatistisk Afdeling

Faculty of Health Sciences. Regressionsanalyse. Simpel lineær regression, Lene Theil Skovgaard. Biostatistisk Afdeling Faculty of Health Sciences Regressionsanalyse Simpel lineær regression, 28-2-2013 Lene Theil Skovgaard Biostatistisk Afdeling 1 / 67 Simpel lineær regression Regression og korrelation Simpel lineær regression

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2015

Vejledende besvarelse af hjemmeopgave, efterår 2015 Vejledende besvarelse af hjemmeopgave, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder i Massachusetts (ref.) søger

Læs mere

ELISA. ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig.

ELISA. ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig. ELISA ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig. Teknikken er ganske snedig, og muliggør at man inddirekte

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ). Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression

Læs mere

Modul 6: Regression og kalibrering

Modul 6: Regression og kalibrering Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................

Læs mere

Basal statistik. 25. september 2007

Basal statistik. 25. september 2007 Basal statistik 25. september 2007 Korrelation og regression Simpel lineær regression Todimensionale normalfordelinger Korrelation vs. regression Modelkontrol Diagnostics Lene Theil Skovgaard, Biostatistisk

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse i R. Lene Theil Skovgaard 23. september 2019 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse i R. Lene Theil Skovgaard. 25. februar 2019

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse i R. Lene Theil Skovgaard. 25. februar 2019 Faculty of Health Sciences Basal Statistik Regressionsanalyse i R. Lene Theil Skovgaard 25. februar 2019 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere