Supplerende opgaver. 2. Beregn gennemsnit og median for variablen Serum Creatinine. 3. Beregn gennemsnit og varians for BMI delt op efter Sex.

Størrelse: px
Starte visningen fra side:

Download "Supplerende opgaver. 2. Beregn gennemsnit og median for variablen Serum Creatinine. 3. Beregn gennemsnit og varians for BMI delt op efter Sex."

Transkript

1 Institut for Matematiske Fag Københavns Universitet Statistik for Biokemikere Helle Sørensen Oktober 2009 Supplerende opgaver Når der nedenfor envises til Biostatistics menes der lærebogen Biostatistics: a guide to design, analysis and discovery af Forthofer, Lee og Hernandez, 2007, 2. udgave (Academice Press). Det er markeret med parentes efter opgavetitlen hvis opgaven skal løses vha. SAS. Datasættene kan findes på hjemmesiden, dvs. under Absalon. Vælg Andet materiale. BK.1: Indlæsning og tilrettelæggelse af data (SAS) 1. Konstruér et SAS-datasæt test med tre variable x, y og z og 12 observationer der antager værdierne (0,1,6), (1,0,9), (0,0,1), (0,0,20), (0,1,5), (0,1,2), (1,1,3), (1,1,8), (1,1,7), (0,1,0), (0,0,15), (1,1,4). I de følgende 4 spørgsmål genbruges datasættet test vha. ordren set. 2. Konstruér på grundlag af test et nyt datasæt der kun indeholder variablene x og y. 3. Konstruér på grundlag af test et nyt datasæt der kun indeholder observationer hvor x har værdien Konstruér på grundlag af test et nyt datasæt der kun indeholder observationer hvor x har værdien 0 og y har værdien Konstruér på grundlag af test et nyt datasæt der kun indeholder variablen z og kun observationer hvor y har værdien Beregn gennemsnittet af x, gennemsnittet af y og gennemsnittet af z. BK.2: Beregninger og tegninger (SAS) 1. Hent datasættet i Biostatistics Tabel 3.1 (side 22) på og indlæs det som SAS-datasæt. 2. Beregn gennemsnit og median for variablen Serum Creatinine. 3. Beregn gennemsnit og varians for BMI delt op efter Sex. 4. Lav et plot af Systolic Blood Pressure mod Age 5. Tegn histogrammer for Age, BMI, Serum Creatinine og Systolic Blood Pressure. 1

2 6. Lav et boxplot af Serum Creatinine delt op efter Sex 7. Beregn andre interessante størrelser efter eget valg. BK.3: Mean and standard deviation for normal samples For a sample y 1,..., y n from the normal distribution with mean µ and standard deviation σ we expect 95% of the observations to fall within the interval (µ 2σ, µ + 2σ), that is, in the interval mean ± 2 standard deviation The figure shows histograms for three samples, each of size The data are drawn from the normal distribution, but with three different means and standard deviations. 1. For each histogram, use the above result to give a (rough) estimate of the mean and the standard deviation. Density Density Density BK.4: Indtag af A-vitamin (SAS) Data til denne opgave stammer fra et stort studie om danskernes kostvaner fra Indtaget af A-vitamin for 1079 mænd er listet i filen avit.txt som ligger på kursushjemmesiden. 1. Indlæs datasættet. Da datasættet er stort er det måske nemmest at klikke sig frem på følgende måde: Klik på File i topmenuen Vælg Import data Vælg *.txt som filtype Browse dig frem til datafilen Giv datasættet et navn som skrives i member-boksen Til sidst beder SAS om et filnavn hvor den kan gemme noget kode så du nemt kan indlæse datasættet en anden gang uden at skulle bruge import-wizarden igen. Du kan angive en file eller lade være: SAS-datasættet bliver lavet under alle omstændigheder. 2

3 Tryk Finish 2. Tegn et histogram og et QQ-plot over A-vitaminindtaget. Er det rimeligt at antage at A-vitaminindtaget er normalfordelt? 3. Konstruér en ny variabel der indeholder den naturlige logaritme til A- vitaminindtaget. Vink: Lav et nyt datasæt, hvor du bruger set til at tage udgangspunkt i det oprindelige datasæt og så laver en ny variabel med kommandoen logavit=log(avit). 4. Tegn et histogram og et QQ-plot over den nye variabel. Er det rimeligt at antage at logaritmen til A-vitaminindtaget er normalfordelt. 5. Beregn gennemsnit og stikprøvespredning for logaritmen til A-vitaminindtaget vha. proc univariate. 6. Antag at logaritmen til A-vitaminindtaget er normalfordelt med de parametre du netop er bestemt. Hvad er sandsynligheden for at en tilfældig mand har et logaritmisk A-vitaminindtag mellem 7.60 og 8.29? 7. Hvad er sandsynligheden for at en tilfældig mand har et A-vitaminindtag mellem 2000 og 4000? Vink: På hvilken skala er det rimeligt at bruge normalfordelingen? BK.5: Nikkelallergi Som en del af et større forsøg undersøgte man nikkelallergiske reaktioner hos seks nikkelallergikere. Lymfocytter blev dyrket og stimuleret med NiSO 4. På basis af dyrkningen bestemte man et såkaldt stimultionsindeks for hver person, som mål for den allergiske reaktion. Målingerne var: 14.9, 8.2, 3.6, 3.2, 2.8, 1.9 og det kan i det følgende benyttes at gennemsnit og spredning for stikprøven er 5.77 og Antag at stimulationsindekset kan antages at være normalfordelt, og beregn et 95% konfidensinterval for middelværdien i denne normalfordeling. 2. Beregn også et 90% konfidensinterval for den samme størrelse. 3. Hvilket af følgende udsagn passer: Vi vil forvente at 95% af alle nikkelallergikere har et stimulationsindeks mellem 0.5 og 11. Vi vil forvente at intervallet fra 0.5 til 11 med 95% sandsynlighed det gennemsnitlige stimulationsindeks blandt nikkelallergikere. Hvad er forskellen mellem de to udsagn? 3

4 4. Er det mon rimeligt at antage at stimulationsindekset følger en normalfordeling? Kan man undersøge antagelsen? BK.6: vedr. Biostatistics opgave 7.6 Du skal bruge tallene i Biostatistics opgave 7.6 (side 208), men ikke svare på spørgsmålene. Svar derimod på spørgsmålene nedenfor. Du kan benytte at ȳ = og at s = Opstil en statistisk model for data. 2. Hvilken værdi af middelværdien svarer til at måleinstrumentet virker, dvs. i gennemsnit måler den rigtige værdi? 3. Test hypotesen om at måleinstrumentet i gennemsnit måler den rigtige værdi. 4. Angiv et konfidensinterval for middelværdien af målinger fra instrumentet. BK.7: vægttab over 6 uger (SAS) Data til opgaven ligger i filen weightloss.txt på kursushjemmesiden. 1. Løs Biostatistics opgave 7.12 (side 210) 2. Beregn også et estimat og et konfidensinterval for det forventede vægttab i løbet af en periode på 6 uger. Vink: Det er nok en god ide at beregne vægttabet for hver af de 20 personer og bruge det i analysen. Hvorfor? BK.8: Ekstra spørgsmål til Vinter , opgave 1 Denne opgave består af supplerende spørgsmål Vinter , opgave Angiv estimatet for spredningen i fordelingen af logaritmen til radium-226 niveauet. 2. Bestem et interval hvor man med sandsynlighed 95% vil forvente at finde logaritmen til radium-226 niveauet for en tilfældig jordprøve fra samme område som data kommer fra. 3. Bestem et interval hvor man med sandsynlighed 95% vil forvente at finde radium-226 niveauet for en tilfældig jordprøve fra samme område som data kommer fra. BK.9: Effekt af behandling på Serum Creatinine, del 1 (SAS) Anvend datamaterialet fra Biostatistics Tabel 3.1 og undersøg, om der er forskel på niveauet for Serum Creatinine hos dem der er blevet behandlet og dem der ikke er blevet behandlet. 4

5 BK.10: Effekt af behandling på Serum Creatinine, del 2 (SAS) Betragt datamaterialet fra Biostatistics Tabel 3.1 og anvend Wilcoxons Rangsum test til at undersøge, om der er forskel på niveauet for Serum Creatinine hos dem der er blevet behandlet og dem der ikke er blevet behandlet. Sammenlign med resultaterne fra opgave BK.9. BK.11: Gene expression levels (SAS) Two groups were compared in an experiment with six microarrays. Two conditions (the test group and the reference group) were examined on each array and the amount of protein synthesized by the gene (also called the gene expression) was measured for the two groups. The expression levels for the six arrays are shown below Test group Reference group Test if the expression level is identical for the test and reference group. The data is saved in the file gene.txt. 2. Compute a confidence interval for the difference in expression level between the test and the reference group. BK.12: Points in a swarm The following experiment was carried out in order to investigate how well people can estimate the number of points in a swarm of points. Seven persons were asked to look at a number of pictures with points. Each picture was shown four times for each person, in a random order, and five seconds each time. For each showing the persons should estimate/guess the number of points in the picture. For a picture with 161 points the average over the four estimates for the seven persons were Person Average guess The sample mean is and the sample standard deviation is Is there a systematic tendency to overestimate or underestimate the number of points? Hint: The mean ȳ = is the estimate of a parameter. What is the interpretation of this parameter? And which tools can you use to say something about the likely values of this parameter, based on your data? 5

6 2. Which assumptions were used in order the answer question 1.? 3. The experimenter would like the 95% confidence interval to have a length of at most 10. Calculate, just roughly, how many persons should be included in the experiment in order to obtain this. Assume now that a guess from a random person is normally distributed with mean 161 and standard deviation Calculate an interval where you wold expect to find the guesses for 95% of the people in the population. Explain the difference in interpretation between this interval and the interval you computed i question 2. BK.13: T-test og konfidensintervaller Betragt to-stikprøve T-testet og diskuter følgende påstand: Man kan udføre testet for µ 1 = µ 2 ved at se om konfidensintervallerne for de to gruppegennemsnit overlapper. BK.14: Analyse af Collinge-data (SAS) I denne opgave skal du analysere variablen h fra Collinge-datasættet. Udfør en analyse med henblik på at undersøge om type har en effekt på h. Data ligger på websiden og du skal selvfølgelig bruge SAS. Se evt. eksempel 1.3 i Variansanalyse i SAS 1. BK.15: Vægt af rotter (SAS) Filen ratweight.txt indeholder data for vægtøgning hos 40 rotter i et forsøg. Rotterne er inddelt i fire grupper svarende til fire forskellige diæter. De fire diæter er de fire kombinationer af proteinkilden (kød eller korn) og proteinmængden (lav eller høj). Analysér data med henblik på at undersøge om kilden og mængden af protein har en effekt på rotternes vægtøgning. Angiv også estimater og konfidensintervaller for interessante forskelle mellem behandlinger. BK.16: Forsøgsplaner og dataanalyse Et forsøg skal planlægges for at undersøge effekten af et bestemt stof på koncentrationen af et hormon. Stoffet tilsættes kosten for forsøgspersonerne. Der benyttes tre forskellige behandlinger: A. Tilsætning af stoffet til kosten i lav koncentration B. Tilsætning af stoffet til kosten i høj koncentration C. Ingen tilsætning af stoffet Efter en uges behandling måles koncentrationen af hormonet i blodet hos forsøgspersonerne. 6

7 1. Antag først at 60 personer indgår i forsøget, således at hver behandling gives til 20 personer. Hvilken type analyse er rimelig at benytte? 2. Antag i stedet at der kun indgår 20 personer i forsøget, men at hver person prøver alle tre behandlinger. Behandlingerne gives med en måneds mellemrum (således at det er rimeligt at antage at tidligere behandlinger ikke har en effekt) og rækkefølgen er tilfældig. Hvilken type analyse er rimelig at benytte? 3. Antag endelig at 30 mænd og 30 kvinder indgår i forsøget, således at hver behanling gives til 10 mænd og 10 kvinder. Hvilken analyse er rimelig at benytte? Hvilke effekter har du mulighed for at teste for? BK.17: Kolesterolkoncentration (SAS) I denne opgave skal du analysere data fra Eksempel 12.5 i Zar, Biostatistical Analysis hvor kolesterolkoncentrationen er målt tre gange for syv forsøgspersoner. De tre målinger svarer til indtagelse af tre forskellige medikamenter, og spørgsmålet er om medikamenterne har forskellige effekt på kolesterolkoncentrationen. Du kan se data i kopierne fra Zar, og de ligger desuden i filen zar12_5.txt. BK.18: Data fra eget fagområde Tænk over forsøg/problemstillinger/data fra Biokemi (eller hvad der nu måtte være dit fagområde) hvor det ville være naturligt at bruge følgende metoder: ensidet variansanalyse tosidet variansanalyse (både blokforsøg og tofaktorforsøg) tresidet variansanalyse lineær regression BK.19: Ekstra spørgsmål til Blok , opgave 3 Denne opgave består af supplerende spørgsmål Blok , opgave 3. Data ligger på websiden i filen j3.txt. Lav residualplot svarende til analysen hvor de utransformerede titer-værdier bruges som respons. Hvordan passer residualplottet med konklusionen fra Bartlett s test? Lav residualplot svarende til analysen hvor de log-transformerede titerværdier bruges som respons. Hvordan passer residualplottet med konklusionen fra Bartlett s test? 7

8 BK.20: Vedr. Vinter , opgave 2 (SAS) Denne opgave går ud på selv at køre analysen fra Vinter , opgave 2 i SAS. Data ligger på websiden i filen b2.txt. Lav residualplot svarende til startmodellen. Er der grund til at være bekymret over modellens evne til at beskrive data? Prøv at gøre som vi har gjort ved forelæsningerne: fjern en ikke-signifikant faktor/effekt ad gangen indtil alle faktorer har en signifikant effekt. BK.21: Effekt af nervegas på reaktionstid (SAS) Data i denne opgave stammer fra to eksperimenter, hvor man målte fluers reaktionstid efter de var blevet udsat for nervegas. Målingen for den enkelte flue består i den tid reaktionstiden der går fra fluen bringes i kontakt med giften og indtil den ikke længere kan stå på benene. I det første eksperiment blev fluerne udsat for giften i 30 sekunder og i det andet i 60 sekunder. Målingerne af reaktionstiden ses nendenfor. Reaktionstider for 31 fluer udsat for nervegas Reaktionstid i sekunder kontakttid sekunder kontakttid sekunder Kilde: Blæsild P. og Granfeldt J., Statistik for biologer og geologer, Århus Universitet Data ligger på websiden i filen reaktionstid.txt. 1. Lav et QQ-plot for hver af de to grupper af observationer. Er det rimeligt at beskrive reaktionstiden ved hjælp af normalfordelingen? 2. Lav en ny variabel der indeholder reaktionstiderne transformeret med den naturlige logaritme. Lav QQ-plot for hver af de grupper af observationer. Er det rimeligt at beskrive log-reaktionstiden ved hjælp af normalfordelingen? 3. Undersøg om fordelingen af reaktionstiden afhænger af om kontakttiden er 30 eller 60 sekunder. Vink: Hvilken variabel skal du analysere? 4. Angiv et konfidensinterval for middelværdien af de logaritmetransformerede reaktionstider. 5. Angiv et skøn for middelværdien af reaktionstiderne samt et konfidensinterval for middelværdien af reaktionstiderne. 8

9 BK.22: Transport af bakterier Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe bakterier. Nedenstående talmateriale er hentet fra et større projekt, der har til formål at undersøge transportmetodens indvirkning på forskellige anaerobe bakteriestammers overlevelse. Her skal vi kun interessere for en enkelt bakteriestamme, to temperaturer (4 og 22 ) og tre transportmedier (agar, tør, stuart). For hver kombination af temperatur og medie er der foretaget to forsøg. Målingerne i tabellen er log 10 ( log 10 (overlevelsesraten)), hvor overlevelsesraten er defineret ved hjælp af den brøkdel af bakterierne til tid 0, der overlever et døgn. Man ved af erfaring at denne transformation gør observationerne tilnærmelsesvis normalfordelte med samme varians. Temperatur Medie agar tør Stuart 4 o o Undersøg om overlevelsesraten afhænger af transporttemperatur og transportmedie. Bilag: Data antages at ligge i datasættet bakterie med de tre variable temp, medie og rate. PROGRAM1: PROGRAM2 UDSKRIFT1 PROC GLM; CLASS temp medie; MODEL rate=temp medie; RUN; PROC GLM; CLASS temp medie; MODEL rate=temp medie/solution; RUN; The GLM Procedure Class Level Information Class Levels Values temp medie 3 agar stuart tor Number of observations 12 Dependent Variable: rate Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total

10 R-Square Coeff Var Root MSE rate Mean Source DF Type I SS Mean Square F Value Pr > F temp <.0001 medie <.0001 temp*medie UDSKRIFT2 The GLM Procedure Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total Source DF Type I SS Mean Square F Value Pr > F temp <.0001 medie <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 temp B <.0001 temp B... medie agar B medie stuart B <.0001 medie tor B... BK.23: Udstødningsgasser For 23 bilmotorer har man målt sammenhørende værdier af HC, CO og NOX i udstødningsgassen (enhed: gram per mile). Nedenfor findes en udskrift fra SAS-programmet PROC CORR. 1. Hvilke af de tre variable er positivt og hvilke er negativt korrelede?. 2. Er der nogle af de tre variable der kan antages at være ukorrelerede? For 23 andre motorer havde man målt HC i udstødningen. Disse målinger havde et gennemsnit på og en empirisk spredning givet ved s = Kan disse nye målinger antages at ligge på samme niveau som de 23 første. Bilag: Data antages at ligge i datasættet motor med de fire variable gruppe, der angiver om det er første eller anden gruppe, og HC, CO og NOX. PROGRAM DATA corr; SET motor; IF gruppe=1; 10

11 PROC CORR; VAR HC CO NOX; PROC TTEST DATA=motor; CLASS gruppe; VAR HC; RUN; UDSKRIFT The CORR Procedure (for gruppe 1) 3 Variables: HC CO NOX Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum HC CO NOX Pearson Correlation Coefficients, N = 23, Prob > r under H0: Rho=0 HC CO NOX HC < CO <.0001 <.0001 NOX <.0001 The TTEST Procedure. Statistics Lower CL Upper CL Lower CL Upper CL Variable GRUPPE N Mean Mean Mean Std Dev Std Dev Std Dev Std Err HC HC HC Diff (1-2) T-Tests Variable Method Variances DF t Value Pr > t HC Pooled Equal HC Satterthwaite Unequal Equality of Variances Variable Method Num DF Den DF F Value Pr > F HC Folded F BK.24: Effekt af kosttilskud på vægt Ved en undersøgelse af kosttilskuds indflydelse på vægt deltes 7 uger gamle rotter i 4 grupper med samme gennemsnitsvægt. Disse fik 4 forskellige kombinationer af kosttilskud. Ved forsøgets afslutning måltes rotternes vægt. I tabellen er vist antal, n, gennemsnit, x, og empirisk varians, s 2 for vægten af rotterne i de fire grupper. 11

12 For x 1, x 2,..., x n er disse størrelser defineret ved x = 1 n n r=1 x r, s 2 = 1 n 1 n (x r x) 2. r=1 I det følgende kan det antages, at vægten af rotterne er normalfordelt og at rotter i samme gruppe stammer fra samme fordeling. Bemærk, at den vedlagte SAS-udskrift kan anvendes ved opgavebesvarelsen. Antal, gennemsnit og empirisk varians for vægt af rotter Gruppe n x s Undersøg om de fire grupper kan antages at have samme varians. 2. Vis, at de fire grupper ikke kan antages at have samme middelværdi. Gruppe 1 og 3 havde fået samme kosttilskud, bortset fra at gruppe 3 også havde fået calciumtilsætning. 3. Vis, at gruppe 1 og gruppe 3 kan antages at have samme middelværdi. Også gruppe 2 og gruppe 4 havde fået samme kosttilskud, bortset fra at gruppe 4 også her havde fået calciumtilsætning. 4. Kan gruppe 2 og gruppe 4 antages at have samme middelværdi? Bilag: Data antages at ligge i datasættet rotte med de to variable gruppe, der angiver gruppe, og vgt, der angiver slutvægt. PROGRAM: PROC GLM DATA=rotte; CLASS gruppe; MODEL vgt= gruppe /SS1 SOLUTION; MEANS gruppe/hovtest=bartlett; UDSKRIFT: General Linear Models Procedure Class Level Information Class Levels Values GRUPPE Number of observations in data set = 61 Dependent Variable: VGT Source DF Sum of Squares F Value Pr > F Model Error Corrected Total

13 R-Square C.V. VGT Mean T for H0: Pr > T Std Error of Parameter Estimate Parameter=0 Estimate INTERCEPT B GRUPPE B B B B... Bartlett s Test for Homogeneity of vgt Variance Source DF Chi-Square Pr > ChiSq gruppe Kilde: W.W. Daniel: Biostatistics, Wiley, 1999 BK.25: Effekt af bestråling på livslængde I et laboratorieeksperiment, hvor man ønskede at studere virkningen af bestråling på livslængde, blev to grupper af RFM hanmus udsat for en stråledosis på 300 rad i en alder af 5-6 uger. Den først gruppe levede i almindelige laboratorieomgivelser, mens den anden gruppe levede i bakteriefrie omgivelser. Efter deres død blev musene obducerede. og det blev afgjort om de var døde af lymfom i skjoldbruskkirtlen, celle sarkom eller af andre årsager. I tabellen nedenfor er angivet overlevelsestiderne for de to grupper af mus. Dødsårsag Tid til død i dage Almindelige laboratorieomgivelser (95) Lymfom Sarkom Andre årsager Bakteriefrie omgivelser (82) Lymfom Sarkom Andre årsager

14 1. I SAS-udskriften nedenfor er overlevelsestiden for de mus, der er døde af lymfom i skjoldbruskirtlen sammenlignet for de to musegrupper ved et Wilcoxontest. Hvad er testets konklusion. Forklar hvorfor det ikke ville være rimeligt at bruge et t-test. 2. Diskuter om forudsætningerne for meningsfuldt at anvende Wilcoxontestet er opfyldt i den betragtede situation. Bilag: Data antages at ligge i datasættet mus2 med de tre variable sygdom, der angiver dødsårsag, mus, der angiver hvilke omgivelser musene har levet i og tid, der angiver levetid i dage. PROGRAM: DATA temp; SET mus2; IF sygdom= lymfom ; PROC NPAR1WAY; CLASS mus; VAR tid; RUN; UDSKRIFT: The NPAR1WAY Procedure Wilcoxon Scores (Rank Sums) for Variable tid Classified by Variable mus Sum of Expected Std Dev Mean mus N Scores Under H0 Under H0 Score laboratorie bakteriefri Wilcoxon Two-Sample Test Statistic Normal Approximation Z One-Sided Pr < Z Two-Sided Pr > Z BK.26: Syntesefraktion hos hamstre I et forsøg interesserer man sig for den såkaldte syntesefraktion i kindposevæv hos hamstre. En del af dette forsøg kan beskrives på følgende måde. På samme tidspunkt (kl 10.00) injiceres et radioaktivt sporstof i en gruppe hamstre. 14

15 Kl slås samtlige hamstre ned, og ved hjælp af det radioaktive sporstof bestemmes syntesefraktionen for højre og venstre kindpose for hver hamster. Undersøg ved et parret t-test, om der kan antages at være samme niveau for syntesefraktionen i højre og venstre kindpose. Diskuter testet i forhold til analysen i bilaget. Syntesefraktion i højre og venstre kindpose hos hamstre. Hamster Syntesefraktion højre venstre Bilag: Data antages at ligge i datasættet hamster med de tre variable hamster, side og fraktion. PROGRAM; UDSKRIFT PROC GLM DATA=hamster; CLASS hamster side; MODEL fraktion=hamster side; RUN; The GLM Procedure Class Level Information Class Levels Values hamster side 2 h v Number of observations 10 Dependent Variable: fraktion Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE fraktion Mean Source DF Type I SS Mean Square F Value Pr > F hamster side BK.27: Pakker med hakket kød På et slagteri pakkes hakket kød i pakker med påtrykt nettoindhold på 500 g. Maskinen på slagteriet er indstillet så der i gennemsnit kommer 510 g kød 15

16 i pakkerne og man ved at maskinen har en præcision der gør at spredningen på kødets vægt i en pakke er 15 g. Vægten af en pakke kan antages at være normalfordelt. 1. Hvad er sandsynligheden for at en tilfældigt udvalgt pakke kød indeholder mindre end 500 g? 2. Hvad er sandsynligheden for at gennemsnittet af to tilfældigt udvalgte pakker kød vejer mindre end 500 g? 3. Hvad er sandsynligheden for at gennemsnittet af 10 tilfældigt udvalgte pakker kød vejer mindre end 500 g? 16

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2006. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 6 sider.

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer. Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Reeksamen i Statistik for biokemikere. Blok 3 2007.

Reeksamen i Statistik for biokemikere. Blok 3 2007. Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot Program Residualanalyse Flersidet variansanalyse Helle Sørensen Modelkontrol (residualanalyse) i tosidet ANOVA med vekselvirkning. Test og konklusion i tosidet ANOVA (repetition) Tresidet ANOVA: the works

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Statistik for Biokemikere Projekt

Statistik for Biokemikere Projekt Statistik for Biokemikere Projekt Institut for Matematiske Fag Inge Henningsen og Helle Sørensen Københavns Universitet November 2008 Formalia Dette projekt udgør en del af evalueringen i kurset Statistik

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Basic statistics for experimental medical researchers

Basic statistics for experimental medical researchers Basic statistics for experimental medical researchers Sample size calculations September 15th 2016 Christian Pipper Department of public health (IFSV) Faculty of Health and Medicinal Science (SUND) E-mail:

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse 1. Hvor stor en andel af deltagerne var mænd? Var der samme andel i de tre randomiseringsgrupper?.

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

KA 4.2 Kvantitative Forskningsmetoder Forår 2010

KA 4.2 Kvantitative Forskningsmetoder Forår 2010 KA 4.2 Kvantitative Forskningsmetoder Forår 2010 Besvar alle spørgsmål. Brug ikke mere end én side af tekst på de åbne spørgsmål som er markeret * Answer all questions. Do not write more than one page

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 11. juni Opgavesættet består af 4 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013 Faculty of Health Sciences Basal Statistik T-tests. Lene Theil Skovgaard 17. september 2013 1 / 67 En- og to-stikprøve problemer One- and two-sample problems: Sammenligning af to situationer: Parret t-test

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences Faculty of Health Sciences En- og to-stikprøve problemer One- and two-sample problems: Basal Statistik T-tests. Lene Theil Skovgaard 17. september 2013 1 / 67 Sammenligning af to situationer: Parret t-test

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Restsaltmængdernes afhængighed af trafikken,

Restsaltmængdernes afhængighed af trafikken, Restsaltmængdernes afhængighed af trafikken, Thomas Glue, marts 2. Trafikintensitet...2 Indledende definitioner...2 Regressionsanalyser på trafikintensiteten...6 Justering af restsaltmængder i henhold

Læs mere

Afdeling for Anvendt Matematik og Statistik December 2006

Afdeling for Anvendt Matematik og Statistik December 2006 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 i SAS (Zar kapitel 23) PROC FREQ PROC CATMOD

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod.

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod. 1-stikprøve t-test (Eksamen 2005 opgave 1) Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod. I nedenstående tabel betragtes blodprøver fra 9 patienter. Hver

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere