Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Relaterede dokumenter
Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Tema. Dagens tema: Indfør centrale statistiske begreber.

Løsning til eksamen d.27 Maj 2010

Reeksamen i Statistik for biokemikere. Blok

Forelæsning 9: Inferens for andele (kapitel 10)

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Nanostatistik: Opgavebesvarelser

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Kapitel 7 Forskelle mellem centraltendenser

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Modelkontrol i Faktor Modeller

1 Hb SS Hb Sβ Hb SC = , (s = )

Modul 12: Regression og korrelation

Kapitel 12 Variansanalyse

Vejledende besvarelser til opgaver i kapitel 14

Kapitel 12 Variansanalyse

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Estimation og konfidensintervaller

ELISA. ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

En Introduktion til SAS. Kapitel 5.

Løsning eksamen d. 15. december 2008

Konfidensintervaller og Hypotesetest

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Eksempel , opg. 2

Løsninger til kapitel 9

Opgaver til kapitel 3

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Reeksamen i Statistik for biokemikere. Blok

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Løsning til eksaminen d. 14. december 2009

(studienummer) (underskrift) (bord nr)

Statistiske Modeller 1: Kontingenstabeller i SAS

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Module 12: Mere om variansanalyse

Susanne Ditlevsen Institut for Matematiske Fag susanne

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Schweynoch, Se eventuelt

Project in Statistics MB

Test nr. 5 af centrale elementer 02402

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Nanostatistik: Konfidensinterval

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Eksamen i Statistik for biokemikere. Blok

Projektopgave til Mat2SS. Espen Højsgaard (CPR xxxx) Rune Højsgaard (CPR xxxx)

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod.

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Forsøgsplanlægning Stikprøvestørrelse

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Module 4: Ensidig variansanalyse

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Forelæsning 11: Kapitel 11: Regressionsanalyse

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Statistik II 1. Lektion. Analyse af kontingenstabeller

Vejledende løsninger kapitel 8 opgaver

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

(studienummer) (underskrift) (bord nr)

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Besvarelser til øvelsesopgaver i uge 6

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Løsning til eksaminen d. 29. maj 2009

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Fejlstrata. Vi forestiller os at V har. 1) Et underrum L. 2) Et indre produkt, 3) En ortogonal dekomposition V = W W m

Transkript:

Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder angiver forskellen mellem niveauet for resorptionsparameteren HPR på dag 1 og efter 28 dage Her udføres et parret t-test (Zar kapitel 91 og 92) for at undersøge om forskellen har middelværdi 0 Vores hypotese er altså H 0 : µ = 0 (a) Det antages, at de 10 observationer af variablen forskel er uafhængige og identisk normalfordelte (b) Af SAS-udskriften aflæses, at et 95% konfidensinterval for forskellen mellem HPR på dag 1 og på dag 28 er ( 2606;2366) (c) Ud fra de i tabellen angivne observationer, kan man konkludere at der ikke er forskel på niveauet af resorptionsparameteren HPR på dag 1 og efter 28 dage, da 0 ligger i 95% konfidensintervallet i (b) Resultatet fremgår også længere nede i SASudskriften, hvor t-testet for hypotesen om, at forskellen har middelværdi 0, har en t-teststørrelse på 011 og en testsandsynlighed på 092, altså langt over 5% Opgave 2 (a) Vi anvender Zar kapitel 231 og tester for uafhængighed mellem inddelingskriterier i 2x3-tabellen H 0 : Ingen sammenhæng mellem omgivelse og dødsårsag Fra SAS-udskriften aflæses teststørrelsen (Zar formel 231) χ 2 = 101652 med 2 frihedsgrader og en testsandsynlighed på 00062 Af SAS-udskriften ses det, at alle de forventede værdier i tabellen er større end 5, så approksimationen må regnes for god Vi forkaster derfor hypotesen, da testsandsynligheden er klart mindre end 5% Havde vi i stedet brugt kvotienttestet i Zar kapitel 237 havde vi fået G=104522 med 2 frihedsgrader og en testsandsynlighed på 00054, der giver samme konklusion som χ 2 -testet Vi må derfor konkludere, at der er forskel på dødsårsagerne, når musene går i henholdsvis almindelige laboratorieomgivelser og i sterile omgivelser De estimerede dødsårsagssandsynligheder fremgår af søjleprocenterne i SAS-udskriften (b) Her skelnes ikke mellem sarkom og lymfom som dødsårsag Hypotesen og modellen er som i (a) Vi anvender altså igen Zar kapitel 231 og tester for uafhængighed mellem inddelingskriterier i den reducerede 2x2-tabel H 0 : Ingen sammenhæng mellem omgivelse og dødsårsag 1

Kvotienttestet (Zar 2310) benyttes (χ 2 -testet kunne også være benyttet) G = 2( f ij ln f ij R i ln R i C j ln C j + n ln n) = 16390 DF = (2 1)(2 1) = 1 Da G < χ 2 005,1 = 3841 godkendes hypotesen (Alle de forventede værdier er igen større end 5) Når man kun skelner mellem kræft/ikke kræft som dødsårsag, har omgivelserne altså ingen indvirkning på fordelingen af dødsårsager Opgave 3 (a) Vi noterer, at data er opdelt efter de tre inddelingskriterier (faktorer) gruppe, mus og tap Der er en ordning mellem mus og gruppe, idet mus giver en finere opdeling end gruppe, der angiver hvilken preimmunisering musene har fået Vi analyserer logaritmen til titer-værdierne ved hjælp af en flerfaktormodel Med det givne design indeholder den mest generelle model, som vi kan stille op, en hovedvirkningen af faktoren mus samt en vekselvirkning mellem faktorerne gruppe og tap Hvis der er en vekselvirkning mellem gruppe og tap i denne model, så ændrer immunresponset sig for en given mus fra tap til tap og ændringen er forskellig afhængigt af hvilken preimmunisering, der er givet For at undersøge om ændringen i immunrespons afhænger af typen af preimmunisering opstiller vi derfor hypotesen: H 0 : Der er ingen vekselvirkning mellem gruppe og tap mod alternativet, at der er en vekselvirkning mellem gruppe og tap Af SAS-udskriften fremgår det, at F-teststørrelsen for H 0 er 116 med (4,32) frihedsgrader, og at test-sandsynligheden er 035 > 005 Ved test på niveau 5% accepterer vi således hypotesen om ingen vekselvirkning mellem gruppe og tap Konklusionen er, at nok kan immunresponset for en mus ændrer sig fra tap til tap (hovedvirkning af tap), men på baggrund af datamaterialet kan vi ikke konkluderer, at denne ændring er anderledes i gruppen der er blevet preimmuniseret med Ovalbumin end i gruppen, der er blevet preimmuniseret med OVA (b) Eftersom nulhypotesen ovenfor accepteres, er vores udgangsmodel at der er en hovedvirkning af mus og en hovedvirkning af tap Dette er den additive model i en to-sidet variansanlyse uden gentagelser Det giver her mening at undersøge, om tap overhovedet betyder noget for immunresponset Vi opstiller hypotesen: H 0 : Der er ingen hovedvirkning af tap mod alternativet, at der er en hovedvirkning af både mus og tap 2

Af SAS-udskriften fremgår det, at F-teststørrelsen for H 0 er 469 med (4,32) frihedsgrader, og at test-sandsynligheden er 00043 < 005 Ved test på niveau 5% forkaster vi således hypotesen om ingen hovedvirkning af tap Konklusionen er, at immunresponset for en mus ændrer sig fra tap til tap (c) En væsentlig grund til at tage logaritmen til titer-værdierne før vi gennemfører analysen kan være at det homogeniserer variansen En anden, at fordelingen af logaritmen til titer-værdierne kan beskrives bedre med normalfordelingen end fordelingen af titer-værdierne selv Forudsætningerne er således at logaritmen til titer-værdierne er uafhængige og normalfordelte med samme varians, og at middelværdien (som udgangspunkt) kan beskrives ved en vekselvirkning af tap og gruppe samt hovedvirkningen af mus Det bemærkes især, at det er en forudsætning, at der ikke er en vekselvirkning mellem tap og mus Idet der ikke er replikationer indenfor cellerne kan vi ikke med det pågældende datamateriale undersøge hypotesen om ingen vekselvirkning mellem tap og mus Ekstra observation: Der også er en yderst signifikant effekt af mus (p-værdi < 00001, jf SAS-udskrift) Såfremt forudsætningerne er opfyldte kan vi alså konkluderer, at der både er en ændring i immunrespons fra tap til tap, og at immunresponset ændrer sig fra mus til mus Opgave 4 (a) Estimater for hældningen såvel som interceptet beregnes for de to datasæt på følgende måde, jf ZAR formel (174) og (177) Standard Mus b = Σxy Σx 2 = 1469 1812 = 08107 b = Σxy Σx 2 = 2982 3984 = 07485 a = Ȳ b X = 0496 + 08107 2602 = 2605 a = Ȳ b X = 08167 + 07485 2892 = 2981 Dvs den estimerede regressionslinje for standardopløsningen er: Y = 2605 08107X + ɛ og den estimerede regressionslinje for musen er: Y = 2981 07485X + ɛ (b) For at undersøge om hældningen i de to regressionslinjer kan antages at være ens, så opstiller vi nulhypotesen H 0 : standard = mus, 3

hvor standard og mus betegner hældningen for standardopløsningen hhv for serum fra musen Hypotesen testes ved hjælp af t-teststørrelsen som angivet i formel (181) Først beregnes s b1 b 2, som er givet ved formel (182), til 0010 s b1 b 2 = 1812 + 0010 3984 = 00896 idet det poolede estimat for variansen er angivet til 0010 Dernæst beregnes teststørrelsen til 08107 + 07485 t = = 0694 00896 Teststørrelsen sammenholdes med den kritiske værdi for et tosidet t-test på niveau 5% med 10+6 4 = 12 frihedsgrader; t 005(2),12 = 2179 (fundet ved opslag i tabel) Eftersom t = 0694 < 2179 accepterer vi hypotesen om ens hældning Estimatet for den fælles hældning, der er givet ved formel (179), beregnes til b c = 1469 2982 1812 + 3984 = 07679 (c) Hvis de to regressionslinjer har sammen hældning,, så er de parallelle, og det giver samme forskel af inverst predikterede log(c)-værdier uafhængigt af OD-værdien I formler kan det udtrykkes på følgende måde Hvis vi laver invers prediktion af log(c) for en given OD-værdi, så får vi de to prediktioner Forskellen er OD α mus OD α standard og OD α standard som vi kan se ikke afhænger af OD-værdien OD α mus = α standard α mus, (d) Under forudsætning om, at den samme koncentration af ubiquitin-antistof i to opløsninger giver sammen OD-måling i middel, ja så vil to fortyndinger, c standard og c mus, der resulterer i samme koncentration af ubiquitin-antistof have samme ODværdi i middel Med andre ord, hvis vi laver invers prediktion af log(c) for en given OD-værdi, så får vi log(c standard ) hhv log(c mus ) således at koncentrationerne i de to fortyndingerne er ens; K standard = K mus c standard c mus Vi ser, at logaritmen til forholdet mellem koncentrationerne af Ubiquitin-antistof i de oprindelige opløsninger er ( ) ( ) Kmus cmus log = log K standard c standard = log(c mus ) log(c standard ) = α standard α mus 4

Med andre ord, så er forholdet mellem koncentrationerne 10 (α standard α mus)/ Vi bemærker, at forholdet kan beregnes uden at vælge en konkret OD-værdi til den inverse prediktion, da forholdet ikke afhænger af OD-værdien Benytter vi de tidligere estimerede værdier af interceptparametre og den fælles hældningsparameter bliver estimatet for koncentrationsforholdet 10 (2605 2981)/ 07679 = 10 04896 = 309 Alternativt kan man argumentere for, at man skal reestimere interceptparametrene ved brug af det fælles hældningsestimat Estimaterne for de to interceptparametre, under antagelsen om ens hældning, beregnes til a standard = Ȳ b c X = 0496 + 07679 2602 = 2494 og a mus = Ȳ b c X = 08167 + 07679 2892 = 3037 Estimatet for koncentrationsforholdet bliver nu 10 (2494 3037)/ 07679 = 10 07071 = 509 Med de reestimerede interceptparametre estimerer vi således, at der er ca 5 gange så stor en koncentration af Ubiquitin-antistof i serummet fra musen som i standardopløsningen, mens vi uden reestimation estimerer, at der er ca 3 gange så stor en koncentration Begge estimater er tilladelige 5