Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder angiver forskellen mellem niveauet for resorptionsparameteren HPR på dag 1 og efter 28 dage Her udføres et parret t-test (Zar kapitel 91 og 92) for at undersøge om forskellen har middelværdi 0 Vores hypotese er altså H 0 : µ = 0 (a) Det antages, at de 10 observationer af variablen forskel er uafhængige og identisk normalfordelte (b) Af SAS-udskriften aflæses, at et 95% konfidensinterval for forskellen mellem HPR på dag 1 og på dag 28 er ( 2606;2366) (c) Ud fra de i tabellen angivne observationer, kan man konkludere at der ikke er forskel på niveauet af resorptionsparameteren HPR på dag 1 og efter 28 dage, da 0 ligger i 95% konfidensintervallet i (b) Resultatet fremgår også længere nede i SASudskriften, hvor t-testet for hypotesen om, at forskellen har middelværdi 0, har en t-teststørrelse på 011 og en testsandsynlighed på 092, altså langt over 5% Opgave 2 (a) Vi anvender Zar kapitel 231 og tester for uafhængighed mellem inddelingskriterier i 2x3-tabellen H 0 : Ingen sammenhæng mellem omgivelse og dødsårsag Fra SAS-udskriften aflæses teststørrelsen (Zar formel 231) χ 2 = 101652 med 2 frihedsgrader og en testsandsynlighed på 00062 Af SAS-udskriften ses det, at alle de forventede værdier i tabellen er større end 5, så approksimationen må regnes for god Vi forkaster derfor hypotesen, da testsandsynligheden er klart mindre end 5% Havde vi i stedet brugt kvotienttestet i Zar kapitel 237 havde vi fået G=104522 med 2 frihedsgrader og en testsandsynlighed på 00054, der giver samme konklusion som χ 2 -testet Vi må derfor konkludere, at der er forskel på dødsårsagerne, når musene går i henholdsvis almindelige laboratorieomgivelser og i sterile omgivelser De estimerede dødsårsagssandsynligheder fremgår af søjleprocenterne i SAS-udskriften (b) Her skelnes ikke mellem sarkom og lymfom som dødsårsag Hypotesen og modellen er som i (a) Vi anvender altså igen Zar kapitel 231 og tester for uafhængighed mellem inddelingskriterier i den reducerede 2x2-tabel H 0 : Ingen sammenhæng mellem omgivelse og dødsårsag 1
Kvotienttestet (Zar 2310) benyttes (χ 2 -testet kunne også være benyttet) G = 2( f ij ln f ij R i ln R i C j ln C j + n ln n) = 16390 DF = (2 1)(2 1) = 1 Da G < χ 2 005,1 = 3841 godkendes hypotesen (Alle de forventede værdier er igen større end 5) Når man kun skelner mellem kræft/ikke kræft som dødsårsag, har omgivelserne altså ingen indvirkning på fordelingen af dødsårsager Opgave 3 (a) Vi noterer, at data er opdelt efter de tre inddelingskriterier (faktorer) gruppe, mus og tap Der er en ordning mellem mus og gruppe, idet mus giver en finere opdeling end gruppe, der angiver hvilken preimmunisering musene har fået Vi analyserer logaritmen til titer-værdierne ved hjælp af en flerfaktormodel Med det givne design indeholder den mest generelle model, som vi kan stille op, en hovedvirkningen af faktoren mus samt en vekselvirkning mellem faktorerne gruppe og tap Hvis der er en vekselvirkning mellem gruppe og tap i denne model, så ændrer immunresponset sig for en given mus fra tap til tap og ændringen er forskellig afhængigt af hvilken preimmunisering, der er givet For at undersøge om ændringen i immunrespons afhænger af typen af preimmunisering opstiller vi derfor hypotesen: H 0 : Der er ingen vekselvirkning mellem gruppe og tap mod alternativet, at der er en vekselvirkning mellem gruppe og tap Af SAS-udskriften fremgår det, at F-teststørrelsen for H 0 er 116 med (4,32) frihedsgrader, og at test-sandsynligheden er 035 > 005 Ved test på niveau 5% accepterer vi således hypotesen om ingen vekselvirkning mellem gruppe og tap Konklusionen er, at nok kan immunresponset for en mus ændrer sig fra tap til tap (hovedvirkning af tap), men på baggrund af datamaterialet kan vi ikke konkluderer, at denne ændring er anderledes i gruppen der er blevet preimmuniseret med Ovalbumin end i gruppen, der er blevet preimmuniseret med OVA (b) Eftersom nulhypotesen ovenfor accepteres, er vores udgangsmodel at der er en hovedvirkning af mus og en hovedvirkning af tap Dette er den additive model i en to-sidet variansanlyse uden gentagelser Det giver her mening at undersøge, om tap overhovedet betyder noget for immunresponset Vi opstiller hypotesen: H 0 : Der er ingen hovedvirkning af tap mod alternativet, at der er en hovedvirkning af både mus og tap 2
Af SAS-udskriften fremgår det, at F-teststørrelsen for H 0 er 469 med (4,32) frihedsgrader, og at test-sandsynligheden er 00043 < 005 Ved test på niveau 5% forkaster vi således hypotesen om ingen hovedvirkning af tap Konklusionen er, at immunresponset for en mus ændrer sig fra tap til tap (c) En væsentlig grund til at tage logaritmen til titer-værdierne før vi gennemfører analysen kan være at det homogeniserer variansen En anden, at fordelingen af logaritmen til titer-værdierne kan beskrives bedre med normalfordelingen end fordelingen af titer-værdierne selv Forudsætningerne er således at logaritmen til titer-værdierne er uafhængige og normalfordelte med samme varians, og at middelværdien (som udgangspunkt) kan beskrives ved en vekselvirkning af tap og gruppe samt hovedvirkningen af mus Det bemærkes især, at det er en forudsætning, at der ikke er en vekselvirkning mellem tap og mus Idet der ikke er replikationer indenfor cellerne kan vi ikke med det pågældende datamateriale undersøge hypotesen om ingen vekselvirkning mellem tap og mus Ekstra observation: Der også er en yderst signifikant effekt af mus (p-værdi < 00001, jf SAS-udskrift) Såfremt forudsætningerne er opfyldte kan vi alså konkluderer, at der både er en ændring i immunrespons fra tap til tap, og at immunresponset ændrer sig fra mus til mus Opgave 4 (a) Estimater for hældningen såvel som interceptet beregnes for de to datasæt på følgende måde, jf ZAR formel (174) og (177) Standard Mus b = Σxy Σx 2 = 1469 1812 = 08107 b = Σxy Σx 2 = 2982 3984 = 07485 a = Ȳ b X = 0496 + 08107 2602 = 2605 a = Ȳ b X = 08167 + 07485 2892 = 2981 Dvs den estimerede regressionslinje for standardopløsningen er: Y = 2605 08107X + ɛ og den estimerede regressionslinje for musen er: Y = 2981 07485X + ɛ (b) For at undersøge om hældningen i de to regressionslinjer kan antages at være ens, så opstiller vi nulhypotesen H 0 : standard = mus, 3
hvor standard og mus betegner hældningen for standardopløsningen hhv for serum fra musen Hypotesen testes ved hjælp af t-teststørrelsen som angivet i formel (181) Først beregnes s b1 b 2, som er givet ved formel (182), til 0010 s b1 b 2 = 1812 + 0010 3984 = 00896 idet det poolede estimat for variansen er angivet til 0010 Dernæst beregnes teststørrelsen til 08107 + 07485 t = = 0694 00896 Teststørrelsen sammenholdes med den kritiske værdi for et tosidet t-test på niveau 5% med 10+6 4 = 12 frihedsgrader; t 005(2),12 = 2179 (fundet ved opslag i tabel) Eftersom t = 0694 < 2179 accepterer vi hypotesen om ens hældning Estimatet for den fælles hældning, der er givet ved formel (179), beregnes til b c = 1469 2982 1812 + 3984 = 07679 (c) Hvis de to regressionslinjer har sammen hældning,, så er de parallelle, og det giver samme forskel af inverst predikterede log(c)-værdier uafhængigt af OD-værdien I formler kan det udtrykkes på følgende måde Hvis vi laver invers prediktion af log(c) for en given OD-værdi, så får vi de to prediktioner Forskellen er OD α mus OD α standard og OD α standard som vi kan se ikke afhænger af OD-værdien OD α mus = α standard α mus, (d) Under forudsætning om, at den samme koncentration af ubiquitin-antistof i to opløsninger giver sammen OD-måling i middel, ja så vil to fortyndinger, c standard og c mus, der resulterer i samme koncentration af ubiquitin-antistof have samme ODværdi i middel Med andre ord, hvis vi laver invers prediktion af log(c) for en given OD-værdi, så får vi log(c standard ) hhv log(c mus ) således at koncentrationerne i de to fortyndingerne er ens; K standard = K mus c standard c mus Vi ser, at logaritmen til forholdet mellem koncentrationerne af Ubiquitin-antistof i de oprindelige opløsninger er ( ) ( ) Kmus cmus log = log K standard c standard = log(c mus ) log(c standard ) = α standard α mus 4
Med andre ord, så er forholdet mellem koncentrationerne 10 (α standard α mus)/ Vi bemærker, at forholdet kan beregnes uden at vælge en konkret OD-værdi til den inverse prediktion, da forholdet ikke afhænger af OD-værdien Benytter vi de tidligere estimerede værdier af interceptparametre og den fælles hældningsparameter bliver estimatet for koncentrationsforholdet 10 (2605 2981)/ 07679 = 10 04896 = 309 Alternativt kan man argumentere for, at man skal reestimere interceptparametrene ved brug af det fælles hældningsestimat Estimaterne for de to interceptparametre, under antagelsen om ens hældning, beregnes til a standard = Ȳ b c X = 0496 + 07679 2602 = 2494 og a mus = Ȳ b c X = 08167 + 07679 2892 = 3037 Estimatet for koncentrationsforholdet bliver nu 10 (2494 3037)/ 07679 = 10 07071 = 509 Med de reestimerede interceptparametre estimerer vi således, at der er ca 5 gange så stor en koncentration af Ubiquitin-antistof i serummet fra musen som i standardopløsningen, mens vi uden reestimation estimerer, at der er ca 3 gange så stor en koncentration Begge estimater er tilladelige 5