PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Transkript

1 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie supplement og blodtryk hos gravide kvinder Test af ens middelværdier i to stikprøver fra en normalfordeling Test af ens varianser i to stikprøver fra en normalfordeling Modelkontrol Formulering af konklusioner Eksempel 7.2: Fødselsvægt af børn født af storrygere og ikke-rygere Ikke-parametriske metoder Styrke og beregning af stikprøvestørrelse PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-1

2 Eksempel: Fiskeolie supplement og blodtryk hos gravide kvinder Videnskabeligt spørgsmål: Har et supplement af fiskeolie en indflydelse på det diastoliske blodtryk hos gravide kvinder? Design: 430 gravide kvinder blev tilfældigt tildelt en af to behandlinger, Kontrol og Fiskeolie (del af et studium udført af Sjudur Olsen). Data: Det diastoliske blodtryk i uge 37 minus det diastoliske blodtryk i uge 30. Kontrol (Gruppe 1, n 1 = 213, her er de første 20 observationer): Fiskeolie (Gruppe 2, n 2 = 217, her er de første 20 observationer): PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-2

3 Fiskeolie supplement og blodtryk hos gravide kvinder: Formulering af problemet Reformulering af spørgsmålet: Er den forventede forskel i diastolisk blodtryk den samme i de to populationer af gravide kvinder? Stikprøvestørrelser, gennemsnit, varianser, standardafvigelser og medianer er Gruppe Behandling n i x i s 2 i s i Median 1 Kontrol Fiskeolie Fiskeolie Kontrol Gruppe Forskel i diastolisk blodtryk PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-3

4 Fiskeolie supplement og blodtryk hos gravide kvinder: Statistisk model Statistisk model: Observationerne i hver gruppe opfattes som en tilfældig stikprøve fra en normalfordelt population. x 1i N(µ 1, σ 2 1) x 2i N(µ 2, σ 2 2) i = 1, 2,...,n 1 eller n 2 uafhængige Tæthed Tæthed Kontrol Fiskeolie PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-4

5 Test af ens middelværdier i to stikprøver fra en normalfordeling Spørgsmål af interesse: Er den forventede forskel i diastolisk blodtryk (db37 - db30) den samme i de to populationer af gravide kvinder? Formulering af spørgsmålet i form af en hypotese om parameterne i den statistiske model: H 0 : µ 1 = µ 2 I det følgende antager vi at σ1 2 = σ2 2 = σ 2. Et estimat for den fælles varians (i de to stikprøver) er ˆσ 2 = s 2 = (n 1 1) s (n 2 1) s 2 2 n 1 + n 2 2 (213 1) (217 1) = Den estimerede fælles standardafvigelse er = s = = 7.96 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-5

6 Fiskeolie supplement og blodtryk hos gravide kvinder: Test af ens middelværdier De forventede forskelle i diastolisk blodtryk i de to grupper bliver estimeret ved ˆµ 1 = x 1 = 1.90 ˆµ 2 = x 2 = 2.19 Den estimerede forskel mellem grupperne er ˆδ = ˆµ 1 ˆµ 2 = x 1 x 2 = 0.29 Beregn t-teststørrelsen t = ˆδ s.e.(ˆδ) = x 1 x 2 = 1 s n n = 0.38 Hvis hypotesen er sand vil t følge en t-fordeling med n 1 + n 2 2 = = 428 frihedsgrader. p-værdien (sandsynligheden for at observere noget mindst lige så ekstremt) er givet ved p = P(t 0.38) + P(t 0.38) = % PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-6

7 Fiskeolie supplement og blodtryk hos gravide kvinder: p-værdi og konklusioner Illustration af hvordan man bestemmer p-værdien: t(428) tæthed observeret værdi Konklusion: Tilfældig variation vil give noget mindst lige så ekstremt, som vi faktisk har observeret, i 7 ud af 10 tilsvarende studier. Konklusionen er derfor at der ikke er meget evidens mod formodningen om at den forventede forskel i diastolisk blodtryk er den samme i de to grupper af gravide kvinder. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-7

8 Konfidensinterval for forskellen mellem de to grupper Et 95%-konfidensinterval for forskellen µ 1 µ 2 er givet ved (ˆδ ± t s.e.(ˆδ)): ( x 1 x 2 ) t s 1 n n 2 < µ 1 µ 2 < ( x 1 x 2 ) + t s 1 n n 2 hvor t er 97.5-percentilen i en t-fordeling med n 1 + n 2 2 frihedsgrader. Her får vi eller 1.80 < µ 1 µ 2 < < µ 1 µ 2 < Læg mærke til at 95%-konfidensintervallet for µ 1 µ 2 indeholder værdien 0 i overensstemmelse med det faktum at vi ikke kunne forkaste hypotesen om at µ 1 og µ 2 er ens. Konklusion: Data er i overensstemmelse med en forskel mellem de to grupper på mellem 1.22 i favør af kontrol-gruppen og 1.80 i favør af fiskeolie-gruppen. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-8

9 Test af ens varianser i to stikprøver fra en normalfordeling Da vi testede ens middelværdier antog vi at varianserne var ens (σ 2 1 = σ 2 2 ). Vi kan teste rimeligheden af denne antagelse ved at betragte hypotesen H 0 : σ 2 1 = σ 2 2 Beregn F -teststørrelsen F = Største variansestimat Mindste variansestimat Under hypotesen om ens varianser kan man vise at F har en F -fordeling med (n 1 1, n 2 1) frihedsgrader hvis s 2 1 > s 2 2 (og ellers (n 2 1, n 1 1) frihedsgrader). Her har vi s 2 1 = < = s 2 2, således at F = s2 2 s 2 1 = = F(216, 212) PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-9

10 Fiskeolie supplement og blodtryk hos gravide kvinder: Test af ens varianser p-værdien kan bestemmes ud fra F -fordelingen p = P(F 1 ) + P(F ) = 2 P(F ) = % F(216, 212) tæthed observeret værdi observeret værdi Konklusion: Vi accepterer (kan ikke forkaste) hypotesen om ens variation i de to populationer af gravide kvinder. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-10

11 Test af ens middelværdier: Hvad hvis vi ikke havde haft ens varianser? Antag at vi ikke havde accepteret at σ 2 1 = σ 2 2. Nogle mulige fremgangsmåder: 1. Prøv at stabilisere variansen ved at betragte en passende transformation af data (for eksempel logaritmen til forskellen i diastolisk blodtryk). 2. Benyt et approksimativt t-test: Beregn t approks = x 1 x 2 s 2 1 n 1 + s2 2 n 2 Hvis middelværdierne i populationerne er ens, så er t approks approksimativt t-fordelt med f frihedsgrader, hvor f = [ c 2 n (1 c)2 n Brug et ikke-parametrisk test (se senere i dag). ] 1, c = s 2 1/n 1 s 2 1 /n 1 + s 2 2 /n 2 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-11

12 Test af ens middelværdier: Approksimativt t-test I vores eksempel får vi t approks = = og således at f = c = 56.68/ / /217 = [ ( ) ] 1 = p-værdien bliver p = 2 P(t ) = % i overensstemmelse med det faktum at variationerne i de to grupper er ganske lig hinanden. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-12

13 Modelkontrol: Vurdering af hvorvidt antagelserne bag den statistiske model er rimelige Vi har antaget følgende: 1. De to grupper af observationer er uafhængige 2. I hver gruppe er observationerne uafhængige og har samme middelværdi og samme varians 3. Observationerne svarende til begge populationer er normalfordelte Vurdering af rimeligheden af antagelserne: 1. De to grupper af observationer er uafhængige? Overvej altid om vigtig information er udeladt af analysen. 2. I hver gruppe: Uafhængige observationer fra den samme population? 3. Populationerne kan beskrives ved normalfordelinger? Dette kan vurderes ud fra Q-Q plots PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-13

14 Fiskeolie supplement og blodtryk hos gravide kvinder: Q-Q plots Q-Q plot for hver behandlingsgruppe: Kontrol Fiskeolie Forskel i diastolisk blodtryk Forskel i diastolisk blodtryk Percentiler fra normalfordelingen Percentiler fra normalfordelingen Ingen grund til at tvivle på tilstrækkeligheden af modellen, til beskrivelse af data, ud fra disse tegninger. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-14

15 Fiskeolie supplement og blodtryk hos gravide kvinder: En stikprøve Vi har accepteret at der ikke er nogen forskel mellem de to populationer af gravide kvinder (ingen signifikant effekt af behandlingen med fiskeolie). Dette betyder at vi kan beskrive data som en stikprøve fra en normalfordeling (med middelværdi µ og varians σ 2 ) x 1 1,...,x 1 213, x 2 1,...,x N(µ, σ 2 ), uafhængige Dette er kun relevant hvis man er interesseret i niveauet (ændringen i det diastoliske blodtryk fra uge 30 til 37), hvilket ikke var det, som man oprindeligt ville undersøge. Den overordnede middelværdi µ bliver estimeret ved ˆµ = x = x 1 + x 2 2 = = 2.05 Et 95%-konfidensinterval for µ er givet ved 2.05 t < µ < t , ( eller 1.29 < µ < 2.80) PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-15

16 Fiskeolie supplement og blodtryk hos gravide kvinder: Konklusioner (1) Den statistiske analyse og konklusionerne kunne præsenteres på følgende måde: Resultaterne af den statistiske analyse: Data blev analyseret som to stikprøver fra en normalfordeling. Hypotesen om samme forskel i diastolisk blodtryk hos gravide kvinder, som får et supplement af fiskeolie til deres diæt, som hos gravide kvinder, der får en kontroldiæt, kunne ikke forkastes (p = 0.70). Et estimat for forskellen mellem de to grupper er, sammen med et 95%-konfidensinterval, givet ved 0.29 ( 1.80, 1.22). Et overordnet estimat for den forventede forskel i diastolisk blodtryk (uge 37 - uge 30) er, med et 95%-konfidensinterval, givet ved 2.05 (1.29, 2.80). Konklusioner: 1. Vi konkluderer at der er meget lidt evidens i denne undersøgelse mod hypotesen om at et supplement med fiskeolie til diæten ingen effekt har på forskellen i diastolisk blodtryk hos gravide kvinder mellem uge 37 og uge 30. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-16

17 Fiskeolie supplement og blodtryk hos gravide kvinder: Konklusioner (2) Konklusioner: 2. Et 95%-konfidensinterval for forskellen mellem de to forventede værdier viser os at data er i overensstemmelse med alt fra en forskel som er 1.22 større i kontrol-gruppen til en forskel som er 1.80 større i fiskeolie-gruppen %-konfidensintervallet for middelværdien (baseret på begge grupper) varierer fra en forøgelse på 1.29 til en på 2.80 for forskellen i diastolisk blodtryk for gravide kvinder mellem uge 30 og uge 37. Det følger at der er en rimelig klar indikation af en forøgelse i det diastoliske blodtryk fra uge 30 til uge 37. Hvorvidt denne (lille men klare) forøgelse er af medicinsk relevans skal vurderes af medicinske eksperter. 4. Denne undersøgelse bidrager med meget begrænset information om det videnskabelige spørgsmål (sammenhængen mellem fiskeolie og diastolisk blodtryk hos gravide kvinder). PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-17

18 Eksempel 7.2: Fødselsvægt af børn født af storrygere og ikke-rygere Spørgsmål: Har moderens rygevaner nogen indflydelse på barnets fødselsvægt? Design: Fødselsvægten (kg) af børn født af 14 storrygere og af 15 ikke-rygere blev opgjort. Storrygere Ikke-rygere Reformulering af spørgsmålet: Er den forventede fødselsvægt af børn født af storrygere den samme som for børn født af ikke-rygere? PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-18

19 Fødselsvægt og rygning: Inspektion af data Stikprøvestørrelser, gennemsnit, varianser og standardafvigelser er Gruppe Behandling n i x i s 2 i s i 1 Storrygere Ikke-rygere Ikke ryger Storryger Fødselsvægt (kg) Gruppe PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-19

20 Fødselsvægt og rygning: Test af ens middelværdier og ens varianser Varians (H 0 : σ 2 1 = σ 2 2 ): F = s2 1 s 2 2 = = 1.67 F(13, 14) hvilket giver en p-værdi på 0.35 og vi kan ikke forkaste hypotesen om at variationen i de to grupper er den samme. Det fælles variansestimat er: s 2 = (14 1) (15 1) = , (s = ) Middelværdi (H 0 : µ 1 = µ 2 ): t = ˆµ 1 ˆµ 2 s.e.(ˆµ 1 ˆµ 2 ) = = 2.95 t(27) hvilket giver en p-værdi på Vi konkluderer at der er klar evidens mod hypotesen om at fødselsvægten er den samme i de to grupper. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-20

21 Fødselsvægt og rygning: Konfidensinterval for forskellen Et 95%-konfidensinterval for forskellen µ 1 µ 2 er (ˆµ 1 ˆµ 2 ± t s.e.(ˆµ 1 ˆµ 2 )): ( ) ( ) eller 0.77 < µ 1 µ 2 < < µ 1 µ 2 < Vi konkluderer, med en sikkerhed på 95%, at storrygning resulterer i en fødselsvægt som er mellem 0.14 kg og 0.77 kg mindre end hvad man ser blandt børn født af ikke-rygere. Gyldigheden af denne konklusion hænger på antagelsen om at den eneste substantielle forskel mellem de to grupper er deres rygevaner (samme alder, sundhedstilstand og så videre). Hvorvidt en forskel så lille som 0.14 kg er af medicinsk relevans skal vurderes af medicinske eksperter i den sammenhæng som førte til undersøgelsen. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-21

22 Fødselsvægt og rygning: Modelkontrol Storrygere: Tæthed Fødselsvægt (kg) Ikke-rygere: Fødselsvægt (kg) Percentiler fra normalfordelingen Tæthed Fødselsvægt (kg) Fødselsvægt (kg) Percentiler fra normalfordelingen PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-22

23 Ikke-parametriske metoder: Wilcoxon rank sum test Indtil videre har vi kun betragtet statistiske analyser baseret på en parametrisk statistisk model (normalfordelingen beskrevet ved en middelværdi- og en variansparameter). Er der nogle alternativer hvis nu data ikke beskrives tilstrækkelig godt af normalfordelingen og ingen transformation af data hjælper (tænk på gruppen af storrygere i Eksempel 7.2)? Antag at vi har observationer svarende til to grupper: Gruppe 1 : Gruppe 2 : x 1, x 2,...,x n1 y 1, y 2,...,y n2 Wilcoxon rank sum test er designet til at teste hvorvidt fordelingerne af observationerne i de to grupper er de samme eller de er rykket i forhold til hinanden. Teststørrelse: T = summen af rangene i gruppen med det mindste antal observationer PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-23

24 Ikke-parametriske metoder: Range Betragt dette lille konstruerede eksempel: & 2 Rang Rang 2 Rang Normalt lader vi en statistisk programpakke (for eksempel Stata) udregne teststørrelser baseret på range. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-24

25 Fødselsvægt og rygning: Wilcoxon rank sum test I dette eksempel får vi (gruppen med færrest observationer er storrygere): T = For store værdier af n 1 and n 2 (normalt siger vi n 1 + n 2 30, hvilket næsten er tilfældet her) har vi under hypotesen om samme position af fordelingerne, at der approksimativt gælder Z = T E T VarT N(0, 1) Her får vi Z = = svarende til en p-værdi på p = 2 P(Z < 2.597) = = Konklusionerne er uændrede ved en analyse af data ved hjælp af ikke-parametriske metoder. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-25

26 Generelle kommentarer til Wilcoxon rank sum test Der er en række forhold man skal være opmærksom på: Læg mærke til at en analyse baseret på ikke-parametriske metoder ikke er uden antagelser. Vi antager stadigvæk at observationerne er uafhængige og har den samme fordeling (indenfor grupperne). Testet er konstrueret til at opfange en forskydning i fordelingerne i de to grupper og ikke, for eksempel, forskellig variation. Focus er primært på test og ikke så meget på at kvantificere eventuelle forskelle, når det drejer sig om ikke-parametriske metoder. De fleste statistikprogrammer er ikke i stand til at give et estimat for forskydningen af to fordelinger i forhold til hinanden. Et ækvivalent test (som giver den samme p-værdi) er det såkaldte Mann-Whitney test. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-26

27 Styrke og beregning af stikprøvestørrelse Udsagn af denne type støder man ofte på i ansøgninger: Med en stikprøvestørrelse på 85 vil vi være i stand til at finde en forskel på 1 mellem behandlingsgruppen og kontrolgruppen baseret på en antaget standardafvigelse på 2, et signifikansniveau på 0.05 og en styrke på 0.9. Hvad mener man med sådan et udsagn og hvordan når man frem til sådan en konklusion? Statistisk model: To stikprøver fra normalfordelinger (med samme varians). x 1i N(µ 1, σ 2 ) x 2i N(µ 2, σ 2 ) i = 1, 2,...,n uafhængige Vi er interesseret i hypotesen om ingen forskel mellem de to grupper H 0 : µ 1 = µ 2 (eller µ 1 µ 2 = 0) PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-27

28 Signifikansniveau og styrke Husk at signifikansniveauet (typisk betegnet α) er sandsynligheden for at forkaste en sand hypotese α = P(forkaste H 0 : µ 1 µ 2 = 0 når der faktisk gælder at µ 1 µ 2 er lig 0) hvilket også kaldes risikoen for at lave en Type 1 fejl, og som typisk sættes til Styrken af et statistisk test defineres som sandsynligheden for at forkaste en falsk hypotese styrke = P(forkaste H 0 : µ 1 µ 2 = 0 når der faktisk gælder at µ 1 µ 2 er lig δ) = 1 β hvor β refereres til som risikoen for at lave en Type 2 fejl (acceptere en falsk hypotese). Læg mærke til at Styrken afhænger af hvad forskellen faktisk er (δ) Typiske værdier af styrken er 0.8 og 0.9 (hvilket medfører at β typisk er 0.1 eller 0.2) PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-28

29 Signifikansniveau og styrke: Analogi til et diagnostisk test Det er muligt at få en forståelse af forholdet mellem signifikansniveau og styrke ved at tænke på sensitivitet og specificitet af et diagnostisk test. Se Tabel 35.3 i Kirkwood & Sterne (2003). Virkeligheden Test Sand hypotese Falsk hypotese Forkast α 1 β = styrke Accepter 1 α β Hvis man laver analogien til et diagnostisk test, så sensitivitet = 1 α specificitet = styrke PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-29

30 Beregning af styrke Betragt teststørrelsen t = x 1 x 2 s 2 n Vi forkaster hypotesen når t-teststørrelsen enten er meget lille eller meget stor t < t eller t > t hvor t er 97.5-percentilen i en t-fordeling med 2n 2 frihedsgrader. Styrken er derfor styrke = P(t < t eller t > t når µ 1 µ 2 er lig med δ) Man har brug for en et statistikprogram for at beregne denne sandsynlighed. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-30

31 Styrkekurver (1) Styrkekurver (α = 0.05 og σ = 2): Styrke Stikprøvestørrelse i hver gruppe δ = 0.75 δ = 1.00 δ = 1.25 δ = 1.50 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-31

32 Styrkekurver (2) Styrkekurver (α = 0.05 og σ = 3): Styrke δ = 0.75 δ = 1.00 δ = 1.25 δ = Stikprøvestørrelse i hver gruppe PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-32

33 Beregning af stikprøvestørrelse Størrelserne i den ligning, som styrken beregnes ud fra, kan flyttes rundt på således at man får et bud på hvilken stikprøvestørrelse der skal til for at opnå en vis styrke. Vi har fem størrelser i spil her: δ = µ 1 µ 2 Behandlingseffekten som vurderes vigtig at idetificere σ = Standardafvigelsen i hver gruppe α = Signifikansniveauet (risikoen for en type 1 fejl) β = En minus styrken (risikoen for en type 2 fejl) n = Antallet af forsøgsenheder i hver gruppe Ved at angive værdier for fire af disse kan et bud på den femte bestemmes. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-33

34 En simpel beregning af stikprøvestørrelsen Hvis n ikke er meget lille kan man benytte følgende simple formel: n = (z 1 α/2 + z 1 β ) 2 2 ( σ δ ) 2 hvor z 1 α/2 og z 1 β er henholdsvis (1 α/2) og (1 β)-percentilerne i standard normalfordelingen. For eksempel, for α = 0.05, har vi at (z 1 α/2 + z 1 β ) 2 er lig med Styrke PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-34

35 Et eksempel på en simpel beregning af stikprøvestørrelsen Antag at vi vil undersøge en ny behandling. Fra tidligere studier ved vi at standardafvigelsen er omkring 2, og vi vil gerne være i stand til at finde en eventuel forskel på 1 på et 5% niveau med en styrke på 90%. Med andre ord har vi at δ = 1 σ = 2 α = 0.05 β = 0.10 Vi får dermed følgende stikprøvestørrelse (i hver af de to behandlingsgrupper): En eksakt beregning giver n = n = = 84 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-35

36 Kommentarer til beregningen af stikprøvestørrelser Der er en række forhold man skal være opmærksom på i denne forbindelse: Beregning af stikprøvestørrelser kan baseres på andre kriterier end det at opnå en bestemt styrke. Undertiden, for eksempel, vælges n således at et konfidensinterval for en behandlingseffekt ikke overstiger en vis bredde. Parameteren δ svarer til det som vi gerne vil kunne finde. Den refereres ofte til som den mindste relevante forskel. Læg mærke til at man skal have en ide om variationen indenfor behandlingsgrupperne (σ). Sådan et estimat kan for eksempel komme fra tidligere studier eller fra litteraturen. Lav ALDRIG post-hoc styrkeberegninger. Når man har opgjort en undersøgelse, så er et konfidensinterval for effektparameteren den mest naturlige måde at udtrykke præcisionen (eller den manglende præcision) af en undersøgelse på. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-36