3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve Praktiske bemærkninger Eksempel: Sammenhæng mellem moderens alder og fødselsvægt Deskriptive metoder: prik-diagram, histogram Statistisk model og parametre (normalfordelingen) Estimation, hypoteser, test og konfidensintervaller Modelkontrol Formulering af konklusioner Videnskabeligt spørgsmål: Har moderens alder nogen indflydelse på fødselsvægten? Problem: Hvordan kan vi tilrettelægge et studium så vi kan belyse dette videnskabelige spørgsmål? Man ved fra andre studier at den gennemsnitlige fødselsvægt af alle danske børn født til tiden er 3.600 kg. En mulig løsning: Betragt populationen af børn født til tiden af 40 år gamle danske kvinder. Vi kan, for eksempel, sammenligne fødselsvægten af disse børn med fødselsvægten af alle danske børn født til tiden (3.600 kg). Vi kan reformulere det oprindelige spørgsmål: Afviger den gennemsnitlige fødselsvægt af børn født af 40 år gamle kvinder fra det overordnede gennemsnit på 3.600 kg? PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-1 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-2 Moderens alder og fødselsvægt: Data og deskriptive metoder Moderens alder og fødselsvægt: Data og deskriptive metoder (2) Det er naturligvis ikke ligetil at registrere fødselsvægten af ALLE disse børn, men vi er muligvis i stand til at udtage en stikprøve af disse. Antag at vi måler fødselsvægten (kg) for 10 sådanne børn. Data er 3.480 4.320 3.980 2.680 3.620 3.150 2.560 3.220 3.950 3.380 Data er taget fra en stor database som indeholder informationer om alle fødsler på Skejby Hospital, Århus, i perioden 1992 1994. En måde at sammenligne disse observerede fødselsvægte med den overordnede gennemsnitlige fødselsvægt på 3.600 kg er at sammenligne gennemsnittet af data med det overordnede gennemsnit. En illustration er vist i nedenstående tegning hvor indikerer det overordnede gennemsnit 3.600 kg og den gennemsnitlige fødselsvægt 3.434 kg i stikprøven. Prik-diagram (se filen dag1.do): Prik-diagram: 2.5 3.0 3.5 4.0 2.5 3.0 3.5 4.0 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-3 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-4

Moderens alder og fødselsvægt: Data og deskriptive metoder (3) Moderens alder og fødselsvægt: Data og deskriptive metoder (4) Antag at 9 kolleger også betragter populationen bestående af børn født til tiden af 40 år gamle kvinder og hver indsamler en stikprøve af størrelse 10. I nedenstående tegning er alle 10 stikprøver vist. Den første er den, som vi tidligere har betragtet, indikerer det overordnede gennemsnit 3.600 kg og gennemsnittet i hver stikprøve. 2.5 3.0 3.5 4.0 4.5 1 2 3 4 5 6 7 8 9 10 Stikprøve PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-5 Det forekommer rimeligt at konkludere at forskellen mellem det observerede gennemsnit (3.434 kg) og det overordnede gennemsnit (3.600 kg) kan forklares ved tilfældige fluktuationer. For at kunne kvantificere hvorvidt denne forskel kan forklares ved tilfældige fluktuationer har vi brug for en statistisk model, det vil sige en matematisk beskrivelse af fordelingen af fødselsvægte. Histogram: Frekvens 0 1 2 3 4 5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-6 Moderens alder og fødselsvægt: Statistisk model Moderens alder og fødselsvægt: Statistisk model (2) Den statistiske model er en kontinuert kurve som beskriver et histogram baseret på mange observationer og en fin gruppeinddeling. Statistisk model: De observerede fødselsvægte x 1, x 2,...,x 10 kan beskrives som en stikprøve fra en normalfordeling. Hvis vi havde indsamlet flere data, kunne vi have anvendt en finere gruppeinddeling. For eksempel hvis vi havde 5000 fødselsvægte, så kunne histogrammet og normalfordelingskurven se således ud. Histogram med normalfordelingskurve (5000 observationer): Histogram med normalfordelingskurve (se filen dag1.do): 0.0 0.4 0.8 2.0 2.5 3.0 3.5 4.0 4.5 5.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 1 2 3 4 5 6 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-7 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-8

Sandsynligheden for lav fødselsvægt Sandsynligheden for lav fødselsvægt: Beregnet ud fra den statistiske model Hvad er sandsynligheden for at observere en fødselsvægt under 2.800 kg? Hvad er sandsynligheden for at observere en fødselsvægt under 2.800 kg? 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.0 0.1 0.2 0.3 0.4 0.5 0.6 1 2 3 4 5 6 1 2 3 4 5 6 I denne hypotetiske undersøgelse har vi 529 ud af 5000 observerede fødselsvægte under 2.800 kg svarende til en sandsynlighed på 0.1058. Baseret på den statistiske model (normalfordelingskurven) så er sandsynligheden for lav fødselsvægt lig med arealet under kurven (til venstre for 2.800 kg), som her er lig med 0.1076. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-9 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-10 Moderens alder og fødselsvægt: Konklusion Statistisk model og parametre: Normalfordelingen Med baggrund i den statistiske model: Tilfældige fluktuationer vil afstedkomme afvigelser mindst lige så ekstreme som de observerede omkring 1 ud af 3 gange (p-værdi på 38%). Konklusion: Data modsiger ikke at fødselsvægten for børn født af 40 år gamle danske kvinder er den samme som den overordnede gennemsnitlige fødselsvægt på 3.600 kg. Hvor vil vi forvente at den gennemsnitlige fødselsvægt i populationen ligger (baseret på denne stikprøve)? Med 95% sandsynlighed forventer vi at intervallet fra 3.032 kg til 3.836 kg indeholder den gennemsnitlige fødselsvægt i populationen af børn født til tiden af 40 år gamle danske kvinder. 3.032 3.434 3.600 3.836 Hvordan kommer vi så frem til sådanne (forholdsvis) præcise konklusioner? Statistisk model: De observerede fødselsvægte x 1, x 2,...,x 10 kan beskrives som en stikprøve fra en normalfordeling. Normalfordelingskurve (tæthed): φ(x) = x i N(µ, σ 2 ), i = 1,...,10, 1 2πσ 2 e 1 2σ 2 (x µ)2 uafhængige Middelværdien µ er den forventede fødselsvægt i populationen Histogram med normalfordelingskurve: 0.0 0.4 0.8 2.0 2.5 3.0 3.5 4.0 4.5 5.0 Variansen σ 2 (standardafvigelse σ) er et mål for variationen i populationen PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-11 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-12

Normalfordelingen: Forskellige normalfordelingskurver Statistisk model og parametre I hvilken tegning er middelværdien µ konstant og i hvilken er variansen σ 2 konstant? Normalfordelingskurve 0.0 0.1 0.2 0.3 0.4 0.5 0 2 4 6 8 Normalfordelingskurve 0.0 0.1 0.2 0.3 0.4 0.5 0 2 4 6 8 Den statistiske model: De observerede fødselsvægte x 1, x 2,...,x 10 kan beskrives som en stikprøve fra en normalfordeling med middelværdi µ og varians σ 2. Middelværdien µ og variansen σ 2 er ukendte konstanter (parametre). Formålet med den statistiske analyse er typisk at komme med udsagn om visse karakteristika ved en population ud fra en stikprøve fra den. Her vil vi finde de bedste gæt på værdierne af parameterne µ and σ 2 baseret på de faktiske observationer. En statistisk analyse er altid baseret på en statistisk model, som er en formalisering af antagelserne om de mekanismer som styrer den systematiske og tilfældige variation i den population hvorfra data er indsamlet. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-13 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-14 Estimation af parameterne i en statistisk model Hypoteser om parameterne i en statistisk model Middelværdien µ: Det bedste gæt på middelværdien (baseret på stikprøven) er gennemsnittet (stikprøvegennemsnittet) Her får vi Variansen σ 2 : ˆµ = x = 1 n n i=1 ˆµ = 1 (3.480 + 4.320 + + 3.380) = 3.434 10 Det bedste gæt på variansen (baseret på stikprøven) er stikprøvevariansen ˆσ 2 = s 2 = 1 n (x i x) 2 n 1 i=1 Her får vi ˆσ 2 = 1 10 1 ((3.480 3.434)2 + +(3.380 3.434) 2 ) = 0.3164 (s = 0.5625 kg) x i Det er nødvendigt at oversætte det spørgsmål, som man er interesseret i at besvare, til et udsagn (hypotese) om parameterne i den statistiske model. Det videnskabelige spørgsmål: Har moderens alder nogen indflydelse på fødselsvægten? Dette bliver oversat til: Er den forventede fødselsvægt for børn født af 40 år gamle kvinder forskellig fra den overordnede gennemsnitlige fødselsvægt på 3.600 kg? Udtrykt ved parameterne i den statistiske model, kan dette formuleres ved at opstille den følgende hypotese: H 0 : µ = 3.600 Vi har observeret x = 3.434! Er stikprøvevariationen en mulig forklaring på forskellen mellem stikprøvegennemsnittet og 3.600? PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-15 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-16

Beregn t-teststørrelsen t = Statistisk test af en hypotese x 3.600 3.434 3.600 1/n = 1/10 = 0.9332 s 0.5625 Størrelsen s/ n = 0.5625/ 10 = 0.1779 i nævneren kaldes for standard error (s.e.). Den betegnes også s.e.m for at understrege at det er standard error af middelværdien. Hvis hypotesen er sand (µ = 3.600) så er fordelingen af t en t-fordeling med n 1 = 10 1 = 9 frihedsgrader. En t-fordeling med 9 frihedsgrader minder meget om en normalfordeling med middelværdi 0 og varians 1 (standardnormalfordeling). Statistisk test af en hypotese: p-værdi Vi bruger t-fordelingen til at beregne sandsynligheden for at observere en værdi af t-teststørrelsen som er mindst lige så ekstrem som den faktisk observerede (p-værdien). t(9) tæthedskurve 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 observeret værdi 0.0 0.1 0.2 0.3 0.4 N(0,1) t(9) 3 2 1 0 1 2 3 p-værdi: p = P(t 0.9332) + P(t 0.9332) = 2 0.1875 38% Vi konkluderer at hvis hypotesen er sand, så vil tilfældigheder resultere i afvigelser mindst lige så ekstreme som den observerede i omkring 1 ud af 3 tilfælde. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-17 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-18 Statistisk test af en hypotese: Signifikansniveau Konfidensintervaller for parametre i en statistisk model Normalt siger vi at der er nok der taler imod en hypotese til at vi forkaster den hvis p-værdien er under signifikansniveauet α. Typisk vælger man α = 0.05 Signifikansniveauet α er risikoen for at lave en Type 1 fejl (sandsynligheden for at forkaste en sand hypotese). Konklusion: Data modsiger ikke at den forventede fødselsvægt for børn født af 40 år gamle kvinder er den samme som det overordnede gennemsnit på 3.600 kg. Vi kan IKKE konkludere at den forventede fødselsvægt for børn født af 40 år gamle kvinder er 3.600 kg! Når p-værdien er mindre end signifikansniveauet α siger vi at forskellen mellem middelværdien µ og værdien under hypotesen (3.600 kg) er statistisk signifikant. Bedømt ud fra vores stikprøve er det bedste bud på den ukendte forventede fødselsvægt i populationen, µ, 3.434 kg. På grund af variationen i data forekommer det dog rimeligt at sige at værdier tæt på 3.434 kg også er i overensstemmelse med data. Spørgsmål: Kan vi angive alle de værdier af den ukendte parameter µ som er understøttet af data? Et Konfidensinterval er svaret på dette spørgsmål. Et 95%-konfidensinterval for den forventede fødselsvægt µ = Et interval (bestående af værdier af den forventede fødselsvægt) som med 95% sandsynlighed indeholder µ PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-19 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-20

Konfidensinterval for middelværdien Percentiler, medianen og kvartiler Et 95%-konfidensinterval for µ (estimat ± t 0.975 standard error): s s x t 0.975 < µ < X + t 0.975 n n Her angiver t 0.975 97.5-percentilen i t-fordelingen med n 1 frihedsgrader. t(9) tæthedskurve 0.0 0.1 0.2 0.3 0.4 I dette eksempel får vi eller 3.032 kg < µ < 3.836 kg. 4 2 0 2 4 2.5 percentilen 97.5 percentilen 3.434 2.262 0.5625 10 < µ < 3.434 + 2.262 0.5625 10 Percentil: Den værdi under hvilken observationerne falder med en bestemt sandsynlighed 10-percentilen = Den værdi under hvilken observationerne falder med 10% sandsynlighed 25-percentilen = nedre kvartil 50-percentilen = medianen 75-percentilen = øvre kvartil Illustration af 10-percentilen: Dette areal er en tiendedel af dette areal 10 percentilen PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-21 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-22 97.5-percentilen i standardnormalfordelingen og t-fordelinger Fortolkning af konfidensintervaller 97.5-percentilen i t-fordelinger med f frihedsgrader: f 1 2 3 5 9 10 20 50 100 t 0.975 12.71 4.30 3.18 2.57 2.26 2.23 2.09 2.01 1.98 1.96 Grafisk kan man illustrere 97.5-percentilerne på følgende måde: 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 0.00 0.05 0.10 0.15 0.20 1.0 1.5 2.0 2.5 3.0 N(0, 1) t(20) t(5) t(3) t(9) Antag at vi har 20 stikprøver fra hele populationen (hver med 10 fødselsvægte) og beregner 95%-konfidensintervallerne for middelværdien baseret på hver stikprøve: 3.0 3.4 3.8 4.2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Stikprøve Vi forventer at 19 ud af 20 (95%) sådanne konfidensintervaller indeholder den sande middelværdi i populationen. Her ser vi præcist et KI (markeret med en ) som ikke indeholder middelværdien i populationen. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-23 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-24

Sammenhængen mellem populationen og en stikprøve Konfidensintervaller baseret på en større stikprøve Statistiske metoder til at drage inferens om populationen ud fra en stikprøve: Population Antag at vi havde en stikprøve af størrelse 100 og samme gennemsnit og standardafvigelse x = 3.434, s = 0.5625 Design p-værdi Konfidensinterval I dette tilfælde bliver 95%-konfidensintervallet eller 3.322 kg < µ < 3.545 kg. 3.434 1.984 0.5625 100 < µ < 3.434 + 1.984 0.5625 100 Vi har mere information (100 observationer sammenlignet med 10 observationer) Stikprøve Statistisk model et smallere konfidensinterval (bredden er reduceret med en faktor 10 3.2) Læg mærke til at i dette tilfælde ville vi have forkastet hypotesen µ = 3.600 kg på et 5% niveau. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-25 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-26 Prædiktionsinterval (eng: prediction interval eller reference range) Spørgsmål: Hvis vi nu tænkte os at vi ville foretage en måling på et andet medlem af populationen, x ny, hvor vil vi så forvente at den måling ligger? Vores bedste gæt på den nye observation er estimatet for den forventede værdi i populationen, her 3.434 kg, men kan vi bestemme et interval som vil indeholde den med en vis sandsynlighed? Svaret er 95%-prædiktionsintervallet (eng: prediction interval eller reference range): x 1.96 s < x ny < x + 1.96 s hvor 1.96 er 97.5-percentilen i standardnormalfordelingen. I vores eksempel ville vi få 3.434 1.96 0.5625 < x ny < 3.434 + 1.96 0.5625 eller 2.332 kg < x ny < 4.537 kg. Dette giver en direkte fortolkning af standardafvigelsen (95% af observationerne ligger indenfor x ± 2 s. Modelkontrol En statistisk analyse er altid baseret på en statistisk model. Gyldigheden af konklusionerne afhænger af hvorvidt den statistiske model beskriver data tilskrækkeligt. Det følger at en undersøgelse af rimeligheden af de underliggende antagelser er en vigtig del af den statistiske analyse. Antagelser: 1. Observationerne er uafhængige (kendskab til værdien af en observation influerer ikke på fordelingen af de andre observationer) 2. Observationerne har samme middelværdi og samme varians 3. Observationerne er normalfordelte PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-27 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-28

Modelkontrol: Check af rimeligheden af antagelserne Moderens alder og fødselsvægt: Modelkontrol Histogram og fraktildiagram (Q-Q plot, se filen dag1.do): Normalt gøres dette bedst ved at inspicere en række tegninger og diagrammer. 1. Uafhængighed checkes oftes ved at gennemgå dataindsamlingsproceduren: Her ville antagelsen ikke forekomme rimelig hvis data for eksempel indeholdt observationer svarende til tvillinger. 2. Samme middelværdi og samme varians: Har vi uafhængige gentagelser af det samme forsøg? Hvis data er indsamlet over tid, så kan det være en god ide at tegne data op mod tiden for at se om der sker en udvikling. 3. Kan fordelingen af observationerne approksimeres tilstrækkeligt af en normalfordeling? Tegn altid data!! Normalt laver man histogrammer og fraktildiagrammer (eng: Q-Q plots), som er observationerne tegnet op mod percentilerne fra normalfordelingen. 0.0 0.2 0.4 0.6 0.8 1.0 Fødselsvægt (kg) 2.5 3.0 3.5 4.0 4.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 1.5 0.5 0.0 0.5 1.0 1.5 Fødselsvægt (kg) Percentiler fra Normalfordelingen De to tegninger (histogram og fraktildiagram) ser rimelige ud. Vi vil ikke tvivle på tilstrækkeligheden af modellen til beskrivelse af data baseret på disse tegninger. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-29 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-30 Modelkontrol: Fraktildiagrammer for stikprøver af størrelse 10 fra en normalfordeling Modelkontrol: Fraktildiagrammer for stikprøver af størrelse 50 fra en normalfordeling PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-31 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-32

Modelkontrol: Fraktildiagrammer for stikprøver af størrelse 250 fra en normalfordeling Modelkontrol: Fraktildiagrammer for stikprøver af størrelse 50 ikke fra en normalfordeling PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-33 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-34 Moderens alder og fødselsvægt: Formulering af konklusioner Moderens alder og fødselsvægt: Formulering af konklusioner (2) Se afsnit 8.4 5 i Kirkwood & Sterne (2003). I en artikel ville vi måske beskrive den statistiske analyse og formulere konklusionerne på denne måde: Resultaterne af den statistiske analyse: Data blev analyseret som en stikprøve fra en normalfordeling. Hypotesen om at den forventede fødselsvægt for børn født af 40 år gamle danske kvinder er den samme som i hele populationen (3.600 kg) kunne ikke forkastes (p = 0.38). Et estimat for den forventede fødselsvægt er, sammen med et 95%-konfidensinterval, givet ved 3.434 kg (3.032 kg, 3.836 kg). Konklusioner: 1. Vi konkluderer at der ikke er noget i data som får os til at tvivle på hypotesen om at fødselsvægten for børn født af 40 år gamle kvinder er 3.600 kg, som er den gennemsnitlige fødselsvægt i hele den danske befolkning. 2. Enten fordi dette studium er ret lille eller fordi der er en ganske stor variation mellem individer, ser vi et stort 95%-konfidensinterval (fra 568 g under til 236 g over den gennemsnitlige fødselsvægt i hele befolkningen). 3. Hvorvidt disse eventuelle afvigelser fra den gennemsnitlige fødselsvægt i hele befolkningen er af medicinsk vigtighed skal altid overvejes (af den medicinske ekspert tilknyttet studiet). 4. Studiet bidrager med meget begrænset information hvad angår det videnskabelige spørgsmål (sammenhængen mellem moderens alder og fødselsvægt). PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-35 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 1-36