1 Populationer og stikprøver 4

Relaterede dokumenter
Stata datafil Variables og Properties Data typer: Skalære, ordinale, nominelle og dikotome

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

1 Regressionsproblemet 2

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Normalfordelingen og Stikprøvefordelinger

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

1 Hb SS Hb Sβ Hb SC = , (s = )

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

Kommentarer til øvelser i basalkursus, 2. uge

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

1 Multipel lineær regression

1 Multipel lineær regression

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Løsning eksamen d. 15. december 2008

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

2 Logaritme- og eksponentialfunktion 6

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Produkt og marked - matematiske og statistiske metoder

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Estimation og usikkerhed

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Tema. Dagens tema: Indfør centrale statistiske begreber.

Vejledende besvarelser til opgaver i kapitel 14

Løsning til eksaminen d. 14. december 2009

Kapitel 12 Variansanalyse

Hypotesetests, fejltyper og p-værdier

Løsning til eksamen d.27 Maj 2010

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Note om Monte Carlo metoden

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Schweynoch, Se eventuelt

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Kapitel 12 Variansanalyse

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forsøgsplanlægning Stikprøvestørrelse

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Løsninger til kapitel 1

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Statistiske modeller

Bilag til Statistik i løb : Statistik og Microsoft Excel tastevejledning / af Lars Bo Kristensen

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Deskriptiv statistik for hf-matc

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Kvantitative Metoder 1 - Forår Dagens program

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

for gymnasiet og hf 2017 Karsten Juul

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Øvelser til basalkursus, 2. uge

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Personlig stemmeafgivning

for gymnasiet og hf 2016 Karsten Juul

Deskriptiv statistik for matc i stx og hf

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Transkript:

Indhold 1 Populationer og stikprøver 4 2 Data, indlæsning og editering i Stata 4 2.1 Stata datafil........................................ 4 2.2 Variables og Properties.................................. 6 2.3 Data typer: Skalære, ordinale, nominelle og dikotome................. 8 3 Gruppering og frekvenstabeller 9 3.1 Gruppering af skalære variable.............................. 9 3.2 Frekvenstabeller...................................... 9 3.3 Bargraf /søjlediagram................................... 10 3.4 Lagkagediagram...................................... 11 4 Histogram - skalær variabel 12 4.1 Frekvensfunktion..................................... 13 4.2 Logaritmetransformation................................. 14 5 Percentiler, median, kvartiler og interkvartilbredde 14 5.1 Boxplot - skalær variabel................................. 16 5.2 Kumuleret frekvensfunktion............................... 18 6 2 skalære variable: Scatterplot 18 7 Gem din analyse 19 8 Centralitetsmål for skalære variable 20 8.1 Median........................................... 20 8.2 Middeltal og typetal................................... 20 9 Spredningsmål for skalære variable 21 9.1 Variations- og interkvartilbredde............................. 21 9.2 Varians, standardafvigelse og frihedsgrader....................... 22 9.3 STATA: Middeltal og standardafvigelse......................... 23 9.4 Variationskoefficient................................... 24 1

10 Stikprøvevariation og standardfejl 24 10.1 Middeltal og standardafvigelse for population...................... 24 10.2 Standardfejl på middeltal for stikprøve......................... 25 10.3 Fordeling af stikprøvens middeltal - central grænseværdisætning........... 27 11 Normalfordeling 27 11.1 z-score........................................... 28 11.2 Øvre halesandsynlighed i normalfordelingen...................... 28 11.3 z-værdi svarende til øvre halesandsynlighed....................... 29 12 Konfidensinterval for populationens middeltal 30 12.1 Stor stikprøve: Normalfordelingen............................ 30 12.2 Lille stikprøve: t-fordelingen............................... 31 12.3 Fortolkning af konfidensinterval............................. 31 12.4 Konfidensinterval i STATA................................ 32 13 Sammenligning af 2 grupper 32 13.1 Stikprøvefordeling af differens i middeltal........................ 33 13.2 Konfidensinterval: Store stikprøver - kendt standardfejl................ 33 13.3 Konfidensinterval: Store stikprøver - ukendt standardfejl............... 34 13.4 z-test for ingen effekt................................... 35 13.5 p-værdi.......................................... 36 13.6 Konfidensinterval: Ens standardafvigelser........................ 37 13.7 Uparret t-test (between subject design)......................... 39 13.8 Små stikprøver - forskellige standardafvigelser..................... 40 13.9 Parret t-test (within subject design)........................... 40 13.10Parret t-test i STATA.................................. 41 14 Generelt om konfidensintervaller og p-værdier 42 14.1 Fortolkning af p-værdi.................................. 43 14.2 En statistisk analyse................................... 44 15 Sandsynlighed(risiko) 47 15.1 Sandsynlighedsbegrebet................................. 47 15.2 Betinget sandsynlighed.................................. 48 15.3 Uafhængighed af hændelser............................... 49 15.4 Bayes regel........................................ 49 2

16 Frekvenser: Binomialfordelingen 50 16.1 Estimation af risiko.................................... 50 16.2 Binomialfordelingen.................................... 51 16.3 Normalapproksimation af binomialfordelingen..................... 52 16.4 Konfidensinterval for andel - normalapproksimation.................. 53 16.5 Hypotese om specifik værdi af andel........................... 53 17 Sammenligning af 2 andele 54 17.1 Test for ingen effekt - normalapproksimation...................... 55 17.2 Konfidensinterval for effekt................................ 56 3

1 Populationer og stikprøver Målpopulation og stikprøvevariation Vi er interesseret i, hvad danske vælgere ville stemme til et folketingsvalg i morgen. I princippet kan vi spørge alle vælgere og få det sande billede af de politiske partiers opbakning, og hvordan de står ift sidste valg. I denne undersøgelse er alle vælgere vores målpopulation. I praksis indskrænker vi undersøgelsen til en stikprøve, hvor vi spørger eksempelvis 1500 tilfældigt udvalgte vælgere om deres holdning. Vi får således et sløret/usikkert billede af situationen, hvor vi ikke med sikkerhed kan drage konklusioner ift sidste valg. Den tilfældige udvælgelse af vælgere kan falde ud på mange måder og således give anledning til forskellige tal for vælgertilslutning. Vi kalder dette for stikprøvevariation. Illustration af inferensproces Vi skal bruge statistik til - på trods af stikprøvevariation - at komme med nogle kvalificerede udsagn om populationen. Fex hvorvidt det er overvejende sandsynligt, at et parti har mistet mere end 3% tilslutning siden sidste valg. Inden vi kaster os over inferens vil vi bruge lidt tid på eksplorativ analyse af data. 2 Data, indlæsning og editering i Stata 2.1 Stata datafil Dataeksempel 4

Beskrivelse Studie af lungefunktion hos 636 peruvianske børn i alderen 7-10 år. Undersøgelsen er foretaget i en fattig forstad til Lima. For hvert barn har man registreret variablene 1. id: identifikationsnummer 2. fev1: Forced expiratory volume i 1 sekund - antal liter målt vha et spirometer. 3. age: barnets alder i år. 4. height: barnets højde i cm. 5. sex: barnets køn. 6. respsymp: Barnets pårørende blev spurgt om respiratoriske symptomer de seneste 12 måneder (dikotom). Indlæsning af Stata-fil: PeruLungeData.dta File Open... Find den relevante sti og klik på filnavn og derefter Open. 5

2.2 Variables og Properties Data Editor Data Data Editor Vi genkender variabelnavnene. Bemærk at kolonnen for variablen sex kun indeholder værdierne 0 og 1. Et 0 repræsenterer pige, mens et 1-tal repræsenterer dreng. Tilsvarende for variablen respsymptoms: 0=Nej og 1=Ja. Variabel egenskaber i Stata Data Variables Manager Name: Vi genkender variabelnavnene, som bruges i den kode, som Stata skal eksekvere. 6

Label: Mere informativt variabelnavn, som bruges i grafik, tabeller, mm. Variabel egenskaber i Stata Klik på sex i vinduet Variables Manager. Man har nu mulighed for eksempelvis at ændre Label fra "Sex of the child(0 F 1 M)" til "Barnets køn". Klik dernæst på Manage... i Value label rækken. Dette giver et vindue, hvor der klikkes på Create label knappen. Variabel egenskaber i Stata 7

Angiv navn på label, fex sex lb Angiv betydning af de forskellige værdier, fex 0=pige etc. Vi kan nu associere sex lb med variablen sex 2.3 Data typer: Skalære, ordinale, nominelle og dikotome Data typer Stata er ikke eksplicit omkring hvilken måleskala vi knytter til en given variabel. Men da det i mange sammenhænge er vigtigt as skelne, så introducerer vi Skalær: Angiver at skalaen er metrisk, dvs variable som højde, blodtryk, dagligt cigaretforbrug, osv. Ordinal: Deler populationen i kategorier, som har en naturlig ordning. Det kan være socialgruppe, men også grupperede metriske data - fex angivelse af blodtryk som lavt, middel eller højt. Nominel: Deler populationen i kategorier, som ikke har en naturlig ordning. Eksempelvis køn, blodtype, haplotype, etc. Vi vil også bruge termen kategorisk variabel, som enten er ordinal eller nominel. En kategorisk variabel med 2 mulige udfald - fex køn kaldes også dikotom. 8

3 Gruppering og frekvenstabeller 3.1 Gruppering af skalære variable Skalær variabel til ordinal variabel Data Create or change data Create new variable(extended) 1. fevbin: Navn på grupperet(binned) variabel 2. fev1: Navn på variabel som skal binnes. 3. Cut: Den kommando som binner 4. Vi ønsker 4 grupper med ca 25% i hver gruppe. Alternativt: Angiv delepunkter. Labels: Interval startpunkt. 3.2 Frekvenstabeller To vejs tabel Statistics Summaries,tables... Frequency tables Two-way... 9

Vi vælger variablene respsymptoms og fevbin, hvor vi ønsker at se frekvenser(antal observationer) og relative frekvenser(procentuel rækkeandel) for hver kombination af de 2 variable. To vejs tabel Resultatet af krydstabuleringen kan ses i Stata s outputvindue, hvor det ses, at der er en relativ overvægt af børn med respiratoriske symptomer, som har lavt lungevolumen (mellem 0.64 og 1.395 liter). 3.3 Bargraf /søjlediagram I stedet for tabellen kan vi illustrere denne ved for hver celle i tabellen at tegne en kasse hvis højde er proportional med frekvensen. Graphics Bar chart 10

Under Type of data vælges Graph of frequencies within categories. Klik på Categories og gør som illustreret nedenfor. Der er mange andre optioner. Fex bør man tilføje en titel. 3.4 Lagkagediagram Et alternativ til søjlediagrammet er et lagkagediagram via Graphics Pie chart Gør som omstående illustreret i hhv Main-fanen og Byfanen. hvilket producerer 11

4 Histogram - skalær variabel Vi vil kigge på børnenes højde og stratificere efter køn. Graphics Histogram Gør som omstående illustreret i hhv Main-fanen og By-fanen. hvilket producerer et histogram: 1. Inddel intervallet fra Minimum til Maximum i et passende antal lige store delintervaller. 2. Tegn kasser over hvert delinterval med højde svarende til antal observationer i delintervallet. 12

4.1 Frekvensfunktion Når observationsantallet vokser Når vi tegner et histogram, hvor arealet af hver kasse svarer til den relative frekvens, så vil det samlede areal af kasserne være en. Når observationsantallet vokser, så kan vi forfine inddelingen og får et mere glat forløb. Histogram af 50 observationer Histogram af 500 observationer Histogram af population I teorien kan vi forestille os uendeligt mange observationer, som giver en pæn glat kurve, hvor arealet under kurven er 1. En funktion hvis graf fremkommer på denne måde kaldes en frekvensfunktion. taethed 0.00 0.05 0.10 0.15 0.20 0.25 taethed 0.00 0.05 0.10 0.15 0.20 0.25 taethed 0.00 0.05 0.10 0.15 0.20 0.25 6 8 10 12 14 16 4 6 8 10 12 14 16 5 10 15 varvalue varvalue varvalue Former på frekvensfunktioner 13

4.2 Logaritmetransformation Transformation Det er ikke usædvanligt at se højreskæve histogrammer, fex målinger af koncentrationer, inkubationstider, ratier, mm. Normalt foretrækker vi en symmetrisk og klokkeformet frekvenskurve. Hvis fordelingen er højreskæv kan vi ofte opnå symmetri ved at logaritmetransformere vore målinger. Eksempler på målinger på logaritmisk skala: ph: Måling af surhedsgrad. Når ph-værdien falder med 1 enhed, 10-dobles surhedsgraden. ph=7 svarer til vand, dvs en væske med ph=5 er 100 gange surere end vand. db: Decibelmåling af lydtryk. Når db-værdien vokser med 6 enheder, så fordobles lydtrykket. db=0 svarer til grænsen for den menneskelige hørelse, mens db=60 svarer til en normal samtale. 5 Percentiler, median, kvartiler og interkvartilbredde Percentiler Eksempler på percentiler for en stikprøve af en skalær variabel: 5-percentilen: 5% af målingerne ligger under eller er lig med denne værdi. 25-percentilen: 25% af målingerne ligger under eller er lig med denne værdi. Dette kaldes også nedre kvartil. 50-percentilen: 50% af målingerne ligger under eller er lig med denne værdi. Dette kaldes også medianen. 14

75-percentilen: 75% af målingerne ligger under eller er lig med denne værdi. Dette kaldes også øvre kvartil. Dette er den ideelle fortolkning af percentilbegrebet. I praksis er det lidt mere kompliceret. Betragt eksempelvis en aldersstikprøve med ordnede værdier givet ved Hvad er den nedre kvartil? Kvartiler Aldersstikprøve: 7, 9, 10, 11, 15 7, 9, 10, 11, 15 Det må være oplagt at 10 er medianen, som skal være den midterste observation. Midten mellem første og femte observation er observation nummer 1+5 = 3. 2 Generelt hvis vi har n observationer: medianen er observation nummer n+1 2 blandt de ordnede værdier. nedre kvartil er observation nummer n+1 4 blandt de ordnede værdier. øvre kvartil er observation nummer 3(n+1) 4 blandt de ordnede værdier. Aktuelt: 5+1 4 = 1.5 er midt imellem observation 1 og 2, hvorfor nedre kvartil sættes til 8. Tilsvarende er øvre kvartil lig med 13. Centralitets og spredningsmål Aldersstikprøve: 7, 9, 10, 11, 15 50-percentilen kaldes som sagt medianen og er et såkaldt centralitetsmål, som angiver en værdi, som målingerne spreder sig omkring. 0-percentilen=7 er den mindste værdi, dvs minimum. 100-percentilen=15 er den største værdi, dvs maximum. Variationsbredde(Range): er forskellen på største og mindste værdi, 15-7=8, og er et såkaldt spredningsmål. Interkvartilbredde(IQR): er et andet spredningsmål givet ved forskellen på øvre og nedre kvartil: 13-8=5. 15

Percentiler for højde-målinger Statistics Summaries,tables... Summary and... Summary statistics, hvor Mainfanen ses nedenfor til venstre: Ovenstående til højre en del af output, som fex viser at 10% af børnene her en højde under 116.2 cm. Medianen er 124 cm. Interkvartilbredden er 128 119.9 = 8.1 cm. 5.1 Boxplot - skalær variabel Box plots with fences/whiskers 1. Beregn median, nedre og øvre kvartil. 2. Plot en linie ved medianen og tegn en kasse mellem øvre og nedre kvartil. 3. Beregn interkvartilbredden og kald det IQR. Beregn følgende værdier: L = nedre kvartil - 1.5*IQR U = øvre kvartil + 1.5*IQR 4. Tegn en linie fra nedre kvartil til det mindste datapunkt, som er større end L. Tilsvarende, Tegn en linie fra øvre kvartil til det største datapunkt, som er mindre end U. 5. Datapunkter under L og over U tegnes som cirkler. Disse betragtes ofte som ekstreme og bør som regel kontrolleres for tastefejl, fejlaflæsning, apparatfejl eller lignende. 16

Data: Børnenes højde Graphics Box plot Vi stratificerer efter køn, dvs et boxplot for både piger og drenge. Main fane: Categories fane: 17

5.2 Kumuleret frekvensfunktion For en given variabelværdi angiver den kumulerede frekvensfunktion (kff) andelen af ma linger, som er mindre end eller lig med denne værdi. Omsta ende graf viser kff for 70 hæmoglobinma linger. Fire ma linger antager værdien 10g/100ml eller derunder, dvs y = 4/70 = 5.7% na r x = 10. Den største værdi er 15.1g/100ml, dvs y = 100% na r x = 15.1. 6 2 skalære variable: Scatterplot Scatterplot - 2 skalære variable Graphics Twoway graph(scatter,...) Alder vælges som x-akse og Højde som y-akse. Ikke overraskende ser der ud til at være en sammenhæng. 18

7 Gem din analyse Gem dit projekt Alle de kommandoer, som du udfører gemmes i Review panelet. Hvis du højreklikker på panelet er der flere muligheder for at gemme eller editere udvalgte dele eller hele forløbet. Kommandoerne gemmes i en såkaldt.do-fil, som stata kan genkende. Hvis du senere åbner.do-filen i stata, så kan du genskabe din analyse. Dette er en vigtig pointe. 19

8 Centralitetsmål for skalære variable 8.1 Median Median Histogrammet giver et godt visuelt indtryk af hvordan variablen fordeler sig. Ofte er det hensigtsmæssigt at beskrive fordelingen via nogle få talstørrelser. Vi har allerede stiftet bekendskab med medianen, som angiver et såkaldt centralitetsmål, dvs en værdi hvoromkring målingerne fordeler sig. Når vi har n målinger er medianen observation nummer n+1 2 blandt de ordnede værdier. Hvis n er ulige er det den midterste observation. Hvis n er lige tager vi gennemsnittet af de 2 midterste observationer. 8.2 Middeltal og typetal Middeltal(Mean) Middeltallet for en stikprøve er summen af målingerne divideret med antallet af målinger, og skrives kort på formen x = Σx n hvor Σx repræsenterer summen af x-målingerne og n er antallet af målinger. Σ er det græske store bogstav sigma og x udtales x-streg. Typetal(Mode) Typetallet er den værdi som forekommer oftest i stikprøven. Hvis alle målinger er forskellige, dvs lige hyppige kan vi ikke angive typetallet. 20

Dataeksempel Måling af plasmavolumen på 8 raske mænd: Sum af målinger: 2.75, 2.86, 3.37, 2.76, 2.62, 3.49, 3.05, 3.12 liter Σx = 2.75 + 2.86 + 3.37 + 2.76 + 2.62 + 3.49 + 3.05 + 3.12 = 24.02 liter Antal målinger er n = 8, hvilket giver middeltallet x = Σx n = 24.02 8 Medianen er gennemsnittet af de to midterste værdier: = 3.00 liter Median = 2.86 + 3.05 2 = 2.96 liter 9 Spredningsmål for skalære variable 9.1 Variations- og interkvartilbredde Spredningsmål Udover et centralitetsmål, som angiver en værdi, som målingerne fordeler sig omkring, er det relevant at have et mål for hvor meget værdierne spreder sig omkring centralitetsmålet. Variationsbredde Har vi tidligere defineret som Variationsbredde=StørsteMåling minus MindsteMåling Interkvartilbredde Har vi også tidligere defineret som Interkvartilbredde=ØvreKvartil minus NedreKvartil 21

9.2 Varians, standardafvigelse og frihedsgrader Varians I første omgang skal vi definere variansen på en stikprøve: s 2 = Σ(x x)2 n 1 x x er målingernes afvigelse fra middeltallet og disse kvadreres og lægges sammen(σ). Derefter divideres - stort set - med stikprøvestørrelsen. Så vi kan tænke på variansen som den gennemsnitlige kvadratiske afvigelse fra middeltallet. Frihedsgrader Der gælder at summen af afvigelser Σ(x x) = 0, dvs når vi kender n 1 afvigelser kan vi beregne den sidste. Dette forhold formuleres ved at sige at s 2 har (n 1) frihedsgrader. Derudover er s 2 et estimat(kvalificeret skøn) over variansen i hele populationen og det kan vises, at det er fornuftigt at dividere summen af kvadrerede afvigelser med frihedsgradstallet frem for n. Standardafvigelse Variansen er den gennemsnitlige kvadratiske afvigelse. Det er hensigsmæssigt at udtrykke variationen på den oprindelige måleskala, så vi uddrager kvadratroden og beregner standardafvigelsen Σ(x x) 2 s = n 1 Sædvanligvis forventer vi at Ca 70% af målingerne ligger inden for en standardafvigelse af middeltallet. Ca 95% af målingerne ligger inden for to standardafvigelser af middeltallet. Ca 99.3% af målingerne ligger inden for 2.7 standardafvigelser af middeltallet. Dette svarer til whiskers i et boxplot. Forventningerne er baseret på den såkaldte normalfordeling, som vi vender tilbage til. 22

Dataeksempel - fortsat Summen af de kvadrerede afvigelser er Σ(x x) 2 = 0.678 med 8 1 = 7 frihedsgrader, hvilket giver standardafvigelsen s = 0.678 7 = 0.31liter 9.3 STATA: Middeltal og standardafvigelse Dataeksempel - fortsat 23

I STATA: Statistics Summaries,... Other tables Compact... på variablen PlasmaVol giver nedenstående output: Et forsigtigt skøn(det lave observationsantal giver usikkerhed) over de midterste 70% af volumenmålinger på raske mænd er da givet ved intervallet 3 ± 0.3 dvs mellem 2.7 og 3.3 liter. 9.4 Variationskoefficient Variationskoefficient Spredningen er udtryk for en absolut afvigelse fra middeltallet. I visse sammenhænge er det relevant at kigge på relative(procentuelle) afvigelser fra middeltallet. Det mest almindelige mål er variationskoefficienten(coefficient of variation) cv = s x % I vores aktuelle datasæt kan vi beregne cv = 0.3 3 = 10%, dvs vi forventer at 70% af raske mænd har et plasmavolumen, som højst afviger 10% fra middeltallet. 10 Stikprøvevariation og standardfejl 10.1 Middeltal og standardafvigelse for population. 24

Populationsparametre Vi er interesseret i en skalær størrelse fex hvordan BMI varierer i en målpopulation. Vi kan i princippet måle BMI på alle individer i populationen og bestemme µ(det græske bogstav my): Populationens middeltal. σ(det græske bogstav sigma): Populationens standardafvigelse. I praksis tager vi en tilfældig stikprøve, hvor x er et estimat(kvalificeret skøn) for µ. Det tilfældige valg af stikprøve har mange mulige udfald, dvs vi har en population af mulige x-værdier, hvor vi vælger en tilfældigt. 10.2 Standardfejl på middeltal for stikprøve Standardfejl Hvis vi kigger på populationen af mulige middeltal for en stikprøve, så kan det vises at Denne har middeltal µ, dvs det samme som målpopulationen. Denne har standardafvigelse σ n og kaldes standardfejlen på stikprøvens middeltal. Mao vil x med ca 95% sikkerhed ligger i intervallet µ ± 2σ n. Dette kan omformuleres til at µ med ca 95% sikkerhed ligger i intervallet x ± 2σ n, et såkaldt konfidensinterval, som vi skal studere nærmere senere hen. Som regel er målpopulationens standardafvigelse σ ukendt. På basis af stikprøven estimerer vi σ ved stikprøvens standardafvigelse s og har således den estimerede standardfejl se = s n Bemærk at standardfejlen falder når n vokser, dvs jo større stikprøve, jo kortere er konfidensintervallet for µ, hvilket virker rimeligt. En illustrativ leg Betragt nedenstående histogram af blodtrykket for 250 piloter. Vi skal betragte disse piloter som vores målpopulation, dvs µ og σ er som angivet på figuren. 25

Vi ser at blodtrykket varierer mellem ca 58 og 98 mmhg. En illustrativ leg Vi tager nu et stikprøve med 10 observationer og beregner stikprøvens middeltal. Dette eksperiment udføres 30 gange, dvs vi kan lave nedenstående histogram for de 30 stikprøvegennemsnit. Middeltallene er stort set centreret om µ = 78.2mmHg, men standardafvigelsen er ift populationen faldet fra σ = 9.4mmHg til 3.01mmHg, hvilket svarer meget godt til σ/ 10 = 2.97mmHg. Hvor populationsværdierne varierer mellem 58 og 98 mmhg, så varierer gennemsnittene mellem 72 og 86 mmhg. 26

10.3 Fordeling af stikprøvens middeltal - central grænseværdisætning Fordeling af stikprøvens middeltal Vi er givet en stikprøve x 1, x 2,..., x n af størrelse n fra en population med middeltal µ og standardafvigelse σ. Stikprøvens middeltal har da en fordeling hvor Fordelingen har middeltal µ. x = 1 n (x 1 + x 2 +... + x n ) Fordelingen har standardafvigelse σ x = σ n, der som sagt benævnes standardfejlen. Når n vokser, så nærmer fordelingen sig en såkaldt normalfordeling. Dette kaldes den centrale grænseværdisætning. Den centrale grænseværdisætning betyder, at normalfordelingen spiller en afgørende rolle, når vi laver statistisk inferens. 11 Normalfordeling Normalfordeling Der er en hel familie af frekvenskurver for normalfordelingen, som er bestemt af 2 parametre: µ er middeltallet, som bestemmer hvor fordelingen er centreret. σ er standardafvigelsen, som bestemmer hvor koncentreret fordelingen er omkring middeltallet. Frekvensfunktion: y = f(x; µ, σ) = hvor exp er den såkaldte exponentialfunktion. 1 exp( 1 2πσ 2 2σ (x 2 µ)2 ) Hvis µ = 0 og σ = 1, så taler vi om en standard normalfordeling. Normalfordelingens udstrækning 27

11.1 z-score Standardisering af variabel En normalfordelt variabel er stadig normalfordelt selv om vi ændrer måleenhed og/eller nulpunkt. Det er blot middeltal/standardafvigelse som ændrer sig. Fex skift fra Fahrenheit til Celcius: y = 5 9 (x 32), hvor et middeltal på fex 41 F ændres til 5 9 (41 32) = 5 C, mens en standardafvigelse på fex 4.5 F ændres til 5 9 4.5 = 2.5 C, idet sidstnævnte kun afhænger af skalaændringen. Betragt en normalfordelt population med middeltal µ og standardafvigelse σ. Når x er en tilfældig måling fra denne population vil vi betragte den standardiserede måling z = x µ σ som også kaldes for z-scoren. Denne har med middeltal µ = 0 og standardafvigelse σ = 1, dvs standard normal fordelt. 11.2 Øvre halesandsynlighed i normalfordelingen Ex: Normalfordelte højdemålinger 28

Hvor hyppigt forekommer højdemålinger over 175cm? 175 171.5 z = = 0.54 6.5 I tabel A1 kan man aflæse denne såkaldte øvre halesandsynlighed til at være 29.46%. 11.3 z-værdi svarende til øvre halesandsynlighed. Ex: Normalfordelte højdemålinger Hvilken z-score svarer til øvre kvartil - dvs at øvre hale skal have sandsynlighed 25%? I tabel A1 kan vi se, at denne ligger ca midtvejs mellem 0.67 og 0.68, dvs z = 0.675 er øvre kvartil i standard normal fordelingen. Da x = µ + σz vil øvre kvartil for den tilsvarede højde være 171.5 + 6.5 0.675 = 175.9cm 29

12 Konfidensinterval for populationens middeltal 12.1 Stor stikprøve: Normalfordelingen 95% konfidensinterval for middeltal Når stikprøvestørrelsen n er stor - typisk n > 15 - er x normalfordelt. 95% af standardnormalfordelingen ligger indenfor ±2 eller mere præcist ±1.96. Dette betyder at stikprøvens middeltal med 95% sikkerhed ligger mellem µ ± 1.96 σ n, dvs middeltallet plus/minus 1.96 standardfejl. Vi kan omformulere dette til et konfidensinterval, når σ er kendt og n > 15 Med 95% sikkerhed vil µ ligge mellem x ± 1.96 σ n I praksis kender vi som oftest ikke σ og bruger i stedet den estimerede standardfejl se = s n Hvis n > 60 er dette et ret præcist estimat, så vi kan beregne et konfidensinterval, når σ er ukendt og n > 60 Med 95% sikkerhed vil µ ligge mellem x ± 1.96 s n Andre konfidensgrader Vi har ovenfor beregnet konfidensintervaller med såkaldt konfidensgrad 95%, hvor den tilhørende z = 1.96 svarer til en øvre halesandsynlighed på 2.5%. Andre konfidensgrader 90% konfidensgrad: z = 1.64 svarer til en øvre halesandsynlighed på 5%. 99% konfidensgrad: z = 2.58 svarer til en øvre halesandsynlighed på 0.5%. dvs når σ er ukendt og n > 60 Med 90% sikkerhed vil µ ligge mellem x ± 1.64 s n Med 99% sikkerhed vil µ ligge mellem x ± 2.58 s n 30

12.2 Lille stikprøve: t-fordelingen Konfidensinterval for middeltal Når 15 n 60 og σ er ukendt, så kan vi ikke bruge en z-værdi, men skal referere til en såkaldt t-værdi. Dette skyldes at stikprøvens standardafvigelse ikke er et tilstrækkeligt nøjagtigt estimat for σ. Hvis n < 15 skal der yderligere gælde at populationen er normalfordelt. t-værdien afhænger af frihedsgradstallet (n 1) og konfidensgraden. Hvis vi eksempelvis vil have konfidensgrad 95% - dvs vi udelader 0.05(kaldes 2-Sidet P-value i TabelA3) - og har 5 frihedsgrader så kan vi i TabelA3 aflæse t-værdien t = 2.57. Når vi har bestemt t-værdien t kan vi beregne konfidensintervallet Med 95% sikkerhed vil µ ligge mellem x ± t s n 12.3 Fortolkning af konfidensinterval Fortolkning af konfidensinterval Nærliggende fortolkning når vi beregner et 95% konfidensinterval er at der er 95% chance for at populationens middelværdi ligger i dette interval, som altså er beregnet på basis af den aktuelle stikprøve. Dette er ikke helt rigtigt. Vi kan kun sige at 95% af alle beregnede konfidensintervaller vil indeholde populationens middelværdi µ Dvs når vi har beregnet 20 konfidensintervaller, så vil der - i middel - faktisk være et af disse, som ikke indeholder populationens middelværdi µ. Hvorvidt vi har ramt en af disse uheldige situationer kan ikke afgøres, hvilket for så vidt er kerneproblematikken, når man ikke har fuld information. 31

12.4 Konfidensinterval i STATA STATA beregninger Statistics Summaries,... Summary and.. Confidence intervals Per default vælges et konfidensinterval baseret på normalfordeling. Med en konfidensgrad på 95% siger vi at middeltallet for plasmavolumen blandt populationens raske mænd ligger mellem 2.74 og 3.26 liter. 13 Sammenligning af 2 grupper Terminologi I mange statistiske undersøgelser ønsker man at sammenligne 2 delpopulationer. Det kunne eksempelvis være mænd/kvinder, men er i medicinske sammenhænge ofte knyttet til eksponering/behandling. Eksempelvis Fødselsvægt, hvor vi ønsker at sammenligne middelvægten for børn af rygere - eksponeringsgruppen(gruppe1) - med middelvægten for børn af ikke-rygere - ikke eksponeringsgruppen(gruppe0). Blodtryk, hvor vi ønsker at sammenligne middeltrykket efter en ny behandlingsform - behandlingsgruppen(gruppe1) - med middeltrykket efter konventionel behandling - kontrolgruppen(gruppe0). 32

Den interessante størrelse er således µ 1 µ 0, hvor µ 0 er populationens middeltal i gruppe0. µ 1 er populationens middeltal i gruppe1. 13.1 Stikprøvefordeling af differens i middeltal Stikprøvefordeling af differens Efter indsamling af data kan vi beregne x 0 : Stikprøvens middeltal i gruppe0 baseret på n 0 målinger. x 1 : Stikprøvens middeltal i gruppe1 baseret på n 1 målinger. hvor vi fokuserer på differensen x 1 x 0, som er et estimat for µ 1 µ 0. For at beskrive stikprøvevariationen af den estimerede differens skal vi kende σ 0 : Stikprøvens standardafvigelse i gruppe0. σ 1 : Stikprøvens standardafvigelse i gruppe1. Det kan vises at populationen af stikprøvedifferenser har middeltal µ 1 µ 0 standardafvigelse se = σ 2 0 n 0 + σ2 1 n 1 - også kaldet standardfejlen. Hvis der tillige gælder at både x 0 og x 1 er normalfordelte, så er x 1 x 0 normalfordelt. 13.2 Konfidensinterval: Store stikprøver - kendt standardfejl Konfidensinterval baseret på normalfordelingen Hvis x 1 x 0 er normalfordelt med kendt standardfejl kan vi bruge den velkendte formel til at fastlægge et 95% konfidensinterval. Mere generelt estimat±1.96 standardfejl Antag at n 0 > 15 eller at kontrolpopulationen er normalfordelt. 33

Antag at n 1 > 15 eller at behandlingspopulationen er normalfordelt. σ0 Antag at σ 0 og σ 1 er kendte og beregn se = 2 n 0 + σ2 1 n 1. Lad z angive z-værdien svarende til den ønskede konfidensgrad. Fex z = 1.64 ved konfidensgrad 90%. Konfidensintervallet er da bestemt af grænserne ( x 1 x 0 ) ± z se 13.3 Konfidensinterval: Store stikprøver - ukendt standardfejl Konfidensinterval baseret på normalfordelingen Det typiske scenarie er at vi ikke kender populationernes standardafvigelse. I stedet estimeres disse ved stikprøvernes standardafvigelse. Dette giver anledning til følgende konstruktion. Antag at n 0 > 30 og n 1 > 30. Beregn stikprøvernes standardafvigelse - s 0 for gruppe0 og s 1 for gruppe1. s Beregn den estimerede standardfejl se = 2 0 n 0 + s2 1 n 1. Lad z angive z-værdien svarende til den ønskede konfidensgrad. Fex z = 2.58 ved konfidensgrad 99%. Konfidensintervallet er da bestemt af grænserne ( x 1 x 0 ) ± z se Eksempel: PeruLungeData Statistics Summaries,.. Other tables Compact tables... 34

Vi kan aflæse x 0 = 1.6288 og x 1 = 1.4792 n 0 = 491 og n 1 = 145 s 0 = 0.2873 og s 1 = 0.3325 Eksempel: PeruLungeData Vi kan nu beregne differensen d = x 1 x 0 = 1.4792 1.6288 = 0.1494 dvs gruppen med respiratoriske symptomer har en kapacitet som er ca 1.5 dl lavere end normalgruppen. Den estimerede standardfejl på forskellen estimeres via formlen s 2 0 se = + s2 1 0.083 = n 0 n 1 491 + 0.111 145 = 0.0306 Ved en konfidensgrad på 95% kan vi beregne intervallet d ± 1.96 se Dette giver nedre grænse -0.209376 og øvre grænse -0.089424 liter. Dvs vi vurderer at forskellen mellem populationernes middeltal ligger mellem 1 og 2 dl. 13.4 z-test for ingen effekt z-score for differens Lad os et øjeblik antage at µ 0 = µ 1, dvs ingen effekt af behandling/eksponering. Hvis vi har store stikprøver gælder da, at hvis µ 0 = µ 1, så er 35

stikprøvefordelingen af x 1 x 0 normal med middeltal nul Dvs når vi dividerer med standardfejlen har vi en størrelse som er standard normalfordelt. Dette leder frem til det såkaldte z-test, hvor vores test statistik er givet ved z = forskel på stikprøvernes middeltal standardfejlen på forskellen = x 1 x 0 se z-score for differens z = Ift standardfejlen har vi 2 scenarier: forskel på stikprøvernes middeltal standardfejlen på forskellen = x 1 x 0 se Kendt standardfejl hvor se = σ 2 0 n 0 + σ2 1 n 1 Tillige må vi antage normalfordelte delpopulationer eller stikprøvestørrelser over 15. Store stikprøver(n 0 > 30 og n 1 > 30) og ukendt standardfejl, som estimeres ved s 2 0 se = + s2 1 n 0 n 1 13.5 p-værdi Eksempel: PeruLungeData I det aktuelle eksempel har vi beregnet differensen Differens: d = 0.1494 og estimeret standardfejl: se = 0.0306 Vi kan således beregne den observere z-score z = d se = 0.1494 0.0306 = 4.88 HVIS µ 0 = µ 1, så er chancen for en z-score mellem ±1.96 lig med 95% og chancen for en z-score mellem ±3.29 lig med 99.9%, dvs chancen for en z-score udenfor grænserne ±3.29 er 0.1%. 36

Vi har mao en z-score, som ligger usandsynligt langt væk fra nul. En indikation på at noget er galt, nemlig antagelsen µ 0 = µ 1. p-værdi Lad z obs betegne den observerede z-værdi. Generelt vil vi definere den tosidede p-værdi, som chancen for at få en z-score, som ligger uden for intervallet bestemt af ±z obs. I nedenstående eksempel har vi beregnet z obs = 2.4. Da øvre og nedre halesandsynlighed er ens skal vi blot beregne en af disse og gange med 2. Den øvre halesandsynlighed kan findes i tabela1. Vi vender tilbage til p-værdier. 13.6 Konfidensinterval: Ens standardafvigelser Ens standardafvigelser I mange situationer er en rimelig antagelse at delpopulationerne har samme standardafvigelse σ, dvs σ 0 = σ 1 = σ hvilket giver standardfejlen på differensen 1 se = σ + 1 n 0 n 1 Hvis σ er ukendt estimeres denne ved en sammenvejning af s 0 og s 1 : (n 0 1)s 2 0 + (n 1 1)s 2 1 s = n 0 + n 1 2 som har df = n 0 + n 1 2 frihedsgrader. 37

Konfidensinterval - ens standardafvigelser Hvis stikprøverne er store bruger vi en z-score(typisk 1.96) til at konstruere konfidensintervallet. Hvis stikprøverne er små skal vi bruge t-score i stedet for z-score, hvorefter proceduren bliver 1. Vælg konfidensgrad. 2. bestem t-scoren t svarende til konfidensgrad og frihedsgradstallet df = n 0 + n 1 2. 3. Beregn den estimerede standardfejl 4. Konfidensintervallet har da grænser givet ved 1 se = s + 1 n 0 n 1 ( x 1 x 0 ) ± t se Eksempel 7.2 Konfidensgrad 95% svarer til tosidet p- værdi=0.05 og med df = 27 fås t = 2.05. 38

13.7 Uparret t-test (between subject design) t-test I analogi med z-testet kan vi udføre et t-test ved små stikprøvestørrelser. Under antagelse af ens standardafvigelser i delpopulationerne bliver den standardiserede score t = x 1 x 0 se = x 1 x 0 s 1 n 0 + 1 n 1 hvor s er det sammenvejede estimat for standardafvigelsen med frihedsgrader df = n 0 +n 1 2. Når t obs betegner den observerede t-værdi: Den tosidede p-værdi er chancen for at få en t-score, som ligger uden for intervallet bestemt af ±t obs. Vi forudsætter µ 0 = µ 1, hvilket betyder at sandsynligheden skal beregnes med reference til t- fordelingen med df frihedsgrader. Eksempel 7.2 I eksemplet med fødselsvægt for eksponeringsgrupperne mor er stor-ryger og mor er ikke-ryger har vi beregnet x 1 x 0 = 0.4524kg s = 0.4121kg hvilket giver t obs = x 1 x 0 = 1 s n 0 + 1 n 1 0.4524 0.4121 1 + 1 14 15 = 2.95 Eksempel 7.2 39

p-værdien er den samme for ±t obs, dvs vi behøver kun have tabel for postive t-værdier. Aktuelt skal vi altså vurdere t obs = 2.95 med df = 27. Med reference til tabela4 kan vi se at p-værdien må ligge mellem 0.6% og 0.7%, dvs t obs er en ekstremt afvigende forskel. Dette indikerer at µ 0 og µ 1 er forskellige - eller mere konkret: Data viser temmelig stærk evidens for at storrygere får børn med lavere fødselsvægt end ikkerygere. 13.8 Små stikprøver - forskellige standardafvigelser Forskellige standardafvigelser Vi skal ikke detaljeret behandle denne situation, men blot bemærke: Hvis delpopulationerne har samme variationskoefficient - dvs samme procentuelle afvigelse fra middeltallet - så kan vi med fordel lave en logaritmetransformation. Ofte vil det da være OK at antage ens standardafvigelser i de 2 delpopulationer, hvilket er standard i STATA. Hvis standardafvigelserne er forskellige laves ofte et såkaldt Welch-test. Test statistikken er den samme, som når stikprøverne er store, men i stedet for en normalfordeling approksimeres med en t-fordeling. I øvelserne skal I selv vha STATA prøve at udføre et Welch-test for storrygerdataene. 13.9 Parret t-test (within subject design) Par af målinger I mange sammenhænge måler vi på den samme person, fex vægten før og efter en slankekur, dvs vi har en gruppe af før -målinger og en gruppe af efter -målinger. Disse målinger er dog uinteressante, idet de centrale målinger er effektmåling=eftermåling minus førmåling Vi er således tilbage i situationen med 1 stikprøve af effektmålinger. Denne stikprøve analyseres som tidligere beskrevet ift bestemmelse af konfidensintervaller. Teststatistikker Givet stikprøve af effektmålinger med Estimeret middeltal x 40

Estimeret standardafvigelse s med (n 1) frihedsgrader. Hvis µ er populationens middeltal er vi interesseret i at teste H 0 : µ = 0. Teststatistik når n > 60: z = x se = x s/ n hvor p-værdien bestemmes vha standard normalfordelingen. Teststatistik når 15 n 60 eller populationen er normalfordelt: t = x se = x s/ n hvor p-værdien bestemmes vha t-fordelingen med (n 1) frihedsgrader. 13.10 Parret t-test i STATA Eksempel 7.3 Data vedrører effekt af sovemiddel. For 10 forsøgspersoner måles søvn i timer - dels med drug og del med placebo, hvilket også er navnet på de 2 variable, som for hver person angiver målingen. Statistics Summaries,.. Classical... t test(mean... 41

Eksempel 7.3 Vi kan aflæse en t-score på 1.4795, som har en tilhørende p-værdi på 17.31%. Dvs vi kan ikke påvise en signifikant forskel - selv om den estimerede forskel er 1 time. 14 Generelt om konfidensintervaller og p-værdier Hypotesebegrebet Vi skal primært beskæftige os med erkendelsesmæssige/videnskabelige hypoteser. I modsætning til kontrollerende hypoteser, hvor man fex i forbindelse med medicinproduktion vil undersøge om produktet opfylder givne myndigheds/produktions-krav. Vi skal især koncentrere os om, hvordan mennesker responderer på behandling/eksponering. Den gængse statistiske tilgang til denne problemstilling er at opstille en nulhypotese H 0 : behandling/eksponering har INGEN indflydelse på responsen. Statistik drejer sig i denne sammenhæng om, hvorvidt man kan fæste lid til nulhypotesen eller ej. Som illustreret i forbindelse med vores analyse af respons på 2 typer af behandling/eksponering. Konfidensinterval og teststatistik Nulhypoten kan som oftest formuleres som en hypotese om en populationsparameter. I eksemplet med 2 delpopulationer med middeltal µ 0 og µ 1 er vi interesseret i forskellen δ = µ 1 µ 0, hvor hypotesen H 0 : δ = 0 42

svarer til ingen behandlings/eksponeringseffekt. Vores analyse baserer sig på en stikprøve, hvor vi kan beregne et estimat for parameteren. Tillige kan vi beregne en standardfejl på estimatet. Med disse i hånden kan vi bestemme 95% konfidensinterval(store stikprøver): estimat ± 1.96 standardfejl Når nulhypotesen siger at parameteren er nul definerer vi test statistikken : estimat TestStatistik = standardfejl 14.1 Fortolkning af p-værdi p-værdi Teststatistikken måler antal standardfejl som estimatet afviger fra nul. Når vi har en observeret værdi z obs af teststatistikken beregner vi p-værdien(tosidet) som chancen for - når H 0 er sand - at få en teststatistik, som ligger uden for intervallet bestemt af ±z obs. fortolkning af p-værdi 43

En lille p-værdi indikerer et usandsynligt fund, hvis nulhypotesen er sand. Dvs jo mindre p-værdi, jo større evidens for at nulhypotesen er forkert. 14.2 En statistisk analyse Eksempel på analyse Vores 1. forsøg tester præparat A med 30 personer i både behandlingsgruppe og kontrolgruppe. Umiddelbart estimeres en kraftig effekt af behandling, da middeltallet i behandlingsgruppen ligger 40mg/deciliter under kontrolgruppens middeltal. 44

Der er dog stor variation, hvilket afspejles i en standardfejl på 40mg/deciliter, dvs vi ligger kun z obs = 40 = 1 standardafvigelse fra nul. 40 Så der er ikke evidens mod hypotesen om ingen effekt. Eksempel på analyse Den estimerede effekt i 1. forsøg ser dog lovende ud, så vi gentager eksperimentet, men nu med 3000 personer i både behandlingsgruppe og kontrolgruppe. Vi iagttager samme estimerede effekt på 40mg/deciliter. Når samplestørrelsen 100-dobles falder standardfejlen med en faktor 100 = 10, dvs se = 4mg/deciliter. Med z obs = 40 4 = 10 er der nu særdeles kraftig evidens mod hypotesen om ingen effekt. Konfidensintervallet viser, at vi kan forvente en effekt over 30mg/deciliter. Eksempel på analyse Et andet præparat B testes i 3. forsøg med 40 personer i hver gruppe. Der estimeres en rimelig effekt af behandling, da middeltallet i behandlingsgruppen ligger 20mg/deciliter under kontrolgruppens middeltal. 45

Der er dog stor variation, hvilket afspejles i en standardfejl på 33mg/deciliter, dvs vi ligger kun z obs = 20 = 0.6 standardafvigelse fra nul. 33 Så der er ikke evidens mod hypotesen om ingen effekt. Eksempel på analyse Den estimerede effekt i 3. forsøg ser lovende ud, så vi gentager eksperimentet, men nu med 4000 personer i både behandlingsgruppe og kontrolgruppe. Vi iagttager nu en estimeret effekt på 2mg/deciliter, som er klinisk uinteressant. Når samplestørrelsen 100-dobles falder standardfejlen med en faktor 100 = 10, dvs se = 3.3mg/deciliter. Med z obs = 2 3.3 = 0.6: Ikke evidens mod hypotesen om ingen effekt. Vi konkluderer at præparat B på ingen måde er et alternativ til A. Eksempel på analyse Sidste eksperiment tester præparat C med 5000 personer i hver gruppe. Vi iagttager en estimeret effekt på 5mg/deciliter, som er klinisk uinteressant. Med en standardfejl på se = 2mg/deciliter fås z obs = 5 2 1.2%. = 2.5, hvilket giver en p-værdi på 46

p-værdien fortæller at der er en forventelig effekt af præparat C. Men 95% konfidensintervallet indikerer at effekten ligger mellem 1.1 og 8.9mg/deciliter. Dette er klinisk set en meget svag effekt, og da C samtidig er dyrt vil det næppe være et alternativ til A. 15 Sandsynlighed(risiko) 15.1 Sandsynlighedsbegrebet Eksempel: Aktuelt eksperiment John Kerrich, a South African mathematician, was visiting Copenhagen when World War II broke out. Two days before he was scheduled to fly to England, the Germans invaded Denmark. Kerrich spent the rest of the war interned at a camp in Jutland and to pass the time he carried out a series of experiments in probability theory. In one, he tossed a coin 10,000 times. His results are shown in the graph. (The horizontal axis is on a log scale). Frekvensfortolkning Kerrichs eksperiment illustrerer den såkaldt frekventistiske tilgang til sandsynlighedsbegrebet. Lad A repræsentere en hændelse, som kan observeres i forbindelse med et eksperiment. Fex A= Kerrich slår krone. 47

Vi gentager eksperimentet nogle gange og kan beregne relativ frekvens af A = Vi definerer så sandsynligheden for A: antal gange vi ser A antal eksperimenter P rob(a)=relativ frekvens af A, når antal eksperimenter er mega stort 15.2 Betinget sandsynlighed Sandsynlighed givet en hændelse Betragt ovenstående krydstabel fra sundby. Relativ frekvens af Meget god: Rf(Meget god) = 760 2648 = 28.7% Relativ frekvens af Meget god givet der er tale om en kvinde: antal Meget god og kvinde Rf(Meget god givet kvinde) = = 405 antal kvinder 1448 = 28.0% Vi betinger med hændelsen kvinde, dvs vi indskrænker os til delpopulationen af kvinder og beregner den relative frekvens. Betinget sandsynlighed Generelt hvis A og B er 2 hændelser, som kan indtræffe i et gentaget eksperiment - fex svarer A til køn=kvinde og B til helbred=meget god - så er den relative frekvens af B givet A Rf(B givet A) = antal gange vi ser A og B antal gange vi ser A 48

Når antal eksperimenter er mega stort, så oversættes dette til den betingede sandsynlighed af B givet A: P rob(a og B) P rob(b givet A) = P rob(a) En simpel omskrivning giver så også kaldet produktreglen. 15.3 Uafhængighed af hændelser Uafhængighed af hændelser Antag at der vores population gælder at P rob(a og B) = P rob(a) P rob(b givet A) P rob(meget god givet kvinde) = P rob(meget god) Dvs sandsynligheden for Helbred=Meget god afhænger ikke af om vi har informationen køn=kvinde. Eller ækvivalent: Kvinder og mænd har samme sandsynlighed for Helbred=Meget god. Vi siger at hændelserne A og B er uafhængige hvis P rob(b givet A) = P rob(b) Indsættes dette i produktreglen fås den alternative formulering af uafhængighed: P rob(a og B) = P rob(a) P rob(b) 15.4 Bayes regel Bayes regel Anvendes produktreglen for B givet A og A givet B ses at P rob(a og B) = P rob(a) P rob(b givet A) = P rob(b) P rob(a givet B) hvilket betyder at vi kan udlede Bayes regel P rob(b givet A) = Eksempel: Yngre piger i Indien Antag at vi kender følgende sandsynligheder: P rob(a givet B) P rob(b) P rob(a) 49

Prob(fejlernæring)=0.1 Prob(anæmi)=0.05 Prob(fejlernæring givet anæmi)=0.5 Vi kan så beregne - hvad der ofte kaldes posterior sandsynligheden: Prob(anæmi givet fejlernæring)= Prob(anæmi) Prob(fejlernæring givet anæmi) Prob(fejlernæring) = 0.05 0.5 0.1 = 0.25 Den såkaldte prior sandsynlighed Prob(anæmi) er lig med 5%. Når sundhedspersonalet vurderer at pigen er fejlernæret, så ændres sandsynligheden til Prob(anæmi givet fejlernæring), som er 25%. Et vigtigt hjælpemiddel i diagnostistik. 16 Frekvenser: Binomialfordelingen 16.1 Estimation af risiko Antalstællinger af dikotom variabel Vi skal studere et eksperiment, hvor målingen er dikotom(binær), dvs der er 2 mulige udfald. Vi vil kode de 2 mulige udfald med D: Som kunne betyde syg(desased) H: Som kunne betyde rask(healthy) Vi indsamler nu en stikprøve af størrelse n, hvor vi optæller d: Antal individer, som viser status lig med D. h: Antal individer, som viser status lig med H. Vi er interesseret i Prob(status=D): Andel af populationen, som har status lig med D. Denne såkaldte risiko estimeres naturligt ved stikprøvens andel p = d n Populationens andel vil vi betegne med det græske bogstav π(pi), dvs p er et estimat for π. 50

16.2 Binomialfordelingen Eksempel Et ægtepar er bærere af en arvelig sygdom, hvor de begge har genotype AS, hvor A er et normalt gen og S er et sygdomsgen. Chancen for at de videregiver sygdomsgenet til et barn er 0.5. Hvis begge videregiver S til barnet,så vil barnet være sygt, dvs type D. Da forældrene videregiver uafhængigt af hinanden siger produktreglen: π = P rob(d) = 0.5 0.5 = 0.25 Forældrene får 4 børn. Hvad er sandsynlighederne for henholdsvis 0,1,2,3,4 syge børn? d=0 syge: Chancen for rask er hver gang 0.75. Da hændelserne er uafhængige siger produktreglen: P rob(d = 0) = 0.75 0.75 0.75 0.75 = 0.75 4 = 0.3164 Eksempel d=1 syg: 1. barn syg og de 3 sidste raske giver sandsynligheden 0.25 0.75 3. Da der er 4 muligheder for hvilket barn, der er sygt får vi P rob(d = 1) = 4 0.25 0.75 3 = 0.4219 d=2 syge: 1. og 2. barn syg og de 2 sidste raske giver sandsynligheden 0.25 2 0.75 2. Der er 6 forskellige muligheder for hvilke 2 børn der er syge, dvs P rob(d = 3) = 4 0.25 3 0.75 = 0.0469 P rob(d = 4) = 0.25 4 = 0.0039 P rob(d = 2) = 6 0.25 2 0.75 2 = 0.2109 Binomialfordelingen Notation: Hvis m er et ikke negativt helt tal, så defineres m! er produktet af tallene fra 1 til m. Per konvention er 0! = 1. 51

π m er tallet π ganget med sig selv m gange. Per konvention er π 0 = 1. Eksempelvis er 5! = 5 4 3 2 1 = 120. Binomialforsøg: Vi tager en stikprøve af størrelse n og optæller d=antal gange vi ser hændelsen D, hvor P rob(d) = π. Da gælder P rob(d hændelser) = Dette kaldes Binomialfordelingen, som har middeltal nπ standardfejl nπ(1 π) n! d! (n d)! πd (1 π) n d 16.3 Normalapproksimation af binomialfordelingen Normalapproksimation Hvis nπ 10 n(1 π) 10 så kan binomialfordelingen approksimeres med en normalfordeling, som har middeltal: nπ standardfejl: nπ(1 π) 52

16.4 Konfidensinterval for andel - normalapproksimation Konfidensinterval Estimatet for π er som sagt stikprøvens andel p = d n som har estimeret standardfejl p(1 p) se = n HVIS np 10 og n(1 p) 10 kan vi bruge normalapproksimation til fastlæggelse af konfidensinterval: Vælg konfidensgrad. Bestem den tilhørende z-score z, fex z = 1.96 ved 95%. Grænserne i konfidensintervallet: p ± z p(1 p) Eksempel I sundby er der d=106 ud af n=2681 respondenter, som oplyser, at de ingenting gør for at bevare deres helbred. Dette giver en estimeret andel på p = 106 = 4%. 2681 Estimatet for standardfejl: p(1 p) 0.04(1 0.04) se = = = 0.4% n 2681 Et 95% konfidensinterval har så grænser p ± z se = 4 ± 1.96 0.4% svarende til intervallet fra 3.2% til 4.8%. 16.5 Hypotese om specifik værdi af andel Hypotesetest Vi skal teste hypotesen H 0 : π = π 0 n 53

hvor π 0 er en kendt andel. Eksempelvis hvis π er chancen for en pigefødsel kunne vi teste om π = 0.5. HVIS nπ 0 10 og n(1 π 0 ) 10 kan vi bruge normalapproksimation, dvs vi beregner z-scoren z = p π 0 se se = π 0 (1 π 0 ) n p-værdien kan nu bestemmes på sædvanlig vis - fex vha TableA1. Eksempel Florida Poll spurgte i 2006 1200 tilfældige borgere i Florida om de foretrak skatteforhøjelser eller et reduceret offentligt serviceniveau. 52% gik ind for skatteforhøjelser. Der er tilsyneladende flertal for skatteforhøjelser. Men kan dette blot skyldes samplingvariation? Hvis π er populationsandelen som går ind for skatteforhøjelser vil vi teste π = 0.5, dvs π 0 = 0.5. π se = 0 (1 π 0 ) 0.5 0.5 = = 0.0144 n 1200 z = p π 0 se = 0.52 0.5 0.0144 = 1.39 I TableA1 svarer 1.39 til en øvre halesandsynlighed på 8.23%, dvs den tosidede p-værdi er 16.46%. Vi kan mao ikke afvise nulhypotesen om at holdningen er fifty-fifty. 17 Sammenligning af 2 andele Sammenligning af delpopulationer Vi skal igen kigge på 2 delpopulationer, som har været udsat for forskellige behandlinger/eksponering. Notation: n 0 er stikprøvestørrelsen i gruppe0. d 0 er antallet af gange vi ser responsen D i gruppe0, og p 0 = d 0 n 0 π 0 er andelen i delpopulation 0. n 1 er stikprøvestørrelsen i gruppe1. d 1 er antallet af gange vi ser responsen D i gruppe1, og p 1 = d 1 n 1 π 1 er andelen i delpopulation 1. 54 er den estimerede andel. er den estimerede andel.

p 0 = 80 220 = 36.4% p 1 = 20 240 = 8.3% 17.1 Test for ingen effekt - normalapproksimation Hypotesetest Vi vil undersøge om der er en effekt af behandling, hvilket gøres ved at teste nulhypotesen H 0 : π 0 = π 1 eller ækvivalent at π 1 π 0 = 0. En naturlig test statistik er den estimerede forskel i risiko p 1 p 0. Når vi skal vurdere om denne er tæt på nul, så skal vi have fat i standardfejlen for at kunne beregne en z-score. Hvis H 0 er sand og π er de identiske andele i delpopulationerne, så kan det vises at standardfejlen er se(p 1 p 0 ) = π(1 π)( 1 n 0 + 1 n 1 ) Vi kender ikke π, men den estimeres naturligt ved risikoen i den totale stikprøve p = d 0 + d 1 n 0 + n 1 Hypotesetest Vi er nu i stand til at beregne den standardiserede score p 1 p 0 z = p(1 p)( 1 n 0 + 1 n 1 ) HVIS n 0 p, n 0 (1 p), n 1 p, n 1 (1 p) alle er større end eller lig med 10, så kan vi anvende en normalfordelingsapproksimation. I vores eksempel: p = d 0+d 1 n 0 +n 1 = 80+20 = 21.7%. 220+240 Hvorefter 0.083 0.346 z = = 7.3 0.217(1 0.217)( 1 + 1 ) 220 240 p-værdien er stort set nul, dvs vi kan klart afvise nulhypotesen. 55

17.2 Konfidensinterval for effekt Konfidensinterval Når vi forkaster nulhypotesen, så er p 1 p 0 et estimeret mål for behandlingseffekten. Dette bør altid suppleres med et konfidensinterval, hvilket kræver at vi kender standardfejlen. Det kan vises at den estimerede standardfejl er se(p 1 p 0 ) = se(p 0 ) 2 + se(p 1 ) 2, hvor se(p 0 ) 2 = p 0(1 p 0 ) n 0 og se(p 1 ) 2 = p 1(1 p 1 ) n 1. HVIS n 0 p 0, n 0 (1 p 0 ), n 1 p 1, n 1 (1 p 1 ) alle er større end eller lig med 10, så kan vi bruge normalapproksimation til fastlæggelse af konfidensinterval: Vælg konfidensgrad og bestem den tilhørende z-score z. Grænserne i konfidensintervallet: (p 1 p 0 ) ± z se(p 1 p 0 ) Eksempel se(p 0 ) 2 = 0.364(1 0.364) 220 = 0.0011 se(p 1 ) 2 = 0.083(1 0.083) 240 = 0.0003 se(p 1 p 0 ) = 0.0011 + 0.0010 = 3.7% Et 95% konfidensinterval har så grænser 28.1% ± 1.96 3.7% svarende til intervallet fra -35.3% til -20.8%. Vi kan med stor sikkerhed sige at vaccinen giver et fald i risikoen, som overstiger 20%. 56