PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Størrelse: px
Starte visningen fra side:

Download "PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006"

Transkript

1 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie supplement og blodtryk hos gravide kvinder Test af ens middelværdier i to stikprøver fra en normalfordeling Test af ens varianser i to stikprøver fra en normalfordeling Modelkontrol Formulering af konklusioner Eksempel 7.2: Fødselsvægt af børn født af storrygere og ikke-rygere Ikke-parametriske metoder Styrke og beregning af stikprøvestørrelse PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-1

2 Eksempel: Fiskeolie supplement og blodtryk hos gravide kvinder Videnskabeligt spørgsmål: Har et supplement af fiskeolie en indflydelse på det diastoliske blodtryk hos gravide kvinder? Design: 430 gravide kvinder blev tilfældigt tildelt en af to behandlinger, Kontrol og Fiskeolie (del af et studium udført af Sjudur Olsen). Data: Det diastoliske blodtryk i uge 37 minus det diastoliske blodtryk i uge 30. Kontrol (Gruppe 1, n 1 = 213, her er de første 20 observationer): Fiskeolie (Gruppe 2, n 2 = 217, her er de første 20 observationer): PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-2

3 Fiskeolie supplement og blodtryk hos gravide kvinder: Formulering af problemet Reformulering af spørgsmålet: Er den forventede forskel i diastolisk blodtryk den samme i de to populationer af gravide kvinder? Stikprøvestørrelser, gennemsnit, varianser, standardafvigelser og medianer er Gruppe Behandling n i x i s 2 i s i Median 1 Kontrol Fiskeolie Fiskeolie Kontrol Gruppe Forskel i diastolisk blodtryk PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-3

4 Fiskeolie supplement og blodtryk hos gravide kvinder: Statistisk model Statistisk model: Observationerne i hver gruppe opfattes som en tilfældig stikprøve fra en normalfordelt population. x 1i N(µ 1, σ 2 1) x 2i N(µ 2, σ 2 2) i = 1, 2,...,n 1 eller n 2 uafhængige Tæthed Tæthed Kontrol Fiskeolie PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-4

5 Test af ens middelværdier i to stikprøver fra en normalfordeling Spørgsmål af interesse: Er den forventede forskel i diastolisk blodtryk (db37 - db30) den samme i de to populationer af gravide kvinder? Formulering af spørgsmålet i form af en hypotese om parameterne i den statistiske model: H 0 : µ 1 = µ 2 I det følgende antager vi at σ1 2 = σ2 2 = σ 2. Et estimat for den fælles varians (i de to stikprøver) er ˆσ 2 = s 2 = (n 1 1) s (n 2 1) s 2 2 n 1 + n 2 2 (213 1) (217 1) = Den estimerede fælles standardafvigelse er = s = = 7.96 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-5

6 Fiskeolie supplement og blodtryk hos gravide kvinder: Test af ens middelværdier De forventede forskelle i diastolisk blodtryk i de to grupper bliver estimeret ved ˆµ 1 = x 1 = 1.90 ˆµ 2 = x 2 = 2.19 Den estimerede forskel mellem grupperne er ˆδ = ˆµ 1 ˆµ 2 = x 1 x 2 = 0.29 Beregn t-teststørrelsen t = ˆδ s.e.(ˆδ) = x 1 x 2 = 1 s n n = 0.38 Hvis hypotesen er sand vil t følge en t-fordeling med n 1 + n 2 2 = = 428 frihedsgrader. p-værdien (sandsynligheden for at observere noget mindst lige så ekstremt) er givet ved p = P(t 0.38) + P(t 0.38) = % PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-6

7 Fiskeolie supplement og blodtryk hos gravide kvinder: p-værdi og konklusioner Illustration af hvordan man bestemmer p-værdien: t(428) tæthed observeret værdi Konklusion: Tilfældig variation vil give noget mindst lige så ekstremt, som vi faktisk har observeret, i 7 ud af 10 tilsvarende studier. Konklusionen er derfor at der ikke er meget evidens mod formodningen om at den forventede forskel i diastolisk blodtryk er den samme i de to grupper af gravide kvinder. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-7

8 Konfidensinterval for forskellen mellem de to grupper Et 95%-konfidensinterval for forskellen µ 1 µ 2 er givet ved (ˆδ ± t s.e.(ˆδ)): ( x 1 x 2 ) t s 1 n n 2 < µ 1 µ 2 < ( x 1 x 2 ) + t s 1 n n 2 hvor t er 97.5-percentilen i en t-fordeling med n 1 + n 2 2 frihedsgrader. Her får vi eller 1.80 < µ 1 µ 2 < < µ 1 µ 2 < Læg mærke til at 95%-konfidensintervallet for µ 1 µ 2 indeholder værdien 0 i overensstemmelse med det faktum at vi ikke kunne forkaste hypotesen om at µ 1 og µ 2 er ens. Konklusion: Data er i overensstemmelse med en forskel mellem de to grupper på mellem 1.22 i favør af kontrol-gruppen og 1.80 i favør af fiskeolie-gruppen. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-8

9 Test af ens varianser i to stikprøver fra en normalfordeling Da vi testede ens middelværdier antog vi at varianserne var ens (σ 2 1 = σ 2 2 ). Vi kan teste rimeligheden af denne antagelse ved at betragte hypotesen H 0 : σ 2 1 = σ 2 2 Beregn F -teststørrelsen F = Største variansestimat Mindste variansestimat Under hypotesen om ens varianser kan man vise at F har en F -fordeling med (n 1 1, n 2 1) frihedsgrader hvis s 2 1 > s 2 2 (og ellers (n 2 1, n 1 1) frihedsgrader). Her har vi s 2 1 = < = s 2 2, således at F = s2 2 s 2 1 = = F(216, 212) PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-9

10 Fiskeolie supplement og blodtryk hos gravide kvinder: Test af ens varianser p-værdien kan bestemmes ud fra F -fordelingen p = P(F 1 ) + P(F ) = 2 P(F ) = % F(216, 212) tæthed observeret værdi observeret værdi Konklusion: Vi accepterer (kan ikke forkaste) hypotesen om ens variation i de to populationer af gravide kvinder. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-10

11 Test af ens middelværdier: Hvad hvis vi ikke havde haft ens varianser? Antag at vi ikke havde accepteret at σ 2 1 = σ 2 2. Nogle mulige fremgangsmåder: 1. Prøv at stabilisere variansen ved at betragte en passende transformation af data (for eksempel logaritmen til forskellen i diastolisk blodtryk). 2. Benyt et approksimativt t-test: Beregn t approks = x 1 x 2 s 2 1 n 1 + s2 2 n 2 Hvis middelværdierne i populationerne er ens, så er t approks approksimativt t-fordelt med f frihedsgrader, hvor f = [ c 2 n (1 c)2 n Brug et ikke-parametrisk test (se senere i dag). ] 1, c = s 2 1/n 1 s 2 1 /n 1 + s 2 2 /n 2 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-11

12 Test af ens middelværdier: Approksimativt t-test I vores eksempel får vi t approks = = og således at f = c = 56.68/ / /217 = [ ( ) ] 1 = p-værdien bliver p = 2 P(t ) = % i overensstemmelse med det faktum at variationerne i de to grupper er ganske lig hinanden. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-12

13 Modelkontrol: Vurdering af hvorvidt antagelserne bag den statistiske model er rimelige Vi har antaget følgende: 1. De to grupper af observationer er uafhængige 2. I hver gruppe er observationerne uafhængige og har samme middelværdi og samme varians 3. Observationerne svarende til begge populationer er normalfordelte Vurdering af rimeligheden af antagelserne: 1. De to grupper af observationer er uafhængige? Overvej altid om vigtig information er udeladt af analysen. 2. I hver gruppe: Uafhængige observationer fra den samme population? 3. Populationerne kan beskrives ved normalfordelinger? Dette kan vurderes ud fra Q-Q plots PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-13

14 Fiskeolie supplement og blodtryk hos gravide kvinder: Q-Q plots Q-Q plot for hver behandlingsgruppe: Kontrol Fiskeolie Forskel i diastolisk blodtryk Forskel i diastolisk blodtryk Percentiler fra normalfordelingen Percentiler fra normalfordelingen Ingen grund til at tvivle på tilstrækkeligheden af modellen, til beskrivelse af data, ud fra disse tegninger. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-14

15 Fiskeolie supplement og blodtryk hos gravide kvinder: En stikprøve Vi har accepteret at der ikke er nogen forskel mellem de to populationer af gravide kvinder (ingen signifikant effekt af behandlingen med fiskeolie). Dette betyder at vi kan beskrive data som en stikprøve fra en normalfordeling (med middelværdi µ og varians σ 2 ) x 1 1,...,x 1 213, x 2 1,...,x N(µ, σ 2 ), uafhængige Dette er kun relevant hvis man er interesseret i niveauet (ændringen i det diastoliske blodtryk fra uge 30 til 37), hvilket ikke var det, som man oprindeligt ville undersøge. Den overordnede middelværdi µ bliver estimeret ved ˆµ = x = x 1 + x 2 2 = = 2.05 Et 95%-konfidensinterval for µ er givet ved 2.05 t < µ < t , ( eller 1.29 < µ < 2.80) PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-15

16 Fiskeolie supplement og blodtryk hos gravide kvinder: Konklusioner (1) Den statistiske analyse og konklusionerne kunne præsenteres på følgende måde: Resultaterne af den statistiske analyse: Data blev analyseret som to stikprøver fra en normalfordeling. Hypotesen om samme forskel i diastolisk blodtryk hos gravide kvinder, som får et supplement af fiskeolie til deres diæt, som hos gravide kvinder, der får en kontroldiæt, kunne ikke forkastes (p = 0.70). Et estimat for forskellen mellem de to grupper er, sammen med et 95%-konfidensinterval, givet ved 0.29 ( 1.80, 1.22). Et overordnet estimat for den forventede forskel i diastolisk blodtryk (uge 37 - uge 30) er, med et 95%-konfidensinterval, givet ved 2.05 (1.29, 2.80). Konklusioner: 1. Vi konkluderer at der er meget lidt evidens i denne undersøgelse mod hypotesen om at et supplement med fiskeolie til diæten ingen effekt har på forskellen i diastolisk blodtryk hos gravide kvinder mellem uge 37 og uge 30. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-16

17 Fiskeolie supplement og blodtryk hos gravide kvinder: Konklusioner (2) Konklusioner: 2. Et 95%-konfidensinterval for forskellen mellem de to forventede værdier viser os at data er i overensstemmelse med alt fra en forskel som er 1.22 større i kontrol-gruppen til en forskel som er 1.80 større i fiskeolie-gruppen %-konfidensintervallet for middelværdien (baseret på begge grupper) varierer fra en forøgelse på 1.29 til en på 2.80 for forskellen i diastolisk blodtryk for gravide kvinder mellem uge 30 og uge 37. Det følger at der er en rimelig klar indikation af en forøgelse i det diastoliske blodtryk fra uge 30 til uge 37. Hvorvidt denne (lille men klare) forøgelse er af medicinsk relevans skal vurderes af medicinske eksperter. 4. Denne undersøgelse bidrager med meget begrænset information om det videnskabelige spørgsmål (sammenhængen mellem fiskeolie og diastolisk blodtryk hos gravide kvinder). PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-17

18 Eksempel 7.2: Fødselsvægt af børn født af storrygere og ikke-rygere Spørgsmål: Har moderens rygevaner nogen indflydelse på barnets fødselsvægt? Design: Fødselsvægten (kg) af børn født af 14 storrygere og af 15 ikke-rygere blev opgjort. Storrygere Ikke-rygere Reformulering af spørgsmålet: Er den forventede fødselsvægt af børn født af storrygere den samme som for børn født af ikke-rygere? PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-18

19 Fødselsvægt og rygning: Inspektion af data Stikprøvestørrelser, gennemsnit, varianser og standardafvigelser er Gruppe Behandling n i x i s 2 i s i 1 Storrygere Ikke-rygere Ikke ryger Storryger Fødselsvægt (kg) Gruppe PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-19

20 Fødselsvægt og rygning: Test af ens middelværdier og ens varianser Varians (H 0 : σ 2 1 = σ 2 2 ): F = s2 1 s 2 2 = = 1.67 F(13, 14) hvilket giver en p-værdi på 0.35 og vi kan ikke forkaste hypotesen om at variationen i de to grupper er den samme. Det fælles variansestimat er: s 2 = (14 1) (15 1) = , (s = ) Middelværdi (H 0 : µ 1 = µ 2 ): t = ˆµ 1 ˆµ 2 s.e.(ˆµ 1 ˆµ 2 ) = = 2.95 t(27) hvilket giver en p-værdi på Vi konkluderer at der er klar evidens mod hypotesen om at fødselsvægten er den samme i de to grupper. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-20

21 Fødselsvægt og rygning: Konfidensinterval for forskellen Et 95%-konfidensinterval for forskellen µ 1 µ 2 er (ˆµ 1 ˆµ 2 ± t s.e.(ˆµ 1 ˆµ 2 )): ( ) ( ) eller 0.77 < µ 1 µ 2 < < µ 1 µ 2 < Vi konkluderer, med en sikkerhed på 95%, at storrygning resulterer i en fødselsvægt som er mellem 0.14 kg og 0.77 kg mindre end hvad man ser blandt børn født af ikke-rygere. Gyldigheden af denne konklusion hænger på antagelsen om at den eneste substantielle forskel mellem de to grupper er deres rygevaner (samme alder, sundhedstilstand og så videre). Hvorvidt en forskel så lille som 0.14 kg er af medicinsk relevans skal vurderes af medicinske eksperter i den sammenhæng som førte til undersøgelsen. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-21

22 Fødselsvægt og rygning: Modelkontrol Storrygere: Tæthed Fødselsvægt (kg) Ikke-rygere: Fødselsvægt (kg) Percentiler fra normalfordelingen Tæthed Fødselsvægt (kg) Fødselsvægt (kg) Percentiler fra normalfordelingen PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-22

23 Ikke-parametriske metoder: Wilcoxon rank sum test Indtil videre har vi kun betragtet statistiske analyser baseret på en parametrisk statistisk model (normalfordelingen beskrevet ved en middelværdi- og en variansparameter). Er der nogle alternativer hvis nu data ikke beskrives tilstrækkelig godt af normalfordelingen og ingen transformation af data hjælper (tænk på gruppen af storrygere i Eksempel 7.2)? Antag at vi har observationer svarende til to grupper: Gruppe 1 : Gruppe 2 : x 1, x 2,...,x n1 y 1, y 2,...,y n2 Wilcoxon rank sum test er designet til at teste hvorvidt fordelingerne af observationerne i de to grupper er de samme eller de er rykket i forhold til hinanden. Teststørrelse: T = summen af rangene i gruppen med det mindste antal observationer PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-23

24 Ikke-parametriske metoder: Range Betragt dette lille konstruerede eksempel: & 2 Rang Rang 2 Rang Normalt lader vi en statistisk programpakke (for eksempel Stata) udregne teststørrelser baseret på range. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-24

25 Fødselsvægt og rygning: Wilcoxon rank sum test I dette eksempel får vi (gruppen med færrest observationer er storrygere): T = For store værdier af n 1 and n 2 (normalt siger vi n 1 + n 2 30, hvilket næsten er tilfældet her) har vi under hypotesen om samme position af fordelingerne, at der approksimativt gælder Z = T E T VarT N(0, 1) Her får vi Z = = svarende til en p-værdi på p = 2 P(Z < 2.597) = = Konklusionerne er uændrede ved en analyse af data ved hjælp af ikke-parametriske metoder. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-25

26 Generelle kommentarer til Wilcoxon rank sum test Der er en række forhold man skal være opmærksom på: Læg mærke til at en analyse baseret på ikke-parametriske metoder ikke er uden antagelser. Vi antager stadigvæk at observationerne er uafhængige og har den samme fordeling (indenfor grupperne). Testet er konstrueret til at opfange en forskydning i fordelingerne i de to grupper og ikke, for eksempel, forskellig variation. Focus er primært på test og ikke så meget på at kvantificere eventuelle forskelle, når det drejer sig om ikke-parametriske metoder. De fleste statistikprogrammer er ikke i stand til at give et estimat for forskydningen af to fordelinger i forhold til hinanden. Et ækvivalent test (som giver den samme p-værdi) er det såkaldte Mann-Whitney test. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-26

27 Styrke og beregning af stikprøvestørrelse Udsagn af denne type støder man ofte på i ansøgninger: Med en stikprøvestørrelse på 85 vil vi være i stand til at finde en forskel på 1 mellem behandlingsgruppen og kontrolgruppen baseret på en antaget standardafvigelse på 2, et signifikansniveau på 0.05 og en styrke på 0.9. Hvad mener man med sådan et udsagn og hvordan når man frem til sådan en konklusion? Statistisk model: To stikprøver fra normalfordelinger (med samme varians). x 1i N(µ 1, σ 2 ) x 2i N(µ 2, σ 2 ) i = 1, 2,...,n uafhængige Vi er interesseret i hypotesen om ingen forskel mellem de to grupper H 0 : µ 1 = µ 2 (eller µ 1 µ 2 = 0) PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-27

28 Signifikansniveau og styrke Husk at signifikansniveauet (typisk betegnet α) er sandsynligheden for at forkaste en sand hypotese α = P(forkaste H 0 : µ 1 µ 2 = 0 når der faktisk gælder at µ 1 µ 2 er lig 0) hvilket også kaldes risikoen for at lave en Type 1 fejl, og som typisk sættes til Styrken af et statistisk test defineres som sandsynligheden for at forkaste en falsk hypotese styrke = P(forkaste H 0 : µ 1 µ 2 = 0 når der faktisk gælder at µ 1 µ 2 er lig δ) = 1 β hvor β refereres til som risikoen for at lave en Type 2 fejl (acceptere en falsk hypotese). Læg mærke til at Styrken afhænger af hvad forskellen faktisk er (δ) Typiske værdier af styrken er 0.8 og 0.9 (hvilket medfører at β typisk er 0.1 eller 0.2) PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-28

29 Signifikansniveau og styrke: Analogi til et diagnostisk test Det er muligt at få en forståelse af forholdet mellem signifikansniveau og styrke ved at tænke på sensitivitet og specificitet af et diagnostisk test. Se Tabel 35.3 i Kirkwood & Sterne (2003). Virkeligheden Test Sand hypotese Falsk hypotese Forkast α 1 β = styrke Accepter 1 α β Hvis man laver analogien til et diagnostisk test, så sensitivitet = 1 α specificitet = styrke PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-29

30 Beregning af styrke Betragt teststørrelsen t = x 1 x 2 s 2 n Vi forkaster hypotesen når t-teststørrelsen enten er meget lille eller meget stor t < t eller t > t hvor t er 97.5-percentilen i en t-fordeling med 2n 2 frihedsgrader. Styrken er derfor styrke = P(t < t eller t > t når µ 1 µ 2 er lig med δ) Man har brug for en et statistikprogram for at beregne denne sandsynlighed. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-30

31 Styrkekurver (1) Styrkekurver (α = 0.05 og σ = 2): Styrke Stikprøvestørrelse i hver gruppe δ = 0.75 δ = 1.00 δ = 1.25 δ = 1.50 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-31

32 Styrkekurver (2) Styrkekurver (α = 0.05 og σ = 3): Styrke δ = 0.75 δ = 1.00 δ = 1.25 δ = Stikprøvestørrelse i hver gruppe PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-32

33 Beregning af stikprøvestørrelse Størrelserne i den ligning, som styrken beregnes ud fra, kan flyttes rundt på således at man får et bud på hvilken stikprøvestørrelse der skal til for at opnå en vis styrke. Vi har fem størrelser i spil her: δ = µ 1 µ 2 Behandlingseffekten som vurderes vigtig at idetificere σ = Standardafvigelsen i hver gruppe α = Signifikansniveauet (risikoen for en type 1 fejl) β = En minus styrken (risikoen for en type 2 fejl) n = Antallet af forsøgsenheder i hver gruppe Ved at angive værdier for fire af disse kan et bud på den femte bestemmes. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-33

34 En simpel beregning af stikprøvestørrelsen Hvis n ikke er meget lille kan man benytte følgende simple formel: n = (z 1 α/2 + z 1 β ) 2 2 ( σ δ ) 2 hvor z 1 α/2 og z 1 β er henholdsvis (1 α/2) og (1 β)-percentilerne i standard normalfordelingen. For eksempel, for α = 0.05, har vi at (z 1 α/2 + z 1 β ) 2 er lig med Styrke PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-34

35 Et eksempel på en simpel beregning af stikprøvestørrelsen Antag at vi vil undersøge en ny behandling. Fra tidligere studier ved vi at standardafvigelsen er omkring 2, og vi vil gerne være i stand til at finde en eventuel forskel på 1 på et 5% niveau med en styrke på 90%. Med andre ord har vi at δ = 1 σ = 2 α = 0.05 β = 0.10 Vi får dermed følgende stikprøvestørrelse (i hver af de to behandlingsgrupper): En eksakt beregning giver n = n = = 84 PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-35

36 Kommentarer til beregningen af stikprøvestørrelser Der er en række forhold man skal være opmærksom på i denne forbindelse: Beregning af stikprøvestørrelser kan baseres på andre kriterier end det at opnå en bestemt styrke. Undertiden, for eksempel, vælges n således at et konfidensinterval for en behandlingseffekt ikke overstiger en vis bredde. Parameteren δ svarer til det som vi gerne vil kunne finde. Den refereres ofte til som den mindste relevante forskel. Læg mærke til at man skal have en ide om variationen indenfor behandlingsgrupperne (σ). Sådan et estimat kan for eksempel komme fra tidligere studier eller fra litteraturen. Lav ALDRIG post-hoc styrkeberegninger. Når man har opgjort en undersøgelse, så er et konfidensinterval for effektparameteren den mest naturlige måde at udtrykke præcisionen (eller den manglende præcision) af en undersøgelse på. PhD-kursus i Basal Biostatistik Afdelingen for Biostatistik Side 2-36

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Konfidensinterval for µ (σ kendt)

Konfidensinterval for µ (σ kendt) Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians)

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19 Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud

Læs mere

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau ypotese test Repetition fra sidst ypoteser Test af middelværdi Test af andel Test af varians Type 1 og type fejl Signifikansniveau Konfidens intervaller Et konfidens interval er et interval, der estimerer

Læs mere

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min

4. september 2003. π B = Lungefunktions data fra tirsdags Gennemsnit l/min Epidemiologi og biostatistik Uge, torsdag 28. august 2003 Morten Frydenberg, Institut for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (udfra

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

En intro til radiologisk statistik

En intro til radiologisk statistik En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Modul 5: Test for én stikprøve

Modul 5: Test for én stikprøve Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen.................................

Læs mere

Seniorkursus i Biostatistik og Stata, Dag 2

Seniorkursus i Biostatistik og Stata, Dag 2 SENIORKURSUS STATA OG BIOSTATISTIK Aarhus Universitet juni DAGENS TEMA: SAMMENLIGNINGER FORMIDDAG: KONTINUERTE DATA EFTERMIDDAG: KATEGORISKE DATA STATISTISK ANALYSE AF TO UAFHÆNGIGE STIKPRØVER FRA NORMALFORDELTE

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X. Opgave I I en undersøgelse af et potentielt antibiotikum har man dyrket en kultur af en bestemt mikroorganisme og tilført prøver af organismen til 20 prøverør med et vækstmedium og samtidig har man tilført

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Statistik i basketball

Statistik i basketball En note til opgaveskrivning jerome@falconbasket.dk 4. marts 200 Indledning I Falcon og andre klubber er der en del gymnasieelever, der på et tidspunkt i løbet af deres gymnasietid skal skrive en større

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

c) For, er, hvorefter. Forklar.

c) For, er, hvorefter. Forklar. 1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne

Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Statistik og Sandsynlighedsregning 1 Indledning til statistik, kap 2 i STAT Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 5. undervisningsuge, onsdag

Læs mere

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre

Læs mere

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl? Module 6: Exercises 6.1 To laboranter....................... 2 6.2 Nicotamid i piller..................... 3 6.3 Karakterer......................... 5 6.4 Blodtryk hos kvinder................... 6 6.5

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Modul 12: Exercises. 12.1 Sukkersygepatienters vægt

Modul 12: Exercises. 12.1 Sukkersygepatienters vægt Modul 12: Exercises 12.1 Sukkersygepatienters vægt............... 1 12.2 Newfoundlandske kvinders blodtryk.......... 4 12.3 Korrelationskoefficient.................. 6 12.4 Højde og vægt......................

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Hypoteser: kap: 10.1-10.2 Eksempler på Maximum likelihood analyser kap 9.10 Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1 Estimationsmetoder Kvantitative

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

SENIORKURSUS STATA OG BIOSTATISTIK

SENIORKURSUS STATA OG BIOSTATISTIK SENIORKURSUS STATA OG BIOSTATISTIK Aarhus Universitet juni 011 Genopfriskning af statistik Basale tankegange og begreber (i dag) Sammenligninger (i morgen) Sammenhænge (i overmorgen) Brug af programpakken

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning Introduktion Kasper K. Berthelsen, Inst f. Matematiske Fag Omfang: 8 Kursusgang I fremtiden

Læs mere

En intro til radiologisk statistik. Erik Morre Pedersen

En intro til radiologisk statistik. Erik Morre Pedersen En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Statistik kommandoer i Stata opdateret 22/ Erik Parner Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1 ! ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1 Eksempel 1 TEST AF MIDDELVÆRDI FRA ÉN STIKPRØVE (ukendt varians) En producent af tyggegummi påstår at en pakke tyggegummi i gennemsnit vejer

Læs mere

Besvarelse af opgavesættet ved Reeksamen forår 2008

Besvarelse af opgavesættet ved Reeksamen forår 2008 Besvarelse af opgavesættet ved Reeksamen forår 2008 10. marts 2008 1. Angiv formål med undersøgelsen. Beskriv kort hvordan cases og kontroller er udvalgt. Vurder om kontrolgruppen i det aktuelle studie

Læs mere

Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger

Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger Analyse af bivirkninger på besætningsniveau efter vaccination med inaktiveret BlueTongue Virus (BTV) serotype 8 i danske malkekvægsbesætninger Af Karen Helle Sloth og Flemming Skjøth, AgroTech Sammendrag

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Matematik B. Højere handelseksamen

Matematik B. Højere handelseksamen Matematik B Højere handelseksamen hhx122-mat/b-17082012 Fredag den 17. august 2012 kl. 9.00-13.00 Prøven består af to delprøver. Delprøven uden hjælpemidler består af opgave 1 til 5 med i alt 5 spørgsmål.

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Valgkampens og valgets matematik

Valgkampens og valgets matematik Ungdommens Naturvidenskabelige Forening: Valgkampens og valgets matematik Rune Stubager, ph.d., lektor, Institut for Statskundskab, Aarhus Universitet Disposition Meningsmålinger Hvorfor kan vi stole på

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Note om Monte Carlo eksperimenter

Note om Monte Carlo eksperimenter Note om Monte Carlo eksperimenter Mette Ejrnæs og Hans Christian Kongsted Økonomisk Institut, Københavns Universitet 9. september 003 Denne note er skrevet til kurset Økonometri på. årsprøve af polit-studiet.

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

9. Chi-i-anden test, case-control data, logistisk regression.

9. Chi-i-anden test, case-control data, logistisk regression. Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/?? Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Maple 11 - Chi-i-anden test

Maple 11 - Chi-i-anden test Maple 11 - Chi-i-anden test Erik Vestergaard 2014 Indledning I dette dokument skal vi se hvordan Maple kan bruges til at løse opgaver indenfor χ 2 tests: χ 2 - Goodness of fit test samt χ 2 -uafhængighedstest.

Læs mere

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Ensidet variansanalyse

Ensidet variansanalyse Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18 Program I dag: Sammenligning af middelværdier Sammenligning af spredninger

Læs mere

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1 Mikro-kursus i statistik 2. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er hypotesetestning? I sundhedsvidenskab:! Hypotesetestning = Test af nulhypotesen Hypotese-testning anvendes til at vurdere,

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler:

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Kapitel 3 Centraltendens og spredning

Kapitel 3 Centraltendens og spredning Kapitel 3 Centraltendens og spredning Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 25 Indledning I kapitel 2 omsatte vi de rå data til en tabel, der bedre viste materialets fordeling

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Mathematical Statistics ST06: Linear Models Bent Jørgensen og Pia Larsen Module 2: Mere om variansanalyse 2. Parreded observationer................................ 2.2 Faktor med 2 niveauer (0- variabel)........................

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1 Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 1. juni 2005 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af (navn)

Læs mere