Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Størrelse: px
Starte visningen fra side:

Download "Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher"

Transkript

1 Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark Efterår 2017 DTU Compute Introduktion til Statistik Efterår / 55

2 Kapitel 7: Inferens for andele Statistik for andele: Andel: p = x n (x successer ud af n observationer) Specifikke metoder, én, to og k > 2 grupper Binær/kategorisk respons Specifikke metoder: Estimation og konfidensintervaller for andele Metoder til store stikprøver vs. til små stikprøver Hypoteser for én andel (p) Hypoteser for to andele Analyse af antalstabeller (χ 2 -test) (Alle forventede antal > 5) DTU Compute Introduktion til Statistik Efterår / 55

3 Chapter 7: Inferences for Proportions Statistics for proportions: Proportion: p = x n (x successes out of n observations) Specific methods: one, two and k > 2 samples: Binary/categorical response Specific methods: Estimation and confidence interval of proportions: Large sample vs. small sample methods Hypotheses for one proportion Hypotheses for two proportions Analysis of contingency tables (χ 2 -test) (All expected > 5) DTU Compute Introduktion til Statistik Efterår / 55

4 Oversigt 1 Intro 2 Konfidensinterval for én andel Eksempel 1 Bestemmelse af stikprøvestørrelse 3 Hypotesetest for én andel Eksempel 1 - fortsat 4 Konfidensinterval og hypotesetest for to andele Eksempel 2 5 Hypotesetest for flere andele Eksempel 2 - fortsat 6 Analyse af antalstabeller DTU Compute Introduktion til Statistik Efterår / 55

5 Intro Forskellige analyse/data-situationer Gennemsnit for kvantitative data: Hypotesetest/KI for én middelværdi (one-sample, i.e. one group/population) Hypotesetest/KI for to middelværdier (two-sample, i.e. two groups/populations) Hypotesetest/KI for flere middelværdier (k-sample, i.e. k groups/populations) I dag: Andele: Hypotesetest/KI for én andel Hypotesetest/KI for to andele Hypotesetest for flere andele Hypotesetest for flere multi-categorical andele DTU Compute Introduktion til Statistik Efterår / 55

6 Intro Estimation af andele Estimation af andele fås ved at observere antal gange x en hændelse har indtruffet ud af n forsøg: ˆp = x n ˆp [0;1] DTU Compute Introduktion til Statistik Efterår / 55

7 Intro Spørgsmål om andel (socrative.com, ROOM: pbac) Hvilken kan ikke en være en andel? A: 103/900 B: 12/80 C: D: 202/154 E: DTU Compute Introduktion til Statistik Efterår / 55

8 Konfidensinterval for én andel Konfidensinterval for én andel Method 7.3 Såfremt der haves en stor stikprøve, fås et (1 α)% konfidensinterval for p ] [ˆp [ˆp ] ˆp(1 ˆp) ˆp(1 ˆp) z1 α/2 ˆσˆp, ˆp + z 1 α/2 ˆσˆp z 1 α/2, ˆp + z n 1 α/2 n (Vi siger: Med stor sikkerhed vælger vi at tro at p i dette interval) Hvordan? Følger af at approximere binomialfordelingen med normalfordelingen As a rule of thumb The normal distribution gives a good approximation of the binomial distrinution if np and n(1 p) are both greater than 15 DTU Compute Introduktion til Statistik Efterår / 55

9 Konfidensinterval for én andel Konfidensinterval for én andel Middelværdi og varians i binomialfordelingen, kapitel 2: E(X) = np Var(X) = np(1 p) Derfor får man ( ) X E(ˆp) = E n ( X Var(ˆp) = σ 2ˆp = Var n = np n = p ) = 1 p(1 p) Var(X) = n2 n DTU Compute Introduktion til Statistik Efterår / 55

10 Konfidensinterval for én andel Eksempel 1 Eksempel 1 Venstrehåndede: p = Andelen af venstrehåndede i Danmark eller: Kvindelige ingeniørstuderende: p = Andelen af kvindelige ingeniørstuderende DTU Compute Introduktion til Statistik Efterår / 55

11 Konfidensinterval for én andel Eksempel 1 Eksempel 1 Venstrehåndede (x = 10 ud af n = 100): ˆp(1 ˆp) 10/100(1 10/100) ˆσˆp = = = 0.03 n ± ± [0.041,0.159] Bedre small sample metode - plus 2-approach (Remark 7.7): Anvend samme formel på x = = 12 og ñ = 104: p(1 p) 12/104(1 12/104) = = ñ ± ± [0.054,0.177] DTU Compute Introduktion til Statistik Efterår / 55

12 Konfidensinterval for én andel Eksempel 1 Spørgsmål om konfidensinterval fejl (socrative.com, ROOM: pbac) Mulig fejl ved konfidensinterval er, at den rigtige værdi ikke er inkluderet i intervallet. Hvor ofte vil man begå en denne fejl ved α = 5%? A: 95% af gangene B: 1% af gangene C: 5% af gangene D: 50% af gangene E: Ved ikke DTU Compute Introduktion til Statistik Efterår / 55

13 Konfidensinterval for én andel Bestemmelse af stikprøvestørrelse Stikprøvestørrelse: Margin of Error (ME): Margin of Error på estimat kan siges at være: Forventningsværdi af halvdelen af konfidensintervallets bredde Den forskel i middelværdi man gerne vil være i stand til at påvise Under H 0 : Forventningsværdi af afstanden mellem middelværdien og det kritiske niveau Margin of Error med (1 α)% konfidens bliver hvor et estimat af p fås ved p = x n ME = z 1 α/2 p(1 p) n DTU Compute Introduktion til Statistik Efterår / 55

14 Konfidensinterval for én andel Bestemmelse af stikprøvestørrelse Spørgsmål om Margin of Error (socrative.com, ROOM: pbac) Hvad er Margin of Error (ME) hvis man vil have et konfidensinterval med bredde på 0.2? A: 0.1 B: C: 0.2 D: 0.4 E: Ved ikke DTU Compute Introduktion til Statistik Efterår / 55

15 Konfidensinterval for én andel Bestemmelse af stikprøvestørrelse Spørgsmål om forskel i middel (socrative.com, ROOM: pbac) Hvad er Margin of Error (ME) hvis man vil være i stand til at påvise forskel i middelværdi på 0.2? A: 0.1 B: C: 0.2 D: 0.4 E: Ved ikke DTU Compute Introduktion til Statistik Efterår / 55

16 Konfidensinterval for én andel Bestemmelse af stikprøvestørrelse Bestemmelse af stikprøvestørrelse Method 7.13 Såfremt man højst vil tillade en Margin of Error (ME) med (1 α)% konfidens, bestemmes den nødvendige stikprøvestørrelse ved Method 7.13 n = p(1 p) [ z1 α/2 ] 2 Såfremt man højst vil tillade en Margin of Error ME med (1 α)% konfidens, og p ikke kendes, bestemmes den nødvendige stikprøvestørrelse ved n = 1 4 ME [ z1 α/2 ] 2 idet man får den mest konservative stikprøvestørrelse ved at vælge p = 1 2 ME DTU Compute Introduktion til Statistik Efterår / 55

17 Konfidensinterval for én andel Bestemmelse af stikprøvestørrelse Eksempel 1 - fortsat Venstrehåndede: Antag vi ønsker ME = 0.01 (med α = 0.05) - hvad skal n være? Antag p 0.10: n = ( ) = UDEN antagelse om størrelsen af p: n = 1 ( ) = DTU Compute Introduktion til Statistik Efterår / 55

18 Konfidensinterval for én andel Bestemmelse af stikprøvestørrelse Spørgsmål om stikprøvestørrelse (socrative.com, ROOM: pbac) Ved test af hvilken af følgende nulhypoteser skal bruges den største stikprøvestørrelse (n) ved samme α konfidens? A: H 0 : p = 0.2 B: H 0 : p = 0.1 C: H 0 : p = 0.4 D: H 0 : p = 0.95 E: Ved ikke DTU Compute Introduktion til Statistik Efterår / 55

19 Konfidensinterval for én andel Bestemmelse af stikprøvestørrelse Spørgsmål om stikprøvestørrelse (socrative.com, ROOM: pbac) Kan I nu beregne hvor mange gange man skal slå med en terning for at teste om den har sandsynlighed 1/6 indenfor 0.01 for at slå en sekser? A: Ja B: Nej C: Ved ikke ## Andel (sandsynlighed) vi vil teste for p <- 1/6 ## Signifikansniveau ## (hvor ofte vil vi lave denne fejl: Terningen er fair, men ## vi konkluderer den ikke er fair) alpha < ## Fejlmargen vi vil tillade ME < ## Beregn antal gange vi skal slå med terningen p * (1-p) * (qnorm(1-alpha/2)/me)^2 ## [1] 5335 DTU Compute Introduktion til Statistik Efterår / 55

20 Hypotesetest for én andel Trin ved Hypotesetest Trin ved Hypotesetest: 1. Opstil hypoteser og vælg signifikansniveau α 2. Beregn teststørrelse 3. Beregn p-værdi (eller kritisk værdi) 4. Fortolk p-værdi og/eller sammenlign p-værdi og signifikansniveau, og derefter drag en konklusion (Alternativ 4. Sammenlign teststørrelse og kritisk værdi og drag en konklusion) DTU Compute Introduktion til Statistik Efterår / 55

21 Hypotesetest for én andel Hypotesetest for én andel Vi betragter en nul- og alternativ hypotese for én andel p: H 0 : p = p 0 H 1 : p p 0 Man vælger som sædvanligt enten at acceptere H 0 eller at forkaste H 0 Theorem 7.10 og Method 7.11 Såfremt stikprøven er tilstrækkelig stor (np 0 > 15 og n(1 p 0 ) > 15) bruges teststørrelsen: z obs = x np 0 np0 (1 p 0 ) Under nulhypotesen gælder at den tilsvarende tilfældige variabel Z følger en standard normalfordeling, dvs. Z N(0,1 2 ) DTU Compute Introduktion til Statistik Efterår / 55

22 Hypotesetest for én andel Test ved brug af p-værdi (Method 7.11) Find p-værdien (bevis mod nulhypotesen): We only use two-sided: 2P(Z > z obs ) in exercises and exams Remark 7.9 om one-sided less og greater Kritiske værdier Alternativ hypotese p p 0 Afvis nulhypotese hvis z obs < z 1 α/2 eller z obs > z 1 α/2 DTU Compute Introduktion til Statistik Efterår / 55

23 Hypotesetest for én andel Eksempel 1 - fortsat Eksempel 1 - fortsat Er halvdelen af alle danskere venstrehåndede? H 0 : p = 0.5, H 1 : p 0.5 Teststørrelse: z obs = x np 0 np0 (1 p 0 ) = = (1 0.5) Er p-værdien under 0.05? (dvs. skal nulhypotesen forkastes ved α = 0.05) A: Ja B: Nej C: Ved ikke DTU Compute Introduktion til Statistik Efterår / 55

24 Hypotesetest for én andel Eksempel 1 - fortsat R: prop.test - een andel ## Single proportion ## Testing the probability = 0.5 with a two-sided alternative ## We have observed 518 out of 1154 ## Without continuity corrections prop.test(x=518, n=1154, p = 0.5, correct = FALSE) DTU Compute Introduktion til Statistik Efterår / 55

25 Konfidensinterval og hypotesetest for to andele Konfidensinterval for to andele Method 7.15 hvor ˆσˆp1 ˆp 2 = (ˆp 1 ˆp 2 ) ± z 1 α/2 ˆσˆp1 ˆp 2 ˆp 1 (1 ˆp 1 ) n 1 + ˆp 2(1 ˆp 2 ) n 2 Rule of thumb: Både n i p i 10 and n i (1 p i ) 10 for i = 1,2 DTU Compute Introduktion til Statistik Efterår / 55

26 Konfidensinterval og hypotesetest for to andele Hypotesetest for to andele, Method 7.18 Two sample proportions hypothesis test Såfremt man ønsker at sammenligne to andele (her vist for et tosidet alternativ) H 0 : p 1 = p 2 H 1 : p 1 p 2 Fås teststørrelsen: z obs = ˆp 1 ˆp 2, hvor ˆp = x 1 + x 2 ˆp(1 ˆp)( n n 1 2 ) n 1 + n 2 Og for passende store stikprøver: Brug standardnormalfordelingen igen DTU Compute Introduktion til Statistik Efterår / 55

27 Konfidensinterval og hypotesetest for to andele Eksempel 2 Eksempel 2 Sammenhæng mellem brug af p-piller og risikoen for blodprob i hjertet (hjerteinfarkt) I et studie (USA, 1975) undersøgte man dette. Fra et hospital havde man indsamlet følgende to stikprøver p-piller Ikke p-piller Blodprob Ikke blodprob Er der sammenhæng mellem brug af p-piller og sygdomsrisiko Udfør et test for om der er sammenhæng mellem brug af p-piller og risiko for blodprob i hjertet. Anvend signifikansniveau α = 5%. DTU Compute Introduktion til Statistik Efterår / 55

28 Konfidensinterval og hypotesetest for to andele Eksempel 2 Eksempel 2 Sammenhæng mellem brug af p-piller og risikoen for blodprob i hjertet p-piller Ikke p-piller Sum Blodprob x 1 = 23 x 2 = 35 x = 58 Ikke blodprob Sum n 1 = 57 n 2 = 167 n = 224 Estimater i hver stikprøve ˆp 1 = = , ˆp 2 = = DTU Compute Introduktion til Statistik Efterår / 55

29 Konfidensinterval og hypotesetest for to andele Eksempel 2 R: prop.test - to andele ## Pill study: two proportions ## Reading the table into R pill.study <- matrix(c(23, 34, 35, 132), ncol = 2) rownames(pill.study) <- c("blood Clot", "No Clot") colnames(pill.study) <- c("pill", "No pill") ## Testing that the probabilities for the two groups are equal prop.test(t(pill.study), correct = FALSE) DTU Compute Introduktion til Statistik Efterår / 55

30 Hypotesetest for flere andele Hypotesetest for flere andele Sammenligning af c andele I nogle tilfælde kan man være interesseret i at vurdere om to eller flere binomialfordlinger har den samme parameter p, dvs. man er interesseret i at teste nulhypotesen H 0 : p 1 = p 2 =... = p c = p mod en alternativ hypotese at disse andele ikke er ens DTU Compute Introduktion til Statistik Efterår / 55

31 Hypotesetest for flere andele Hypotesetest for flere andele Tabel af observerede antal for c stikprøver: stikprøve 1 stikprøve 2... stikprøve c Total Succes x 1 x 2... x c x Fiasko n 1 x 1 n 2 x 2... n c x c n x Total n 1 n 2... n c n Fælles (gennemsnitlig) estimat: Under nulhypotesen fås et estimat for p ˆp = x n DTU Compute Introduktion til Statistik Efterår / 55

32 Hypotesetest for flere andele Hypotesetest for flere andele Fælles (gennemsnitlig) estimat: Under nulhypotesen fås et estimat for p ˆp = x n Brug dette fælles estimat i hver gruppe: såfremt nulhypotesen gælder, vil vi forvente at den j te gruppe har e 1j successer og e 2j fiaskoer, hvor e 1j = n j ˆp = n j x n e 2j = n j (1 ˆp) = n j n x n DTU Compute Introduktion til Statistik Efterår / 55

33 Hypotesetest for flere andele Hypotesetest for flere andele Generel formel for beregning af forventede værdier i antalstabeller: e ij = (j th column total) (i th row total) (total) DTU Compute Introduktion til Statistik Efterår / 55

34 Hypotesetest for flere andele Beregning af teststørrelse - Method 7.20 Teststørrelsen bliver χobs 2 = 2 c i=1 j=1 (o ij e ij ) 2 hvor o ij er observeret antal i celle (i,j) og e ij er forventet antal i celle (i,j) e ij DTU Compute Introduktion til Statistik Efterår / 55

35 Hypotesetest for flere andele Find p-værdi eller brug kritisk værdi - Method 7.20 Stikprøvefordeling for test-størrelse: χ 2 -fordeling med (c 1) frihedsgrader Kritisk værdi metode Såfremt χobs 2 > χ2 1 α (c 1) forkastes nulhypotesen Rule of thumb for validity of the test: Alle forventede værdier e ij 5 DTU Compute Introduktion til Statistik Efterår / 55

36 Hypotesetest for flere andele Eksempel 2 - fortsat Eksempel 2 - fortsat De OBSERVEREDE værdier o ij p-piller Ikke p-piller Total Blodprob Ikke blodprob DTU Compute Introduktion til Statistik Efterår / 55

37 Hypotesetest for flere andele Eksempel 2 - fortsat Eksempel 2 - fortsat Beregn de FORVENTEDE værdier e ij (altså forventede under H 0 ) p-piller Ikke p-piller Total Blodprob x = 58 Ikke blodprob n 1 = 57 n 2 = 167 n = 224 DTU Compute Introduktion til Statistik Efterår / 55

38 Hypotesetest for flere andele Eksempel 2 - fortsat Eksempel 2 - fortsat Beregn de FORVENTEDE værdier e ij (altså forventede under H 0 ) p-piller Ikke p-piller Total Blodprob x = 58 Ikke blodprob n 1 = 57 n 2 = 167 n = 224 Brug reglen for forventede værdier fire gange, f.eks. : e 12 = = DTU Compute Introduktion til Statistik Efterår / 55

39 Hypotesetest for flere andele Eksempel 2 - fortsat Eksempel 2 - fortsat Teststørrelsen: χ 2 obs = (o 11 e 11 ) 2 e 11 + (o 12 e 12 ) 2 e 12 + (o 21 e 21 ) 2 e 21 + (o 22 e 22 ) 2 = χobs 2 ( )2 = = 8.33 Kritisk værdi og p-værdi: ( ) ( ) e 22 ( ) ## Kritisk værdi qchisq(0.95, 1) ## [1] 3.8 ## p-værdi 1 - pchisq(8.33, df=1) ## [1] Konklusion: Vi forkaster hulhypotesen - der ER en signifikant forhøjet sygdomsrisiko i p-pille DTU Compute Introduktion til Statistik Efterår / 55

40 Hypotesetest for flere andele Eksempel 2 - fortsat R: chisq.test - to andele ## Pill study: two proportions, chi-square test ## Chi2 test for testing the probabilities for the two groups are equal chisq.test(pill.study, correct = FALSE) ## If we want the expected numbers save the test in an object chi <- chisq.test(pill.study, correct = FALSE) ## The expected values chi$expected DTU Compute Introduktion til Statistik Efterår / 55

41 Analyse af antalstabeller Antalstabeller Antalstabel Flere end 2 kategorier (f.eks. fire.: rød, grøn, blå, sort) Beregningerne er ens for begge følgende setups To mulige setups Setup 1: c stikprøver med r kategorier: Test om der er forskel i fordelingen mellem kategorierne for hver stikprøve Setup 2: To kategoriske variabel (r kategorier) målt på samme individer (parret setup): Test om der er forskel i fordelingen mellem de to grupper DTU Compute Introduktion til Statistik Efterår / 55

42 Analyse af antalstabeller Setup 1: c stikprøver med r kategorier En 3 3 tabel - 3 stikprøver, 3-kategori udfald 4 uger før 2 uger før 1 uge før Kandidat I Kandidat II ved ikke n 1 = 200 n 2 = 200 n 3 = 200 Er stemmefordelingen ens? H 0 : p i1 = p i2 = p i3,i = 1,2,3 DTU Compute Introduktion til Statistik Efterår / 55

43 Analyse af antalstabeller Setup 2: To kategoriske variabel (r kategorier) målt på samme individer (parret setup) En 3 3 tabel - 1 stikprøve, to stk. 3-kategori variable: dårlig middel god dårlig middel god Er der uafhængighed mellem inddelingskriterier? H 0 : p ij = p i p j f.eks. er der sammenhæng mellem den måde elever klarer sig i matematik som i dansk? DTU Compute Introduktion til Statistik Efterår / 55

44 Analyse af antalstabeller Beregning af teststørrelse uanset type af tabel I en antalstable med r rækker og c søjler, fås teststørrelsen χ 2 obs = r c i=1 j=1 (o ij e ij ) 2 hvor o ij er observeret antal i celle (i,j) og e ij er forventet antal i celle (i,j) e ij Generel formel for beregning af forventede værdier i antalstabeller: e ij = (j th column total) (i th row total) (total) DTU Compute Introduktion til Statistik Efterår / 55

45 Analyse af antalstabeller Spørgsmål (socrative.com, ROOM: pbac) En 3 4 tabel - 4 stikprøver, 3-kategori udfald Gruppe A Gruppe B Gruppe C Gruppe D n j Han Hun Tvekøn n i Hvad er e 23? (H 0 forventning af hunner i gruppe C) A: 10 10/40 B: 3 C: 10 13/40 D: 17 4/40 E: Ved ikke DTU Compute Introduktion til Statistik Efterår / 55

46 Analyse af antalstabeller Find p-værdi eller brug kritisk værdi Method 7.22 Stikprøvefordeling for test-størrelse: χ 2 -fordeling med (r 1)(c 1) frihedsgrader Kritisk værdi metode Såfremt χobs 2 > χ2 1 α med (r 1)(c 1) frihedsgrader forkastes nulhypotesen Rule of thumb for validity of the test: Alle forventede værdier e ij 5 DTU Compute Introduktion til Statistik Efterår / 55

47 Analyse af antalstabeller R: chisq.test - antalstabeller ## Poll study: contingency table, chi-square test ## Reading the table into r poll <-matrix(c(79, 91, 93, 84, 66, 60, 37, 43, 47), ncol = 3, byrow = TRUE) colnames(poll) <- c("4 weeks", "2 weeks", "1 week") rownames(poll) <- c("cand1", "Cand2", "Undecided") ## Column percentages colpercent <- prop.table(poll, 2) colpercent DTU Compute Introduktion til Statistik Efterår / 55

48 Analyse af antalstabeller R: chisq.test - antalstabeller barplot(t(colpercent), beside = TRUE, col = 2:4, las = 1, ylab = "Percent each week", xlab = "Candidate", main = "Distribution of Votes") legend( legend = colnames(poll), fill = 2:4,"topright", cex = 0.5) par(mar=c(5,4,4,2)+0.1) Distribution of Votes Percent each week Cand1 Cand2 Undecided Candidate 4 weeks 2 weeks 1 week DTU Compute Introduktion til Statistik Efterår / 55

49 Analyse af antalstabeller R: chisq.test - antalstabeller ## Testing same distribution in the three populations chi <- chisq.test(poll, correct = FALSE) chi ## Expected values chi$expected DTU Compute Introduktion til Statistik Efterår / 55

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Itroducerede Statistik Forelæsig 12: Iferes for adele Klaus K. Aderse og Per Bruu Brockhoff DTU Compute, Statistik og Dataaalyse Damarks Tekiske Uiversitet 2800 Lygby Damark e-mail:

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Repetition Goodness of Fit Uafhængighed i Kontingenstabeller Chi-i-anden Test Chi-i-anden test omhandler data, der har form af antal eller frekvenser. Antag, at n observationer kan inddeles

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Hypotesetests, fejltyper og p-værdier

Hypotesetests, fejltyper og p-værdier Hypotesetests, fejltyper og p-værdier Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet October 25, 2018 Søren Højsgaard Institut for Matematiske Fag, Aalborg Hypotesetests, Universitet

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Afdeling for Anvendt Matematik og Statistik December 2006

Afdeling for Anvendt Matematik og Statistik December 2006 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 i SAS (Zar kapitel 23) PROC FREQ PROC CATMOD

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Estimation og konfidensintervaller

Estimation og konfidensintervaller Statistik og Sandsynlighedsregning STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Estimation og konfidensintervaller Antag X Bin(n,

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Susanne Ditlevsen Institut for Matematiske Fag susanne

Susanne Ditlevsen Institut for Matematiske Fag    susanne Statistik og Sandsynlighedsregning 1 STAT kapitel 4.4 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne 7. undervisningsuge, mandag 1 Estimation og konfidensintervaller

Læs mere

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 10: Statistik ved hjælp af simulering Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

c) For, er, hvorefter. Forklar.

c) For, er, hvorefter. Forklar. 1 af 13 MATEMATIK B hhx Udskriv siden FACITLISTE TIL KAPITEL 7 ØVELSER ØVELSE 1 c) ØVELSE 2 og. Forklar. c) For, er, hvorefter. Forklar. ØVELSE 3 c) ØVELSE 4 90 % konfidensinterval: 99 % konfidensinterval:

Læs mere

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Binomialfordelingen. X ~ bin(n,p): X = antal succeser i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):

Læs mere

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Kapitel 8 Chi-i-anden (χ 2 ) prøven Kapitel 8 Chi-i-anden (χ 2 ) prøven Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 19 Indledning Forskelle mellem stikprøver undersøges med z-test eller t-test for data målt på

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen Kursus 02402/02323 Introducerende Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Oversigt 1 Intro: Regneeksempel og TV-data fra B&O 2 Model og hypotese Per Bruun Brockhoff DTU Compute, Statistik

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012 Kapitel 4 Statistik & sandsynlighedsregning 2016 MATEMATIK A-NIVEAU Vejledende eksempler på eksamensopgaver

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Besvarelser til øvelsesopgaver i uge 6

Besvarelser til øvelsesopgaver i uge 6 Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere