Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr)

Størrelse: px
Starte visningen fra side:

Download "Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr)"

Transkript

1 Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 16. august 2015 Kursus navn og nr: Introduktion til Statistik (02323, og 02593) Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 9 opgaver. Besvarelserne af multiple choice spørgsmålene anføres i det i CampusNet uploadede svarark, med numrene på de svarmuligheder, du mener er de korrekte. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. KUN følgende 5 svarmuligheder er gyldige: 1, 2, 3, 4 eller 5. Hvis et spørgsmål efterlades blankt eller andet type svar angives tæller det ikke med i besvarelsen. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde og online-aflevere svararket via CampusNet. Skemaet her er KUN et nød-alternativ til dette. Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 IV.2 IV.3 IV.4 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Opgave IV.5 V.1 V.2 V.3 V.4 V.5 VI.1 VI.2 VI.3 VI.4 Spørgsmål (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar Opgave VI.5 VII.1 VII.2 VII.3 VII.4 VIII.1 VIII.2 VIII.3 IX.1 IX.2 Spørgsmål (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar Husk at angive dit studienummer på din besvarelse. Sættets sidste side er nr. 26; blad lige om og se, at den er der. Fortsæt på side 2 1

2 Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I Et teglværk producerer mursten og deres længde X i kan antages normalfordelt med middellængde 228 mm og standardafvigelse 4 mm. Spørgsmål I.1 (1) Teglværket vil nu give en 95% garanti for den enkelte murstens faktiske længde, X. Hvilket af følgende udsagn er korrekt? 1 Sandsynligheden for at 221 mm < X < 235 mm er ca 95% 2 Sandsynligheden for at 197 mm < X < 259 mm er ca 95% 3 Sandsynligheden for at 220 mm < X < 236 mm er ca 95% 4 Sandsynligheden for at 224 mm < X < 232 mm er ca 95% 5 Sandsynligheden for at 217 mm < X < 231 mm er ca 95% Spørgsmål I.2 (2) I teglværket udtages en tilfældig stikprøve på 50 sten og gennemsnittet af længderne beregnes ved 50 X = 1 50 i=1 X i Hvad er sandsynligheden for at gennemsnittet af længderne, X, ligger indenfor intervallet mm? Fortsæt på side 3 2

3 Opgave II I mange statistiske undersøgelser benytter man binomialfordelingen til at beskrive den tilfældige variation. Spørgsmål II.1 (3) For hvilken af følgende 5 stokastiske variable kunne binomialfordelingen være velegnet til beskrivelse af den tilfældige variation? 1 Antal studerende ud af et hold på 30, der i løbet af en sommer bliver stukket af en bi. 2 Samlet antal øjne ved kast med 3 terninger. 3 Indhold af sukker i gram i en flaske sodavand. 4 Indhold af sukker i gram i 6 flasker sodavand. 5 Antal punkteringer for en cykel i løbet af et år. Spørgsmål II.2 (4) Antag at man har to uafhængige i.i.d. binomialfordelte stokastisk variabler X i B(n, p) og man definerer en ny stokastisk variabel Y = X1 2 X 2 Man vil da ved simulering bestemme sandsynligheden for at få et udfald af Y over 50 for n = 100 trækninger og p = 0.02 for success. Til det har man kørt følgende R kode ## Sæt parametre n <- 100 p < ## Antal simuleringer k < ## Simuler x1 <- rbinom(k, size=n, prob=p) x2 <- rbinom(k, size=n, prob=p) y <- x1^2 * x2 Hvilken af følgende R koder beregner da korrekt en approksimation til P (Y > 50)? 1 quantile(y, 0.5) 3

4 2 mean(y < 50) 3 quantile(y, 0.5) / k 4 sum(y < 50) / k 5 sum(y > 50) / k Fortsæt på side 5 4

5 Opgave III For at holde øje med kvaliteten i en produktion af brødristere udtages en stikprøve på 14 brødristere, hvor det undersøges, om de lever op til firmaets specifikationer. Man forventer, at 92% af brødristerne lever op til specifikationerne. Hvis der er mere end 1 brødrister i stikprøven, som ikke lever op til specifikationerne, skal hele dagens produktion gås efter. Spørgsmål III.1 (5) Hvad er sandsynligheden for, at man har taget en stikprøve, der medfører at hele dagens produktion skal testes, selvom 92% af brødristerne lever op til specifikationerne? 1 1 (e ( ) + ( ) e ( ) ) = (( ) 14 0 (0.08) 0 (0.92) 14 + ( ) 14 1 (0.08) 1 (0.92) 13) = π exp( ( )2 2 ) = ( ) 14 0 (0.08) 0 (0.92) 14 + ( ) 14 1 (0.08) 1 (0.92) 13 = (0.08) 1 (0.92) 13 = Spørgsmål III.2 (6) Hvis det kun er 75% af brødristerne, som lever op til specifikationen, hvilken R kode beregner da sandsynligheden for at dagens produktion alligevel ikke gås efter? 1 pbinom(0.75, 14, 0.25) 2 dpois(0, 14*0.25) + dpois(1, 14*0.25) 3 dbinom(0, 14, 0.25) + dbinom(1, 14, 0.25) 4 dbinom(0, 14, 0.75) 5 pnorm(1, mean= 14*0.25) Fortsæt på side 6 5

6 Opgave IV Et dansk forsikringsselskab har i forsøget på at fastholde kunder arbejdet med et såkaldt I love You koncept, hvor nye kunder fik et telefonisk opkald. Udgangspunktet er ikke et mersalg, men et forsøg på at fortælle kunden, at man er glad for, at de har valgt det pågældende forsikringsselskab og produkt. I den forbindelse tilbydes kunden et servicetjek - har kunden nu de rigtige forsikringer og forsikringsdækning. Man har i den forbindelse udtaget en tilfældig stikprøve omfattende 958 nye kunder og randomiseret om kunden skal have et såkaldt I love You -opkald. For hver kunde har man registreret forskellige baggrundsoplysninger som køn, alder, postnr. og forsikringspræmie (kundens årlige pris for sine forsikringer) før forsøget (før-præmie eller PRM1). Forsøget løber et halvt år. Efter perioden registreres præmien igen (efter-præmie eller PRM2), og derved om kunden har ændret sine policer. Man kan i følgende spørgsmål antage at log(prm1) er normalfordelt N(µ, σ 2 ). Resultaterne af registreringen af før-præmie kan opgøres ved følgende output fra R: n mean var std PRM log(prm1) % Q1 median Q3 97.5% PRM log(prm1) Spørgsmål IV.1 (7) Bestem 90 pct. konfidensintervallet for variansen σ [ ; [ ; ] = [0.81; 0.97] 3 [ ; ] = [1.2; 1.39] 4 [ [ ; ] = [0.72; 0.84] ] = [0.83; 0.93] 0.88 ; ] = [0.066; 1.83] Spørgsmål IV.2 (8) For forsikringsselskabet er der omkostninger ved at oprette en ny kunde. Typisk er dækningsbidraget (det selskabet har tjent i en periode) negativt de første år med en ny kunde. Det vurderes, at en ny kunde skal have præmier for mindst 2000 kr., før der er et overskud på kunden. Det ønskes undersøgt (i log domænet) om middelværdien af før-præmien er under Hypotesen testes på signifikansniveau α = Bestem den relevante teststørrelse 6

7 1 t obs = ( 7.19 log(2000) ) 0.78 / 958 = t obs = ( ) 2054 / 958 = t obs = 7.19/ 958 = t obs = ( 7.23 log(2000) ) / = t obs = 1960/ = Spørgsmål IV.3 (9) I det følgende udtages en tilfældig stikprøve omfattende 12 nye kunder fra stikprøven med nye kunder, der får et I-love-You opkald Respondent id Før-præmie Efter-præmie Køn PRM1 PRM Mand Mand Mand Kvinde Mand Kvinde Mand Mand Kvinde Kvinde Mand Kvinde Der indføres nu følgende to variable: X = log(prm1) og Y = log(prm2). Man kan i følgende spørgsmål antage at X er normalfordelt N(µ x, σx) 2 og at Y er normalfordelt N(µ y, σy). 2 Opsummering i R giver følgende resultater: n mean var std PRM PRM log(prm1) log(prm2) % Q1 median Q3 97.5% PRM

8 PRM log(prm1) log(prm2) Bestem et 99 pct. konfidensinterval for middelværdien µ x ± = [6.99; 7.89] ± = [796; 3726] ± = [6.73; 8.15] ± = [7.10; 8.30] ± = [5.39; 9.41] Spørgsmål IV.4 (10) Vi ønsker at lave en sammenligning af før-præmien (PRM1) med efter-præmien (PRM2) for de kunder, der har fået et I love You opkald, for at vurdere om I love You opkald har en effekt. Derfor foretages følgende kørsler i R: > x <- log(prm1) > y <- log(prm2) > mean(x)-mean(y) [1] > t.test(x,y) Welch Two Sample t-test data: x and y t = , df = , p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y > t.test(x,mu=mean(y)) One Sample t-test data: x t = , df = 11, p-value =

9 alternative hypothesis: true mean is not equal to percent confidence interval: sample estimates: mean of x > t.test(x) One Sample t-test data: x t = , df = 11, p-value = 2.904e-12 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: sample estimates: mean of x > t.test(x,y, paired=true) Paired t-test data: x and y t = , df = 11, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of the differences Hvad er svaret på vurderingen af om I love You opkald har en effekt er der forskel på µ x og µ y, idet hypotesen testes på niveau α = 0.05? 1 Idet ˆµ x ˆµ y = er negativ er der en klar I love You effekt 2 Nej, der er ingen I love You effekt, idet den relevante p-værdi er Ja, der er en signifikant I love You effekt, idet den relevante p-værdi er Nej, der er ingen I love You effekt, idet den relevante p-værdi er Nej, der er ingen I love You effekt, idet den relevante p-værdi er Spørgsmål IV.5 (11) På baggrund af ovenstående beskrevet stikprøve vil vi nu undersøge om der er forskel i præmie niveauet før forsøget for mænd og kvinder. 9

10 Først udtages delmængde med henholdsvis mænd og kvinder, og logaritmen til deres før-præmie tages > male <- subset(data, Data$gender=="male") > female <- subset(data, Data$gender=="female") > > m <- log(male$prm1) > f <- log(female$prm1) I det følgende spørgsmål antage at m er normalfordelt N(µ m, σ 2 m) og at f er normalfordelt N(µ f, σ 2 f ) > t.test(f) One Sample t-test data: f t = , df = 4, p-value = 2.517e-05 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: sample estimates: mean of x > t.test(m,f) Welch Two Sample t-test data: m and f t = , df = 8.659, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y > t.test(m,mu=mean(f)) One Sample t-test data: m t = , df = 6, p-value = alternative hypothesis: true mean is not equal to percent confidence interval: sample estimates: mean of x > mean(f)-mean(m) [1]

11 Hvad er svaret på vurderingen af om der er forskel på mænd og kvinders præmie før forsøget, svarende til hypotesen: idet hypotesen testes på niveau α = H 0 : µ f = µ m H 1 : µ f µ m 1 Nej der er ingen forskel mellem mænd og kvinders før-præmie, idet den relevante p-værdi er Ja der er en signifikant forskel på før-præmien for mænd og kvinder, idet den relevante p-værdi er Ja der er en signifikant forskel på før-præmien for mænd og kvinder, idet den relevante p-værdi er Nej der er ingen forskel mellem mænd og kvinders før-præmie, idet den relevante p-værdi er Idet ˆµ f ˆµ m = er negativ fremgår det at før-præmie for mænd er større end for kvinder Fortsæt på side 12 11

12 Opgave V En ostefrabrikant har lavet en ny spændende opskrift og man har lavet en prøveproduktion. Udfra denne har man taget en tilfældig stikprøve på 20 målinger af fedtprocenten. Data er indlæst i R med følgende kode x <- c(25.3, 23.2, 21.2, 22.6, 26.4, 21.9, 24.5, 23.9, 22.8, 24.9, 29.9, 26.8, 25, 26, 27.7, 26.9, 22.7, 28.2, 23.4, 25.6) og følgende er beregnet (resultat er her udskrevet med 2 decimaler) > mean(x) [1] > sd(x) [1] 2.28 Spørgsmål V.1 (12) Det er ønsket at vurdere hvilken fordeling udfaldene i stikprøven kunne stamme fra og man har derfor lavet nedestående histogram af x Histogram of x Frequency x Vurder på baggrund af de givne oplysninger hvilken af følgende fordelinger, der med størst rimelighed kan antages at have genereret udfaldene i stikprøven? 12

13 1 En normal fordeling 2 En Poisson fordeling 3 En exponentiel fordeling 4 En t-fordeling 5 En χ 2 -fordeling Spørgsmål V.2 (13) Det er på forhånd ønsket at holde fedtprocenten under 30% og man vil derfor teste om det kan konkluderes at middelværdien er derunder. Man vil derfor lave en t-test med et to-sidet alternativ for middelværdien med hypotesen H 0 : µ = 30 H 1 : µ 30 p-værdien beregnes ved? 1 p-værdi = P ( T < / 20 ) 2 p-værdi = P ( T > / 20 ) 3 p-værdi = 2 P ( T > / 20 ) 4 p-værdi = 2 P ( T < / 20 ) 5 p-værdi = 2 P ( T > / 20 ) Spørgsmål V.3 (14) Det er desuden vigtigt at ostene bliver ensartede og man vil derfor undersøge spredningen af fedtprocenten. Man vil undlade at antage en fordeling og derfor bootstrappe et ikke-parametrisk 95% konfidensinterval for spredningen. Hvilken af følgende R koder beregner dette korrekt? 1 simsamples <- replicate(10000, sample(x, replace = TRUE)) simmeans <- apply(simsamples, 2, sd) quantile(simmeans, c(0.05, 0.95)) 2 simsamples <- replicate(10000, sample(x, replace = FALSE)) simmeans <- apply(simsamples, 2, sd) quantile(simmeans, c(0.05, 0.95)) 13

14 3 simsamples <- replicate(10000, sample(x, replace = FALSE)) simmeans <- apply(simsamples, 2, mean) quantile(simmeans, c(0.05, 0.95)) 4 simsamples <- replicate(10000, sample(x, replace = TRUE)) simmeans <- apply(simsamples, 2, mean) quantile(simmeans, c(0.025, 0.975)) 5 simsamples <- replicate(10000, sample(x, replace = TRUE)) simmeans <- apply(simsamples, 2, sd) quantile(simmeans, c(0.025, 0.975)) Spørgsmål V.4 (15) Man har nu kørt endnu en produktion med små ændringer af opskriften på den nye ost og alle hos ostefabrikanten er meget spændte på resultatet. Man har udtaget en tilfældig stikprøve af fedtprocenten fra den nye produktion, denne gang dog kun på 15 målinger. Denne er indlæst i R med ## Ny stikprøve y <- c(26, 28.3, 29.1, 25.1, 26.4, 28.5, 26.5, 33.8, 27.5, 24.7, 23.8, 25.8, 26.7, 27.7, 26.3) og følgende er beregnet (resultat er her udskrevet med 2 decimaler) > mean(y) [1] > sd(y) [1] 2.36 Man vil nu gerne undersøge om fedtprocenten har ændret sig mellem den første og den nye produktion. Man udfører den sædvanlige Welch t-test for forskel i middelværdi mellem de to produktioner. Dette gøres i R med > t.test(x,y, conf.level=0.99) Welch Two Sample t-test data: x and y t = , df = 29.74, p-value = alternative hypothesis: true difference in means is not equal to 0 99 percent confidence interval:

15 sample estimates: mean of x mean of y Hvad vil da kunne konkluderes på baggrund af ovenstående resultat fra R? 1 Der kan påvises en signifikant forskel i middelværdi på 5% signifikansniveau 2 Der kan påvises en signifikant forskel i middelværdi på 1% signifikansniveau 3 Der kan påvises en signifikant forskel i middelværdi på 0.1% signifikansniveau 4 Der kan ikke påvises en signifikant forskel i middelværdi på 10% signifikansniveau 5 Der kan ikke påvises en signifikant forskel i middelværdi på 5% signifikansniveau Spørgsmål V.5 (16) Den sidste test man udfører gøres med følgende R kode ## Simuler simxsamples <- replicate(10000, rnorm(length(x), mean(x), sd(x))) simysamples <- replicate(10000, rnorm(length(y), mean(y), sd(y))) simdiff <- apply(simxsamples, 2, sd) - apply(simysamples, 2, sd) ## Beregn resultatet quantile(simdiff, c(0.025,0.975)) Hvad beregnes derved i sidste linie? 1 Et 95% bootstrap konfidensinterval for forskel i median uden antagelse om fordeling af stikprøverne 2 Et 99% bootstrap konfidensinterval for forskel i standard afvigelse med antagelse af exponentialfordeling af stikprøverne 3 Et 95% bootstrap konfidensinterval for forskel i standard afvigelse med antagelse af normalfordeling af stikprøverne 4 Et 99% bootstrap konfidensinterval for forskel i standard afvigelse uden antagelse om fordeling af stikprøverne 5 Et 99% bootstrap konfidensinterval for forskel i median med antagelse af normalfordeling af stikprøverne Fortsæt på side 16 15

16 Opgave VI I en undersøgelse ønsker man at belyse sammenhængen mellem kørselsøkonomi (y, [km/l]) og pris (x 1, [kkr]) for forskellige biler. I undersøgelsen ønsker man at tage højde for en eventuel effekt af motorydelsen (x 2, [hk]). Sammenhængende værdier mellem kørselsøkonomi, pris og motorydelse er vist for 25 biler i tabellen herunder. Obs nr y i x 1,i x 2,i Obs nr y i x 1,i x 2,i Obs nr y i x 1,i x 2,i Indledningsvis foretages en grafisk analyse af sammenhængene mellem de tre variable, resultatet er vist i figuren herunder: Kørselsøkonomi (y) Kørselsøkonomi (y) Motorydelse (x2) Pris (x 1 ) Motorydelse (x 2 ) Pris (x 1 ) Spørgsmål VI.1 (17) Udfra figuren, afgør hvilket udsagn om værdierne af de tre empiriske korrelationer, som kan være sandt (her betegnes eksempelvis Cor(x 1, x 2 ) som ρ x1,x 2 )? 16

17 1 0 < ρ y,x1 < ρ y,x2 < ρ x1,x 2 2 ρ y,x2 < ρ x1,x 2 < ρ y,x1 3 ρ y,x2 < ρ y,x1 < ρ x1,x 2 4 ρ y,x2 < ρ x1,x 2 < ρ y,x1 < < ρ y,x2 < ρ y,x1 < ρ x1,x 2 < 1 Spørgsmål VI.2 (18) Man ønsker nu at modellere kørselsøkonomien som en lineær funktion af pris og motorydelse, eller (omsat til en lineær model): Y i = β 0 + β 1 x 1,i + β 2 x 2,i + ɛ i hvor ɛ i N(0, σ 2 ) er i.i.d.. Til det formål har man kørt følgende R-kode (inklusiv resultater, idet signifikanskoder dog er udeladt) > y <- c(19.6, 19.2, 23, 16.6, 18.5, 13.5, 16.9, 17.5, 24.4, 25.6, , 22.7, 12.5, 17.5, 23.8, 17.5, 23.8, 20, 17.2, 20, , 12.8, 26.3, 11.8, 21.3) > > x1 <- c(180.0, 205.0, 225, 250.0, 270.0, 285.0, 285.0, 296.0, , 300.0, 304.0, 308.0, 330.0, 340.0, 350.0, 355.0, , 400, 435.0, 448, 495.0, 540.0, 553.0, 600.0, ) > > x2 <- c(100.0, 109.0, 105, 140.0, 120.0, 204.0, 180.0, 180.0, , 120.0, 182.0, 120.0, 180.0, 170.0, 150.0, 192.0, , 140, 150.0, 184, 170.0, 200.0, 181.0, 240.0, ) > > fit <- lm(y ~ x1 + x2) > > summary(fit) Call: lm(formula = y ~ x1 + x2) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-09 x x

18 --- Residual standard error: 3.2 on 22 degrees of freedom Multiple R-squared: 0.434,Adjusted R-squared: F-statistic: 8.43 on 2 and 22 DF, p-value: Hvad er parameterestimatet for skæringen β 0 og residual variansen σ 2 for modellen? 1 ˆβ 0 = 3.04 og ˆσ 2 = ˆβ 0 = 9.71 og ˆσ 2 = ˆβ 0 = 29.5 og ˆσ 2 = ˆβ 0 = 3.04 og ˆσ 2 = ˆβ 0 = 29.5 og ˆσ 2 = Spørgsmål VI.3 (19) Ved dette spørgsmål anvendes R kode og resultat fra forrige spørgsmål. Hvad er 95% konfidensintervallet for β 2 (hvor relevant angiver df frihedgrader for fordelingen)? 1 [ 0.15; 0.048] = ± t , med df = 22 2 [ 7.29; 1.21] = ± t , med df = 22 3 [5.48; 13.9] = 9.71 ± t , med df = 22 4 [2.01; 2.37] = 2.19 ± t , med df = 22 5 [ 1.43, 1.23] = ± t , med df = 22 Spørgsmål VI.4 (20) For at vurdere den samlede økonomi (pris og kørselsøkonomi) er man interesseret i at teste hypotesen H 0 : β 1 = 0.01 mod et tosidet alternativ. Hvad er p-værdien og konklusion for hypotesen (benyt konfidensniveau α = 0.05)? 1 p-værdi = og β p-værdi = 0.98 og det kan ikke afvises at β 1 =

19 3 p-værdi = og β p-værdi = og det kan ikke afvises at β 1 = p-værdi = 0.48 og det kan ikke afvises at β 1 = 0.01 Spørgsmål VI.5 (21) Hvilken af følgende R-kommandoer udregner et 95% konfidensinterval for brændstoføkonomien for biler som koster 350 kkr og har en motorydelse på 160 hk? 1 predict(fit, newdata = data.frame(x1 = 160, x2 = 350), interval = "confidence", level = 0.975) 2 confint(fit, newdata = data.frame(x1 = 350, x2 = 160), level = 0.95) 3 predict(fit, newdata = data.frame(x1 = 350, x2 = 160), interval = "confidence", level = 0.95) 4 confint(fit, newdata = data.frame(x1 = 160, x2 = 350), level = 0.975) 5 predict(fit, newdata = data.frame(x1 = 160, x2 = 350), interval = "prediction", level = 0.95) Fortsæt på side 20 19

20 Opgave VII Gallup har for Berlinske Tidende i juni 2012 undersøgt holdninger til organdonation blandt vælgere landet over på 18 år eller derover. De følgende spørgsmål handler om denne undersøgelse. Spørgsmål VII.1 (22) På spørgsmålet Er du grundlæggende for eller imod organdonation får man følgende resultater: Svar For Imod Ved ikke I alt Pct Det interessante ved sådan en undersøgelse er jo bla. hvordan vi får personer, der ikke har et afklaret forhold til organdonation, til at tage stilling til spørgsmålet. Bestem et 90 pct. konfidensinterval for andelen der svarer Ved ikke ± = [0.0998; ] ± = [0.0983; ] ± = [0.1059; ] ± = [90.91; ] ± = [0.0947; ] Spørgsmål VII.2 (23) I forbindelse med undersøgelse af, om der er en sammenhæng mellem køn og holdning til spørgsmålet Mener du, at staten bør give en økonomisk kompensation til borgere, der tilmelder sig donorregisteret, har vi følgende resultater: Køn Mener du, at staten bør give en økonomisk Kvinde Mand Total kompensation til borgere, der tilmelder sig donorregisteret Ja Nej Ved ikke Total

21 Det fremgår således af tabellen, at der er 59 mandlige respondenter, der mener staten bør give økonomisk kompensation. Desuden ses det, at stikprøven omfatter 998 respondenter. Bestem bidraget q til teststørrelsen χ 2 obs hidhørende fra respondenter, der svarer Nej og som er kvinde, idet uafhængighedshypotesen skal testes. 1 q Nej, Kvinde = q Nej, Kvinde = q Nej, Kvinde = q Nej, Kvinde = q Nej, Kvinde = Fortsæt på side 22 21

22 Spørgsmål VII.3 (24) Gallup anfører, at stikprøven er repræsentativ. Til vurdering af dette har man en række baggrundsvariable: køn, alder, region og hvad man stemte på ved det foregående folketingsvalg (15. september 2011). På baggrund af udtræk fra Danmarks Statistik har vi, at blokfordelingen ved folketingsvalget kan beskrives ved følgende tabel: Blok Rød Blå Pct At undersøge om stikprøven er repræsentativ med hensyn til blokfordeling, svarer til at undersøge følgende hypotese: H 0 : p = , H 1 : p hvor p er sandsynligheden for at et tilfældigt valgt individ stemte på rød blok ved sidste folketingsvalg. Stikprøven omfattede 906 respondenter og i stikprøven var der 401 respondenter, der havde stemt rød blok. Test hypotesen ved α = 0.05, bestem teststørrelse, p-værdi og konklusion: 1 χ 2 obs = ( )2 401 = Idet χ 2 fordelingen med 2 frihedsgrad er den relevante at benytte, har vi p-værdi = P (χ 2 obs 7.20) = , H 0 accepteres, dvs. at det på det foreliggende data vurderes stikprøven at være repræsentativ mht. blokfordeling z obs = ( ) / 906 = Idet normalfordelingen er den relevante at benytte, har vi at p-værdi = , H 0 forkastes, dvs. at det på det foreliggende data vurderes, at stikprøven ikke er repræsentativ mht. blokfordeling ( ) 3 z obs = = Idet normalfordelingen er den relevante at benytte, har vi at p-værdi = , H 0 accepteres, dvs. at det kan ikke afvises, at stikprøven er repræsentativ mht. blokfordeling. 4 z obs = ( )/ ( ) = Idet normalfordelingen er den relevante at benytte, har vi at p-værdi = 2 P (z obs 1.77) = , H 0 accepteres, dvs. at det på det foreliggende data vurderes, at stikprøven er repræsentativ mht. blokfordeling t obs = ( ) / 401 = Idet t-fordelingen med 401 frihedsgrader er den relevante at benytte, har vi at p-værdi = , H 0 forkastes, dvs. at det kan afvises, at stikprøven er repræsentativ mht. blokfordeling Fortsæt på side 23 22

23 Spørgsmål VII.4 (25) Hvor stor skal stikprøven være, hvis vi vil lave en ny undersøgelse, hvor 90 pct. konfidensintervallet for andelen, der er for organdonation højest har bredden 2 pct. point, når der tages udgangspunkt i, at 87 pct. er for organdonation. 1 n / ( ) 2 = rundet op altså n= n ( /2) 2 = rundet op altså n= n 1 4 /( ) 2 = rundet op altså n ( ) = rundet op altså 7569 ) n 0.25 ( 0.02 = rundet op altså n=1692 Fortsæt på side 24 23

24 Opgave VIII Tre forskellige insulinformuleringer (A, B og C) blev testet på 15 hunde - 5 hunde til hver formulering. Man målte tiden til maximal insulinabsorbtion (Tmax), og fik følgende data for de 15 hunde (i sekunder): Formulering A Formulering B Formulering C Tallene i nederste række angiver gennemsnittene. En analyse af disse data gav følgende resultat fra R: (hvor 4 af tallene dog er erstattet med bogstaverne I, J, K og L) Analysis of Variance Table Response: Tmax Df Sum Sq Mean Sq F value Pr(>F) Formulering I K L *** Residuals J Signif. codes: 0 *** ** 0.01 * Spørgsmål VIII.1 (26) Hvad er de korrekte værdier for I, J, K og L: 1 I=2, J=12, K=116862/2, L=9739/2 2 I=2, J=12, K=382769/2, L=K/ I=3, J=15, K=382769/3, L=K/15 4 I=3, J=15, K=9739/3, L= I=2, J=12, K=382769/12, L=9739/K Spørgsmål VIII.2 (27) Hvad er det mest korrekte udsagn, der opsummerer konklusionen for den udførte analyse? (Anvend det sædvanlige signifikansniveau α = 0.05) 24

25 1 Residualvariansen er for lille 2 De tre Tmax varianser kan påvises at være ens 3 De tre Tmax middelværdier kan afvises at være ens 4 De tre Tmax middelværdier kan accepteres som værende ens 5 Formulering C har den største spredning. Spørgsmål VIII.3 (28) En forudplanlagt sammenligning af formulering A og B giver følgende konklusion vedrørende middelværdi µ A og µ B : (Anvend det sædvanlige signifikansniveau α = 0.05) (Både konklusion og argument skal være korrekt) µ A og µ B er forskellige, idet < t /6 = (1/5+1/5) µ A og µ B er ikke forskellige, idet < t /6 = (1/5+1/5) µ B er signifikant større end µ A, idet > t = /15 (1/5+1/5) 4 µ A og µ B er ikke forskellige, idet < t = /2 5 µ B er signifikant større end µ A, idet > t = /5 Fortsæt på side 26 25

26 Opgave IX Skarpheden for tre TV-apparater scoredes af 8 personer, således at hver person scorede hvert TVapparat netop en gang. Man antager at scoren er normalfordelt. De 24 observationer analyseredes med den relevante variansanalyse, og man fik følgende resultat fra R: Analysis of Variance Table Response: Skarphed Df Sum Sq Mean Sq F value Pr(>F) Person ** TVapparat *** Residuals Signif. codes: 0 *** ** 0.01 * Spørgsmål IX.1 (29) Den totale kvadratsum for alle observationerne, SST = 3 i=1 8 j=1 (y ij ȳ) 2 bliver: 1 SST = SST = /14 3 SST = SST = SST = Spørgsmål IX.2 (30) Hvad er den mest korrekte konklusion på analysen? (Anvend det sædvanlige signifikansniveau α = 0.05) (Både konklusion og argument skal være korrekt) 1 Der er ingen påviselig forskel på hverken personernes eller på TV-apparaternes middelskarphed 2 Der er signifikant forskel på både personernes og på TV-apparaternes middelskarphed 3 Den totale variation er stor 4 Der er signifikant forskel på personernes middelskarphed men ikke på TV-apparaternes 5 Der er signifikant forskel på TV-apparaternes middelskarphed men ikke på personernes SÆTTET ER SLUT. FORTSAT GOD SOMMER! 26

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 15. december 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 1. december 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 27. maj 2014 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 20. august 2017 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 2. juni 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 26. maj 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1 Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 1. juni 2005 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af (navn)

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 25 sider. Skriftlig prøve: 13. december 2016 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af

Læs mere

Kursus 02402/02323 Introducerende Statistik

Kursus 02402/02323 Introducerende Statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 23. maj 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Danmarks Tekniske Universitet Side 1 af 19 sider

Danmarks Tekniske Universitet Side 1 af 19 sider Danmarks Tekniske Universitet Side 1 af 19 sider Skriftlig prøve: 2. juni 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dettesæterbesvaretafeksaminant

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side af 7 sider Skriftlig prøve, den: 0. maj 206 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 10: Statistik ved hjælp af simulering Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Danmarks Tekniske Universitet Side?? af 20 sider

Danmarks Tekniske Universitet Side?? af 20 sider Danmarks Tekniske Universitet Side?? af 20 sider Skriftlig prøve: 15. december 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af eksaminant

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Kapitel 4: Statistik ved simulering. Kursus 02323: Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik.

Kapitel 4: Statistik ved simulering. Kursus 02323: Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik. Kursus 02323: Introducerende Statistik Forelæsning 7: Simuleringsbaseret statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus 02402/02323 Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik

Kursus 02402/02323 Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 7: Simuleringsbaseret statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren Faculty of Life Sciences Program Sammenligning af grupper Ensidet ANOVA Claus Ekstrøm E-mail: ekstrom@life.ku.dk Sammenligning af to grupper: tre eksempler Sammenligning af mere end to grupper: ensidet

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter Opgave I I mange statistiske undersøgelser benytter man binomialfordelingen til at beskrive den tilfældige variation. Spørgsmål I.1 (1): For hvilken af følgende 5 stokastiske variable kunne binomialfordelingen

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget?

Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget? Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget? Udarbejdet af frivillige Frederik Carl Windfeld og Kim Alexander Byrial Juárez Jensen samt sekretariatet i Transparency

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere