(studienummer) (underskrift) (bord nr)

Størrelse: px
Starte visningen fra side:

Download "(studienummer) (underskrift) (bord nr)"

Transkript

1 Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 20. august 2017 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 9 opgaver. Besvarelserne af multiple choice spørgsmålene anføres i det i CampusNet uploadede svarark (på 6 seperate sider), med numrene på de svarmuligheder, du mener er de korrekte. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. KUN følgende 5 svarmuligheder er gyldige: 1, 2, 3, 4 eller 5. Hvis et spørgsmål efterlades blankt eller andet type svar angives, tæller det ikke med i besvarelsen. Envidere, hvis mere end et svar angives, hvilket faktisk er teknisk muligt i online-systemet, så tæller det ikke med (dvs. giver 0 point ). Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen. Den endelige besvarelse af opgaverne gøres ved at udfylde og online-aflevere svararket via CampusNet. Skemaet her er KUN et nød-alternativ til dette (husk at angive dit studienummer på din besvarelse, hvis du afleverer skemaet). Opgave I.1 I.2 I.3 II.1 II.2 II.3 III.1 III.2 IV.1 IV.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Opgave IV.3 IV.4 IV.5 V.1 V.2 V.3 V.4 V.5 VI.1 VI.2 Spørgsmål (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar Opgave VI.3 VI.4 VI.5 VII.1 VIII.1 VIII.2 VIII.3 IX.1 IX.2 IX.3 Spørgsmål (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar Sættet består af 26 sider. 1 Fortsæt på side 2

2 Multiple choice opgaver: Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I Et svømmeteam tager på en ugelang træningslejr med fokus på crawltræning. Før og efter laves en test hvor træneren tager hver svømmers tid på samme distance svømmet med crawl. Tiderne er gemt i samme rækkefølge (for svømmerne) i følgende vektorer i R: before er tiderne før og after er tiderne efter træningslejren. Følgende hypotese ønskes testet µ efter µ før = 0 µ efter µ før 0 hvor µ før og µ efter er middelværdien for hele holdets tid henholdvis før og efter træningslejren. Spørgsmål I.1 (1) Hvilket af følgende R-kald beregner korrekt p-værdien en t-test for hypotesen? 1 t.test(after, before, mu=0) 2 t.test(after, before, mu=-10) 3 t.test(after, before, mu=10) 4 t.test(after, mu=10) 5 t.test(after-before, mu=0) Spørgsmål I.2 (2) Testens p-værdi blev beregnet til Kan nulhypotesen afvises på signifikansniveau α = 5% (både konklusion og argument skal være korrekt)? 1 Ja, da p-værdien er under signifikansniveaet afvises nulhyposen 2 Nej, da p-værdien er under signifikansniveaet accepteres nulhyposen 3 Ja, da p-værdien er over signifikansniveaet afvises nulhyposen 4 Nej, da p-værdien er over signifikansniveaet accepteres nulhyposen 5 Der skal flere oplysninger til før konklusionen kan drages 2

3 Spørgsmål I.3 (3) Hver dag på træningslejren trækkes der lod om hvem der skal vaske op. Der skal bruges 4 hver dag til at vaske op og der er 35 deltagere. Der er lige stor sandsynlighed for at blive trukket hver dag. Beregn sandsynligheden for at en tilfældigt udvalgt deltager ikke kommer til at vaske op på hele træningslejren, som strækker sig over 7 aftener hvor der skal vaskes op ( 7 0) ( ) 7 0 = ( 5 2) ( ) 5 2 = ( 7 7) ( ) 7 7 = ( 7 7) ( ) 7 7 = ( 5 2) ( ) 5 2 = Fortsæt på side 4

4 Opgave II I forbindelse med eksamen i Introduktion til Statistisk ønskes det undersøgt om udenlandske studerende klarer sig godt. Scoren til eksamen regnes ud som et tal mellem -30 og 150, da der er 30 spørgsmål og der tælles -1 for et forkert svar og 5 point for et korrekt svar, samt der kun kan afgives et svar til hvert spørgsmål. Der er udtaget to tilfældige stikprøver af scoren: en for udenlandske studerende (x) og en for danske studerende (y). Hver stikprøve har 30 observationer. Spørgsmål II.1 (4) For at vurdere den mest passende analyse, så plottes et histogram af hver stikprøve: Histogram of x Histogram of y Frequency Frequency x y Hvad er den mest passende betragtning ud fra de givne oplysninger? 1 Der er ikke noget der indikerer at stikprøverne ikke kommer fra symmetriske fordelinger 2 Stikprøverne kan ikke antages at komme fra symmetriske fordelinger og dette understøttes af histogrammerne, specielt ses x at være højreskæv 3 Stikprøverne kan ikke antages at komme fra symmetriske fordelinger og dette understøttes af histogrammerne, specielt ses x at være venstreskæv 4 Populationerne hvorfra stikprøverne er taget begge antages at være exponentialfordelte 5 Populationerne hvorfra stikprøverne er taget begge antages at være normalfordelte 4

5 Spørgsmål II.2 (5) Det besluttes at den bedste analyse er inkluderet i følgende R-kode: ## Number of simulations k < ## Simulate each sample k times simxsamples <- replicate(k, sample(x, replace=true)) simysamples <- replicate(k, sample(y, replace=true)) ## Calculate the sample mean differences simmeandifs <- apply(simxsamples,2,mean) - apply(simysamples,2,mean) ## Quantiles of the differences gives the CI quantile(simmeandifs, c(0.005,0.995)) ## 0.5% 99.5% ## quantile(simmeandifs, c(0.025,0.975)) ## 2.5% 97.5% ## ## CI for the median differences simmediandifs <- apply(simxsamples,2,median) - apply(simysamples,2,median) quantile(simmediandifs, c(0.005,0.995)) ## 0.5% 99.5% ## quantile(simmediandifs, c(0.025,0.975)) ## 2.5% 97.5% ## Hvilket af følgende udsagn er korrekt? 1 Der er udregnet ikke-parametriske bootstrap konfidensintervaller for forskelle mellem to populationer 2 Der er udregnet parametriske bootstrap konfidensintervaller for forskelle mellem to populationer 3 Der er udregnet konfidensintervaller for forskelle mellem to populationer med antagelse af normalfordeling 4 Der er udregnet konfidensintervaller for forskelle mellem to populationer med antagelse af eksponentielfordeling 5

6 5 Der er udregnet konfidensintervaller for forskelle mellem to populationer med antagelse af Poissonfordeling Spørgsmål II.3 (6) Følgende hypotese ønskes testet på signifikansniveau α = 5% H 0 : q 0.5,x = q 0.5,y H 1 : q 0.5,x q 0.5,y hvor q 0.5,x angiver 50% fraktilen for udenlandske studerende og q 0.5,y angiver 50% fraktilen for danske studerende. Hvilket af følgende udsagn er korrekt (ikke alle udsagn giver nødvendigvis mening)? 1 H 0 afvises og det kan konkluderes at danske studerende klarer sig signifikant bedre end udenlandske på det angivne signifikansniveau 2 H 0 afvises og det kan konkluderes at udenlandske studerende klarer sig signifikant bedre end danske på det angivne signifikansniveau 3 H 0 afvises ikke og det er derfor ikke påvist at danske studerende klarer sig signikant anderledes end udenlandske på det angivne signifikansniveau 4 H 0 afvises ikke og det er derfor påvist at danske studerende klarer sig signifikant anderledes end udenlandske på det angivne signifikansniveau 5 Ingen af ovenstående udsagn er korrekte 6 Fortsæt på side 7

7 Opgave III Lad følgende to uafhængige stokastiske variabler være givet ved X 1 N( 20, 10 2 ) og X 2 N(20, 10 2 ). Deres tæthedsfunktioner (pdf) er da: f1(x) X x f2(x) X x Spørgsmål III.1 (7) Nu defineres en ny stokastisk variabel ved Y = X 1 + X 2. Hvilket af følgende plots er af tæthedsfunktionen (pdf) for Y? f(y) A y C f(y) B y D f(y) y f(y) y 7

8 1 Plot A 2 Plot B 3 Plot C 4 Plot D 5 Ingen af de viste plots kan være pdf for Y Spørgsmål III.2 (8) Hvis man antog at X 1 og X 2 repræsenterede hver deres population og man planlagde et forsøg hvor man ville teste for forskel i middelværdi med den sædvanligt anvendte ikke-parrede t-test. Hvad er den mindste stikprøvestørrelse n = n 1 = n 2 som skal tages fra hver population være for, på signifikansniveau α = 5%, at opnå en styrke af testen på mindst 99%? 1 n = 4 observationer i hver stikprøve 2 n = 12 observationer i hver stikprøve 3 n = 38 observationer i hver stikprøve 4 n = 69 observationer i hver stikprøve 5 n = 248 observationer i hver stikprøve 8 Fortsæt på side 9

9 Opgave IV Nedenstående figur viser sammenhængen mellem højden på omkring 1000 fædre og deres sønner målt i tommer: Son Father Den viste regressionslinje beskriver følgende model estimeret til observationerne Y i = β 0 + β 1 x i + ε i, ε i N(0, σ 2 ) og i.i.d., hvor Y i er højden af den i te søn og x i er højden af den i te far. Spørgsmål IV.1 (9) Hvilket af følgende udsagn er en korrekt beskrivelse af regressionslinjen? 1 Linjen beskriver et estimat af sønners middelhøjde som en funktion af deres fædres middelhøjde 2 Linjen beskriver et estimat af den lineære korrelation mellem den gennemsnitlige højde af far og søn 3 Linjen beskriver et estimat af fædres middelhøjde som funktion af højden af deres sønner 4 Linjen beskriver et estimat af sønners middelhøjde som en funktion af højden af deres fædre 5 Linjen beskriver et estimat af en søns højde som funktion af faderens højde Spørgsmål IV.2 (10) 9

10 Man har valgt at analysere data med følgende R-kode, hvor fs er et data.frame med kolonnerne Son og Father der indeholder de observerede højder: summary(fit <- lm(son ~ Father, data=fs)) Hvilket giver følgende resultat hvor et par af tallene er erstattet af bogstaver: Call: lm(formula = Son ~ Father, data = fs) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) A <2e-16 *** Father B <2e-16 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 1076 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 1076 DF, p-value: < 2.2e-16 Hvor stor en andel af variationen i højden af sønner er ikke forklaret af højden af fædrene? 1 ca. 25% 2 ca. 50% 3 ca. 75% 4 ca. 86.5% 5 ca. 66% Spørgsmål IV.3 (11) Hvad er estimatet af standardafvigelsen på estimatet af koefficienten for Father? 1 ˆσ β1 = 0.514/2.438 = ˆσ β1 = 2.438/1076 =

11 3 ˆσ β1 = = ˆσ β1 = 33.89/18.49 = ˆσ β1 = 0.514/19.0 = Spørgsmål IV.4 (12) Givet følgende beregninger i R, hvad er da et 95% konfidensinterval for middelhøjden af sønner for fædre, der er 75 tommer høje? mean(fs$father); var(fs$father) ## [1] ## [1] mean(fs$son); var(fs$son) ## [1] ## [1] ± ± ± ± ± ( ) (1078 1) 1 + ( ) ( ) (1078 1) ( ) (1077 1) ( ) (1077 1) 11

12 Spørgsmål IV.5 (13) Man får nu oplysninger om hver families månedlige indkomst og opstiller modellen Y i = β 0 + β 1 x 1,i + β 2 x 2,i + ε i, ε i N(0, σ 2 ) og i.i.d., hvor Y i er højden af den i te søn, x 1,i er højden af den i te far, og x 2,i er indkomsten for den i te familie. Under følgende to antagelser: Rige familier spiser bedre og at bedre kost har en signifikant positiv effekt, der giver familiens sønner større vækst Der er uafhængighed mellem faderens højde og familiens indkomst Hvad er da konsekvensen af at inddrage indkomst i modellen (ikke alle svarmuligheder er nødvendigvis meningsfulde)? 1 Inddragelse af indkomst i modellen vil bidrage til at mindske residualvariationen (ˆσ 2 ) og usikkerheden på regressionskoefficienten for faderens højde (β 1 ) vil blive reduceret 2 Inddragelse af indkomst i modellen vil bidrage til at mindske residualvariationen (ˆσ 2 ), men dette vil ikke have indflydelse på usikkerheden af regressionskoefficienten for faderens højde (β 1 ) 3 Da fædrenes højde er uafhængig af fædrenes indkomst vil inddragelse af indkomst i modellen ikke have nogen indflydelse på estimatet af β 1 eller usikkerheden på denne 4 Inddragelse af indkomst i modellen vil bruge endnu en frihedsgrad, så et konfidensinterval for β 1 må forventes at være bredere end hvis indkomst ikke var inkluderet i modellen 5 Man må forvente en høj grad af multikollinearitet imellem estimaterne af β 1 og β 2, så modellen alligevel skal reduceres til en simpel lineær regressionsmodel 12 Fortsæt på side 13

13 Opgave V I mennesket findes en lang række forskellige genetisk bestemte blodtypesystemer. De mest kendte er nok AB0- og Rhesus-systemerne. Et andet blodtypesystem er det såkaldte MNblodtypesystem, som bestemmes af et enkelt gen Glycophorin A (GPA). I GPA-genet findes to alleller M og N således at et menneske kan have genotypen (blodtypen) MM, MN, eller NN. Fordelingen af blodtyper i MN-blodtypesystemet søges nu estimeret ud fra en stikprøve af frivillige studerende på to forskellige filippinske universiteter. Det ene universitet, University of the Philippines-Diliman her forkortet UPD, er landets største universitet hvor studerende kommer fra hele landet. Det andet universitet, Isabela State University her forkortet ISU, er et lille universitet hvor de studerende primært kommer fra lokalområdet. Følgende antalstabel angiver fordelingen af genotyperne blandt de studerende i stikprøverne ved de to universiteter: Spørgsmål V.1 (14) Blodtype UDP ISU MM MN 15 7 NN 17 9 Angiv χ 2 teststørrelsen og konklusionen på testen for sammenligningen af fordelingen fra de to universiteter (både teststørrelse og konklusion skal være korrekt). 1 Teststørrelsen er χ 2 = 14.15, dens fordeling har 2 frihedsgrader og testen viser, at der er nogen evidens for en forskel på MN-blodtypefordelingen ved de to universiteter 2 Teststørrelsen er χ 2 = 14.15, dens fordeling har 2 frihedsgrader og testen viser, at der er meget stærk evidens for en forskel på MN-blodtypefordelingen ved de to universiteter 3 Teststørrelsen er χ 2 = 3.76, dens fordeling har 2 frihedsgrader og testen viser, at der ikke er evidens for en forskel på MN-blodtypefordelingen ved de to universiteter 4 Teststørrelsen er χ 2 = 4.57, dens fordeling har 1 frihedsgrad og testen viser, at der er signifikant forskel på MN-blodtypefordelingen ved de to universiteter 5 Teststørrelsen er χ 2 = 3.76, dens fordeling har 1 frihedsgrad og testen viser, at der er svag evidens for en forskel på MN-blodtypefordelingen ved de to universiteter 13

14 Spørgsmål V.2 (15) En biologisk population siges at være i Hardy-Weinberg (HW) ligevægt hvis andelen af genotyperne kan skrives som p MM = p 2, p MN = 2pq, p NN = q 2. Hvor p og q kaldes allelfrekvenserne for henholdsvis M og N. De beregnes ved p = 2 X MM + X MN, 2n q = 2 X NN + X MN, 2n hvor X blodtype er det observerede antal af den pågældende blodtype og n er stikprøvestørrelsen. Således bliver for UDP p MN = 2 2 X MM + X MN 2n 2 X NN + X MN 2n en beregnet andel af MN blodtype under HW-ligevægt. = , En simpel test for om populationen på UDP ikke er i HW-ligevægt kan være af nulhypotesen H 0 : p MN,UDP = H 1 : p MN,UDP dvs. om den observerede andel med MN blodtype på UDP (p MN,UDP ) er lig andelen under HW-ligevægt. Det ønskes testet om det kan afvises at genotyperne på UDP er i HW-ligevægt. Hvad bliver den sædvanligt anvendte teststørrelse for denne test? 1 Teststørrelsen er χ 2 = 2( ) = Teststørrelsen er z obs = = ( ) 3 Teststørrelsen er z obs = = ( ) 4 Teststørrelsen er χ 2 = ( )/2 = Teststørrelsen er χ 2 = = 8.6 Spørgsmål V.3 (16) For en anden type test om HW-ligevægt fås teststørrelsen til χ 2 = og den skal følge en χ 2 -fordeling med 1 frihedsgrad under nulhypotesen. Hvad bliver p-værdien og konklusionen på testen ved brug af et signifikansniveau på 0.001? 14

15 1 p-værdien er pchisq(24.52, df=1) 1 og hypotesen om HW-ligevægt kan ikke afvises 2 p-værdien er 1 - pchisq(24.52, df=1) < og hypotesen om HW-ligevægt kan ikke afvises 3 p-værdien er 1 - pchisq(24.52, df=1)< og hypotesen om HW-ligevægt afvises 4 p-værdien er 1 - pnorm(sqrt(24.52)) < og hypotesen om HW-ligevægt kan ikke afvises 5 p-værdien er 1 - pnorm(sqrt(24.52)) < og hypotesen om HW-ligevægt afvises Spørgsmål V.4 (17) Det er af teoretiske grunde blevet foreslået at frekvenserne af genotyperne MM og NN i den bagvedliggende population er ens og man ønsker nu på baggrund af observationerne fra UDP at belyse denne hypotese. Under antagelse af at andelene for MM og NN er uafhængige, er et 90% konfidensinterval for forskellen i andelen af MM og NN (p MM p NN ) givet ved: /51 ± /51 ± /51 ± /51 ± /51 ± Spørgsmål V.5 (18) Hvad er den sædvanlige teststørrelse for testen af p MM = p NN? 1 z obs = 2 2 z obs = / z obs = z obs = 2/51 5 z obs = / Fortsæt på side 16

16 Opgave VI En stikprøve med følgende 10 observationer er indsamlet: x <- c(-1.63, -1.37, -1.21, -0.60, -0.36, -0.26, -0.18, 0.02, 0.29, 0.39) Læg mærke til at stikprøven er blevet sorteret i ovenstående. Stikprøvegennemsnittet og -standardafvigelsen er udregnet: mean(x) ## [1] sd(x) ## [1] Spørgsmål VI.1 (19) Hvad er stikprøvevariansen? 1 s 2 = s 2 = s 2 = s 2 = s 2 = 2.36 Spørgsmål VI.2 (20) Hvad er den første kvartil af stikprøven? 1 Q 1 = Q 1 = Q 1 = Q 1 = Q 1 =

17 Spørgsmål VI.3 (21) Hvilket af følgende er et korrekt 95% konfidensinterval for middelværdien af populationen hvorfra stikprøven er taget? ± t = [ 0.84, 0.14] hvor t = 2.26 er en fraktil i t-fordelingen med 9 frihedsgrader ± t = [ 0.92, 0.64] hvor t 0.95 = 1.83 er en fraktil i t-fordelingen med 9 frihedsgrader ± t = [ 0.79, 0.19] hvor t 0.95 = 1.83 er en fraktil i t-fordelingen med 9 frihedsgrader ± t = [ 0.65, 0.33] hvor t = 2.26 er en fraktil i t-fordelingen med 9 frihedsgrader ± t = [ 0.99, 0.01] hvor t = 2.26 er en fraktil i t-fordelingen med 9 frihedsgrader Spørgsmål VI.4 (22) En anden stikprøve er indsamlet og følgende empiriske tæthed er lavet for stikprøven: Density Empirical density x Hvor stor er stikprøven, dvs. mange observationer n er der i stikprøven?

18 Dette spørgsmål kan ikke besvares med de givne oplysninger Spørgsmål VI.5 (23) Givet følgende 3 plots af sammenhørende værdier af x og y for stikprøver fra 3 forskellige populationer: x y x y x y3 Hvilket af følgende er det eneste ikke meget usandsynlige udsagn om korrelationerne af de populationer som stikprøverne er taget fra? 1 ρ XY1 = 0, ρ XY2 = 0 og ρ XY3 = ρ XY1 = 0, ρ XY2 = 0 og ρ XY3 = ρ XY1 = 0, ρ XY2 = 0.61 og ρ XY3 = ρ XY1 = 0.87, ρ XY2 = 0 og ρ XY3 = ρ XY1 = 0.22, ρ XY2 = 0 og ρ XY3 = 0.34 Fortsæt på side 19 18

19 Opgave VII I en endelig population af N enheder med middelværdi E[Y ] = µ og varians V[Y ] = σ 2 betragter vi en stikprøve med n enheder Y i, i = 1,..., n. Hvis en stikprøven tages tilfældigt og uden tilbagelægning har gennemsnittet, Ȳ = 1 n n i=1 Y i, variansen V(Ȳ ) = ( ) N n σ 2. Interessen N n falder nu på totalen τ = N i=1 Y i, der kan estimeres ved ˆτ = N n n i=1 Y i. Spørgsmål VII.1 (24) Hvad er variansen af estimatoren ˆτ dvs. V(ˆτ)? 1 V(ˆτ) = N 2 n σ2 2 V(ˆτ) = N(N n) σ2 n 3 V(ˆτ) = N 2 n 3 σ 2 4 V(ˆτ) = N 2 (1 n)σ 2 5 V(ˆτ) = N n σ2 19 Fortsæt på side 20

20 Opgave VIII Op til 1970 erne var det i Finland kun tilladt at sælge og servere alkoholiske drikke i byerne og ikke i landområderne. Da man på dette tidspunkt ønskede at ophæve salgsbegrænsningerne på alkohol i landområderne opstod der bekymring om det ville lede til en øget rate af trafikulykker. Forud for ophævelsen udførte man derfor et pilotprojekt hvor man i fire landkommuner ekstraordinært gav lov til at sælge alkohol i butikkerne og i yderligere fire landkommuner ekstraordinært gav lov til at servere alkohol i restauranter og andre serveringssteder foruden at sælge alkohol i butikkerne. Fire andre landkommuner uden ekstraordinære tilladelser skulle agere kontrol. Data på antallet af trafikulykker fra de 12 udvalgte landkommuner igennem et år er præsenteret i nedenstående tabel: Navn Kontrol Salg SalgOgServering Sum og den valgte analyse er en ANOVA. Resultat er: ## Analysis of Variance Table ## ## Response: Accidents ## Df Sum Sq Mean Sq F value Pr(>F) ## Treatment A C D ## Residuals B Hvor Treatment er en factor variabel der grupperer landkommunerne i de tre grupper og Accidents er antallet af trafikulykker. Spørgsmål VIII.1 (25) For at undersøge om tilgængeligheden af alkohol har betydning for hyppigheden af trafikulykker ønsker man at sammenligne middelantallet af trafikulykker i de 3 grupper. Under antagelse af at variansen i antallet af trafikulykker er konstant mellem grupperne, hvad bliver da resultatet af testen af om der er forskel i middelantallet af trafikulykker mellem de 3 grupper på signifikansniveay α = 0.05? 1 Teststørrelsen F obs = der under H 0 følger en F -fordeling med 3 og 8 frihedsgrader, hvilket giver en p-værdi på og undersøgelsen giver derfor ikke grund til at tro at en lempelse af alkoholtilgængeligheden vil øge antallet af trafikulykker 2 Teststørrelsen F obs = der under H 0 følger en F -fordeling med 2 og 9 frihedsgrader, hvilket giver en p-værdi på og undersøgelsen viser derfor at en lempelse af alkoholtilgængeligheden med sikkerhed ikke vil øge antallet af trafikulykker 20

21 3 Teststørrelsen F obs = der under H 0 følger en F -fordeling med 2 og 9 frihedsgrader, hvilket giver en p-værdi på og undersøgelsen giver derfor ikke grund til at tro at en lempelse af alkoholtilgængeligheden vil øge antallet af trafikulykker 4 Teststørrelsen F obs = der under H 0 følger en F -fordeling med 2 og 9 frihedsgrader, hvilket giver en p-værdi på og undersøgelsen viser derfor at en lempelse af alkoholtilgængeligheden ændrer antallet af trafikulykker 5 Teststørrelsen F obs = der under H 0 følger en F -fordeling med 3 og 8 frihedsgrader, hvilket giver en p-værdi på og undersøgelsen viser derfor at en lempelse af alkoholtilgængeligheden ændrer antallet af trafikulykker Spørgsmål VIII.2 (26) Hvad er estimatet af afvigelsernes standardafvigelse? 1 ˆσ = /(12 1) = ˆσ = /(3 1) = ˆσ = /(12 1) = ˆσ = /(12 3) = ˆσ = /(12 3) 2 = 66.3 Spørgsmål VIII.3 (27) Antagelsen om varianshomogenitet undersøges med følgende boxplots: Kontrol Salg SalgOgServering 21

22 Hvilket af følgende udsagn er den mest korrekte slutning på denne baggrund (ikke alle udsagn er nødvendigvis meningsfulde)? 1 Taget det høje antal observationer i betragtning, så findes der ikke belæg for at antagelsen af varianshomogenitet ikke er opfyldt 2 Taget det høje antal observationer i betragtning, så findes der belæg for at antagelsen af varianshomogenitet ikke er opfyldt 3 Taget det lave antal observationer i betragtning, så findes der ikke belæg for at antagelsen af varianshomogenitet ikke er opfyldt 4 Taget det lave antal observationer i betragtning, så findes der belæg for at antagelsen af varianshomogenitet ikke er opfyldt 5 Der kan ikke tages stilling til antagelsen af varianshomogenitet på baggrund af de givne oplysninger 22 Fortsæt på side 23

23 Opgave IX Miljø- og Fødevarestyrelsen indsamler hvert år data om affald i Danmark og udgiver en rapport med data og analyser. I Affaldsstatisk 2015 ( 1 ) kan man finde en opgørelse af affald (kg) per indbygger for årene 2013 til 2015 opdelt på regioner: Hovedstaden Midtjylland Nordjylland Sjaelland Syddanmark Følgende boxplot viser affald per borger opdelt på henholdsvis år og region: Affald (kg per indbygger) Affald (kg per indbygger) Aar Hovedstaden Midtjylland Nordjylland Sjaelland Syddanmark Region Der er udført en 2-vejs ANOVA og resultatet er: ## Analysis of Variance Table ## ## Response: Affald ## Df Sum Sq Mean Sq F value Pr(>F) ## Aar ## Region e-05 *** ## Residuals ## --- ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' '

24 Spørgsmål IX.1 (28) Hvilket af følgende udsagn er korrekt når der anvendes en signifikansniveau på α = 5%? 1 Udfra boxplottet kan det ses at der ikke kan påvises signifikant forskel i affald opdelt på år, hvilket også er konklusionen af ANOVA testen 2 Udfra boxplottet kan det ses at der ikke kan påvises signifikant forskel i affald opdelt på år, men fra ANOVA testen ses det, at der kan påvises signifikant forskel i affald opdelt på år 3 Udfra boxplottet kan man ikke afgøre om der kan påvises signifikant forskel i affald opdelt på år, men fra ANOVA testen ses det, at der ikke kan påvises signifikant forskel i affald opdelt på år 4 Udfra boxplottet kan man ikke afgøre om der kan påvises signifikant forskel i affald opdelt på år, men fra ANOVA testen ses det, at der kan påvises signifikant forskel i affald opdelt på år 5 Ingen af ovenstående udsagn er korrekte Spørgsmål IX.2 (29) Der er yderligere opgjort hvor stor en mængde affald per borger, der bliver sorteret i de fem regioner, og andelen af affald der er sorteret er beregnet opdelt på år og region. Der er udført en 2-vejs ANOVA på data med følgende resultat: ## Analysis of Variance Table ## ## Response: Andel ## Df Sum Sq Mean Sq F value Pr(>F) ## Aar ** ## Region ** ## Residuals ## --- ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Hvilken af følgende konklusioner er korrekt med anvendelse af et signifikansniveau på 5% (både argument og konklusion skal være korrekt)? 1 Da p-værdien > 0.05 for den relevante test, kan der ikke påvises en signifikant ændring i den sorterede andel mellem årene 2 Da P (F > ) < 0.05 hvor F følger den relevante F -fordeling, kan der kan påvises en signifikant ændring i den sorterede andel mellem årene 24

25 3 Da P (T > 0.003) > 0.05 hvor T følger den relevante t-fordeling, kan der ikke påvises en signifikant ændring i den sorterede andel mellem årene 4 Da P (T < ) < 0.05 hvor T følger den relevante t-fordeling, kan der kan påvises en signifikant ændring i den sorterede andel mellem årene 5 Da 1 P (T > ) > 0.05 hvor T følger den relevante t-fordeling, der kan ikke påvises en signifikant ændring i den sorterede andel mellem årene Spørgsmål IX.3 (30) Boxplottene der viser andelen af sorteret affald opdelt på år og opdelt på region er: Sorteret andel Sorteret andel Aar Hovedstaden Midtjylland Nordjylland Sjaelland Syddanmark Region Det ses at der i 2015 er en observation som er væsentligt lavere en resten, den er ifølge det modificerede boxplot identificeret som en outlier. Hvilket af følgende udsagn er ikke korrekt (Tip: Husk at der kun er en observation for hvert år for hver region)? 1 Den laveste observation i 2013 tilhører Hovedstaden 2 Den laveste observation i 2015 (dvs. outlieren) tilhører Nordjylland 3 Sjælland har hvert år haft en højere observation end Hovedstaden 4 Nordjylland har den laveste median 5 75% fraktilen for 2014 er højere end 25% fraktilen for

26 SÆTTET ER SLUT. God sensommer! 26

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 15. december 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 1. december 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 26. maj 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 25 sider. Skriftlig prøve: 13. december 2016 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af

Læs mere

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1 Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 1. juni 2005 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af (navn)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 27. maj 2014 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr)

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 16. august 2015 Kursus navn og nr: Introduktion til Statistik (02323, 02402 og 02593) Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 23. maj 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus 02402/02323 Introducerende Statistik

Kursus 02402/02323 Introducerende Statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Danmarks Tekniske Universitet Side 1 af 19 sider

Danmarks Tekniske Universitet Side 1 af 19 sider Danmarks Tekniske Universitet Side 1 af 19 sider Skriftlig prøve: 2. juni 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dettesæterbesvaretafeksaminant

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 2. juni 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere