(studienummer) (underskrift) (bord nr)

Størrelse: px
Starte visningen fra side:

Download "(studienummer) (underskrift) (bord nr)"

Transkript

1 Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 27. maj 2014 Kursus navn og nr: Introduktion til Statistik, Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 8 opgaver. Besvarelserne af multiple choice spørgsmålene anføres i det i CampusNet uploadede svarark, med numrene på de svarmuligheder, du mener er de korrekte. Et eksempel er vist p side 2 af eksamenssættet hre. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. KUN følgende 6 svarmuligheder er gyldige: 1, 2, 3, 4, 5 eller 6. Hvis et spørgsmål efterlades blankt eller andet svar angives, tæller det i praksis som 6=ved ikke. Et 6-tal giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde og online-aflevere svararket via CampusNet. Skemaet her er KUN et nøds-alternativ til dette. Opgave I.1 I.2 I.3 I.4 II.1 II.2 II.3 III.1 III.2 III.3 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Opgave III.4 IV.1 IV.2 V.1 VI.2 V.3 V.4 V.5 VI.1 VI.2 Spørgsmål (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar Opgave V1.3 V1.4 VII.1 VII.2 VII.3 VIII.1 VIII.2 VIII.3 VIII.4 VIII.5 Spørgsmål (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar Husk at angive dit studienummer på din besvarelse. Sættets sidste side er nr 20; blad lige om og se, at den er der. Fortsæt på side 2 1

2 Herunder er et eksempel på hvorledes svar-arket kunne se ud: Studienummer, s Spørgsmål (1),1 Spørgsmål (2),2 Spørgsmål (3),3 Spørgsmål (4), Spørgsmål (5),4 Spørgsmål (6),5 Spørgsmål (7),6 Spørgsmål (8), Spørgsmål (9),1 Spørgsmål (10),2 Spørgsmål (11),3 Spørgsmål (12),4 Spørgsmål (13),5 Spørgsmål (14),6 Spørgsmål (15),1 Spørgsmål (16),2 Spørgsmål (17),3 Spørgsmål (18),4 Spørgsmål (19),5 Spørgsmål (20),6 Spørgsmål (21), Spørgsmål (22), Spørgsmål (23), Spørgsmål (24), Spørgsmål (25),1 Spørgsmål (26),2 Spørgsmål (27),3 Spørgsmål (28),4 Spørgsmål (29),5 Spørgsmål (30),6 Fortsæt på side 3 2

3 Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I For at sammenligne sværdhedsgraden af 2 forskellige kurser på et universitet har man registreret følgende karakterfordeling (givet som antal elever der opnåede karakteren) Kursus 1 Kursus 2 Total Karakteren Karakteren Karakteren Karakteren Karakteren Karakteren Karakteren Total Spørgsmål I.1 (1) Hvad er medianen for de 251 opnåede karakterer? Fortsæt på side 4 3

4 Spørgsmål I.2 (2): Man ønsker at sammenligne beståelsesandelen for de to kurser, p 1 og p 2. Idet karakterene -3 og 0 betyder ikke bestået, får man følgende skema over antal elever: Kursus 1 Kursus 2 Total Bestået Ikke bestået Total Et 95% konfidensinterval for forskellen mellem de to beståelsesandele bliver: ± [ ; 0.141] (108/7 143/7) ± [ 18.60; 8.603] (108/7 143/7) ± t (250) 251 [ 20.45; 10.45] ± [ 13.57; 13.63] ± [ 10.48; 10.54] Spørgsmål I.3 (3) Et χ 2 -test for hypotesen H 0 : p 1 = p 2 mod et tosidet alternativ med signifikansniveau α = 0.01 har følgende kritiske værdi: (i R: 2*qchisq(0.99,1)) (i R: qnorm(0.95)) (i R: qnorm(0.99)) (i R: qchisq(0.99,1)) (i R: qchisq(0.95,1)) Fortsæt på side 5 4

5 Spørgsmål I.4 (4) Hvis en beståelsesandel for et kursus, der gives gentagne gange, antages gennemsnitligt at ligge på 0.80, og der er 250 elever, der går til eksamen hver gang, hvad er da middelværdi, µ og spredning, σ, for antallet af elever, der ikke består eksamen for et tilfældigt udvalgt kursus? 1 µ = 200 og σ = 40 2 µ = 50 og σ = µ = 125 og σ = µ = 50 og σ = 40 5 µ = 0.8 og σ = Opgave II I et studie af 3 forskellige dæktypers ( treatment ) effekt på brændstoføkonomien har man kørt 1000 km i 4 forskellige biler ( blocks ). Resultatet er angivet i nedenstående tabel (km/l). Bil 1 Bil 2 Bil 3 Bil 4 Middel Dæk Dæk Dæk Middel Spørgsmål hvilket? II.1 (5) Lad y ij være resultatet for dæk i og bil j. Netop et af følgende udsagn er sandt, 1 SST 3 4 i=1 j=1 (y ij ) 2 2 SS(Bl) 3 ( ( ) 2 + ( ) 2 + ( ) 2 + ( ) 2) 3 SS(T r) 3 ( ( ) 2 + ( ) 2 + ( ) 2) 4 SST SSE + SS(T r) + SS(Bl) 5 MSE SSE/6 Fortsæt på side 6 5

6 Spørgsmål II.2 (6) Hvis man kører følgende i R: y=c(20.5,23.3,23.9,22.4, 21.5,21.3,23.9,18.4, 22.2,21.9,21.7,17.9) bil=factor(rep(1:4,3)) daek=factor(rep(1:3,c(4,4,4))) mydata=data.frame(y,bil,daek) anova(lm(y~bil+daek,data=mydata)) får man følgende resultat: > anova(lm(y~bil+daek,data=mydata)) Analysis of Variance Table Response: y Df Sum Sq Mean Sq F value Pr(>F) bil daek Residuals Hvilken af følgende konklusioner er den mest rigtige?(hvis man anvender signifikansniveau α = 0.05) 1 Der er større forskel på dæktyperne end på bilerne 2 Der kan påvises forskel på dæktypernes effekt på brændstoføkonomien, men der kan ikke påvises forskel på bilernes brændstoføkonomi 3 Der kan påvises forskel på dæktypernes effekt på brændstoføkonomien, og der kan påvises forskel på bilernes brændstoføkonomi 4 Der kan ikke påvises forskel på dæktypernes effekt på brændstoføkonomien, men der kan påvises forskel på bilernes brændstoføkonomi 5 Der kan ikke påvises forskel på dæktypernes effekt på brændstoføkonomien, og iøvrigt heller ikke på bilernes brændstoføkonomi Spørgsmål II.3 (7) Betragt R-kode og -outputtet i ovenstående spørgsmål. Der er angivet to P- værdier - en ud for biler og en ud for dæk (daek). Skulle man udføre de to tilsvarende hypotesetest ved hjælp af kritisk-værdi-metoden, nu med signifikansniveau α = 0.01, hvad bliver da de to kritiske værdier: 1 For biler: For dæk: For biler: For dæk: For biler: For dæk: For biler: For dæk: For biler: For dæk: 5.07 Fortsæt på side 7 6

7 Opgave III 13 løbere fik målt deres puls ved slutningen af en træningstur og 1 minut efter igen, og man fik følgende pulsmålinger: Løber Puls slut Puls 1min Følgende kørtes i R: > Puls_slut=c(173,175,174,183,181,180,170,182,188,178,181,183,185) > Puls_1min=c(120,115,122,123,125,140,108,133,134,121,130,126,128) > mean(puls_slut) [1] > mean(puls_1min) [1] 125 > sd(puls_slut) [1] > sd(puls_1min) [1] > sd(puls_slut-puls_1min) [1] Spørgsmål III.1 (8) Hvad er et 99% konfidensinterval for middelpulsfaldet? (underforstået pulsfaldet på 1 minut fra træningsslut) ± [51.95; 56.97] ± ± /13 [46.80; 62.13] /13 [50.24; 58.68] ± [49.58; 59.35] ± [52.24; 56.68] Fortsæt på side 8 7

8 Spørgsmål III.2 (9) Betragt nu de 13 pulsslutmålinger (første række i tabellen). Angiv et 95% konfidensinterval for spredningen for disse: 1 σ ± < σ < < σ 2 < < σ < σ ± Spørgsmål III.3 (10) Et mål for løbegruppen var at opnå en gennemsnitlig form, svarende til et 1 minuts middelpulsfald på mere end 50. Er det med de givne data muligt for gruppen at påvise statistisk signifikant (på signifikansniveau α = 0.05) et sådan middelpulsfald, eller anderledes udtrykt kan man forkaste nulhypotesen H 0 : µ pulsfald = 50 (på signifikansniveau α = 0.05) mod alternativet H 1 : µ pulsfald > 50? (Både konklusion og argument skal være korrekt) 1 Ja, idet den relevante test-størrelse er 2.79, som er større end den kritiske værdi Ja, idet den relevante test-størrelse er 1.63, som er mindre end den kritiske værdi Nej, idet den relevante test-størrelse er 1.63, som er mindre end den kritiske værdi Nej, idet den relevante test-størrelse er 2.79, som er større end den kritiske værdi Ja, idet den relevante test-størrelse er 34.04, som er større end den kritiske værdi 2.18 Fortsæt på side 9 8

9 Spørgsmål III.4 (11) Et 95% konfidensinterval for middelpulsfaldet ønskedes UDEN brug af normalfordelingsantagelser. Derfor kørte man følgende i R: k = mysamples = replicate(k, sample(puls_slut-puls_1min, replace = TRUE)) mymeans = apply(mysamples, 2, mean) round(quantile(mymeans,c(0.001,0.005,0.01,0.025,0.050,0.95,0.975,0.99,0.995,0.999)),2) hvor round afrunder de angivne fraktiler til 2 decimaler. Man fik følgende fraktiler som resultat: 0.1% 0.5% 1% 2.5% 5% 95% 97.5% 99% 99.5% 99.9% Hvad bliver 95% konfidensintervallet baseret på dette? 1 [50.15; 57.92] 2 [51.23; 57.23] 3 [49.00; 58.54] 4 [51.77; 56.85] 5 Ingen af ovenstående Fortsæt på side 10 9

10 Opgave IV Det såkaldte BMI (Body Mass Index) er et mål for forholdet mellem vægt og højde, og defineres som vægt (V ) i kg divideret med den kvadrerede højde (H) i meter: BMI = V H 2. Antag, at BMI-fordelingen i en population er en lognormal-fordeling med signifikansniveau α = 3.1 og β = 0.15 (altså at log(bmi) er normalfordelt med middelværdi 3.1 og spredning 0.15). Spørgsmål IV.1 (12) En definition af fedme er en BMI-værdi på mindst 30. Hvor stor en andel af populationen er i så fald fede? 1 3.1% % 3 > 99% 4 < 0.01% % Spørgsmål beregne: IV.2 (13): Hvis en person skal bestemme sin egen log(bm I)-værdi, skal personen således log(bmi) = log(v ) 2 log(h) Det antages i det følgende at standardafvigelsen på en måling af højden er σ H = 0.005m og standardafvigelsen på en måling af vægten er σ V = 1.5kg. Det oplyses desuden at de partielle afledede af log(bmi) er log(bmi) V = 1 V og log(bmi) H = 2 H. Hvis en person måler sin højde til 1.67m og sin vægt til 64.3 kg, og altså dermed sin log(bmi)-værdi til log(64.3) 2 log(1.67) = 3.14, hvad er da omtrent spredningen på denne log(bmi)-måling? 1 1.5/ /1.67 = = / / = (1.5/ /1.67) = log( 64.3) log( ) = 1.06 Fortsæt på side 11 10

11 Opgave V I et studie af spædbørns fødselsvægt for forskellige erhvervsgrupper registreredes denne for nogle førstegangsfødende frisører. Nedenstående tabel viser resultatet i gram (data er angivet i sorteret rækkefølge) for 20 fødsler i alt, 10 pigefødsler og 10 drengefødsler. Det kan antages at fødselsvægtene er normalfordelte. Piger (x) Drenge (y) Det oplyses endvidere at x = , ȳ = , s 1 = (for piger) og s 2 = (for drenge). Spørgsmål V.1 (14) Hvad er 20% og 80% fraktilerne for pigefødselsvægtene ved brug af bogens definition? (Husk at R som default bruger en anden definition end bogens) 1 20% fraktil: 2547 og 80% fraktil: % fraktil: og 80% fraktil: % fraktil: 2474 og 80% fraktil: % fraktil: 2830 og 80% fraktil: % fraktil: og 80% fraktil: Spørgsmål V.2 (15) Kan man baseret på disse data påvise statistisk signifikant, at drenges middelfødselsvægt er større end pigers? (Både konklusion og argument skal være korrekt) 1 Ja, idet en relevant teststørrelse er som er mindre end t (18) = Nej, idet en relevant teststørrelse er som er større end z = Nej, idet en relevant teststørrelse er som er større end t (9) = Ja, idet en relevant teststørrelse er som er mindre end t 0.05 (9) = Nej, idet en relevant teststørrelse er som ikke er mindre end t 0.05 (18) = Fortsæt på side 12 11

12 Spørgsmål V.3 (16) Resultatet for hypotesetestet på signifikansniveau α = 0.05 om ens varianser: H 0 : σ 2 1 = σ 2 2 mod et tosidet alternativ kan opsummeres som følger: korrekt) (Både konklusion og argument skal være 1 Varianserne kan påvises forskellige idet / F 0.05 (9, 9) 2 Varianserne kan ikke påvises forskellige idet / F (10, 10) 3 Spredningerne kan påvises ens idet / > F (9, 9) 4 Varianserne kan ikke påvises forskellige idet / F (9, 9) 5 Varianserne kan påvises forskellige idet / > F 0.05 (10, 10) Fortsæt på side 13 12

13 Spørgsmål V.4 (17) Man kender den generelle middelfødselsvægt for (førstefødte) piger (3450g) og (førstefødte) drenge (3600g). Man kigger derfor nu på de 20 (relevante) forskelle til disse midler, og kører følgende i R: (hvoraf ikke nødvendigvis alt giver lige god mening) difs=c(x-3450,y-3600) t.test(difs,mu=3525) t.test(difs) med følgende resultat: > t.test(difs,mu=3525) One Sample t-test data: difs t = , df = 19, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to percent confidence interval: sample estimates: mean of x > t.test(difs) One Sample t-test data: difs t = , df = 19, p-value = alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: sample estimates: mean of x Kan man med disse data påvise statistisk signifikant (på signifikansniveau α = 0.05) at frisørers førstefødte har en anden middelvægt end det generelle niveau? (Både konklusion og argument skal være korrekt) 1 Nej, idet den relevante P-værdi er som er større end Nej, idet den relevante P-værdi er ca. 0 som er mindre end Ja, idet den relevante P-værdi er som er større end Ja, idet den relevante P-værdi er ca. 0 som er mindre end Ja, idet konfidensintervallet indeholder tallet 0 Fortsæt på side 14 13

14 Spørgsmål V.5 (18) I et kommende studie vil man gerne have et 90% konfidensinterval for middelpigefødselsvægten for frisører med en bredde på ca. 100g (dvs. ±50g). Hvor mange pigefødselsvægte skal registreres for at opnå dette? 1 Omtrent (1.96/ ) 2 dvs. mindst 89 2 Omtrent 0.25 (1.96/0.25) 2 dvs. mindst 16 3 Omtrent ( /50) 2 dvs. mindst Omtrent (qnorm(0.90) /50) 2 dvs. mindst Omtrent (qnorm(0.95) /50) 2 dvs. mindst 374 Fortsæt på side 15 14

15 Opgave VI For at undersøge effekten af to nyere danske vandmiljøplaner, har man i et bestemt vandløb målt koncentrationen af kvælstof (målt i g/m 3 ) lige før vandmiljøplanerne trådte i kraft (1998 og 2003) samt i Hver måling er gentaget 6 gange på en kort strækning af vandløbet. Resultatet er vist i nedenstående tabel: N 1998 N 2003 N Gennemsnit Det oplyses, at den totale variation i data er SST = Man fik følgende output fra R svarende til en envejs variansanalyse: (hvor det meste af informationen dog er erstattet af bogstaverne A-E samt U og V) > anova(lm(n~aar)) Analysis of Variance Table Response: N Df SumSq MeanSq Fvalue Pr(>F) Aar A B C U V Residuals D E Spørgsmål VI.1 (19) Hvilke tal har bogstaverne A-D erstattet: 1 A: 3, B: , C: , D: 17 2 A: 3, B: , C: , D: 15 3 A: 2, B: , C: , D: 15 4 A: 2, B: , C: , D: 17 5 A: 2, B: , C: , D: 22 Fortsæt på side 16 15

16 Spørgsmål VI.2 (20) Hvis man anvender signifikansniveau α = 0.05, hvilken kritisk værdi skal så bruges for det hypotesetest, der er udført i analysen (og i tabellen illustreret med tallene U og V)? 1 F (3, 15) = F 0.01 (3, 18) = χ (2) = F 0.05 (2, 15) = χ (1) = Spørgsmål VI.3 (21) Kan man med disse data påvise statistisk signifikant (på signifikansniveau α = 0.05) nogen form for forskelligheder i N-middelværdierne fra år til år? (Både konklusion og argument skal være korrekt) 1 Ja, idet tallet V er mindre end Nej, idet tallet V er større end Ja, idet tallet U er mindre end Nej, idet tallet U er større end Nej, idet tallet U/V er mindre end 0.05 Spørgsmål VI.4 (22) Et 90% konfidensinterval for middelforskellen mellem år 2011 og år 1998 bliver: ± / ± / ± / ± / ± /3 Fortsæt på side 17 16

17 Opgave VII I 2013 var der views på de DTU-statistik-videoer, der ligger tilgængeligt online. Antag først, at forekomsten af views igennem 2014 følger en poisson-process med et 2013-gennemsnit: λ 365dage = Spørgsmål VII.1 (23) Hvad er sandsynligheden for, at der inden for en tilfældig udvalgt halv time ikke forekommer nogen views? < / = /( ) = Spørgsmål VII.2 (24) Der har netop været et view, hvad er sandsynligheden for at man skal vente mere end et kvarter på næste view? < Spørgsmål VII.3 (25) I juni måned 2013 var der views. Hvilket af følgende svar, er det bedste på spørgsmålet: Er dette juni-tal i modstrid med en antagelse om at forekomsten af views fordeler sig helt jævnt hen over året? (Alle sandsynlighedsudsagn i svarmulighederne er korrekte, og X P o(λ) betyder at X følger en poisson-fordeling med intensitet λ) 1 Nej, idet P (X 17560) < 0.498, hvor X P o(λ), λ = Nej, idet P (X 9167) = 0.497, hvor X P o(λ), λ = Ja, idet P (X 9167) = 0.497, hvor X P o(λ), λ = Nej, idet P (X 17560) > , hvor X P o(λ), λ = Ja, idet P (X 17560) < , hvor X P o(λ), λ = 9167 Fortsæt på side 18 17

18 Opgave VIII Ved rensning af drikkevand kan man benytte såkaldt membranfiltrering. I et forsøg ønsker man at undersøge sammenhængen mellem trykfaldet over en membran og den såkaldte flux gennem membranen. Man observerer følgende 10 sammenhængende værdier af tryk (x) og flux (y): Tryk (x) Flux (y) Følgende kørtes i R: Tryk=c(1.02,2.08,2.89,4.01,5.32,5.83,7.26,7.96,9.11,9.99) Flux=c(1.15,0.85,1.56,1.72,4.32,5.07,5.00,5.31,6.17,7.04) mean(tryk) mean(flux) var(tryk) var(flux) sum((tryk-mean(tryk))*(flux-mean(flux))) summary(lm(flux~tryk)) med følgende resultater: > mean(tryk) [1] > mean(flux) [1] > var(tryk) [1] > var(flux) [1] > sum((tryk-mean(tryk))*(flux-mean(flux))) [1] > summary(lm(flux~tryk)) Call: lm(formula = Flux ~ Tryk) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) Tryk e-06 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 8 degrees of freedom Multiple R-squared: ,Adjusted R-squared: F-statistic: on 1 and 8 DF, p-value: 7.177e-06 Fortsæt på side 19 18

19 Spørgsmål VIII.1 (26) Korrelationen mellem tryk og flux estimeres til og fortolkes som følger: (begge dele skal være korrekt) , så flux stiger med stigende tryk , så flux stiger med stigende tryk , så flux falder med stigende tryk , så flux stiger med stigende tryk , så flux stiger med stigende tryk. Spørgsmål VIII.2 (27) Et 90% konfidensinterval for hældningskoefficienten β i regressionsmodellen, der ligger til grund for den udførte analyse, bliver: ± ± ± ± ± Spørgsmål VIII.3 (28) Hvor stor en del af flux-variationen ( 10 i=1 (y i 3.819) 2 ) er ikke forklaret af trykforskelligheder? % % % % % Fortsæt på side 20 19

20 Spørgsmål VIII.4 (29) Kan man på signifikansniveau α = 0.05 afvise hypotesen om at regressionslinien passerer gennem (0, 0)? (Både konklusion og argument skal være korrekt) 1 Ja, idet antallet af observationer er mindre end 30 2 Ja, idet den relevante P-værdi er ca. 0, som er mindre end α 3 Nej, idet den relevante P-værdi er ca. 0, som er mindre end α 4 Nej, idet den relevante P-værdi er 0.681, som er større end α 5 Ja, idet den relevante P-værdi er 0.681, som er større end α Spørgsmål VIII.5 (30) Et konfidensinterval for linien ved tre forskellige trykværdier: x A 0 = 3.5, x B 0 = 5.0 og xc 0 = 9.5 vil se ud som følger: a + b x U 0 ± C U hvor U så er enten A, B eller C. Hvilket af følgende udsagn omkring størrelserne af C A, C B og C C er sandt? (Antag at det samme konfidensniveau er anvendt for alle tre intervaller) 1 C B = C A < C C 2 C B < C A < C C 3 C B > C A > C C 4 C B < C A = C C 5 C B = C A = C C SÆTTET ER SLUT. GOD SOMMER! 20

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 1. december 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 15. december 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1 Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 1. juni 2005 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af (navn)

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 26. maj 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 23. maj 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 2. juni 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 20. august 2017 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr)

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 16. august 2015 Kursus navn og nr: Introduktion til Statistik (02323, 02402 og 02593) Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 25 sider. Skriftlig prøve: 13. december 2016 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 10: Statistik ved hjælp af simulering Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345) Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i

Læs mere

Danmarks Tekniske Universitet Side?? af 20 sider

Danmarks Tekniske Universitet Side?? af 20 sider Danmarks Tekniske Universitet Side?? af 20 sider Skriftlig prøve: 15. december 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af eksaminant

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen Kursus 02402/02323 Introducerende Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Oversigt 1 Intro: Regneeksempel og TV-data fra B&O 2 Model og hypotese Per Bruun Brockhoff DTU Compute, Statistik

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se Epidemiologi og biostatistik. Uge, torsdag 5. februar 00 Morten Frydenberg, Institut for Biostatistik. Type og type fejl Statistisk styrke Nogle speciale metoder: Normalfordelte data : t-test eksakte sikkerhedsintervaller

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Besvarelser til øvelsesopgaver i uge 6

Besvarelser til øvelsesopgaver i uge 6 Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok Opgave 1 Vejledende besvarelse af eksamen i Statistik for biokemikere, blok 2 2006 Inge Henningsen og Niels Richard Hansen Analysevariablen i denne opgave er variablen forskel, der for hver af 10 kvinder

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Forelæsning 11: Tovejs variansanalyse, ANOVA

Forelæsning 11: Tovejs variansanalyse, ANOVA Introduktion til Statistik Forelæsning 11: Tovejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Danmarks Tekniske Universitet Side 1 af 19 sider

Danmarks Tekniske Universitet Side 1 af 19 sider Danmarks Tekniske Universitet Side 1 af 19 sider Skriftlig prøve: 2. juni 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dettesæterbesvaretafeksaminant

Læs mere

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter Opgave I I mange statistiske undersøgelser benytter man binomialfordelingen til at beskrive den tilfældige variation. Spørgsmål I.1 (1): For hvilken af følgende 5 stokastiske variable kunne binomialfordelingen

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

2 0.9245. Multiple choice opgaver

2 0.9245. Multiple choice opgaver Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere