(studienummer) (underskrift) (bord nr)

Størrelse: px
Starte visningen fra side:

Download "(studienummer) (underskrift) (bord nr)"

Transkript

1 Danmarks Tekniske Universitet Side 1 af 25 sider. Skriftlig prøve: 13. december 2016 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 18 opgaver. Besvarelserne af multiple choice spørgsmålene anføres i det i CampusNet uploadede svarark, med numrene på de svarmuligheder, du mener er de korrekte. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. KUN følgende 5 svarmuligheder er gyldige: 1, 2, 3, 4 eller 5. Hvis et spørgsmål efterlades blankt eller andet type svar angives, tæller det ikke med i besvarelsen. Envidere, hvis mere end et svar angives, hvilket faktisk er teknisk muligt i online-systemet, så tæller det ikke med (dvs. giver 0 point ). Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen. Den endelige besvarelse af opgaverne gøres ved at udfylde og online-aflevere svararket via CampusNet. Skemaet her er KUN et nød-alternativ til dette (husk at angive dit studienummer på din besvarelse, hvis du afleverer skemaet). Opgave I.1 II.1 III.1 III.2 IV.1 IV.2 V.1 VI.1 VII.1 VIII.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Opgave VIII.2 IX.1 IX.2 IX.3 IX.4 X.1 XI.1 XI.2 XI.3 XI.4 Spørgsmål (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar Opgave XI.5 XII.1 XII.2 XIII.1 XIII.2 XIV.1 XV.1 XVI.1 XVII.1 XVIII.1 Spørgsmål (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar Sættet består af 25 sider. Fortsæt på side 2 1

2 Multiple choice opgaver: Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I Archaeopteryx er en uddød fugleslægt, der danner en af de vigtigste fossile mellemformer mellem krybdyr og fugle. Det er den tidligste kendte og mest primitive urfugl. Antag, at man har data fra 6 fossile fund af Archaeopteryx, og har målt længe af lårbenet (femur) og overarmsbenet (humerus), som vist i nedenstående tabel. Femur Humerus Data kan indlæses i R ved: femur = c(38,46,56,59,64,74) humerus = c(41,50,63,70,71,76) Spørgsmål I.1 (1) Arkæologer har længe ment, at der bør være en lineær sammenhæng mellem længde af femur og humerus for uddøde dyr som Archaeopteryx. Hvilken konklusion kommer man frem til ved at analysere ovenstående data når signifikansniveau α = 0.05 anvendes? 1 Der er grund til at antage en lineær sammenhæng, da længde af ben i dyr altid er positivt korreleret. 2 Der er grund til at antage en lineær sammenhæng, idet p-værdien for det relevante test er Der er grund til at antage en lineær sammenhæng, idet p-værdien for det relevante test er Der er ikke grund til at antage en lineær sammenhæng, idet p-værdien for det relevante test er Der er ikke grund til at antage en lineær sammenhæng, idet p-værdien for det relevante test er Fortsæt på side 3

3 Opgave II Man planlægger et studie hvor man vil undersøge om indtagelse af et naturprodukt har betydning for vægt. I forsøget skal der indgå 10 forsøgspersoner (mænd med nogenlunde ens vægt), og man vil registrere vægtændringen D i (i = 1,..., 10) efter brug af naturproduktet i 1 måned. Man er interesseret i at teste om middelændringen kan tænkes at være lig nul, dvs. hypotesen H 0 : µ D = 0 mod alternativet H 1 : µ D 0. Man beslutter sig for signifikansniveauet α = Spørgsmål II.1 (2) Hvis man antager, at standardafgivelsen for vægtændringen er σ = 1 kg, hvor stor styrke (eng: power) har man så for at opdage en faktisk vægtændring på mindst 1 kg? (hint: man kan med fordel anvende funktionen power.t.test i R.) % % % % % 3 Fortsæt på side 4

4 Opgave III Det antages, at kolesterolindhold i hønseæg, X, er normalfordelt med middelværdi µ = 200 mg og standardafgivelse σ = 15 mg, dvs. X N(200, 15 2 ). Spørgsmål III.1 (3) Hvor stor en andel af hønseæg har et kolesterolindhold, der er højere end 205 mg? 1 P (X > 205) = P (X > 205) = P (X > 205) = P (X > 205) = P (X > 205) = Spørgsmål III.2 (4) Til industrikøkkener sælges kartoner med æg, hvor indholdet, Y, i en karton svarer til indholdet af 100 æg, dvs. det samlede indhold af kolesterol i en karton er Y = 100 i=1 X i. Indholdet i æggene kan antages uafhængige fra hinanden. Du køber en karton med æg svarende til at købe 100 æg. Hvilken af nedenstående R kommandoer giver sandsynligheden for, at det samlede kolesterolindhold, Y, er højere end 20.5 g (bemærk at 200 mg er 0.2 g)? 1 pnorm(q=100*0.205, mean=100*0.200, sd=100*0.015) 2 1-pnorm(q=100*0.200, mean=100*0.205, sd=sqrt(100*0.015*0.015)) 3 pnorm(q=100*0.205, mean=100*0.200, sd=100*100*0.015) 4 1-pnorm(q=100*0.205, mean=100*0.200, sd=sqrt(100*0.015*0.015)) 5 pnorm(q=100*0.205, mean=100*0.200, sd=sqrt(100*0.015*0.015)) 4 Fortsæt på side 5

5 Opgave IV Vi betragter en binomialfordelt stokastisk variabel Y hvor n = 100 og p = Spørgsmål IV.1 (5) Beregn nu P (Y > 40): Spørgsmål IV.2 (6) Vi definerer en ny stokastisk variabel, X, ved X = k Y, hvor konstanten k er givet ved k = 2 og Y er binomial fordelt med n = 100 og p = Angiv nu variansen for den stokastiske variabel X: 1 Var(X) = Var(k Y ) = k + n p(1 p) = Var(X) = Var(k Y ) = k 2 n 2 p 2 (1 p) 2 = Var(X) = Var(k Y ) = k 2 n 2 p(1 p) = Var(X) = Var(k Y ) = k 2 n p(1 p) = Var(X) = Var(k Y ) = k n p(1 p) = Fortsæt på side 6

6 Opgave V Vi betragter en eksponentialt fordelt stokastisk variabel X med parameter β, og hvor fordelingsfunktionen er givet ved P (X x) = 1 e x/β, hvor x > 0 og og β > 0. Det oplyses, at middelværdien for X er lig β. Spørgsmål V.1 (7) Angiv nu medianen for X: 1 Medianen for X bliver β 2 Medianen for X bliver β. 3 Medianen for X bliver log(2) β (hvor log er den naturlige logaritme) 4 Medianen for X bliver log( 1) 2 β2 (hvor log er den naturlige logaritme) 5 Medianen for X bliver 2 β 6 Fortsæt på side 7

7 Opgave VI En biolog er interesseret i at undersøge effekten af 3 forskellige fodertyper (A, B, C) til opdræt af tigerrejer. Der indkøbes 24 ensartede larver fra et klækkeri til eksperimentet. Hver larve placeres i sin egen beholder, og ved lodtrækning bestemmes tildeling af fodertype således at hver fodertype bliver afprøvet på 8 larver. Larverne vokser sig til tigerrejer, og efter endt forsøg måles vægten af rejerne, Y ij (i gram). Da vægten kan antages normalfordelt, vælger man at analysere data ud fra følgende variansanalysemodel Y ij = µ + α i + ε ij I modellen angiver α i effekten af fodertype i (i = 1, 2, 3). Endelig er µ gennemsnittet og ε ij er modellens afvigelser, der antages normalfordelt med middelværdi 0 og standardafvigelse σ ε. En variansanalyse for ovenstående model er givet nedenfor, og det ses, at fodertype er statistisk signifikant. Analysis of Variance Table Response: Y Df Sum Sq Mean Sq F value Pr(>F) Fodertype ** Residuals Spørgsmål VI.1 (8) På forhånd var der en interesse i at sammenligne middelværdi for fodertype A og C, der har estimeret middelværdi på hhv. ˆµ A = og ˆµ C = Angiv nu et 95% konfidensinterval for middelforskellen mellem fodertype A og C: ± ( ) ± ( ) ± ( 1 + 1) ± ( 1 + 1) ± ( 1 + 1) Fortsæt på side 8

8 Opgave VII Antag, at dødeligheden (mortaliteten) fra en bestemt kræftform er 23% indenfor det første år. I et forsøg med en ny eksperimentel behandling finder man, at 15 ud af 84 patienter døde indenfor det første år. Spørgsmål VII.1 (9) Kan man statistisk påvise, at den nye eksperimentelle behandling reducerer dødeligheden for det første år, når signifikansniveau α = 0.05 anvendes? 1 Ja, idet p-værdien er Ja, idet p-værdien er Nej, idet p-værdien er Nej, idet p-værdien er større end Det kan ikke besvares uden yderligere oplysninger 8 Fortsæt på side 9

9 Opgave VIII I et forsøg vil man sammenligne slidstyrken af to forskellige slags gummi (A og B), der anvendes som materiale i skosåler. I forsøget indgår 100 skolebørn i alderen 8-10 år. Man udfører forsøget ved at hvert barn får udleveret et par sko, hvor sålen på den ene sko er lavet i materiale A, mens sålen på den anden sko er materiale B. For hvert par sko har man trukket lod om hvorvidt materiale A skal være på skoen til højre eller til venstre. Børnene anvender skoene hver dag i 3 måneder, og efter endt forsøg, måles slid (i mm) på hver sko. Spørgsmål VIII.1 (10) Idet man kan antage at det målte slid er kontinuert og normalfordelt for hvert slags gummi, skal man angive hvilken af nedenstående analyser man bør anvende, såfremt man ønsker at teste om materiale A og B er ens mht. slidstyrke: 1 En test i en antalstabel 2 En F test for sammenligning af to varianser 3 En almindelig (ikke-parret) t-test 4 En parret t-test 5 En ensidet variansanalyse Spørgsmål VIII.2 (11) Det viser sig, at man må acceptere nul-hypotesen om at de to materialer er lige slidstærke. I stedet beregner man for hvert barn i forsøget det gennemsnitlige slid for et par sko. Idet der indgik 50 piger og 50 drenge i forsøget, vil man nu undersøge ved brug af et almindeligt t-test, om drenge og piger slider skoene lige meget, eller der alternativt er forskel på slid for køn (tosidet test). Idet slidet kan antages normalfordelt indenfor hvert køn med ens varians, fås den sædvanlige teststørrelse til t obs = 2.23 med 98 frihedsgrader. Angiv nu p-værdien for testet: 1 p-værdi bliver p-værdi bliver p-værdi bliver p-værdi bliver p-værdi bliver Fortsæt på side 10

10 Opgave IX Et kursus på en højere læreranstalt bliver udbudt hvert semester, typisk med flere end 300 studerende, der går til eksamen. Eksamensresultaterne, for 280 studerende, der har bestået kurset ved den sidste eksamen, er gengivet i nedenstående tabel. Eksempelvis ses, at 24 studerende fik karakteren 12. Fordelingen af de 280 karakterer indgår i de 4 næste spørgsmål. Karakter I alt Antal Data kan indlæses i R ved: karakterer = rep(x=c(2,4,7,10,12), times=c(22,78,84,72,24)) Spørgsmål IX.1 (12) Benyt den centrale grænseværdisætning til at bestemme et 95% konfidensinterval for middelkarakteren baseret på de studerende, der har bestået eksamen (Det er vigtigt i dette spørgsmål, at karakterene opfattes numerisk, fx. svarer 02 til tallet 2 osv.). 1 [6.51 ; 7.43] 2 [6.62 ; 7.32] 3 [4 ; 10] 4 [5.12 ; 8.67] 5 [5.99 ; 8.72] 10 Fortsæt på side 11

11 Spørgsmål IX.2 (13) Man ønsker nu at teste om andelen af studerende, der har bestået eksamen med karakteren 7 eller højrere kan antages at være 65%, hvilket har været en målsætning i konstruktionen af karakterskalaen. Vi kalder denne andel p 7+. Fra tabellen i forrige spørgsmål ses, at 180 studerende ud af 280 fik karakteren 7 eller højere. Angiv p-værdien når vi tester H 0 : p 7+ = 0.65 mod H 1 : p Spørgsmål IX.3 (14) En studerende synes det er interessant at analysere data nærmere, og kører nedenstående kode, idet de 280 karakterer er gemt i vektoren karakterer k = samples = replicate(k, sample(karakterer, replace = TRUE)) simval = apply(samples, 2, sd) resultater = quantile(simval, c(0.025,0.975)) Hvilket numerisk resultat er blevet beregnet i vektoren resultater 1 Et 95% konfidensinterval for standard afvigelsen af karaktererne (ikke-parametrisk bootstrap) 2 Et 95% konfidensinterval for karakterfordelingen (parametrisk bootstrap) 3 Et 95% prædiktionsinterval for medianen af karaktererne (ikke-parametrisk bootstrap) 4 Et 95% prædiktionsinterval for standard error af karaktererne (parametrisk bootstrap) 5 Et 95% konfidensinterval for 75% fraktilen af karaktererne (parametrisk bootstrap) 11 Fortsæt på side 12

12 Spørgsmål IX.4 (15) Man ønsker nu at undersøge om karakterfordelingen er ens for mænd og kvinder. Karakterfordelingen efter køn er vist i nedenstående tabel. Karakter I alt Mænd Kvinder Angiv nu det forventede antal for mænd med karakteren 7, såfremt karakterfordelingen er ens for mænd og kvinder (dvs. under antagelse af nul-hypotesen) Fortsæt på side 13

13 Opgave X En diskret stokastisk variabel, X, anvendes til at beskrive antal hændelser per tidsinterval. X har tæthedsfunktion på den velkendte form: P (X = x) = 2x x! e 2, for x 0. Spørgsmål X.1 (16) Hvad er middelværdien af X? log(2) (hvor log er den naturlige logaritme) π Fortsæt på side 14

14 Opgave XI I et studie sammenligner man kognetive evner hos 3 grupper af børn. Grupperne består af a) børn med Tourette Syndrom (TS), b) børn med ADHD og c) børn uden nogen af disse diagnoser (Kontrol). I undersøgelsen blev hvert barn bedt om at løse en sekvens af opgaver på en computer, og man målte den gennemsnitlige reaktionstid, R i, (i millisekunder) for det enkelte barn. I undersøgelsen indgik 17 børn med TS, 13 med ADHD og 20 Kontrol, dvs. i alt n = 50 børn. Ved analyse af data fra forsøget har man antaget, at reaktionstiden R i kan antages normalfordelt for hver gruppe med konstant varians, σe 2. Med henblik på at undersøge om middelreaktionstiden kan antages ens for de tre grupper (TS, ADHD og Kontrol) er følgende variansanalysetabel beregnet. Analysis of Variance Table Response: reaktionstid Df Sum Sq Mean Sq F value Pr(>F) gruppe A D.976e-07 *** Residuals B C --- Det ses dog, at ikke alle tal er oplyst i variansanalysetabellen, men er i stedet givet ved symbolerne A, B, C og D. Disse 4 symboler indgår i løsningen af det næste spørgsmål. Spørgsmål XI.1 (17) Såfremt det gælder, at middelreaktionstiden er ens for de tre grupper (TS, ADHD og Kontrol), hvilken fordeling vil den beregnede værdi D i tabellen så følge? 1 F (A, A + B) dvs. en F -fordeling med frihedsgrader A og A + B fundet i variansanalysetabellen. 2 F (C, B) dvs. en F -fordeling med frihedsgrader C og B fundet i variansanalysetabellen. 3 F (A, B) dvs. en F -fordeling med frihedsgrader A og B fundet i variansanalysetabellen. 4 F (A, C) dvs. en F -fordeling med frihedsgrader A og C fundet i variansanalysetabellen. 5 F (B, A) dvs. en F -fordeling med frihedsgrader B og A fundet i variansanalysetabellen. 14 Fortsæt på side 15

15 Spørgsmål XI.2 (18) Hvad bliver konklusionen på analysen givet i variansanalysetabellen, såfremt signifikansniveau α = 0.05 anvendes? 1 Man må afvise hypotesen om at middelreaktionstiden for kontrolbørn er som for børn med TS eller ADHD. 2 Man må afvise hypotesen om at variansen for reaktionstiden for kontrolbørn er som for børn med TS eller ADHD. 3 Man kan påvise at variansen for reaktionstiden er ens for de tre grupper, idet p-værdien er lig Man må afvise hypotesen om at middelreaktionstiden er ens for de tre grupper, idet p-værdien er lig Man kan ikke afvise hypotesen om at middelreaktionstiden er ens for de tre grupper. Spørgsmål XI.3 (19) Efterfølgende ville man undersøge hvorvidt børnenes alder x 1,i havde indflydelse på reaktionstiden, Y i. Man udførte derfor et nyt forsøg, hvor i n = 12 børn uden diagnose (Kontrol), men med forskellige alder løste sekvensen af opgaver og den gennemsnitlige reaktionstid blev målt. Man anvender modellen Y i = β 0 + β 1 x 1,i + ε i for at undersøge sammenhæng mellem alder og reaktionstid, hvor afvigelserne antages i.i.d. og normalfordelt med konstant varians, altså ε i N(0, σ 2 ). Man får følgende output for de nye data: Call: lm(reaktionstid ~ Alder) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) *** Alder * --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 10 degrees of freedom 15

16 Multiple R-squared: ,Adjusted R-squared: F-statistic: on 1 and 10 DF, p-value: Ved brug af tallene i output for modellen skal teststørrelsen for hypotesen H 0 : β 1 = 0 angives Spørgsmål XI.4 (20) Ved brug af resultat af analysen i forrige spørgsmål, find da estimatet af korrelationen, ˆρ, mellem Reaktionstid (Y i ) og Alder (x 1,i ): 1 ˆρ = ˆρ = ˆρ = ˆρ = ˆρ = / Fortsæt på side 17

17 Spørgsmål XI.5 (21) En kritik af modellen Y i = β 0 + β 1 x 1,i + ε i i forrige spørgsmål er, at der ikke tages højde for hvorvidt der svares korrekt eller ej på de enkelte spørgsmål, men at blot reaktionstiden registreres. Man ønsker derfor en udvidet model på formen: Y i = β 0 + β 1 x 1,i + β 2 x 2,i + ε i, hvor x 2,i nu er antal korrekte svar i sekvensen af spørgsmål (øvrige variable er som i forrige spørgsmål). Baseret på et nyt forsøg med 12 børn får man resultatet Call: lm(reaktionstid ~ Alder + Korrekte) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-05 *** Alder * Korrekte * --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 9 degrees of freedom Multiple R-squared: ,Adjusted R-squared: F-statistic: on 2 and 9 DF, p-value: Angiv nu estimaterne ˆβ 1, ˆβ 2 og ˆσ 2 : 1 ˆβ 1 = , ˆβ 2 = og ˆσ 2 = ˆβ 1 = , ˆβ 2 = og ˆσ 2 = ˆβ 1 = , ˆβ 2 = og ˆσ 2 = ˆβ 1 = , ˆβ 2 = og ˆσ 2 = ˆβ 1 = , ˆβ 2 = og ˆσ 2 = Fortsæt på side 18

18 Opgave XII En ingeniør analyserer en process Y, der kan udtrykkes ved Y = U/B. Det kan antages, at U og B er uafhængige. Ingeniøren har 20 sammenhørende målinger af U og B gemt som vektorer i statistikprogrammet R og disse er benævnt uobs og bobs. Spørgsmål XII.1 (22) Ingeniøren vil gerne beregne et 95% konfidensinterval for variansen for Y, dvs. σy 2 ved brug af ikke-parametrisk bootstrap. Hvilket af nedenstående forslag (kode i R) er mest hensigtsmæssigt? 1 samples = replicate(10000,sample(uobs/bobs,replace=false)) results = apply(samples,1, var) quantile(results, c(0.025, 0.975)) 2 samples = replicate(10000,sample(uobs/bobs,replace=true)) results = apply(samples,2, var) quantile(results, c(0.025, 0.975)) 3 samples = replicate(10000,sample(var(uobs)/var(bobs),replace=true)) results = apply(samples,2, var) quantile(results, c(0.025, 0.975)) 4 samples = replicate(10000,sample(uobs/bobs,replace=true)) results = apply(samples,1, var) quantile(results, c(0.95)) 5 samples = replicate(10000,sample(uobs/bobs,replace=false)) results = apply(samples,2, var) quantile(results, c(0.025, 0.975)) 18 Fortsæt på side 19

19 Spørgsmål XII.2 (23) Vi fortsætter med problemstillingen fra forrige opgave, dvs. vi analyserer en process Y, der kan udtrykkes ved Y = U/B. Hvis vi antager, at U N(µ = 35, σ 2 = 10 2 ) og B N(µ = 50, σ 2 = 10 2 ), hvad bliver så sandsynligheden for at Y overstiger 1, dvs. angiv P (Y > 1): 1 < Fortsæt på side 20

20 Opgave XIII Et analyseinstitut vil gerne angive et 95% konfidensinterval for den sande andel, p, af forbrugere, der bevidst går efter at købe økologiske fødevarer når de handler. Analyseinstituttet planlægger at stille n forbrugere spørgsmålet: Går De bevidst efter at købe økologiske fødevarer når De handler?. Svarmulighederne til dette skal være Ja eller Nej. Spørgsmål XIII.1 (24) Hvor mange uafhængige forbrugere n skal svare på undersøgelsen for at 95% konfidensinterval for den sande andel, p, højst bliver 0.04 bredt (Hint: Som udgangspunkt for beregningerne kan det antages, at 50% af forbrugerne bevidst går efter at købe økologiske fødevarer når de handler)? 1 n = n = ( = n = ( ) 2 = dvs. mindst n = ( ) = ) 2 = dvs. mindst n = ( 1 2 ) 2 = Spørgsmål XIII.2 (25) Uanset svaret i foregående spørgsmål betragter vi nu resultatet af en forundersøgelse, hvor 1000 forbrugere fik stillet spørgsmålet Går De bevidst efter at købe økologiske fødevarer når De handler?. Blandt de 1000 adspurgte svarede 436 Ja. Hvad bliver den relevante test størrelse, hvis man vil undersøge om den sande andel, p ja, der svarer Ja kan antages at være 50% eller alternativt at den er mindre end 50%, dvs. H 0 : p ja = 0.5 mod H 1 : p ja < ( )/ 0.25/1000 = ( )/ 0.436( ) = ( )/ 0.436( ) 1000 = ( )/ = ( )/ = Fortsæt på side 21

21 Opgave XIV Antag, at antal forsøg til køreprøven (før den er bestået) i en bestemt kommune kan beskrives ved modellen Y = X + 1, hvor X er en poissonfordelt stokastisk variabel med middelværdi λ = 0.4, dvs. X Pois(λ = 0.4). Spørgsmål XIV.1 (26) Vi betragter nu antal forsøg blandt 100 tilfældigt udvalgte personer, der skal bestå køreprøven. Hvad bliver middelværdi, µ, og varians, σ 2, for det samlede antal forsøg, 100 i=1 Y i der skal gennemføres? 1 µ = 140 og σ 2 = 40 2 µ = 140 og σ 2 = µ = 140 og σ 2 = µ = 140 og σ 2 = 40 5 µ = 140 og σ 2 = Fortsæt på side 22

22 Opgave XV Antag at antal færdselsuheld per dag, X, følger en poissonfordeling. Fra 200 uafhængige observationer har man estimeret raten λ til ˆλ = 1.2. Spørgsmål XV.1 (27) Angiv nu et 95% konfidensinterval for den sande rate λ: 1 [1.2; 4.8] 2 [0; 4] ± ± ± Fortsæt på side 23

23 Opgave XVI To typer receptpligtig medicin (A og B) til at sænke kolesterol i blodet, bliver sammenlignet i et klinisk studie. Ved analyse af data, estimeres hvor meget medicin A reducerer kolesteroltallet, benævnt A, og tilsvarende hvor meget medicin B reducerer kolesteroltallet, benævnt B (positive værdier af angiver reduktion og man fandt, at både A og B reducerede kolesteroltallet i middel.). Endelig finder man et 95% konfidensinterval for forskellen i reduktion ( A B ). Dette interval bliver [0.24; 0.50] mmol/l. Spørgsmål XVI.1 (28) Hvilket af følgende udsagn er en rimelig konklusion på undersøgelsen? 1 Medicin A reducerer kolesterol med 0.24 mmol/l mens medicin B reducerer kolesterol med 0.50 mmol/l 2 Der er 95% sandsynlighed for at medicin A er bedre til at sænke kolestroltallet end medicin B for en vilkårlig person 3 Der er 95% sandsynlighed for at medicin A vil sænke kolestroltallet med mindst 39 mmol/l i forhold til medicin B for en vilkårlig person 4 Der er mindst 95% sikkerhed for at medicin A virker bedre end medicin B 5 Ingen af ovenstående 23 Fortsæt på side 24

24 Opgave XVII En ingeniør planlægger at tage en stikprøve fra en population. Vi betragter følgende 3 udsagn: I. Såfremt stikprøven har varians nul, så er variansen i populationen også nul. II. Såfremt populationen har varians nul, så er variansen i stikprøven også nul. III. Såfremt stikprøven har varians nul, så bliver middelværdi og median ens i stikprøven. Spørgsmål XVII.1 (29) Hvilke af de 3 ovenstående udsagn er korrekt(e)? 1 Kun I. og II. 2 Kun I. og III. 3 Kun II. og III. 4 I., II., og III. er alle korrekte 5 Ingen af ovensteånde 24 Fortsæt på side 25

25 Opgave XVIII Det er velkendt, at gøge lægger deres æg i andre fuglearters rede, og dermed overlader opgaven med at udruge og opfostre deres unger til værtsfuglen. Envidere er der en teori om, at gøge er i stand til at tilpasse størrelsen af deres æg, afhængig af hvor stor værtsfuglen er. For at undersøge denne teori, har en ornitolog over en periode registreret størrelsen (længde af ægget) af 10 gøgeæg i hver af 2 forskellige værtsfugles reder, her benævnt værtsfugl A og B, altså samlet 20 æg. Hun regner sig frem til, at standardafgivelsen for størrelsen er 2 mm for både værtsfugl A og B. Spørgsmål XVIII.1 (30) Det viser sig nu, at den observerede forskel i størrelse, XA X B, mellem æggene er 1 mm. Hvilken konklusion kommer man frem til, idet man ønsker at teste hypotesen H 0 : µ A = µ B mod H 1 : µ A µ B med anvendelse af et almindelig t-test og signifikansniveau α = 5%? 1 Forskel i størrelse på æggene er statistisk set signifikant 2 Forskel i størrelse på æggene er statistisk set ikke-signifikant 3 Man kan ikke konkludere noget uden oplysning om den faktiske størrelse på æggene for A og B 4 Man kan ikke konkludere noget uden kendskab til populationsstørrelsen 5 Det er ikke relevant at anvende et almindelig t-test her SÆTTET ER SLUT. Hav en god juleferie! 25

(student number) (signature) (table number)

(student number) (signature) (table number) Technical University of Denmark Page 1 of 25 pages. Written examination: 13. december 2016 Course name and number: Introduktion til Statistik (02323 og 02402) Aids and facilities allowed: All The questions

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 15. december 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 1. december 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Danmarks Tekniske Universitet Side 1 af 19 sider

Danmarks Tekniske Universitet Side 1 af 19 sider Danmarks Tekniske Universitet Side 1 af 19 sider Skriftlig prøve: 2. juni 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dettesæterbesvaretafeksaminant

Læs mere

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1 Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 1. juni 2005 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af (navn)

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 27. maj 2014 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 2. juni 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 20. august 2017 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 26. maj 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 23. maj 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Danmarks Tekniske Universitet Side?? af 20 sider

Danmarks Tekniske Universitet Side?? af 20 sider Danmarks Tekniske Universitet Side?? af 20 sider Skriftlig prøve: 15. december 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af eksaminant

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr)

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 16. august 2015 Kursus navn og nr: Introduktion til Statistik (02323, 02402 og 02593) Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

2 X 2 = Antal mygstik på enpersoniløbetaf1minut Opgave I I mange statistiske undersøgelser bygger man analysen på anvendelse af normalfordelingen til (eventuelt tilnærmelsesvist) at beskrive den tilfældige variation. Spørgsmål I.1 (1): Forén af følgende

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Side 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2003. Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2003. Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 21 sider Skriftlig prøve: 15. december 2003 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

2 0.9245. Multiple choice opgaver

2 0.9245. Multiple choice opgaver Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

02402 Løsning til testquiz02402f (Test VI)

02402 Løsning til testquiz02402f (Test VI) 02402 Løsning til testquiz02402f (Test VI) Spørgsmål 4. En ejendomsmægler ønsker at undersøge om hans kunder får mindre end hvad de har forlangt, når de sælger deres bolig. Han har regisreret følgende:

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 30. maj 2016 Kursus nr : (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side af 7 sider Skriftlig prøve, den: 0. maj 206 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side af 7 sider Skriftlig prøve, den: 9. maj 05 Kursus nr : 0405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret af:

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

2 Gennemsnitligt indhold af aktivt stof i en tablet fra et glas med 200 tabletter

2 Gennemsnitligt indhold af aktivt stof i en tablet fra et glas med 200 tabletter Ekstraopgaver uge 2-02402 Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de

Læs mere

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr) CIVILINGENIØREKSAMEN Side?? af?? sider Skriftlig prøve, den: 6. december 2004 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift)

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger Program Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Analyse af ikke-parrede stikprøver: repetition of rettelse af fejl! Lidt

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2019 Kursus nr : (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side 1 af 16 sider Skriftlig prøve, den: 7. maj 019 Kursus nr : 0405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4 Vejledende løsning 5.46 P (0.010 < error < 0.015) = (0.015 0.010)/0.050 = 0.1 > punif(0.015,-0.025,0.025)-punif(0.01,-0.025,0.025) [1] 0.1

Læs mere

Test nr. 6 af centrale elementer 02402

Test nr. 6 af centrale elementer 02402 QuizComposer 2001- Olaf Kayser & Gunnar Mohr Contact: admin@quizcomposer.dk Main site: www.quizcomposer.dk Test nr. 6 af centrale elementer 02402 Denne quiz angår forståelse af centrale elementer i kursus

Læs mere