(studienummer) (underskrift) (bord nr)

Størrelse: px
Starte visningen fra side:

Download "(studienummer) (underskrift) (bord nr)"

Transkript

1 Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 23. maj 2012 Kursus navn og nr: Introduktion til Statistik, Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer) (underskrift) (bord nr) Opgavesættet består af 30 spørgsmål af multiple choice typen fordelt på 13 opgaver. Besvarelserne af multiple choice spørgsmålene anføres ved at udfylde skemaet på forsiden (denne side), med numrene på de svarmuligheder, du mener er de korrekte. Et forkert svar kan rettes ved at sværte det forkerte svar over og anføre det rigtige i stedet. Er der tvivl om meningen med en rettelse, eller er der anført flere end ét nummer ved et spørgsmål, betragtes spørgsmålet som ubesvaret. Kladde, mellemregninger eller andet tillægges ingen betydning, kun svarene i tabellen tæller. Der gives 5 point for et korrekt multiple choice svar og 1 for et ukorrekt svar. Ubesvarede spørgsmål eller et 6-tal (svarende til ved ikke ) giver 0 point. Det antal point, der kræves for, at et sæt anses for tilfredstillende besvaret, afgøres endeligt ved censureringen af sættene. Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Opgave I.1 I.2 II.1 II.2 II.3 III.1 III.2 IV.1 IV.2 IV.3 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Opgave V.1 V.2 V.3 VI.1 VI.2 VII.1 VII.2 VII.3 VIII.1 IX.1 Spørgsmål (11) (12) (13) (14) (15) (16) (17) (18) (19) (20) Svar / Opgave IX.2 X.1 X.2 XI.1 XI.2 XII.1 XII.2 XIII.1 XIII.2 XIII.3 Spørgsmål (21) (22) (23) (24) (25) (26) (27) (28) (29) (30) Svar Husk at forsyne opgavesættet med dit nummer. Sættets sidste side er nr 20; blad lige om og se, at den er der. Fortsæt på side 2 1

2 Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder er meningsfulde. Opgave I Ved illegal import af hunde fra Østlandene, fås ofte hunde til landet der ikke er vaccinerede mod en given sygdom. Der er kommet et nyt præparat på markedet til behandling af ikke vaccinerede hunde, hvis de angribes af sygdommen. Hidtil har sygdommen medført en stor dødelighed blandt de importerede hunde, men producenten af det nye præparat påstår at mindst 80% af de angrebne hunde vil overleve, hvis de behandles med præparatet. På en dyreklinik behandles 30 hunde med præparatet, og 19 af disse helbredes. Spørgsmål I.1 (1) Modbeviser dette resultat producentens påstand, hvis et signifikansniveau på α = 5% anvendes: (Både konklusion og argument skal være i orden) 1 Ja, idet P-værdien = P (X 19) = , hvor X er en bin(x; 30, 0.8)-fordeling 2 Nej, idet P-værdien = P (X 19) = , hvor X er en bin(x; 30, 0.8)-fordeling 3 Nej, idet P-værdien = P (X 19) = , hvor X er en bin(x; 30, 0.5)-fordeling 4 Ja, idet P-værdien = P (X 20) = , hvor X er en bin(x; 30, 0.5)-fordeling 5 Nej, idet P-værdien = P (X 20) = , hvor X er en bin(x; 30, 0.8)-fordeling Spørgsmål I.2 (2) Dyrlægerne har pligt til at indberette sygdomstilfældene. I en periode er der i middel indberettet 10 sygdomstilfælde pr. arbejdsdag. Hvis man anvender den sædvanlige sandsynlighedsfordeling for antal hændelser pr. tidsenhed med et gennemsnit på 10 pr. dag, bliver sandsynligheden for at få 16 indberetninger eller flere en given dag: Fortsæt på side 3 2

3 Opgave II Ved produktion af en folie kontrolleres en færdig rulle folie ved at tykkelsen af folien måles i nogle punkter fordelt over rullens bredde. Produktionen anses for stabil, hvis middelværdien af differensen mellem største og mindste mål ikke overstiger 0.35mm. På et givet skift er følgende data fundet for 10 ruller: Rulle Max. mål i mm (y max ) Min. mål i mm (y min ) Max-Min(D) Følgende beregningsstørrelser kan evt. benyttes: ȳ max = 2.508, ȳ min = 2.103, s ymax = , s ymin = , s D = Spørgsmål II.1 (3) Testes følgende hypotese om middelforskellen: H 0 : µ D = 0.35 H 1 : µ D > 0.35 fås følgende t-værdi: ( ) = 3.90 ( )/2 3 10( ) = 0.56 ( )/ ( )/(2 10) = / 10 = 1.80 Fortsæt på side 4 3

4 Spørgsmål II.2 (4) Den kritiske værdi for t-testet for hypotesen: H 0 : µ D = 0.35 H 1 : µ D > 0.35 på niveau α = 0.01 bliver (udtrykt vha. R-funktioner) 1 qt(0.99,9) (= 2.821) 2 qnorm(0.995) (= 2.576) 3 qt(0.995,18) (= 2.878) 4 qt(0.005,18) (= 2.878) 5 qnorm(0.025) (= 1.96) Spørgsmål II.3 (5) For én af de folier, der produceres, er kravet, at middeltykkelsen skal være µ = 2.55mm med en spredning på σ = 0.10mm. Hvor mange målinger af tykkelsen skal der foretages, hvis det kræves, at et 95% konfidensinterval for foliens tykkelse har en bredde på maks. 0.1mm: 1 85, idet ( /0.05) = , idet ( /0.10) 2 = , idet ( /0.05) 2 = , idet ( /0.1) 2 = , idet ( /0.1) 2 = 5.12 Fortsæt på side 5 4

5 Opgave III Som led i fødevarekontrollen i et supermarked udtrækkes der fra køledisken 5 ferske kyllinger med andet oprindelsesland end Danmark til kontrol. Det antages, at der i alt er 15 kyllinger i køledisken, og det antages at 3 af disse er inficerede med salmonella. Den stokastiske variabel X beskriver antallet af kyllinger, der er inficerede med salmonella blandt de 5 udtrukne. Spørgsmål III.1 (6) Hvad er middelværdien og spredningen for X? 1 µ X = 3 og σ X = µ X = 1 og σ X = µ X = 1 og σ X = µ X = 1 og σ X = µ X = 1 og σ X = Spørgsmål III.2 (7) Kyllinger modtages i partier på 1500 stk., et parti kontrolleres ved at 15 kyllinger udtages til kontrol og partiet accepteres, hvis alle de kontrollerede kyllinger er frie for salmonella. Antag at kyllinger med andet oprindelsesland end Danmark indeholder 10% kyllinger, der er inficerede med salmonella. Antag at dansk producerede kyllinger indeholder 1% kyllinger, der er inficerede med salmonella. Sandsynligheden for at acceptere partiet, hvis det er kyllinger med andet oprindelsesland end Danmark hhv. hvis det er dansk producerede kyllinger bliver: 1 Andet land: mellem 0 og 1%. Danmark: omtrent 50% 2 Andet land: mellem 20 og 21%. Danmark: omtrent 86% 3 Andet land: omtrent 10%. Danmark: omtrent 99% 4 Andet land: omtrent 0%. Danmark: omtrent 0% 5 Andet land: omtrent 90%. Danmark: omtrent 99% Fortsæt på side 6 5

6 Opgave IV Længden af et afskåret aluminiums profil skal ligge i intervallet: 179.8mm L 180.2mm Det antages, at længden af profilerne L kan beskrives ved en normalfordelt stokastisk variabel med parametrene: µ L = 180mm og σ L = 0.08mm Spørgsmål IV.1 (8) Procentdelen af profiler, der har en længde, der ligger uden for det ønskede interval, bliver: 1 Ca. 50% 2 Ca. 0.6% 3 Ca. 2% 4 Ca. 1.2% 5 Ca. 0.2% Spørgsmål IV.2 (9) For at kontrollere længden af profilerne udtages der løbende stikprøver på 16 profiler. Længden af disse profiler måles og gennemsnittet af disse ȳ beregnes. En produktion accepteres såfremt det 2-sidede hypotesetest for H 0 : µ = 180mm accepteres. Signifikansniveauet sættes til α = 5% og σ L = 0.08mm antages uændret. Inden for hvilke grænser skal ȳ ligge for at produktionen accepteres? ± 0.2mm ± mm ± mm ± 0.08mm ± mm Fortsæt på side 7 6

7 Spørgsmål IV.3 (10) På profilet skal der monteres et rør, for hvilket det er givet, at længden af røret R kan beskrives ved en normalfordelt stokastisk variabel med middelværdien µ R = 180mm. Kravet til at profil og rør passer sammen er at: 0.25mm < L R < 0.25mm Skal dette krav opfyldes i 99% af tilfældene bliver kravet, der må stilles til spredningen σ R på længden af røret: (µ L = 180mm og σ L = 0.08mm antages uændret) 1 σ R = 0.055mm 2 σ R = 0.097mm 3 σ R = 2.576mm 4 σ R = 0.250mm 5 σ R = 0.500mm Fortsæt på side 8 7

8 Opgave V En virksomhed skal anvende nogle rør. Det er væsentligt for anvendelsen, at rørenes indvendige ruhed er mindst mulig. For at finde de bedst egnede rør, indhentes rørprøver fra fire mulige leverandører. På hver rørprøve foretages 9 målinger af den indvendige ruhed, måledata fremgår af nedenstående tabel: Leverandør Ruhed i µm x i µm s i µm I en R-kørsel for envejs variansanalyse: anova(lm(ruhed~leverandoer)) fås følgende output: (hvor visse af værdierne dog er erstattet er symbolerne A, B, C og D) Analysis of Variance Table Response: Ruhed Df Sum Sq Mean Sq F value Pr(>F) Leverandoer A C D Residuals B Spørgsmål V.1 (11) Værdierne for A, B, C og D er: 1 A = 4, B = 36, C = og D = A = 3, B = 32, C = og D = A = 36, B = 4, C = 3.19 og D = A = 4, B = 36, C = og D = A = 3, B = 32, C = og D = Fortsæt på side 9 8

9 Spørgsmål V.2 (12) Testes på et 5% signifikansniveau bliver resultatet af hypotesetestet for, om rørenes ruhed afhænger af den valgte leverandør: (både konklusion og begrundelse skal være i orden) 1 Ruheden af rørene afhænger ikke af den valgte leverandør, idet P-værdien er mindre end 5% 2 Ruheden af rørene afhænger af den valgte leverandør, idet P-værdien er større end 5% 3 Ruheden af rørene afhænger ikke af den valgte leverandør, idet P-værdien er større end 5% 4 Ruheden af rørene afhænger af den valgte leverandør, idet P-værdien er mindre end 5% 5 Ruheden af rørene afhænger ikke af den valgte leverandør, idet < Spørgsmål V.3 (13) Som anført er virksomheden interesseret i, at ruheden er mindst mulig. Konklusionen på analysen bliver derfor: (både begrundelse og konklusion skal være i orden) 1 Der er ikke signifikant forskel på leverandør 3 og 4, idet et 95% konfidensinterval for µ 3 µ 4 bliver 0.2 ± /9, så der kan frit vælges mellem disse 2 Der er signifikant forskel på leverandør 3 og 4, idet et 95% konfidensinterval for µ 3 µ 4 bliver 0.2 ± /36, så leverandør 4 bør vælges 3 Der er ikke signifikant forskel mellem nogen par af leverandørerne, så der kan frit vælges mellem de fire 4 Der er ikke signifikant forskel på leverandør 1 og 3, idet et 95% konfidensinterval for µ 1 µ 3 bliver 3.2 ± /9, så der kan frit vælges mellem disse 5 Der er ikke signifikant forskel på leverandør 1 og 3, idet et 95% konfidensinterval for µ 1 µ 3 bliver 3.2 ± /36, så der kan frit vælges mellem disse Fortsæt på side 10 9

10 Opgave VI Et firma, MM, der sælger varer på nettet ønsker at sammenligne to transportfirmaers tider for levering af varerne. For at sammenligne de to firmaer er der foretaget registreringer af transporttider på en given strækning, med en stikprøvestørrelse på n =9 for hvert firma. Følgende data er fundet: Firma A: ȳ A = 1.93døgn og s A = 0.45døgn Firma B: ȳ B = 1.49døgn og s B = 0.58døgn Det antages, at data kan betragtes som normalfordelt. Spørgsmål VI.1 (14) Følgende hypotese ønskes testet: H 0 : σ 2 A = σ2 B H 1 : σ 2 A σ2 B P-værdi og konklusion for dette test bliver: 1 P-værdi = Det kan afvises, at de to varianser er ens 2 P-værdi = Det kan ikke afvises, at de to varianser er ens 3 P-værdi = Det kan ikke afvises, at de to varianser er ens 4 P-værdi = Det kan ikke afvises, at de to varianser er ens 5 P-værdi = Det kan afvises, at de to varianser er ens Spørgsmål VI.2 (15) Følgende hypotese ønskes testet, idet det her forudsættes at σ 2 A = σ2 B : H 0 : µ A = µ B H 1 : µ A > µ B P-værdi og konklusion for dette test (på α = 5% niveau) bliver: 1 P-værdi = Så firma B er ikke hurtigere end firma A 2 P-værdi = Så firma B er hurtigere end firma A 3 P-værdi = Så firma B er ikke hurtigere end firma A 4 P-værdi = Så firma B er ikke hurtigere end firma A 5 P-værdi = Så firma B er hurtigere end firma A Fortsæt på side 11 10

11 Opgave VII I en undersøgelse sammenlignes transporttiden for tre transportfirmaer, idet man i undersøgelsen også inddrager størrelsen af det transporterede emne. For transporttider regnet i døgn er følgende data fundet: Forsendelsens størrelse Række- Lille Mellem Stor gennemsnit Firma A Firma B Firma C Søjlegennemsnit I en R-kørsel: anova(lm(tid~firma+stoerrelse)) fås følgende output: (hvor visse af værdierne dog er erstattet er symbolerne A, B, C og D) Analysis of Variance Table Response: Tid Df Sum Sq Mean Sq F value Pr(>F) Firma 2 A B Stoerrelse C D Residuals Spørgsmål VII.1 (16) Hvad er A, B, C og D? 1 A = , B = , C = og D = A = , B = , C =0.723 og D = A = 0.5, B = 0.25, C =0.723 og D = A = 0.5, B = 0.25, C = og D = A = 0.5, B = 0.25, C = og D = 49.6 Fortsæt på side 12 11

12 Spørgsmål VII.2 (17) Konklusionen på analysen bliver: (med et testniveau på 5%) 1 Kun forsendelsens størrelse har signifikant indflydelse på transporttiden 2 Hverken firmaets identitet eller forsendelsens størrelse har signifikant indflydelse på transporttiden 3 Såvel firmaets identitet som forsendelsens størrelse har signifikant indflydelse på transporttiden 4 Kun firmaets identitet har signifikant indflydelse på transporttiden 5 Kun forsendelsens størrelse er uden signifikant indflydelse på transporttiden Spørgsmål VII.3 (18) Et 95% konfidensinterval for den mulige forskel mellem firma A og B ønskes, men uden brug af antagelsen om normalfordelte data. Følgende R-kode anvendes for at finde et bootstrap-baseret konfidensinterval: x = c(1.4,2.5,2.1) y = c(0.8,1.8,1.9) k = # Number of bootstrap samples xsamples = replicate(k, sample (x, replace = TRUE)) ysamples = replicate(k, sample (y, replace = TRUE)) mymeandifs = apply(xsamples, 2, mean)-apply(ysamples, 2, mean) mybootquantiles=quantile(mymeandifs, c(0.005,0.01,0.025,0.05,0.95,0.975,0.99,0.995)) round(mybootquantiles,3) Den næstsidste R-linie finder således otte forskellige fraktiler i bootstrap-fordelingen, som i sidste linie udskrives med 3 betydende cifre: 0.5% 1% 2.5% 5% 95% 97.5% 99% 99.5% Hvad er 95%-konfidensintervallet for den mulige forskel mellem firma A og B baseret på dette? < µ A µ B < < µ A µ B < < µ A µ B < < µ A µ B < < µ A µ B < Fortsæt på side 13 12

13 Opgave VIII Et firma, der sælger musik på nettet, har i en undersøgelse observeret nedenstående fordeling på valg af musikgenrer og alder. 200 personer deltog i undersøgelsen. Tallene angiver procent ud af de 200. Alder i år Genrer under over 40 Klassisk Jazz Pop Rock Spørgsmål VIII.1 (19) Firmaet ønsker at undersøge, om der er afhængighed mellem valg af musikgenrer og alder. Det relevante test at anvende til besvarelse af spørgsmålet er: (DF=frihedsgrader (degrees of freedom)) 1 Et χ 2 -test, hvor der benyttes DF = 1 2 Et χ 2 -test, hvor der benyttes DF = 6 3 Et F -test, hvor der benyttes DF tæller = 6 og DF nævner = 12 4 Et F -test, hvor der benyttes DF tæller = 3 og DF nævner = 9 5 Et t-test, hvor der benyttes DF = 9 Fortsæt på side 14 13

14 Opgave IX På en maskine, der folder plastfolie, kan temperaturen varieres i området grader celcius. For om muligt, at få en model for temperaturens indflydelse på foldetykkelsen, er der målt n = 12 sammenhørende sæt af værdier af temperatur og foldetykkelse, som er illustreret i følgende figur: Foldetykkelse Temperatur Spørgsmål IX.1 (20) Afgør ved at betragte figuren, hvilket af følgende sæt af estimater for parametrene i den sædvanlige regressionsmodel, der er det rigtige: 1 ˆα = 0, ˆβ = 0.9, ˆσ e = 36 2 ˆα = 0, ˆβ = 0.9, ˆσ e = ˆα = 252, ˆβ = 0.9, ˆσ e = ˆα = 252, ˆβ = 0.9, ˆσ e = 36 5 ˆα = 252, ˆβ = 0.9, ˆσ e = 36 Spørgsmål IX.2 (21) Hvad er det eneste mulige korrekte svar: 1 Forklaringsgraden er 50% og korrelationen er Forklaringsgraden er 0% og korrelationen er Forklaringsgraden er 96% og korrelationen er 1 4 Forklaringsgraden er 96% og korrelationen er Forklaringsgraden er 96% og korrelationen er 0.98 Fortsæt på side 15 14

15 Opgave X En virksomhed, der sælger udendørs belysning, får fremstillet en lampe i 3 materialevarianter, i kobber, med malet overflade og i rustfrit stål. Lamperne sælges i Danmark og eksporteres primært til Holland og Norge. For 250 lamper er den procentvise fordelingen af salget mellem de 3 varianter og de aktuelle lande opgjort. Data fremgår af nedenstående tabel: Følgende ønskes testet: Variant Land Danmark Holland Norge Kobber 7.2% 5.2% 1.2% Malet 28.0% 14.0% 20.8% Rustfri 8.8% 4.8% 10.0% H 0 : Uafhængighed mellem afsætning af variant og land H 1 : Afhængighed ved anvendelse af det for denne situation sædvanlige test. Spørgsmål X.1 (22) Hvad bliver det forventede antal lamper for materialet kobber solgt i Danmark, hvis H 0 gælder: 1 e 11 = 18 2 e 11 = = e 11 = = e 11 = = e 11 = = 7.92 Spørgsmål X.2 (23) Den kritiske værdi for det relevante test på niveau 1% er: Fortsæt på side 16 15

16 Opgave XI På en lampe skal der monteres 2 plastskærme. Det er væsentligt, at disse plastskærme har en god slagstyrke. Der udføres derfor en afprøvning af 5 forskellige plasttyper. Der støbes 6 prøveemner i hver plasttype. Slagstyrkerne af disse emner bestemmes. Følgende måledata blev fundet (slagstyrke i kj/m 2 ): Følgende R-kode blev kørt: Plasttype I II III IV V Slagstyrke=c(44.6,52.8,53.1,51.5,48.2, 50.5,58.3,50.0,53.7,40.8, 46.3,55.4,54.4,50.5,44.5, 48.5,57.4,55.3,54.4,43.9, 45.2,58.1,50.6,47.5,45.9, 52.3,54.6,53.4,47.8,42.5) Plasttype=factor(rep(1:5,6)) anova(lm(slagstyrke~plasttype)) med følgende resultat: Analysis of Variance Table Response: Slagstyrke Df Sum Sq Mean Sq F value Pr(>F) Plasttype e-07 *** Residuals Signif. codes: 0 *** ** 0.01 * Spørgsmål XI.1 (24) Forudsætningerne for at anvende den angivne analyse er (mest korrekt og fyldestgørende givet ved): 1 Data skal være normalfordelt inden for hver gruppe, uafhængige og varianserne inden for hver gruppe må antages ens 2 Data skal antages at være simuleret med forskellige varianser i hver gruppe 3 Data skal være log-normalfordelt, uafhængige og med store varianser 4 Data skal være normalfordelt, med forskellige varianser i hver gruppe 5 Der skal være mindst 5 observationer i hver gruppe og uafhængige med små varianser Fortsæt på side 17 16

17 Spørgsmål XI.2 (25) Konklusionen på analysen bliver: (begrundelsen skal også være i orden) 1 Mindst et materiale har en slagstyrke, der afviger fra de øvriges, idet P-værdien er omtrent 1 2 Intet materiale har en slagstyrke, der afviger fra de øvriges, idet P-værdien er omtrent 0 3 Intet materiale har en slagstyrke, der afviger fra de øvriges, idet P-værdien er omtrent 1 4 Mindst et materiale har en slagstyrke, der afviger fra de øvriges, idet P-værdien er omtrent 0 5 Residualerne afviger meget, idet P-værdien er omtrent 0 Fortsæt på side 18 17

18 Opgave XII Plastskærme til en produktion af en specifik lampe påtænkes udliciteret til en underleverandør. Det er væsentligt for lampens tæthed, at plastskærmene har de korrekte dimensioner. To underleverandører kontaktes. Fra underleverandør A modtages 500 prøveemner: af disse er der 4, der ikke overholder de stillede krav til dimensionerne. Fra underleverandør B modtages 700 prøveemner: af disse er der 8, der ikke overholder de stillede krav til dimensionerne. Følgende test ønskes udført: H 0 : p A = p B H 1 : p A < p B Spørgsmål XII.1 (26) P-værdi og konklusion for dette test bliver: 1 P-værdi=0.56. H 0 kan afvises på niveau 5%. A er signifikant bedre end B og kan derfor foretrækkes 2 P-værdi=0.28. H 0 kan ikke afvises på normalt anvendte signifikansniveauer. A er ikke signifikant bedre end B og kan derfor ikke foretrækkes 3 P-værdi=12/1200=0.01. H 0 kan afvises på niveau 5%. A er signifikant bedre end B og kan derfor foretrækkes 4 P-værdi=0.28. H 0 kan afvises på normalt anvendte signifikansniveauer. A er signifikant bedre end B og kan derfor foretrækkes 5 P-værdi=0.56. H 0 kan ikke afvises på normalt anvendte signifikansniveauer. A er ikke signifikant bedre end B og bør derfor foretrækkes Spørgsmål XII.2 (27) For en helt anden type skærme har der været i omegnen af 10% af emner, der ikke var i orden (defekte). Man beder nu en konkret underleverandør om at levere et 95%- konfidensinterval for andelen af defekte med en bredde, der ikke overstiger 0.02, dvs. plus/minus 1 procentpoint. Hvor mange prøveemner skal leverandøren undersøge for at imødegå dette krav? 1 Omtrent 1 4 (1.96/0.02) Omtrent 1 4 (1.65/0.02) Omtrent ( /0.005) Omtrent ( /0.02) Omtrent (1.96/0.01) Fortsæt på side 19 18

19 Opgave XIII I en varmeveksler afhænger varmeovergangstallet af volumenstrømmen. Sammenhængen er lineær på den logaritmerede skala, og kan således skrives som E(y) = α + β x hvor y er logaritmerede varmeovergangstal og x er logaritmerede volumenstrømme. I en måleserie er følgende 11 sammenhørende værdier fundet: x y I R kørtes følgende: x=c(8.81,9.03,9.28,9.47,9.69,9.95,10.16,10.28,10.47,10.59,10.73) y=c(7.60,7.81,7.93,8.07,8.22,8.39,8.50,8.57,8.67,8.73,8.81) summary(lm(y~x)) med følgende resultat: Call: lm(formula = y ~ x) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-08 *** x e-12 *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 9 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: 2152 on 1 and 9 DF, p-value: 5.031e-12 Derudover kan følgende beregningsstørrelser evt. benyttes: x = 9.86, ȳ = 8.3, S xx = , S yy = og S xy = Fortsæt på side 20 19

20 Spørgsmål XIII.1 (28) Et 95% konfidensinterval for hældningskoefficienten β bliver: ± / ± ± / ± ± /11 Spørgsmål XIII.2 (29) Et 95% konfidensinterval for µ x=10 = α + β 10, forventningen til y for en x-værdi på 10 bliver: ± ± ± ± ± Spørgsmål XIII.3 (30) Spredningen for afvigelse mellem datapunkterne og linien estimeres til:

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 1. december 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 26. maj 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 30. maj 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 15. december 2006 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1 Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 1. juni 2005 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af (navn)

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet!

Den endelige besvarelse af opgaverne gøres ved at udfylde nedenstående skema. Aflever KUN skemaet! Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 2. juni 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 27. maj 2014 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 10: Statistik ved hjælp af simulering Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Danmarks Tekniske Universitet Side 1 af 19 sider

Danmarks Tekniske Universitet Side 1 af 19 sider Danmarks Tekniske Universitet Side 1 af 19 sider Skriftlig prøve: 2. juni 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dettesæterbesvaretafeksaminant

Læs mere

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm. Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Danmarks Tekniske Universitet Side?? af 20 sider

Danmarks Tekniske Universitet Side?? af 20 sider Danmarks Tekniske Universitet Side?? af 20 sider Skriftlig prøve: 15. december 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af eksaminant

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 25 sider. Skriftlig prøve: 13. december 2016 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 20. august 2017 Kursus navn og nr: Introduktion til Statistik (02323 og 02402) Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff. Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345) Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Besvarelser til øvelsesopgaver i uge 6

Besvarelser til øvelsesopgaver i uge 6 Besvarelser til øvelsesopgaver i uge 6 Opgave 7.46, side 228 (7ed 7.28, side 244 og 6ed: 7.28, side 240) Vi tænker os, at vi har data for emissionen {x 1, x 2,..., x n }, når det pågældende device er monteret.

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen STATISTIK Skriftlig evaluering, 3. semester, mandag den 6. januar 004 kl. 9.00-13.00. Alle hjælpemidler er tilladt. Opgaveløsningen forsynes med navn og CPR-nr. OPGAVE 1 Et firma tuner biler. Antallet

Læs mere

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr)

Kursus navn og nr: Introduktion til Statistik (02323, og 02593) (studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 26 sider. Skriftlig prøve: 16. august 2015 Kursus navn og nr: Introduktion til Statistik (02323, 02402 og 02593) Tilladte hjælpemidler: Alle Dette sæt er besvaret

Læs mere

Side 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2003. Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2003. Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 21 sider Skriftlig prøve: 15. december 2003 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter

2 X 2 = gennemsnitligt indhold af aktivt stof i én tablet fra et glas med 200 tabletter Opgave I I mange statistiske undersøgelser benytter man binomialfordelingen til at beskrive den tilfældige variation. Spørgsmål I.1 (1): For hvilken af følgende 5 stokastiske variable kunne binomialfordelingen

Læs mere

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr) CIVILINGENIØREKSAMEN Side 1 af 16 sider Skriftlig prøve, den: 16. december 2010 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift)

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr) CIVILINGENIØREKSAMEN Side 1 af 18 sider Skriftlig prøve, den: XY. december 200Z Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift)

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Motivation Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser Rasmus Waagepetersen October 26, 2018 Eksempel: En landmåler får til opgave at måle længden λ fra A til B. Entreprenøren

Læs mere

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 27. maj 2011 Kursus nr : (navn) (underskrift) (bord nr) CIVILINGENIØREKSAMEN Side af 6 sider Skriftlig prøve, den: 27. maj 20 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift) (bord

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3. Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1

Læs mere

(student number) (signature) (table number)

(student number) (signature) (table number) Technical University of Denmark Page 1 of 25 pages. Written examination: 13. december 2016 Course name and number: Introduktion til Statistik (02323 og 02402) Aids and facilities allowed: All The questions

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

2 0.9245. Multiple choice opgaver

2 0.9245. Multiple choice opgaver Multiple choice opgaver Der gøres opmærksom på, at ideen med opgaverne er, at der er ét og kun ét rigtigt svar på de enkelte spørgsmål. Endvidere er det ikke givet, at alle de anførte alternative svarmuligheder

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Kursus 02402/02323 Introducerende Statistik

Kursus 02402/02323 Introducerende Statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr) CIVILINGENIØREKSAMEN Side?? af?? sider Skriftlig prøve, den: 6. december 2004 Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift)

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere