Statistik opgaver - Efterår 2009 Keller - Statistics for management and economics

Størrelse: px
Starte visningen fra side:

Download "Statistik opgaver - Efterår 2009 Keller - Statistics for management and economics"

Transkript

1 Statistik opgaver - Efterår 2009 Keller - Statistics for management and economics Jonas Sveistrup Hansen - stud.merc.it 17. december

2 Indhold 2

3 1 Opgave 24 En virksomhed har gennem længere tid anvendt en og sammen introduktionsprocedure, når man ansætter nye nye medarbejdere til at udføre bestem type akkordarbejde. Personalechefen har været meget utilfreds med denne procedure, fordi 50 % af de nyansatte rejste, inden der var gået et år. For at imødegå dette gennemtræk af medarbejdere har han udarbejdet en ny introduktionsprocedure, men er meget i tvivl om den virkning. Antag, at vi har 25 medarbejdere, der har gennemgået den gamle introduktionsproducere. χ = Antal nyansatte (gamle intro)rejste medarbejdere indenfor det 1. år. n = 25 og p = 0, 50 Binomialfordeling valgt X Binomial(n = 25, p = 0, 5) Forudsætninger: to udfald - bliver eller ikke konstant p: forskellige kvalifikationer uafhængighed: tvivlsom, da medarbejdere snakker sammen. Hvem rejser? n = 25 punktsssh for Bino. ( ) n X p x (1 p) n x = n! x!(n x)! px (1 p) n x 1. Hvad er sandsynligheden for at, (a) 3 medarbejdere rejser i løbet af det 1. år? P (x = 3 n = 25, p = 0, 50) = 0, 00 (b) højst 5 rejser i af det 1. år? P (x 5 n = 25, p = 0, 50) = 0, 02 (c) mindst 9 rejser i løbet af 1. år? P (x 9 n = 25, p = 0, 50) = 1 E(x 8 n = 25, p = 0, 50) = 1 0, 0539 = 0, Beregn den forventede værdi og standardafvigelse E(X) = n p = 25 0, 5 = 12, 5 V (X) = n p(1 p) = 25 0, 5(1 0, 5) = 6, 25 = 2, 5 3

4 3. Konklusion Ud fra vores antagelser, kan resultaterne være lidt skæve. Antag, at den nye introduktionsprocedure reducerer gennemtrækket, så kun 40 % af de nyansatte rejser, inden der er gået et år, og at 30 medarbejdere gennemgår den nye introduktionsprocedure. Y = Antal nyansatte (ny intro)rejste medarbejdere indenfor det 1. år. 4. Besvar - med de lige nævnte antagelser - de i spørgsmål 1 og 2 stillede spørgsmål. (a) 3 medarbejdere rejser i løbet af det 1. år? P (y = 3 n = 30, p = 0, 40) = 0, 0002 (b) højst 5 rejser i af det 1. år? Approx: til NF, se p. 8 i notesamling. np > 5 og n(1 p) > 5, at de er OK P (Z < Y E(Y ) ) P (Z < V (Y ) ,4) 30 0,4 (1 0,4) = 2, 42) = 0, 0078 (c) mindst 9 rejser i løbet af 1. år? P (y 9 n = 30, p = 0, 40) = 1 E(y 8 n = 30, p = 0, 40). Approx til NF da krav igen er OK! 1 P (Z < ,4 (1 0,4) 30 0,4 = 1, 31) = 1 0, 0951 = 0, Beregn den forventede værdi og standardafvigelse E(Y ) = n p = 30 0, 4 = 12 V (Y ) = n p(1 p) = 30 0, 4(1 0, 4) = 7, 2 = 2, Opgave 29 Til pakning af kaffe i 250 grams pakker anvendes en pakkemaskine. Maskinen indstilles til at pakke med en middelvægt (brutto) på 263 g. Emballagen vejer 5 g. Alle pakker kontrolvejes, og pakker med en bruttovægt under 255 g frasorteres. Pakkernes vægt antages at være normalfordelt med en middelværdi på 263 g. Normaltfordelt er kontinuert: måleligt vendelige antal udvalg 4

5 Forventede værdi = µ = 263 g. Variansen er = σ 2 Std. afv. = σ 2 χ Bruttovægt pr. pose kaffe i gram. χ NF (µ = 263) Beregn fordelingens standardafvigelse, når det oplyses, at der sidste år blev frasorteret i alt 5,5 % af samtlige pakker. P (X < 255 µ = 263, σ =?) P (Z = X µ < ) = 255 σ σ Slå op i kroppen af tabel 3. 1, 6 = 8 σ = 5 σ Hvor stor bliver frasorteringesprocenter, hvils middelvægten vælges til 255 g? 260 g? P (Z = X µ < ) = 0, 5 σ 5 P (Z = X µ < = 1, 00) = 0, Nu er frasorteringsprocenten 15,87 % ved µ= σ Hvilken middelvægt skal maskinen indstilles til, hvis man under i øvrigt undrede forhold ønsker frasorteringsprocenter ned til 2? P (X < 255 µ =?, σ = 5) = 0, 02 P (Z = X µ < 255 µ ) = 0, 02 σ 5 Slå igen op i kroppen af tabellen. Z = 2, 05 2, 05 = 255 µ µ = 265, Opgave Opgavetekst I en afdeling produceres på maskinen MS et emne i massefabrikation. Emnet skal anvendes som delkomponent i det endelige produkt, som fabrikeres af samme virksomhed. Det kræves af emnet, at dets diameter ligger i intervallet 2,30 ± 0,30 mm. Emner, som er mindre end nedre grænse, kasseres, mendes emner, som er større end øvre grænse slibes i en reparationsafdeling. Erfaringer viser, at diameteren på emner produceret på MS er normalfordelt med en standardafvigelse på 0,20 mm. 1 da, decimalerne er, 00 skal der slås op i den første kolonne i Tabel 3 5

6 I det følgende antages det, at MS er indstillet til at producere med en middelværdi på 2,26 mm. Hvor stor vil kassationsprocenten være? Hvis 30 emner udtages, hvor stor er sandsynligheden da for, at der højst er 2, der må kasseres? Beregn det forventede antal emner, der videresendes til slibning fra et parti på Undersøgelser har vist, at kassationsomkostningerne er relativt store i forhold til slibeomkostningerne, og virksomheden ønsker derfor at nedsætte kassationssandsyndligheden. Beregn den minimale middelværdig (µ 1 ), der sikre, at kassationssandsynligheden højst er 0, Egne betrækninger χ = Vurdering af enmer. I følge opgave tekst følger X en formalfordeling. Binomialfordeling. Slibes eller ikke. µ = 2, 26, σ = 0, 20, 1 α = 0, 95 2, 26 ± 1, 96 0,2 30 µɛ[2, 19; 2, 33] 4 Opgave Opgavetekst For at producere en bestemt type komponenter kræves behandling på 2 af hinanden uafhængigt arbejdende maskiner, Maskine 1 (M1) og Maskine 2 (M2). Behandlingen skal først foregå på M1 og dernæst på M2. M2 s kapacitet er så stor, at lige så snart behandlingen på M1 er færdig, kan behandlingen på M2 begynde. Behandlingstiden på M1 er en stokastisk variable, der kan beskrives ved NF 6

7 med forventet værdi 6 min. og standardafgivelse 0,4 min. Behandlingstiden på M2 kan ligeledes beskrives ved en normalfordeling med forventet værdi 4 min. og standardafvigelse 0,3 min. Beregn ssh for, at et emne, hvor behandlingen netop påbegyndes på M1, er færdigbehandlet på begge maskiner, inden der er gået 9 min. og 10 sek. (Vink: En stokastisk variabel, der er summen af to normalfordelte stokastiske variable, er selv normalfordelt.) Man har netop færdigbehandlet 100 komponenter. Hvad er sandsyndligheden for, at mindst 90 komponenter har været udsat for en samlet behandlingstid på mindst 9 min. og 10 sek.? Hvad er sandsynligheden for, at den gennemsnitlige behandlingstid for disse 100 komponenter er højst 10 min. og 6 sek.? Hvis den samlede behandlingstid for en komponent bliver mindre end 9 min., skal komponenten kasseres på grund af stor sandsynlighed for at være mangelfuld (defekt). I sidste måned kiksede kvalitetskontrollen, og alle producerede komponenter, inkl. de, der skulle have været kasseret, blev placeret på lageret. Hvor mange komponenter må vi forvente skal kasseres, pga. at behandlingstiden var under 9 min.? Fra dette parti udvælges en tilfældig stikprøve på 50 komponenter. Hvad er sandsynligheden for, at der er flere end 4 komponenter i denne stikprøve, der burde have været kasseret, fordi behandlingstiden har været mindre end 9 min.? 4.2 Egne betrækninger Is the sample median an unbiased estimator of the population mean? Explain? 7

8 µ = parameter X = redskab til at estimere µ x = estimatet Valg af estimator Unbiased - E( X) = µ Konsistent - V ( X = σ2 ) - n så går variansen 0 n Relativ efficiens - Laveste varians E(x) = µ γ = 0 (skævhed) X er symmerisk fordelt (skævhed = 0). Idet x NF, gælder E(MD) = µ. Medianen er således en unbiased estimator af µ The following data represent a random sample of 9 marks (out of 10) on a statistics quiz. The marks are normally distributed with a standard of deviation of 2. Estimate the population mean with 90 % confidence. 2 7, 9, 7, 5, 4, 8, 3, 10, Besvarelse χ : Angiver karakter givet ved en stat. quiz. χ NF (σ = 2, µ =?) 6.2 Forudsætninger 1. STU - 2. Troværdige svar - 2 Appendix B eller p

9 3. Processbetragtning - 4. Kender populationsvariansen - 5. At X NF - n= 9 x = 62 9 = 6, 89 x ± z α/2 σ n (1) 6, 89 ± µ [5, 79; 7, 98] (2) 6.3 Konklusion Med 90 % sikkerhed er den sande værdi af karaktergennemsnittet indeholdt i intervallet [5,79; 7,98] 6.4 ekstra Konfidensinterval valgt til 99 % Stikprøvevarians x ± z α/2 σ n (3) 6, 89 ± 2, µ [5, 17; 8, 61] (4) 9i=1 S 2 x 2 i n x 2 = n 1 (5) ( ) 9 6, (6) S 2 = 5, 844 5, 844 2, 42 (7) 9

10 A statistics professor is in the process is investigating how many classes... x = 10,21 n = 100 σ = 2,2 confidence = 99 % = 2,575 x ± z α/2 σ n (8) 10, 21 ± 2, 575 2, µ [9, 6435; 10, 7765] (9) x = 14, 98 confidence = 90 % = 1,645 n=250 σ = 3 x ± z α/2 σ n (10) 3 10, 39 ± 1, 645 µ [14, 6679; 15, 2921] (11) Hypotesetest X : Det gennemsnitlige # fodgængere der passere et bestemt sted pr. time. x = 105, 7 σ = 16 n = Hypoteseformulering H H 1 > 100 En sidet, da H 1 >100 10

11 9.2 Valg af signifikansnivaeu α = 1% Z α = 2, Valg af observator (jvf. p. 24 samt og notesamling) H 0 er sand - Simpel tilfældig udvalgt, kan diskuteres da tidspunkterne kan spille ind på kundestrømmen. σ kendt - n N < 0, Beregning af observatorværdi (Keller p. 351 og 383) Slå op på side 24 i notesamling. Z obs = x µ 0 σ/ n (12) 105, / = 2, (13) 9.4 Fastsættelse af den kritiske grænser samt valg af H 0 eller H 1 - Keller p. 353 og 386 Da Z obs < Z kritisk (14) 2, 25 < 2, 326 (15) Fastholdes H 0 3 Appendix B - B8 tabel 3 11

12 9.5 Beregning af p-værdi - Keller p. 383 og 386 P-værdi = P (Z > z obs = 2, 25) (16) = 1 P (Z < 2, 25) (17) = P (Z > 2, 25) (18) = 0, 0122 (19) Dvs., at SSH for et lige så eller men ekstremt resultat såfremt H 0 er 1,22 % 9.6 Konklusion Med et sig. niveau på 1 %, er man således nødsaget til at fastholde H 0. Derfor kan man ikke konkludere, at der går under 100, og vi ikke kan åben butikken. De har sagt sig. niveau lagt, så de er sikre på der kommer nok kunder. 10 Opgave E26 Ingen af nedenstående tre påstande er sande. Du bedes for hver påstand kort redegøre for, hvorfor påstande ikke er sand. 1. Den centrale grænseværdisætning udtrykker, at variansen af estimatoren går imod nul for voksende stikprøvestørrelse. CGS udtrykker at, lige meget hvilken fordeling af X, vil fordelingen af x approksimativt, når stikprøven bliver tilstrækkelig stor nærme sig NF. Dvs. hvis X NF vil x NF. Jo mere skæv populationen er, jo større n kræves der. (n > 25 γ 2 ) Påstand berører begrebet konsistens V ( X) = V (x) n 0 (20) når n (21) 2. Der er ingen sammenhæng imellem stikprøvestørrelsen og fejlmagin i et konfidensinterval 12

13 σ 2 b = z α/2 n (22) eller (23) b = t n 1;α/2 S 2 n (24) Vi ser der er sammenhæng imellem x, gennemsnittet for stikprøven og n, som angiver størrelsen af stikprøven. BONUS: En firdobling af stikprøvestørrelsen betyder en halvering af fejlmarginen. b = z α/2 σ 2 n = z α/2 σ 2 n 4 σ 2 = z α/2 n 1 4 = 1 σ 2 z 2 α/2 n (25) (26) (27) (28) 3. Observatorværdien ved test for en µ-værdi beregnes som stikprøveandelen minus det postulerede divideret med kvadratroden af forholdet mellem varianesen og stikprøvestørrelsen. z obs = x µ 0 σ 2 n z obs = ˆp µ 0 σ 2 n (29) (30) (31) Skift ˆp ud med x 13

14 A medical statician wants to estima the average weight loss of people who are on a new diet plan in at preliminary study he guesses that the standard deviation of the populations weight losses is about 10 pounds. How large a sample should be taken to estimate the mean weight loss to within 2 pounds, with 90 % confidence 11.1 Besvarelse Find fejlmargin, halvdelen af konfidensinterval. b = z α/2 X: Angiver vægttab for mennesker på den nye diet x NF σ = 10 pounds confidence = 90 % = 1,645 b 4 = 2 pounds 11.2 Forudsætninger σ n (32) n = ( z α/2 σ ) 2 (33) b 1. STU - Da de mennesker der kommer på den nye diet, kan det diskuteres om de er simpelt tilfældigt udvalgt. 2. Troværdige svar - 3. n N < 5% eller processbetragtning(vores N er uendelig) n = ( ) 1, (34) n = 67, (35) 4 fejlmargin 14

15 11.3 kontrol 11.4 Konklusion µ = x ± Z α/2 = x ± 1, 645 σ n (36) (37) = x ± 1, 99 (38) Stikprøven skal være på 68 personer for at sikre at vi får en fejlmargin på Hypotesetest X : Lyspærers brændetid over timer x = 5064, 96 σ = 400 µ = n = Hypoteseformulering H 0 < H En sidet, da H Valg af signifikansnivaeu α = 5% Z α = Appendix B - B8 tabel 3 eller p. 308 (327 i ny gb) 15

16 12.3 Valg af observator (jvf. p. 24 samt og notesamling) H 0 er sand - Simpel tilfældig udvalgt - Tag fra flere dage, så Troværdige svar - σ kendt - n N < 0, 05 - Kender ikke store N, men går ud fra produktionen er større end 2000 enheder Beregning af observatorværdi (Keller p. 351 og 383) Slå op på side 24 i notesamling. Z obs = x µ 0 σ/ n (39) 5.064, / = 1, (40) 12.4 Fastsættelse af den kritiske grænser samt valg af H 0 eller H 1 - Keller p. 353 og 386 Da Z obs < Z kritisk (41) 1, 624 < 1, 96 (42) Fastholdes H Beregning af p-værdi - Keller p. 353 og 386 P-værdi = P (Z > z obs = 1, 624) (43) 16

17 = 1 P (Z < 1, 624) (44) = P (Z > 1, 624) (45) = 0, 052 (46) Dvs., at SSH for for at begå en type 2 fejl (forkaster sand H 0 ) er 0,052-5,2 % 12.6 Konklusion Med et sig. niveau på 5 %, kan vi beholde H 0. Så 95(97,5 skal diskuteres!) % af populationen vil overholde de timers brændetid Hypotesetest X : Antal min. der bruges på rygepause pr. dag. x = 29, 92 minutter σ = 8 minutter µ = 32 minutter n = Hypoteseformulering H 0 : µ 32 H 1 : µ < 32 En sidet, da H 1 < Valg af signifikansnivaeu α = 5% Z α = 1, Appendix B - B8 tabel 3 eller p. 308 (327 i ny gb) 17

18 13.3 Valg af observator (jvf. p. 24 samt og notesamling) H 0 er sand - Simpel tilfældig udvalgt - Z obs = x µ 0 σ/ n (47) Troværdige svar - Dårlig formulering, da tiden målt kan bruges til andet end at ryge - σ kendt - n N < 0, 05 eller procesbetragning(vores N er uendelig) X NF, for N stor nok - Uafhængighed - Problemer med uafhængighed (de kan snakke sammen osv.) Beregning af observatorværdi (Keller p. 351 og 383) Slå op på side 24 i notesamling. Z obs = x µ 0 σ/ n (48) 29, / = 2, (49) 13.4 Fastsættelse af den kritiske grænser samt valg af H 0 eller H 1 - Keller p. 353 og 386 Da Z obs < Z kritisk (50) 2, 7269 > 1, 645 (51) forkaster H 0 18

19 13.5 Beregning af p-værdi - Keller p. 353 og 386 P-værdi 13.6 Konklusion = P (Z < z obs = 2, 7269) (52) = 0, 0032 (53) Med et sig. niveau på 5 %, forkaster vi H 0, da p-værdi under 1 %, er konk., at forkaste H 0, til trods for nogle usikkerheder omkring forudsætninger ref til X : Antal min. der bruges på rygepause pr. dag Type 1 fejl 32 1, 654 µ z α σ n = (54) = 30, 75 (55) Ved stikprøve resultat på over 30,75 fastholder man H 0 Ved stikprøve resultat på under 30,75 forkaster man H Type 2 fejl P ( x > 30, 75 µ = 30, σ = 8, n = 110) (56) 30, = P (Z > 8/ = 0, (57) SSH for at begå en type 2 fejl er 16,35 % 2 måder at reducerer på: n eller α 19

20 15 E10 - a, b Ingen af nedenstående påstande er sande. Du bedes for hver påstand kort redegøre for, hvorfor påstanden ikke er sand. 1. Sandsynligheden for, at en standardnormalfordelt stokastisk variabel antager en værdi på over 1,5, er lig med 0,33. Påstand: P (z > 1, 5) = 0, 33 Opslag:1 P (z < 1, 5) = 1 0, 9332 = 0, Det er ikke sandt, da 33 % 6,8 % 2. Den empiriske varians beregnes som summen af observationernes kvadrat divideret med stikprøvestørrelsen minus en. Postuleret udtryk s 2 = Varians: s 2 = x 2 i n 1 n (x i x) 2 i=1 n 1 (58) (59) 16 E21.1 Siden 1874 har Dansmarks Meteorologisk Institut målt temperaturen, nedbørsmængden samt antal solskinstimer måned for måned. Nedenfor er anført, at middeltemperaturen i juni måned i de 132 år, der er blevet målt, i gennemsnit har været 14,26 grader med en standardafvigelse på 1,20. Tabel 1: Descriptive Statistics N Minimum Maximum Mean Std. deviation Mean temp. june ,7 18,2 14,26 1,20 1. Du bedes på grundlag af ovenstående argumentere for, hvad sandsynligheden er for, at middeltemperaturen i juni 2006 bliver på over 18,2 grader. 20

21 X: Middel temp i juni 1 P (z < P (X > 18, 2) (60) 18, 2 19, 26 = 3, 28) 1, 20 (61) 1 0, 9995 = 0, 0005 (62) Kan også udregnes på lommeregner med cdf(). 17 E4.1 - Alm. ssh opgave Batterier af typen XFT har en levetid, som er normalfordelt med en forventet levetid på 115 timer, og en standardafvigelse på 10 timer. Du indsætter nu fire af denne type batterier i din bærbare pc. ( Pc en fungerer kun, når alle fire batterier fungerer). 1. Hvad er sandsynligheden for, at pc en kan fungere i over 100 timer? X: Antal timer et batteri af typen XFT har som levetid X n(µ = 115, σ = 10) P (X > 100) = (Z = x µ = = 1, 5) σ 10 1 P (z < 1, 5) = 1 0, 0668 = 0, 9332 Vi skal finde for fire batterier lever over 100 timer. 0, = 0, Opgave En virksomhed får hver måned leveret et parti på stk. af en elektronisk komponent. Normalt er et mindre antal komponenter defekte. Defektandelen kaldes p. Hvis p 0,01, er partiets kvalitet tilfredsstillende. Er p 0,04, er kvaliteten utilfredsstillende, og partiet skal helst returneres. Om et parti skal returneres eller ej, afgøres ved hjælp af en stikprøve. Der udvælges en stikprøve på 100 stk. X er antallet af defekte komponenter i stikprøven. Hvis p=0,04, hvor stor er da: 21

22 X: Antal defekte komponenter i stikprøven X Hyp, da N= Endelig pop (N=10.000) 2 udfald n= P (X 2)? Der approx til Bin. (a) N > 50 (b) n < 0, 05 N Vha. lommeregner binomcdf(100,0.04,2) 2. P (X = 3)? Vha. lommeregner binompdf(100,0.04,3) 3. P ( 5)? binomcdf(100,0.04,5). 1 P (x 4) = 1 0, 6288 = 0, 37 Virksomheden opstiller det krav, at sandsynligheden for at acceptere et parti med p=0,04, højst må være 0, Hvilke stikprøveresultater (kontrolgrænsen) fører til, at partiet returneres, når stikprøvens størrelse er 100? P (x? µ = 4) 0, 1 P (x 0) = 0, = 0,09 2=0,23 P (x 2) partiet afvises 2. Find sandsynligheden for, at et parti med p=0,01 returneres, hvis man anvendes den i spm.1 fundne kontrolgrænse. p =0,01 P (x µ = n p = 100 0, 01 = 1) 1 P (x 1) = 1 0, 7358 = 0,

23 19 E K.I To CarPark-kontrollører, Gisme og Fuzzy, har på de 21 hverdage i marts måned dagligt optalt det antal kontrolafgifter, de hver især har placeret under vinduesviskeren på biler, der ikke har overholde de vilkår, der er fastsat for parkering på stedet. Gisme er provisionslønnet og blev ved ansættelsen stillet i udsigt at kunne udskrive mindst 20 kontrolafgifter pr. dag. Han har i marts i gennemsnit udskrevet 18,5 pr. dag med en varians på 19,2. 1. Opstil et 95 %-K.I. for det forventede antal kontrolafgifter pr. dag. X : Antal kontrolafgifter pr. dag (63) X Poisson hændelser over tid = m (64) Approx µ > 10 20, ok! (65) µ = x x m ± z α/2 (66) m x = 21 18, 5 = 388, (67) µ = ± 1, 96 (68) µɛ[16, 66; 20, 34] (69) Vi kan derfor sige at der med 95 % sikkerhed sige, at de 20 kontrolafgifter pr. dag er indeholdt i intervallet. Kan også løses ved NF vælges. 20 E28.1,3 - K.I 19, 2 µ = 18, 5 ± t 20;α/2 21 (70) µɛ[16, 5; 20, 5] (71)... Man ønsker at fastlægge stikprøvestørrelsen, således at man kan opstille et 95 %-K.I., hvor fejlmargin er 2 procentpoint(0,02) 23

24 1. Du bedes argumentere for, hvor stor stikprøvestørrelsen skal være. Herunder bedes du anføre, hvilke forudsætninger, du gør. X: Antal elever der mener gym. ref har fungeret tilfredsstillende X Hyper (72) F.O. (73) Tilf / ikke tilfd. (74) n - STU (75) Uafh (76) Endelig pop (alle elever på alm. gym.) (77) ˆp(1 ˆp) b = z α/2 (78) n n = ( z α/2 ˆp(1 ˆp) ) 2 b 2 (79) n = 1, 962 ˆp(1 ˆp) ˆp = 50% 0, 02 2 (80) Vi ser at stikprøven skal være n = 1, 962 0, 5 0, 5 0, 02 2 (81) n = 2401 (82) De 1000 elever, der indgik i undersøgelsen, havde desuden angivet deres årskarakter i faget Dansk. Den gennemsnitlige karakter for disse 1000 elever var på 7,2 med en std.afg. på 3,1. 2. Du bedes opstille et 95 %-K.I. for den gennemsnitlige årskarakter i faget Dansk for dette års studenter fra det almene gymnasium. Diskuter herunder konsekvensen, hvis man inddrog korrektion for den endelige population. X: Årskarakter i dansk x NF( x =7,2; s= 3,1) µ = x ± t n 1;α/2 s n (83) 24

25 F.O. (84) STU (85) Uafh (86) Ukendt varians (87) 3, 1 = 7, 2 ± 1, 96da n er meget stor (88) 1000 µɛ[7, 01; 7, 39] (89) Vi kan dermed sige med 95 % sikkerhed sige, at 7,2 ligger i intervallet. Vi går ud fra N < s N n µ = x ± t n 1;α/2 (90) n N 1 3, µ = 7, 2 ± 1, 96 (91) µɛ[7, 0125; 7, 3875] (92) 21 E31- Påstand Ingen af nedenstående påstande er sande. 1. Såfremt stikprøven udgør mere end 5 % af populationen, bør man korrigere estimatet for andelen med N n N Variansen for estimatet skal korrigeres V (P ) p(1 p) N n n N 1 2. Såfremt der normalt ankommer 15 skibe til en havn pr. uge, kan man ud fra CGS argumentere for, at ssh for, at der ankommer 9 skibe på en uge er 7 % Påstand: P (X < 9 µ = 15) = 0, 07 Sand: P (X 8 µ = 15) = 3, 74% Da der ingen stikprøvestørrelsen er opgivet, kan vi ikke benytte CGS. 3. Den forventede værdi af en χ 2 v-fordeling er 0 med en varians på 2. 25

26 Den forventede værdi er antal frihedsgrader, mens variansen er antal frihedsgrader n = 15 s 2 = 12 Estimer variansen med 90 % sikkerhed. σ 2 ɛ (n 1) s2 ; χ 2 n 1;α/2 (n 1) s2 χ 2 n 1;1 α/2 (93) F.O. (94) STU (95) Uafh (96) sande svar (97) [ ] (15 1) 12 σ 2 2 (15 1) 122 ɛ ; (98) 23, 7 6, 57 σ 2 ɛ[7, 09; 25, 57] (99) n = 30 nu. [ (30 1) 12 σ 2 2 ɛ ; 42, 6 ] (30 1) , 7 (100) σ 2 ɛ[8, 17; 19, 66] (101) 26

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele Anvendt Statistik Lektion 4 Hypotesetest generelt Test for middelværdi Test for andele Hypoteser og Test Hypotese I statistik er en hypotese en påstand om en populationsparameter. Typisk en påstand om

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala 3 5% 5% 5% 0 3 4 5 6 7 8 9 0 Statistik for biologer 005-6, modul 5: Normalfordelingen opstår når mange forskellige faktorer uafhængigt af hinanden bidrager med additiv variation til. F.eks. Højde af rekrutter

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Nanostatistik: Opgavebesvarelser

Nanostatistik: Opgavebesvarelser Nanostatistik: Opgavebesvarelser JLJ Nanostatistik: Opgavebesvarelser p. 1/16 Pakkemaskine En producent hævder at poserne indeholder i gennemsnit 16 ounces sukker. Data: 10 pakker sukker: 16.1, 15.8, 15.8,

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Estimation: Kapitel 9.1-9.3 Estimation Estimationsfejlen Bias Eksempler Bestemmelse af stikprøvens størrelse Konsistens De nitioner påkonsistens Eksempler på konsistente og middelrette estimatorer

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

hvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y))

hvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y)) 1 Opgave II.1 a) Stikprøvevariansen er vidt forskellig for de fire varetyper, men denne absolutte størrelse er vanskelig at sammenligne på tværs af varetyper, da disse har vidt forskellige niveauer, målt

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni 2007 4 timers prøve med hjælpemidler Opgaven består af re delopgaver, som alle skal besvares. De re opgaver indgår med samme vægt. Opgaverne

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Statistik noter - Efterår 2009 Keller - Statistics for management and economics

Statistik noter - Efterår 2009 Keller - Statistics for management and economics Statistik noter - Efterår 2009 Keller - Statistics for management and economics Jonas Sveistrup Hansen - stud.merc.it 22. september 2009 1 Indhold 1 Begrebsliste 3 2 Forelæsning 1 - kap. 1-3 3 2.1 Kelvin

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1

Mikro-kursus i statistik 1. del. 24-11-2002 Mikrokursus i biostatistik 1 Mikro-kursus i statistik 1. del 24-11-2002 Mikrokursus i biostatistik 1 Hvad er statistik? Det systematiske studium af tilfældighedernes spil!dyrkes af biostatistikere Anvendes som redskab til vurdering

Læs mere

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0. Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet Repetition:

Læs mere

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm Kon densintervaller og vurdering af estimaters usikkerhed Claus Thorn Ekstrøm KU Biostatistik ekstrom@sund.ku.dk Marts 18, 2019 Slides @ biostatistics.dk/talks/ 1 Population og stikprøve 2 Stikprøvevariation

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Estimation og usikkerhed

Estimation og usikkerhed Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel

ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel ! ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel Opgave 1 Når populationens varians er kendt En virksomhed har udviklet en proces til at producere mursten,

Læs mere

Nanostatistik: Opgaver

Nanostatistik: Opgaver Nanostatistik: Opgaver Jens Ledet Jensen, 19/01/05 Opgaver 1 Opgaver fra Indblik i Statistik 5 Eksamensopgaver fra tidligere år 11 i ii NANOSTATISTIK: OPGAVER Opgaver Opgave 1 God opgaveskik: Når I regner

Læs mere

Grundlæggende statistik Lektion 2 Indhold Diskrete fordelinger Binomial fordelingen Poisson fordelingen Hypergeometrisk fordeling Data typer el. typer af tilfældige variable Diskrete variable > Kategoriseres

Læs mere

Opgaver til kapitel 3

Opgaver til kapitel 3 Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer

Læs mere

Vejledende løsninger til opgaver i kapitel 6

Vejledende løsninger til opgaver i kapitel 6 Vejledende løsninger til opgaver i kapitel Opgave 1: a) Den stokastiske variabel, X, der angiver, om en elev består, X = 1, eller dumper, X =, sin eksamen i statistik. b) En binomialfordelt variabel fremkommer

Læs mere

Stastistik og Databehandling på en TI-83

Stastistik og Databehandling på en TI-83 Stastistik og Databehandling på en TI-83 Af Jonas L. Jensen (jonas@imf.au.dk). 1 Fordelingsfunktioner Husk på, at en fordelingsfunktion for en stokastisk variabel X er funktionen F X (t) = P (X t) og at

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Vejledende løsninger kapitel 8 opgaver

Vejledende løsninger kapitel 8 opgaver KAPITEL 8 OPGAVE 1 Nej den kan også være over 1 OPGAVE 2 Stikprøvestørrelse 10 Stikprøvegennemsnit 1,18 Stikprøvespredning 0,388158 Konfidensniveau 0,95 Nedre grænse 0,902328 Øvre grænse 1,457672 Stikprøvestørrelse

Læs mere

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136 Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 36 Det er besværligt at regne med binomialfordelingen, og man vælger derfor ofte at bruge en approksimation med normalfordeling. Man

Læs mere

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr) DANMARKS TEKNISKE UNIVERSITET Side af 7 sider Skriftlig prøve, den: 9. maj 05 Kursus nr : 0405 Kursus navn: Sandsynlighedsregning Varighed : 4 timer Tilladte hjælpemidler: Alle Dette sæt er besvaret af:

Læs mere

Definition. Definitioner

Definition. Definitioner Definition Landmålingens fejlteori Lektion Diskrete stokastiske variable En reel funktion defineret på et udfaldsrum (med sandsynlighedsfordeling) kaldes en stokastisk variabel. - kkb@math.aau.dk http://people.math.aau.dk/

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr) CIVILINGENIØREKSAMEN Side 1 af 18 sider Skriftlig prøve, den: XY. december 200Z Kursus nr : 02405 Kursus navn: Sandsynlighedsregning Tilladte hjælpemidler: Alle Dette sæt er besvaret af: (navn) (underskrift)

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5 Opgave 5.117, side 171 (7ed: 5.116 side 201 og 6ed: 5.116 side 197) I denne opgave skal vi benytte relationen mellem den log-normale fordeling

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen Anvendt Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfni@dtu.dk Dagens emner: Afsnit 3.3 og 3.4 Varians/standardafvigelse

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro

Uge 48 II Teoretisk Statistik 27. november 2003. Numerisk modelkontrol af diskrete fordelinger: intro Uge 48 II Teoretisk Statistik 7. november 003 Numerisk modelkontrol af diskrete fordelinger: intro Eksempel: kvalitetskontrol Goodness-of-fit test: generel teori Endeligt udfaldsrum Udfaldsrum uden øvre

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 4: Diskrete fordelinger Afsnit 4.1-4.2, 4.7: Bernoulli fordeling Binomial fordeling Store Tals Lov (Laws of Averages, Laws of Large Numbers) 1 Bernoulli fordeling Kvantitative Metoder

Læs mere

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 8: Inferens for varianser (kap 9) Kursus 02402 Introduktion til Statistik Forelæsning 8: Inferens for varianser (kap 9) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Fagplan for statistik, efteråret 2015

Fagplan for statistik, efteråret 2015 Side 1 af 7 M Fagplan for statistik, efteråret 20 Litteratur Kenneth Hansen & Charlotte Koldsø (HK): Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave, ISBN 9788741256047 HypoStat

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Side 1 af 6 Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning Litteratur: Kenneth Hansen & Charlotte Koldsø: Statistik I økonomisk perspektiv, Hans Reitzels Forlag 2012, 2. udgave,

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Dagens program. Praktisk information:

Dagens program. Praktisk information: Dagens program Praktisk information: Husk hjemmeopgaven i statistik Hypoteseprøvning kap. 11.2,11.3 og 11.8 Eksempel på test Styrkefunktionen kap. 11.2 Stikprøvens størrelse kap. 11.3 Likelihood ratio

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Anvendt Statistik Lektion 2 Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger Sandsynlighed: Opvarmning Udfald Resultatet af et eksperiment kaldes et udfald. Eksempler:

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model). Hypotesetests, fejltyper og p-værdier og er den nu også det? Søren Højsgaard Institut for Matematiske Fag, Aalborg Universitet (updated: 2019-03-17) 1 / 40 Statistisk test Et statistisk test er en konfrontation

Læs mere

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Binomialfordelingen. X ~ bin(n,p): X = antal succeser i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p):

Læs mere