Statistik opgaver - Efterår 2009 Keller - Statistics for management and economics



Relaterede dokumenter
Konfidensintervaller og Hypotesetest

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Løsning til eksaminen d. 29. maj 2009

Løsning eksamen d. 15. december 2008

Produkt og marked - matematiske og statistiske metoder

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Løsning til eksaminen d. 14. december 2009

Vejledende besvarelser til opgaver i kapitel 14

Tema. Dagens tema: Indfør centrale statistiske begreber.

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Statistiske modeller

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Kvantitative Metoder 1 - Forår 2007

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Nanostatistik: Opgavebesvarelser

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Kvantitative Metoder 1 - Forår 2007

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

hvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y))

Note til styrkefunktionen

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Normalfordelingen og Stikprøvefordelinger

Forelæsning 9: Inferens for andele (kapitel 10)

Statistik noter - Efterår 2009 Keller - Statistics for management and economics

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Estimation og usikkerhed

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel

Nanostatistik: Opgaver


Opgaver til kapitel 3

Vejledende løsninger til opgaver i kapitel 6

Stastistik og Databehandling på en TI-83

Note om Monte Carlo metoden

Vejledende løsninger kapitel 8 opgaver

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 29. maj 2015 Kursus nr : (navn) (underskrift) (bord nr)

Definition. Definitioner

Kapitel 4 Sandsynlighed og statistiske modeller

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: XY. december 200Z Kursus nr : (navn) (underskrift) (bord nr)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Skriftlig eksamen Science statistik- ST501

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Kvantitative Metoder 1 - Forår 2007

Forelæsning 8: Inferens for varianser (kap 9)

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Fagplan for statistik, efteråret 2015

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Løsning til eksamen d.27 Maj 2010

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

(studienummer) (underskrift) (bord nr)

Eksamen i Statistik for biokemikere. Blok

Dagens program. Praktisk information:

(studienummer) (underskrift) (bord nr)

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Et statistisk test er en konfrontation af virkelighenden (data) med en teori (model).

Binomialfordelingen. X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes.

Transkript:

Statistik opgaver - Efterår 2009 Keller - Statistics for management and economics Jonas Sveistrup Hansen - stud.merc.it 17. december 2009 1

Indhold 2

1 Opgave 24 En virksomhed har gennem længere tid anvendt en og sammen introduktionsprocedure, når man ansætter nye nye medarbejdere til at udføre bestem type akkordarbejde. Personalechefen har været meget utilfreds med denne procedure, fordi 50 % af de nyansatte rejste, inden der var gået et år. For at imødegå dette gennemtræk af medarbejdere har han udarbejdet en ny introduktionsprocedure, men er meget i tvivl om den virkning. Antag, at vi har 25 medarbejdere, der har gennemgået den gamle introduktionsproducere. χ = Antal nyansatte (gamle intro)rejste medarbejdere indenfor det 1. år. n = 25 og p = 0, 50 Binomialfordeling valgt X Binomial(n = 25, p = 0, 5) Forudsætninger: to udfald - bliver eller ikke konstant p: forskellige kvalifikationer uafhængighed: tvivlsom, da medarbejdere snakker sammen. Hvem rejser? n = 25 punktsssh for Bino. ( ) n X p x (1 p) n x = n! x!(n x)! px (1 p) n x 1. Hvad er sandsynligheden for at, (a) 3 medarbejdere rejser i løbet af det 1. år? P (x = 3 n = 25, p = 0, 50) = 0, 00 (b) højst 5 rejser i af det 1. år? P (x 5 n = 25, p = 0, 50) = 0, 02 (c) mindst 9 rejser i løbet af 1. år? P (x 9 n = 25, p = 0, 50) = 1 E(x 8 n = 25, p = 0, 50) = 1 0, 0539 = 0, 946 2. Beregn den forventede værdi og standardafvigelse E(X) = n p = 25 0, 5 = 12, 5 V (X) = n p(1 p) = 25 0, 5(1 0, 5) = 6, 25 = 2, 5 3

3. Konklusion Ud fra vores antagelser, kan resultaterne være lidt skæve. Antag, at den nye introduktionsprocedure reducerer gennemtrækket, så kun 40 % af de nyansatte rejser, inden der er gået et år, og at 30 medarbejdere gennemgår den nye introduktionsprocedure. Y = Antal nyansatte (ny intro)rejste medarbejdere indenfor det 1. år. 4. Besvar - med de lige nævnte antagelser - de i spørgsmål 1 og 2 stillede spørgsmål. (a) 3 medarbejdere rejser i løbet af det 1. år? P (y = 3 n = 30, p = 0, 40) = 0, 0002 (b) højst 5 rejser i af det 1. år? Approx: til NF, se p. 8 i notesamling. np > 5 og n(1 p) > 5, at de er OK P (Z < Y + 1 2 E(Y ) ) P (Z < V (Y ) 5+ 1 2 30 0,4) 30 0,4 (1 0,4) = 2, 42) = 0, 0078 (c) mindst 9 rejser i løbet af 1. år? P (y 9 n = 30, p = 0, 40) = 1 E(y 8 n = 30, p = 0, 40). Approx til NF da krav igen er OK! 1 P (Z < 8+ 1 2 30 0,4 (1 0,4) 30 0,4 = 1, 31) = 1 0, 0951 = 0, 9049 5. Beregn den forventede værdi og standardafvigelse E(Y ) = n p = 30 0, 4 = 12 V (Y ) = n p(1 p) = 30 0, 4(1 0, 4) = 7, 2 = 2, 683 2 Opgave 29 Til pakning af kaffe i 250 grams pakker anvendes en pakkemaskine. Maskinen indstilles til at pakke med en middelvægt (brutto) på 263 g. Emballagen vejer 5 g. Alle pakker kontrolvejes, og pakker med en bruttovægt under 255 g frasorteres. Pakkernes vægt antages at være normalfordelt med en middelværdi på 263 g. Normaltfordelt er kontinuert: måleligt vendelige antal udvalg 4

Forventede værdi = µ = 263 g. Variansen er = σ 2 Std. afv. = σ 2 χ Bruttovægt pr. pose kaffe i gram. χ NF (µ = 263) Beregn fordelingens standardafvigelse, når det oplyses, at der sidste år blev frasorteret i alt 5,5 % af samtlige pakker. P (X < 255 µ = 263, σ =?) P (Z = X µ < 255 263 ) = 255 σ σ Slå op i kroppen af tabel 3. 1, 6 = 8 σ = 5 σ Hvor stor bliver frasorteringesprocenter, hvils middelvægten vælges til 255 g? 260 g? P (Z = X µ < 255 255 ) = 0, 5 σ 5 P (Z = X µ < 255 260 = 1, 00) = 0, 1587 1 Nu er frasorteringsprocenten 15,87 % ved µ= σ 5 260 Hvilken middelvægt skal maskinen indstilles til, hvis man under i øvrigt undrede forhold ønsker frasorteringsprocenter ned til 2? P (X < 255 µ =?, σ = 5) = 0, 02 P (Z = X µ < 255 µ ) = 0, 02 σ 5 Slå igen op i kroppen af tabellen. Z = 2, 05 2, 05 = 255 µ µ = 265, 25 5 3 Opgave 30 3.1 Opgavetekst I en afdeling produceres på maskinen MS et emne i massefabrikation. Emnet skal anvendes som delkomponent i det endelige produkt, som fabrikeres af samme virksomhed. Det kræves af emnet, at dets diameter ligger i intervallet 2,30 ± 0,30 mm. Emner, som er mindre end nedre grænse, kasseres, mendes emner, som er større end øvre grænse slibes i en reparationsafdeling. Erfaringer viser, at diameteren på emner produceret på MS er normalfordelt med en standardafvigelse på 0,20 mm. 1 da, decimalerne er, 00 skal der slås op i den første kolonne i Tabel 3 5

I det følgende antages det, at MS er indstillet til at producere med en middelværdi på 2,26 mm. Hvor stor vil kassationsprocenten være? Hvis 30 emner udtages, hvor stor er sandsynligheden da for, at der højst er 2, der må kasseres? Beregn det forventede antal emner, der videresendes til slibning fra et parti på 1.000. Undersøgelser har vist, at kassationsomkostningerne er relativt store i forhold til slibeomkostningerne, og virksomheden ønsker derfor at nedsætte kassationssandsyndligheden. Beregn den minimale middelværdig (µ 1 ), der sikre, at kassationssandsynligheden højst er 0,01 3.2 Egne betrækninger χ = Vurdering af enmer. I følge opgave tekst følger X en formalfordeling. Binomialfordeling. Slibes eller ikke. µ = 2, 26, σ = 0, 20, 1 α = 0, 95 2, 26 ± 1, 96 0,2 30 µɛ[2, 19; 2, 33] 4 Opgave 38 4.1 Opgavetekst For at producere en bestemt type komponenter kræves behandling på 2 af hinanden uafhængigt arbejdende maskiner, Maskine 1 (M1) og Maskine 2 (M2). Behandlingen skal først foregå på M1 og dernæst på M2. M2 s kapacitet er så stor, at lige så snart behandlingen på M1 er færdig, kan behandlingen på M2 begynde. Behandlingstiden på M1 er en stokastisk variable, der kan beskrives ved NF 6

med forventet værdi 6 min. og standardafgivelse 0,4 min. Behandlingstiden på M2 kan ligeledes beskrives ved en normalfordeling med forventet værdi 4 min. og standardafvigelse 0,3 min. Beregn ssh for, at et emne, hvor behandlingen netop påbegyndes på M1, er færdigbehandlet på begge maskiner, inden der er gået 9 min. og 10 sek. (Vink: En stokastisk variabel, der er summen af to normalfordelte stokastiske variable, er selv normalfordelt.) Man har netop færdigbehandlet 100 komponenter. Hvad er sandsyndligheden for, at mindst 90 komponenter har været udsat for en samlet behandlingstid på mindst 9 min. og 10 sek.? Hvad er sandsynligheden for, at den gennemsnitlige behandlingstid for disse 100 komponenter er højst 10 min. og 6 sek.? Hvis den samlede behandlingstid for en komponent bliver mindre end 9 min., skal komponenten kasseres på grund af stor sandsynlighed for at være mangelfuld (defekt). I sidste måned kiksede kvalitetskontrollen, og alle 2.000 producerede komponenter, inkl. de, der skulle have været kasseret, blev placeret på lageret. Hvor mange komponenter må vi forvente skal kasseres, pga. at behandlingstiden var under 9 min.? Fra dette parti udvælges en tilfældig stikprøve på 50 komponenter. Hvad er sandsynligheden for, at der er flere end 4 komponenter i denne stikprøve, der burde have været kasseret, fordi behandlingstiden har været mindre end 9 min.? 4.2 Egne betrækninger 5 10.17 Is the sample median an unbiased estimator of the population mean? Explain? 7

µ = parameter X = redskab til at estimere µ x = estimatet Valg af estimator Unbiased - E( X) = µ Konsistent - V ( X = σ2 ) - n så går variansen 0 n Relativ efficiens - Laveste varians E(x) = µ γ = 0 (skævhed) X er symmerisk fordelt (skævhed = 0). Idet x NF, gælder E(MD) = µ. Medianen er således en unbiased estimator af µ 6 10.21 The following data represent a random sample of 9 marks (out of 10) on a statistics quiz. The marks are normally distributed with a standard of deviation of 2. Estimate the population mean with 90 % confidence. 2 7, 9, 7, 5, 4, 8, 3, 10, 9 6.1 Besvarelse χ : Angiver karakter givet ved en stat. quiz. χ NF (σ = 2, µ =?) 6.2 Forudsætninger 1. STU - 2. Troværdige svar - 2 Appendix B eller p. 327 8

3. Processbetragtning - 4. Kender populationsvariansen - 5. At X NF - n= 9 x = 62 9 = 6, 89 x ± z α/2 σ n (1) 6, 89 ± 1.645 2 9 µ [5, 79; 7, 98] (2) 6.3 Konklusion Med 90 % sikkerhed er den sande værdi af karaktergennemsnittet indeholdt i intervallet [5,79; 7,98] 6.4 ekstra Konfidensinterval valgt til 99 % Stikprøvevarians x ± z α/2 σ n (3) 6, 89 ± 2, 575 2 9 µ [5, 17; 8, 61] (4) 9i=1 S 2 x 2 i n x 2 = n 1 (5) (7 2 + 9 2 +... 9 2 ) 9 6, 89 2 9 1 (6) S 2 = 5, 844 5, 844 2, 42 (7) 9

7 10.33 A statistics professor is in the process is investigating how many classes... x = 10,21 n = 100 σ = 2,2 confidence = 99 % = 2,575 x ± z α/2 σ n (8) 10, 21 ± 2, 575 2, 2 100 µ [9, 6435; 10, 7765] (9) 8 10.39 x = 14, 98 confidence = 90 % = 1,645 n=250 σ = 3 x ± z α/2 σ n (10) 3 10, 39 ± 1, 645 µ [14, 6679; 15, 2921] (11) 250 9 11.43 - Hypotesetest X : Det gennemsnitlige # fodgængere der passere et bestemt sted pr. time. x = 105, 7 σ = 16 n = 40 9.1 Hypoteseformulering H 0 100 H 1 > 100 En sidet, da H 1 >100 10

9.2 Valg af signifikansnivaeu α = 1% Z α = 2, 326 3 9.2.1 Valg af observator (jvf. p. 24 samt 25-28 og 43-48 notesamling) H 0 er sand - Simpel tilfældig udvalgt, kan diskuteres da tidspunkterne kan spille ind på kundestrømmen. σ kendt - n N < 0, 05-9.3 Beregning af observatorværdi (Keller p. 351 og 383) Slå op på side 24 i notesamling. Z obs = x µ 0 σ/ n (12) 105, 7 100 16/ = 2, 25 40 (13) 9.4 Fastsættelse af den kritiske grænser samt valg af H 0 eller H 1 - Keller p. 353 og 386 Da Z obs < Z kritisk (14) 2, 25 < 2, 326 (15) Fastholdes H 0 3 Appendix B - B8 tabel 3 11

9.5 Beregning af p-værdi - Keller p. 383 og 386 P-værdi = P (Z > z obs = 2, 25) (16) = 1 P (Z < 2, 25) (17) = P (Z > 2, 25) (18) = 0, 0122 (19) Dvs., at SSH for et lige så eller men ekstremt resultat såfremt H 0 er 1,22 % 9.6 Konklusion Med et sig. niveau på 1 %, er man således nødsaget til at fastholde H 0. Derfor kan man ikke konkludere, at der går under 100, og vi ikke kan åben butikken. De har sagt sig. niveau lagt, så de er sikre på der kommer nok kunder. 10 Opgave E26 Ingen af nedenstående tre påstande er sande. Du bedes for hver påstand kort redegøre for, hvorfor påstande ikke er sand. 1. Den centrale grænseværdisætning udtrykker, at variansen af estimatoren går imod nul for voksende stikprøvestørrelse. CGS udtrykker at, lige meget hvilken fordeling af X, vil fordelingen af x approksimativt, når stikprøven bliver tilstrækkelig stor nærme sig NF. Dvs. hvis X NF vil x NF. Jo mere skæv populationen er, jo større n kræves der. (n > 25 γ 2 ) Påstand berører begrebet konsistens V ( X) = V (x) n 0 (20) når n (21) 2. Der er ingen sammenhæng imellem stikprøvestørrelsen og fejlmagin i et konfidensinterval 12

σ 2 b = z α/2 n (22) eller (23) b = t n 1;α/2 S 2 n (24) Vi ser der er sammenhæng imellem x, gennemsnittet for stikprøven og n, som angiver størrelsen af stikprøven. BONUS: En firdobling af stikprøvestørrelsen betyder en halvering af fejlmarginen. b = z α/2 σ 2 n = z α/2 σ 2 n 4 σ 2 = z α/2 n 1 4 = 1 σ 2 z 2 α/2 n (25) (26) (27) (28) 3. Observatorværdien ved test for en µ-værdi beregnes som stikprøveandelen minus det postulerede divideret med kvadratroden af forholdet mellem varianesen og stikprøvestørrelsen. z obs = x µ 0 σ 2 n z obs = ˆp µ 0 σ 2 n (29) (30) (31) Skift ˆp ud med x 13

11 10.49 A medical statician wants to estima the average weight loss of people who are on a new diet plan in at preliminary study he guesses that the standard deviation of the populations weight losses is about 10 pounds. How large a sample should be taken to estimate the mean weight loss to within 2 pounds, with 90 % confidence 11.1 Besvarelse Find fejlmargin, halvdelen af konfidensinterval. b = z α/2 X: Angiver vægttab for mennesker på den nye diet x NF σ = 10 pounds confidence = 90 % = 1,645 b 4 = 2 pounds 11.2 Forudsætninger σ n (32) n = ( z α/2 σ ) 2 (33) b 1. STU - Da de mennesker der kommer på den nye diet, kan det diskuteres om de er simpelt tilfældigt udvalgt. 2. Troværdige svar - 3. n N < 5% eller processbetragtning(vores N er uendelig) n = ( ) 1, 646 10 2 2 (34) n = 67, 65 68 (35) 4 fejlmargin 14

11.3 kontrol 11.4 Konklusion µ = x ± Z α/2 = x ± 1, 645 σ n (36) 10 68 (37) = x ± 1, 99 (38) Stikprøven skal være på 68 personer for at sikre at vi får en fejlmargin på 2. 12 11.35 - Hypotesetest X : Lyspærers brændetid over 5.000 timer x = 5064, 96 σ = 400 µ = 5.000 n = 100 12.1 Hypoteseformulering H 0 < 5.000 H 1 5.000 En sidet, da H 1 5.000 12.2 Valg af signifikansnivaeu α = 5% Z α = 1.96 5 5 Appendix B - B8 tabel 3 eller p. 308 (327 i ny gb) 15

12.3 Valg af observator (jvf. p. 24 samt 25-28 og 43-48 notesamling) H 0 er sand - Simpel tilfældig udvalgt - Tag fra flere dage, så Troværdige svar - σ kendt - n N < 0, 05 - Kender ikke store N, men går ud fra produktionen er større end 2000 enheder. 12.3.1 Beregning af observatorværdi (Keller p. 351 og 383) Slå op på side 24 i notesamling. Z obs = x µ 0 σ/ n (39) 5.064, 96 5.000 400/ = 1, 624 100 (40) 12.4 Fastsættelse af den kritiske grænser samt valg af H 0 eller H 1 - Keller p. 353 og 386 Da Z obs < Z kritisk (41) 1, 624 < 1, 96 (42) Fastholdes H 0 12.5 Beregning af p-værdi - Keller p. 353 og 386 P-værdi = P (Z > z obs = 1, 624) (43) 16

= 1 P (Z < 1, 624) (44) = P (Z > 1, 624) (45) = 0, 052 (46) Dvs., at SSH for for at begå en type 2 fejl (forkaster sand H 0 ) er 0,052-5,2 % 12.6 Konklusion Med et sig. niveau på 5 %, kan vi beholde H 0. Så 95(97,5 skal diskuteres!) % af populationen vil overholde de 5.000 timers brændetid. 13 11.46 - Hypotesetest X : Antal min. der bruges på rygepause pr. dag. x = 29, 92 minutter σ = 8 minutter µ = 32 minutter n = 110 13.1 Hypoteseformulering H 0 : µ 32 H 1 : µ < 32 En sidet, da H 1 <32 13.2 Valg af signifikansnivaeu α = 5% Z α = 1, 645 6 6 Appendix B - B8 tabel 3 eller p. 308 (327 i ny gb) 17

13.3 Valg af observator (jvf. p. 24 samt 25-28 og 43-48 notesamling) H 0 er sand - Simpel tilfældig udvalgt - Z obs = x µ 0 σ/ n (47) Troværdige svar - Dårlig formulering, da tiden målt kan bruges til andet end at ryge - σ kendt - n N < 0, 05 eller procesbetragning(vores N er uendelig) X NF, for N stor nok - Uafhængighed - Problemer med uafhængighed (de kan snakke sammen osv.) 13.3.1 Beregning af observatorværdi (Keller p. 351 og 383) Slå op på side 24 i notesamling. Z obs = x µ 0 σ/ n (48) 29, 92 32 8/ = 2, 7269 110 (49) 13.4 Fastsættelse af den kritiske grænser samt valg af H 0 eller H 1 - Keller p. 353 og 386 Da Z obs < Z kritisk (50) 2, 7269 > 1, 645 (51) forkaster H 0 18

13.5 Beregning af p-værdi - Keller p. 353 og 386 P-værdi 13.6 Konklusion = P (Z < z obs = 2, 7269) (52) = 0, 0032 (53) Med et sig. niveau på 5 %, forkaster vi H 0, da p-værdi under 1 %, er konk., at forkaste H 0, til trods for nogle usikkerheder omkring forudsætninger. 14 11.66 - ref til 11.46 X : Antal min. der bruges på rygepause pr. dag. 14.1 Type 1 fejl 32 1, 654 µ z α σ n = (54) 6 110 = 30, 75 (55) Ved stikprøve resultat på over 30,75 fastholder man H 0 Ved stikprøve resultat på under 30,75 forkaster man H 0 14.2 Type 2 fejl P ( x > 30, 75 µ = 30, σ = 8, n = 110) (56) 30, 75 30 = P (Z > 8/ = 0, 1635 110 (57) SSH for at begå en type 2 fejl er 16,35 % 2 måder at reducerer på: n eller α 19

15 E10 - a, b Ingen af nedenstående påstande er sande. Du bedes for hver påstand kort redegøre for, hvorfor påstanden ikke er sand. 1. Sandsynligheden for, at en standardnormalfordelt stokastisk variabel antager en værdi på over 1,5, er lig med 0,33. Påstand: P (z > 1, 5) = 0, 33 Opslag:1 P (z < 1, 5) = 1 0, 9332 = 0, 0668. Det er ikke sandt, da 33 % 6,8 % 2. Den empiriske varians beregnes som summen af observationernes kvadrat divideret med stikprøvestørrelsen minus en. Postuleret udtryk s 2 = Varians: s 2 = x 2 i n 1 n (x i x) 2 i=1 n 1 (58) (59) 16 E21.1 Siden 1874 har Dansmarks Meteorologisk Institut målt temperaturen, nedbørsmængden samt antal solskinstimer måned for måned. Nedenfor er anført, at middeltemperaturen i juni måned i de 132 år, der er blevet målt, i gennemsnit har været 14,26 grader med en standardafvigelse på 1,20. Tabel 1: Descriptive Statistics N Minimum Maximum Mean Std. deviation Mean temp. june 132 10,7 18,2 14,26 1,20 1. Du bedes på grundlag af ovenstående argumentere for, hvad sandsynligheden er for, at middeltemperaturen i juni 2006 bliver på over 18,2 grader. 20

X: Middel temp i juni 1 P (z < P (X > 18, 2) (60) 18, 2 19, 26 = 3, 28) 1, 20 (61) 1 0, 9995 = 0, 0005 (62) Kan også udregnes på lommeregner med cdf(). 17 E4.1 - Alm. ssh opgave Batterier af typen XFT har en levetid, som er normalfordelt med en forventet levetid på 115 timer, og en standardafvigelse på 10 timer. Du indsætter nu fire af denne type batterier i din bærbare pc. ( Pc en fungerer kun, når alle fire batterier fungerer). 1. Hvad er sandsynligheden for, at pc en kan fungere i over 100 timer? X: Antal timer et batteri af typen XFT har som levetid X n(µ = 115, σ = 10) P (X > 100) = (Z = x µ = 100 115 = 1, 5) σ 10 1 P (z < 1, 5) = 1 0, 0668 = 0, 9332 Vi skal finde for fire batterier lever over 100 timer. 0, 9332 4 = 0, 7584 18 Opgave 34.1-3 En virksomhed får hver måned leveret et parti på 10.000 stk. af en elektronisk komponent. Normalt er et mindre antal komponenter defekte. Defektandelen kaldes p. Hvis p 0,01, er partiets kvalitet tilfredsstillende. Er p 0,04, er kvaliteten utilfredsstillende, og partiet skal helst returneres. Om et parti skal returneres eller ej, afgøres ved hjælp af en stikprøve. Der udvælges en stikprøve på 100 stk. X er antallet af defekte komponenter i stikprøven. Hvis p=0,04, hvor stor er da: 21

X: Antal defekte komponenter i stikprøven X Hyp, da N=10.000 Endelig pop (N=10.000) 2 udfald n=100 1. P (X 2)? Der approx til Bin. (a) N > 50 (b) n < 0, 05 N Vha. lommeregner binomcdf(100,0.04,2) 2. P (X = 3)? Vha. lommeregner binompdf(100,0.04,3) 3. P ( 5)? binomcdf(100,0.04,5). 1 P (x 4) = 1 0, 6288 = 0, 37 Virksomheden opstiller det krav, at sandsynligheden for at acceptere et parti med p=0,04, højst må være 0,10. 1. Hvilke stikprøveresultater (kontrolgrænsen) fører til, at partiet returneres, når stikprøvens størrelse er 100? P (x? µ = 4) 0, 1 P (x 0) = 0, 0183 1= 0,09 2=0,23 P (x 2) partiet afvises 2. Find sandsynligheden for, at et parti med p=0,01 returneres, hvis man anvendes den i spm.1 fundne kontrolgrænse. p =0,01 P (x µ = n p = 100 0, 01 = 1) 1 P (x 1) = 1 0, 7358 = 0, 2642 22

19 E12.2 - K.I To CarPark-kontrollører, Gisme og Fuzzy, har på de 21 hverdage i marts måned dagligt optalt det antal kontrolafgifter, de hver især har placeret under vinduesviskeren på biler, der ikke har overholde de vilkår, der er fastsat for parkering på stedet. Gisme er provisionslønnet og blev ved ansættelsen stillet i udsigt at kunne udskrive mindst 20 kontrolafgifter pr. dag. Han har i marts i gennemsnit udskrevet 18,5 pr. dag med en varians på 19,2. 1. Opstil et 95 %-K.I. for det forventede antal kontrolafgifter pr. dag. X : Antal kontrolafgifter pr. dag (63) X Poisson hændelser over tid = m (64) Approx µ > 10 20, ok! (65) µ = x x m ± z α/2 (66) m x = 21 18, 5 = 388, 5 389 (67) µ = 389 389 ± 1, 96 (68) 21 21 µɛ[16, 66; 20, 34] (69) Vi kan derfor sige at der med 95 % sikkerhed sige, at de 20 kontrolafgifter pr. dag er indeholdt i intervallet. Kan også løses ved NF vælges. 20 E28.1,3 - K.I 19, 2 µ = 18, 5 ± t 20;α/2 21 (70) µɛ[16, 5; 20, 5] (71)... Man ønsker at fastlægge stikprøvestørrelsen, således at man kan opstille et 95 %-K.I., hvor fejlmargin er 2 procentpoint(0,02) 23

1. Du bedes argumentere for, hvor stor stikprøvestørrelsen skal være. Herunder bedes du anføre, hvilke forudsætninger, du gør. X: Antal elever der mener gym. ref har fungeret tilfredsstillende X Hyper (72) F.O. (73) Tilf / ikke tilfd. (74) n - STU (75) Uafh (76) Endelig pop (alle elever på alm. gym.) (77) ˆp(1 ˆp) b = z α/2 (78) n n = ( z α/2 ˆp(1 ˆp) ) 2 b 2 (79) n = 1, 962 ˆp(1 ˆp) ˆp = 50% 0, 02 2 (80) Vi ser at stikprøven skal være 2401. n = 1, 962 0, 5 0, 5 0, 02 2 (81) n = 2401 (82) De 1000 elever, der indgik i undersøgelsen, havde desuden angivet deres årskarakter i faget Dansk. Den gennemsnitlige karakter for disse 1000 elever var på 7,2 med en std.afg. på 3,1. 2. Du bedes opstille et 95 %-K.I. for den gennemsnitlige årskarakter i faget Dansk for dette års studenter fra det almene gymnasium. Diskuter herunder konsekvensen, hvis man inddrog korrektion for den endelige population. X: Årskarakter i dansk x NF( x =7,2; s= 3,1) µ = x ± t n 1;α/2 s n (83) 24

F.O. (84) STU (85) Uafh (86) Ukendt varians (87) 3, 1 = 7, 2 ± 1, 96da n er meget stor (88) 1000 µɛ[7, 01; 7, 39] (89) Vi kan dermed sige med 95 % sikkerhed sige, at 7,2 ligger i intervallet. Vi går ud fra N < 20.000 s N n µ = x ± t n 1;α/2 (90) n N 1 3, 1 20.000 1000 µ = 7, 2 ± 1, 96 (91) 1000 20.000 1 µɛ[7, 0125; 7, 3875] (92) 21 E31- Påstand Ingen af nedenstående påstande er sande. 1. Såfremt stikprøven udgør mere end 5 % af populationen, bør man korrigere estimatet for andelen med N n N Variansen for estimatet skal korrigeres V (P ) p(1 p) N n n N 1 2. Såfremt der normalt ankommer 15 skibe til en havn pr. uge, kan man ud fra CGS argumentere for, at ssh for, at der ankommer 9 skibe på en uge er 7 % Påstand: P (X < 9 µ = 15) = 0, 07 Sand: P (X 8 µ = 15) = 3, 74% Da der ingen stikprøvestørrelsen er opgivet, kan vi ikke benytte CGS. 3. Den forventede værdi af en χ 2 v-fordeling er 0 med en varians på 2. 25

Den forventede værdi er antal frihedsgrader, mens variansen er antal frihedsgrader 2 22 12.45 n = 15 s 2 = 12 Estimer variansen med 90 % sikkerhed. σ 2 ɛ (n 1) s2 ; χ 2 n 1;α/2 (n 1) s2 χ 2 n 1;1 α/2 (93) F.O. (94) STU (95) Uafh (96) sande svar (97) [ ] (15 1) 12 σ 2 2 (15 1) 122 ɛ ; (98) 23, 7 6, 57 σ 2 ɛ[7, 09; 25, 57] (99) n = 30 nu. [ (30 1) 12 σ 2 2 ɛ ; 42, 6 ] (30 1) 122 17, 7 (100) σ 2 ɛ[8, 17; 19, 66] (101) 26