ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel



Relaterede dokumenter
Vejledende løsninger kapitel 8 opgaver

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Susanne Ditlevsen Institut for Matematiske Fag susanne

Vejledende besvarelser til opgaver i kapitel 14


Normalfordelingen og Stikprøvefordelinger

Estimation og usikkerhed

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

ØVELSER Statistik, Logistikøkonom Lektion 7: Hypotesetest 2

ca. 5 min. STATISTISKE TEGN

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Konfidensintervaller og Hypotesetest

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Kapitel 4 Sandsynlighed og statistiske modeller

1 Hb SS Hb Sβ Hb SC = , (s = )

Løsning til eksaminen d. 14. december 2009

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Løsning eksamen d. 15. december 2008

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Kvantitative Metoder 1 - Forår 2007

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

c) For, er, hvorefter. Forklar.

Statistik i løb Supplerende opgaver

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

hvor y antages approksimeret ved normalfordeling med middelværdi y og varians va^r(y): y ± u 1-/2 # cv(y) # y = y(1 ± u 1-/2 # cv(y))

Bilag 6: Bootstrapping

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Eksempel I. Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ =2minutter.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Kapitel 4 Sandsynlighed og statistiske modeller

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

CIVILINGENIØREKSAMEN Side 1 af 16 sider. Skriftlig prøve, den: 16. december 2010 Kursus nr : (navn) (underskrift) (bord nr)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Estimatet for standardfejlen i stikprøven, som anvendes i udregningen af konfidensintervallet ( ) ( )

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Løsninger til kapitel 6

Sandsynlighedsregning

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Tema. Dagens tema: Indfør centrale statistiske begreber.

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Opgaver til kapitel 3

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Valgkampens og valgets matematik

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Matematik A. Højere handelseksamen. Vejledende opgave 2

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Eksamen i Statistik for biokemikere. Blok

(studienummer) (underskrift) (bord nr)

Løsninger til kapitel 1

Statistiske modeller

Projekt 8.3 Hvordan undersøges om et talmateriale normalfordelt?

Modelkontrol i Faktor Modeller

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Note om Monte Carlo metoden

Note til styrkefunktionen

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

S4-S5 statistik Facitliste til opgaver

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Rapport 23. november 2018

Test nr. 6 af centrale elementer 02402

for gymnasiet og hf 2017 Karsten Juul

Test nr. 5 af centrale elementer 02402

Stikprøver og acceptgrænser

Bilag 2 - Følsomhedsanalyse af netvolumenmålet Bilaget indeholder en teknisk gennemgang af følsomhedsanalysen af netvolumenmålet.

Kvantitative Metoder 1 - Forår 2007

(studienummer) (underskrift) (bord nr)

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Transkript:

! ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel Opgave 1 Når populationens varians er kendt En virksomhed har udviklet en proces til at producere mursten, hvor det er kendt at vægten på disse mursten er normalfordelt med en standardafvigelse på 0,12 kg. En tilfældig stikprøve på 16 mursten udvælges fra dagens produktion. Den gennemsnitlige vægt på disse 16 mursten er 4,07 kg. a) 99 % konfidensinterval for den gennemsnitlige vægt på alle mursten produceret den givne dag, µx: α = 0,01 dvs. der er 1% sandsynlighed for at µx ligger udenfor konfidensintervallet n = 16 antal mursten fra dagens produktion der indgår i stikprøven = 4,07 stikprøvens middelværdi (gennemsnitlig vægt for de 16 mursten) = 0,12 populationens kendte standardafvigelse (gennemsnitlig afvigelse fra gennemsnittet for de 16 mursten) 99% interval for gennemsnit N. grænse: 3,992725121 Ø. grænse: 4,147274879 ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side #1

Formelt set kan vi skrive: 3,99272 µx 4,14728. Den gennemsnitlige vægt målt i kg på alle mursten produceret den givne dag ligger altså med 99 % sandsynlighed mellem 3,99 kg og 4,15 kg. b) Et 95% konfidensinterval for populationens gennemsnit, µx, ville være smallere end et 99% konfidensinterval. Ved 95% accepteres et lavere sikkerhedsniveau og derved en større α (arealet udenfor konfidensintervallet udgør en større del af hele arealet under tæthedsfunktionen). Jo mindre konfidensniveau jo smallere interval. c) En stikprøve på 20 mursten vil medføre et smallere konfidensinterval end en stikprøve på 16 (et 99% K.I. estimeret fra en stor stikprøve vil føre til et mere sikkert estimat (mindre standardfejl) og derfor vil intervalestimatet ligger nærmere gennemsnittet). Jo større stikprøve jo mindre standardfejl - jo smallere interval. d) En mindre populationsvarians vil føre til et smallere konfidensinterval, da vægten af de enkelte mursten varierer mindre omkring gennemsnittet (et 99% K.I. vil være smallere jo mindre populationens varians / standardafvigelse er da standardfejlen så bliver mindre). Jo mindre standardafvigelse jo mindre standardfejl - jo smallere interval. Opgave 2 Når populationens varians er kendt Kagefabrikken Jensen Supreme Royal Cookies International har udviklet en proces til at producere lækre lagkager med masser af flødeskum, chokoladecreme med hvid og lys mælkechokolade, kakaotrøffel, valnødder, brændte mandler, råcreme og kokosdrys. Dog er det svært at gøre produktionen helt stringent mht. vægten. Det er vigtigt, at når varen skal ud i butikkerne, så skal vægten være nogenlunde den samme for at prissættelsen kan sættes rigtig. Derudover har det også indflydelse på udgifterne til transporten til butikkerne, hvis produktet svinger for meget i vægt. Vægten på disse lagkager er normalfordelt med en standardafvigelse på 21,8 gram. En tilfældig stikprøve på 200 lagkager udvælges. Den gennemsnitlige vægt på disse 200 lagkager er 243 gram. Vi anvender et konfidensniveau på 95%. a) 95 % konfidensinterval for den gennemsnitlige vægt på alle lagkager produceret, µx: α = 0,05 dvs. der er 5% sandsynlighed for at µx ligger udenfor konfidensintervallet ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side #2

n = 200 antal lagkager der indgår i stikprøven = 243 stikprøvens middelværdi (gennemsnitlig vægt for de 200 lagkager) = 21,8 populationens standardafvigelse (gennemsnitlig afvigelse fra gennemsnittet for de 200 lagkager) 95% interval for gennemsnit N. grænse: 239,9787297 Ø. grænse: 246,0212703 Formelt set kan vi skrive: 239,9788 µx 246,0213. Den gennemsnitlige vægt målt i gram på alle producerede lagkager ligger altså med 95 % sandsynlighed mellem 239,9788 gr. og 246,0213 gr. b) Svaret må tage udgangspunkt i, hvilke aftaler kagefabrikken har med det transportfirma der leverer varer til butikkerne. Hvis aftalen her går på at lagkagerne vejer 240 gram, vil vi med 95% sandsynlighed kunne konkludere, at lagkagerne generelt set vil overholde aftalen. Vi vil derfor ikke anbefalde fabrikken at foretage sig yderligere. Hvad angår prissætningen, bør man tage højde for, at den sande middelværdi med 95% sandsynlighed kan være på 246 gram, og det bør derfor indgå i prissætningen, at meromkostningerne til en lagkage på 246 gram i modsætning til en lagkage på 239,97 gram bør inddækkes. c) 90 % konfidensinterval for den gennemsnitlige vægt på alle lagkager produceret, µx: α = 0,1 dvs. der er 10% sandsynlighed for at µx ligger udenfor konfidensintervallet n = 200 antal lagkager der indgår i stikprøven = 243 stikprøvens middelværdi (gennemsnitlig vægt for de 200 lagkager) = 21,8 populationens standardafvigelse (gennemsnitlig afvigelse fra gennemsnittet for de 200 lagkager) 90% interval for gennemsnit N. grænse: 240,46447 ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side #3

Ø. grænse: 245,53553 Formelt set kan vi skrive: 240,4645 µx 245,5355. Den gennemsnitlige vægt målt i gram på alle producerede lagkager ligger altså med 90 % sandsynlighed mellem 240,46 gr. og 245,54 gr. d) Intervallet er blevet mindre da sandsynligheden for, at den sande middelværdi ligger udenfor intervallet er blevet større. Opgave 3 Konfidensinterval for en andel En stor detailkæde står foran en relancering af sin egen hårpleje-produktserie. Man har tidligere haft den antagelse, at hårplejeserien hovedsageligt henvendte sig til kvinder. Der foreligger dog ingen nyere analyser af denne antagelse, og detailkæden ønsker derfor ved hjælp af en stikprøve på 1041 tilfældigt udvalgte kunder at undersøge, hvor hvidt denne antagelse stadig er rigtig. Stikprøven viste, at ud af de 1041 tilfældigt udvalgte kunder, var 550 kvinder. a) Bestem et 95% konfidensinterval for andelen af hårpleje-kunderne, der er kvinder. I Statlearn bruger vi 3.1.a: KI for andel. 95% konfidensinterval for andel N. grænse: 0,498014 Ø. grænse: 0,558663 Formelt set kan vi skrive: 0,498014 px 0,558663. Den sande andel af kvinder, som køber hudplejeprodukterne, vil med 95 % sandsynlighed ligge mellem 49,8 % og 55,9%. b) Kan man på baggrund af dette resultat konkludere, at hårpleje-produktserien hovedsageligt henvender sig til kvinder? I sår fald, hvorfor/hvorfor ikke? SVAR: Vi kan ikke konkludere, at der vil være en overvægt af kvinder, da intervallets nedre grænse ligger under 50 %. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side #4

c) Hvis vi forestiller os, at stikprøven på de 1041 kunder reelt set var hele populationen - dvs. det præcise antal og den samlede mængde kunder af hårplejeserien. Kan vi i så fald konkludere, at hårplejeserien fortrinsvis henvender sig til kvinder? I sår fald, hvorfor/hvorfor ikke? SVAR: JA! Vi foretager i så fald en deskriptiv analyse (beskrivende statistik), og behøver derfor ikke se på konfidensintervallets grænseværdier, men kan alene holde os til andelstallet. Da 1041 / 2 = 520, skal andelen af kvinder således være over 520, for at være mere end 50%. Antallet af kvindelige kunder ligger på 550, og er således mere end 50%. Vi kan i dette tilfælde konkludere, at hårpleje-produktserien hovedsageligt henvender sig til kvinder. d) Vi skal nu se på konfidensniveauets betydning for konfidensintervallets bredde og dermed for grænseværdiernes placering. Vi anvender igen stikprøven ovenfor på de 1041 tilfældigt valgte hårpleje-produktkunder, hvoraf 550 var kvinder. Færdiggør - ved hjælp af en række konfidensintervaller, skemaet nedenfor: Konfidensniveau Nedre grænseværdi Øvre grænseværdi 99,9 % 0,47742716 0,57924911 99 % 0,48848495 0,56819133 95 % 0,49801361 0,55866267 90 % 0,50288899 0,55378729 70 % 0,51230246 0,54437382 50 % 0,51790244 0,53877383 10 % 0,52639391 0,53028237 e) Hvad sker der med intervallernes størrelse, når konfidensniveauet bliver mindre og hvad skyldes det? SVAR: Når konfidensintervallet bliver mindre, bliver intervallet samtidig mindre. Med andre ord, så stiger præcisionen når konfidensniveauet falder (da vores intervalområde bliver mindre og mere præcist), men samtidig stiger usikkerheden, da sandsynligheden for at vi tager fejl (og dermed at den sande værdi ikke ligger indenfor de to grænseværdier), samtidig stiger. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side #5