ØVELSER Statistik, Logistikøkonom Lektion 7: Hypotesetest 2

Relaterede dokumenter
ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Vejledende besvarelser til opgaver i kapitel 14

ØVELSER // SVAR Statistik, Logistikøkonom Konfidensintervaller for én middelværdi og én andel

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Løsninger til kapitel 9

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

c) For, er, hvorefter. Forklar.

J E T T E V E S T E R G A A R D

Kapitel 7 Forskelle mellem centraltendenser

Studieplan Biostatistik Semester 2

S4-S5 statistik Facitliste til opgaver

Forelæsning 9: Inferens for andele (kapitel 10)

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Eksamen i Statistik for biokemikere. Blok

Vejledende løsninger kapitel 8 opgaver

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Løsning til eksamen d.27 Maj 2010

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

ca. 5 min. STATISTISKE TEGN

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Matematik B. Højere handelseksamen

Matematik B. Højere handelseksamen. Mandag den 15. december 2014 kl hhx143-mat/b

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Produktsøgning. Eniro Krak. Tabelrapport. Oktober 2014

Note til styrkefunktionen

02402 Løsning til testquiz02402f (Test VI)

for gymnasiet og hf 2017 Karsten Juul

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Hb SS Hb Sβ Hb SC = , (s = )

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Peter Harremoës Mat A eksamen med hjælpemidler 21. april 2014

En intro til radiologisk statistik. Erik Morre Pedersen

Module 4: Ensidig variansanalyse

Hjemmearbejde. Udarbejdet december 2011 BD272

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

HELSINGØR KOMMUNE Borgerundersøgelse af kommunens image 2017

Matematik B. Højere handelseksamen. Vejledende opgave 1

Opgave 1.1 Gennem en måned i 2007 var de daglige benzinpriser (kr/liter) i Aalborg givet ved tallene i tabel 1.1.

Økogården. Virksomheds- og situationsbeskrivelse. Problemformuleringer. Økogården

Matematik B. Højere handelseksamen. Mandag den 17. august 2015 kl hhx152-mat/b

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Velkommen til Flemmings store Maplekursus 1. lektion. Skift mellem tekst- og matematikmode

Løsninger til kapitel 5

1 Metodeappendiks. Spørgeskemaet omhandler ledernes erfaringer med forældresamarbejde og indeholder både faktuelle spørgsmål og holdningsspørgsmål.

Stikprøver og acceptgrænser

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

det offentlige Hilsner fra sådan vil danskerne tiltales BJERG KOMMUNIKATION FLÆSKETORVET 68, KØBENHAVN V T: KONTAKT@BJERGK.

Matematik B. Højere handelseksamen. Tirsdag den 15. december 2015 kl hhx153-mat/b

Empirisk Miniprojekt 2

Matematik B. Højere handelseksamen

Undersøgelser af Borgerservice

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Peter Harremoës Matematik A, delprøve med hjælpemidler. 19 maj x 2. Først findes stationære punkter. f (x) = x 1 /2. 1 x = 0.

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

En intro til radiologisk statistik

Matematik B. Højere handelseksamen. Mandag den 18. august 2014 kl hhx142-mat/b

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Konfidensinterval for µ (σ kendt)

Hvert femte FOA-medlem forventer ikke at kunne arbejde, til de når folkepensionalderen

Transkript:

ØVELSER Statistik, Logistikøkonom Lektion 7: Hypotesetest 2 Eksempel 1 TEST AF FORSKEL PÅ TO MIDDELVÆRDIER Apple har udviklet et nyt batteri (type B), som skulle have længere brændtid end den hidtidige type (type A). En sammenlignende undersøgelse mellem den nye og den hidtidige type batterier blev foretaget ved i samme apparat (en ipad) først at anvende et tilfældigt valgt batteri af typen A og dernæst et tilfældigt valgt batteri af type B. Brændtiden blev målt mens apparatet var i dvale-tilstand. Hver gang måltes de enkeltes batteriers brændtid i minutter ved vedvarende drift. Type A Brændtid i min. Type B Brændtid i min. ipad nr. 1 514 611 ipad nr. 2 598 539 ipad nr. 3 570 598 ipad nr. 4 542 498 ipad nr. 5 521 596 ipad nr. 6 574 519 ipad nr. 7 546 601 ipad nr. 8 539 538 ipad nr. 9 558 591 ipad nr. 10 581 499 Afgør ved en test, om type B kan siges at have længere brændtid end type A. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!1

1. Vi opstiller først vores H0 og H1-hypoteser: H0: µtype_a µtype_b H1: µtype_a < µtype_b En enkeltsidet hypotese (højresidet), da vi tester for, om batteritype B har en længere brændtid end type A. H1-hypotesen går altså på, at type B har en længere brændtid end A. 2. Vi udregner først henholdsvis middelværdi og standardafvigelse for de stikprøver. Batteritype A Middelværdi: 554,3 Standardafvigelse: 26,78743487 Batteritype B Middelværdi: 559 Standardafvigelse: 44,89988864 Vi gennemfører testet (4.2.e: Upooled test af differensen for 2 gennemsnit) og finder en p-værdi på 0,39 (39%). Jeg indskriver data på denne måde:! Da p-værdi (0,3901819) > testniveau (0,05) accepteres H0. Vi kan altså IKKE forkaste H0, da p-værdien er over 0,05 4. Det kan ikke konkluderes, at batteritype B har en signifikant længere brændtid end type A. Dette skyldes bl.a., at type B er langt mere ustabil i brændtid (som vi ser ved den store standardafvigelse). Eksempel 2 TEST AF FORSKEL MELLEM TO ANDELE ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!2

En større bank ønsker at sammenligne tilfredsheden med bankens service blandt offentlige og private ansatte. Banken har udtaget en stikprøve fra hver af de to grupper af ansatte. Stikprøven der blev udtaget blandt offentligt ansatte var på 200 personer og stikprøven der blev udtaget blandt private ansatte var på 150 personer. Stikprøverne viste, at der blandt offentligt ansatte var 120 personer, der tilkendegav at de var tilfredse, mens det tilsvarende tal for privat ansatte var 81. Stikprøverne viste altså, at der blandt de offentlige ansatte var en tilfredshedsgrad på 60%, mens det tilsvarende tal blandt private ansatte var 54%. Test på 5% niveauet om der er statistisk belæg for at påstå, at tilfredshedsgraden blandt offentligt ansatte er større end tilfredshedsgraden blandt privat ansatte? 1. Vi opstiller først vores H0 og H1-hypoteser: H0: pprivat poffentligt H1: pprivat < poffentligt En enkeltsidet hypotese (venstresidet), da vi tester for, om privat ansatte generelt udviser mindre tilfredshed end offentligt ansatte. 2. Vi gennemfører testet (4.2.a: Test af differensen for 2 andele) og finder en p-værdi på 0,1306 (13,1%). Jeg indskriver data på denne måde (læg mærke til, at jeg skriver private ind som stikprøve a og offentligt ansatte som stikprøve b): Da p-værdi (0,1306227) > testniveau (0,05) accepteres H0. Vi kan altså ikke forkaste H0, da p-værdien er over 0,05 4. Vi har derfor ikke statistisk belæg for at påstå, at tilfredshedsgraden blandt offentligt ansatte er større end tilfredshedsgraden blandt privat ansatte. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!3

Opgave 1 TEST AF FORSKEL MELLEM TO ANDELE Firmaet EARLINK som producerer high-end højtalere til den kritiske forbruger, ønsker at undersøge, om der er bestemte aldersgrupper, som foretrækker henholdsvis virksomhedens nye mobile højtalerserie eller den traditionelle stationære serie. Man har derfor undersøgt alderen og produktkøb blandt de sidste 100 kunder. Resultat blev, at der blandt 43 kunder under 35 år var 26, som foretrak den nye mobile højtalerserie, mens der blandt 57 kunder over 35 år var 27, som foretrak den nye mobile højtalerserie. Test på 5% niveauet, om andelen af kunder under 35 år, som foretrækker den nye mobile højtalerserie, er forskellig fra den tilsvarende andel af kunder over 35 år. 1) Vi opstiller først vores H0 og H1-hypoteser: H0: punder 35 år = punder 35 år H1: punder 35 år punder 35 år Vi har at gøre med en dobbeltsidet hypotese (tosidet), da vi tester for, om kunderne under 35 år, som foretrækker den nye mobile højtalerserie, er forskellig fra den tilsvarende andel af kunder over 35 år. 2. Vi gennemfører testet (4.2.a: Test af differensen for 2 andele) og finder en p-værdi på 0,1939056 (19,39%). Jeg indskriver data på denne måde: Da p-værdi (0,1939056) > testniveau (0,05) accepteres H0. Vi kan altså ikke forkaste H0, da p-værdien er over 0,05 ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!4

4. Det kan med et signifikansniveau på 5% konkluderes, at vi ikke kan se nogen signifikant forskel på de to aldersgruppers præferencer i forhold til den nye type højtalerserie. Vi kan således ikke konkludere, at højtalerserien fortrinsvis henvender sig til de yngre kunder (under 35 år). Opgave 2 TEST AF ANDEL EARLINK ønsker også at undersøge, om mindst 50% af kunderne foretrækker deres nye mobile højtalerserie fremfor den traditionelle stationære serie. Test på 5% niveauet, om mere end 50% af alle kunder foretrækker den nye mobile højtalerserie. 1) Vi opstiller først vores H0 og H1-hypoteser: H0: pforetrækker den nye højtalerserie 50 % H1: pforetrækker den nye højtalerserie > 50 % Vi har at gøre med en enkeltsidet hypotese (højresidet), da vi tester for om mindst 50% af kunderne foretrækker den nye mobile højtalerserie. Husk at vi nu faktisk slår de to grupper (hhv. under 35 år og over 35 år sammen, så vi får én stikprøve på 100 respondenter. Vi ser derfor nu, at 53 foretrækker den nye højtalerserie). 2. Vi gennemfører testet (4.1.a: Test af andel) og finder en p-værdi på 0,2742531 (27,43%). Jeg indskriver data på denne måde: Da p-værdi (0,2742531) > testniveau (0,05) accepteres H0. Vi kan altså ikke forkaste H0, da p-værdien er over 0,05 4. Det kan med et signifikansniveau på 5% konkluderes, at andelen af kunderne der foretrækker den nye mobile højtalerserie ikke overstiger 50%. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!5

Opgave 3 TEST AF FORSKEL MELLEM TO GENNEMSNIT (ved ikke-varianshomogenitet) Producenten af kosmetikproduktet Princess Glory gennemførte i foråret 2015 en kampagne med det formål at forøge salget med mindst 90 Princess Glory produkter om ugen pr. butik i gennemsnit. For at undersøge resultatet af denne kampagne spurgte man 20 vilkårligt udvalgte butikker om deres salg af Princess Glory produkter i ugen, før kampagnen begyndte og i ugen efter den sluttede. Se tabellen nedenfor: Butiknr.: Før kampagnen Efter kampagnen 1 243 352 2 137 225 3 308 412 4 96 192 5 264 357 6 256 365 7 285 379 8 98 198 9 169 278 10 292 389 11 244 334 12 237 339 13 239 351 14 187 278 15 224 322 16 191 298 17 215 325 18 304 409 19 257 365 20 220 327 ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!6

Har kampagnen nået det ønskede salgsmål? 1. Vi opstiller først vores H0 og H1-hypoteser: H0: µfør kampagnen µefter kampagnen + 90 H1: µfør kampagnen < µefter kampagnen + 90 En enkeltsidet hypotese (højresidet), da vi tester for, om kampagnen har forøget salget med mindst 90 Princess Glory produkter om ugen pr. butik i gennemsnit. 2. Vi udregner først henholdsvis middelværdi og standardafvigelse for de stikprøver. Før kampagnen Middelværdi: 240,8571429 Standardafvigelse: 44,10277707 Efter kampagnen Middelværdi: 323,3157895 Standardafvigelse: 64,86657471 Vi gennemfører testet (4.2.e: Upooled test af differensen for 2 gennemsnit) og finder en p-værdi på 0,0000 (0%). Jeg indskriver data på denne måde (læg mærke til, at jeg skriver 90 under Diff. ):! Da p-værdi (0,0000000) < testniveau (0,05) forkastes H0. Vi kan altså forkaste H0, da p-værdien er langt under 0,05 4. Vi kan derfor med stor sandsynlighed konkludere, at kampagnen har nået målet, og dermed forøget det gennemsnitlige daglige salg med mindst 90 Princess Glory produkter. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!7

Opgave 4 TEST AF FORSKEL PÅ TO STIKPRØVER Kan du huske casen med modebloggen fra sidste undervisningsgang (opgave 6)? Modebloggen vil nu forsøge at forbedre det gennemsnitlige tidsforbrug pr. besøgende, for i en fremtidig forhandling med annoncørerne, at opnå en endnu mere fordelagtig pris pr. konvertering (dvs. pr. besøgende som klikker på en reklame og som videresendes til annoncørernes hjemmesider). Modebloggen gennemgår derfor en omfattende opdatering. Al design ændres, bloggens opsætning reorganiseres og moderepportagerne undergår en radikal forandring i sproglig stil, fokus og opsætning. For at teste om det gennemsnitlige tidsforbrug på siden forøges pr. besøgende efter opdateringen, opstiller folkene bag modebloggen en splittest (en form for eksperiment), hvor halvdelen af alle besøgende sendes ind på den oprindelige side, mens den anden halvdel sendes ind på den total reviderede og opdaterede blog. Der udtrækkes derfor to stikprøver blandt 940 besøgende på den oprindelige blog samt 940 besøgende på den opdaterede blog. Det viser sig, at det gennemsnitlige tidsforbrug fordeler sig med henholdsvis 824 sekunder på den oprindelige side (med en standardafvigelse på 281 sekunder) mod 911 sekunder på den opdaterede side (med en standardafvigelse på 331 sekunder). Test på et 5 % signifikansniveau om de besøgendes gennemsnitlige tidsforbrug er signifikant forbedret på den opdaterede modeblog i forhold til den oprindelige blog. Husk naturligvis (som altid!) at opstille H0 og H1-hypoteserne og kommentér på dine resultater. 1) Vi opstiller først vores H0 og H1-hypoteser: H0: µfør opdateringen µefter opdateringen + 90 H1: µfør opdateringen < µefter opdateringen Vi har igen at gøre med en enkeltsidet hypotese (venstresidet), da vi tester for, om opdateringen har forøget det gennemsnitlige tidsforbrug på bloggen. 2. Vi gennemfører testet (4.2.e: Upooled test af differensen for 2 gennemsnit) og finder en p-værdi på 0,0000 (0%). Jeg indskriver data på denne måde: ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!8

Da p-værdi (0,0000000) < testniveau (0,05) forkastes H0. Vi kan altså forkaste H0, da p-værdien er langt under 0,05 4. Da p-værdien er langt under 0,05, forkaster vi H0 og konkluderer vi, at den opdaterede modeblog signifikant har forbedret de besøgendes gennemsnitlige tidsforbrug på bloggen. Vi vil derfor klart anbefale folkene bag bloggen at overgå fuldt til at benytte den opdaterede blog. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!9