ØVELSER Statistik, Logistikøkonom Lektion 7: Hypotesetest 2 Eksempel 1 TEST AF FORSKEL PÅ TO MIDDELVÆRDIER Apple har udviklet et nyt batteri (type B), som skulle have længere brændtid end den hidtidige type (type A). En sammenlignende undersøgelse mellem den nye og den hidtidige type batterier blev foretaget ved i samme apparat (en ipad) først at anvende et tilfældigt valgt batteri af typen A og dernæst et tilfældigt valgt batteri af type B. Brændtiden blev målt mens apparatet var i dvale-tilstand. Hver gang måltes de enkeltes batteriers brændtid i minutter ved vedvarende drift. Type A Brændtid i min. Type B Brændtid i min. ipad nr. 1 514 611 ipad nr. 2 598 539 ipad nr. 3 570 598 ipad nr. 4 542 498 ipad nr. 5 521 596 ipad nr. 6 574 519 ipad nr. 7 546 601 ipad nr. 8 539 538 ipad nr. 9 558 591 ipad nr. 10 581 499 Afgør ved en test, om type B kan siges at have længere brændtid end type A. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!1
1. Vi opstiller først vores H0 og H1-hypoteser: H0: µtype_a µtype_b H1: µtype_a < µtype_b En enkeltsidet hypotese (højresidet), da vi tester for, om batteritype B har en længere brændtid end type A. H1-hypotesen går altså på, at type B har en længere brændtid end A. 2. Vi udregner først henholdsvis middelværdi og standardafvigelse for de stikprøver. Batteritype A Middelværdi: 554,3 Standardafvigelse: 26,78743487 Batteritype B Middelværdi: 559 Standardafvigelse: 44,89988864 Vi gennemfører testet (4.2.e: Upooled test af differensen for 2 gennemsnit) og finder en p-værdi på 0,39 (39%). Jeg indskriver data på denne måde:! Da p-værdi (0,3901819) > testniveau (0,05) accepteres H0. Vi kan altså IKKE forkaste H0, da p-værdien er over 0,05 4. Det kan ikke konkluderes, at batteritype B har en signifikant længere brændtid end type A. Dette skyldes bl.a., at type B er langt mere ustabil i brændtid (som vi ser ved den store standardafvigelse). Eksempel 2 TEST AF FORSKEL MELLEM TO ANDELE ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!2
En større bank ønsker at sammenligne tilfredsheden med bankens service blandt offentlige og private ansatte. Banken har udtaget en stikprøve fra hver af de to grupper af ansatte. Stikprøven der blev udtaget blandt offentligt ansatte var på 200 personer og stikprøven der blev udtaget blandt private ansatte var på 150 personer. Stikprøverne viste, at der blandt offentligt ansatte var 120 personer, der tilkendegav at de var tilfredse, mens det tilsvarende tal for privat ansatte var 81. Stikprøverne viste altså, at der blandt de offentlige ansatte var en tilfredshedsgrad på 60%, mens det tilsvarende tal blandt private ansatte var 54%. Test på 5% niveauet om der er statistisk belæg for at påstå, at tilfredshedsgraden blandt offentligt ansatte er større end tilfredshedsgraden blandt privat ansatte? 1. Vi opstiller først vores H0 og H1-hypoteser: H0: pprivat poffentligt H1: pprivat < poffentligt En enkeltsidet hypotese (venstresidet), da vi tester for, om privat ansatte generelt udviser mindre tilfredshed end offentligt ansatte. 2. Vi gennemfører testet (4.2.a: Test af differensen for 2 andele) og finder en p-værdi på 0,1306 (13,1%). Jeg indskriver data på denne måde (læg mærke til, at jeg skriver private ind som stikprøve a og offentligt ansatte som stikprøve b): Da p-værdi (0,1306227) > testniveau (0,05) accepteres H0. Vi kan altså ikke forkaste H0, da p-værdien er over 0,05 4. Vi har derfor ikke statistisk belæg for at påstå, at tilfredshedsgraden blandt offentligt ansatte er større end tilfredshedsgraden blandt privat ansatte. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!3
Opgave 1 TEST AF FORSKEL MELLEM TO ANDELE Firmaet EARLINK som producerer high-end højtalere til den kritiske forbruger, ønsker at undersøge, om der er bestemte aldersgrupper, som foretrækker henholdsvis virksomhedens nye mobile højtalerserie eller den traditionelle stationære serie. Man har derfor undersøgt alderen og produktkøb blandt de sidste 100 kunder. Resultat blev, at der blandt 43 kunder under 35 år var 26, som foretrak den nye mobile højtalerserie, mens der blandt 57 kunder over 35 år var 27, som foretrak den nye mobile højtalerserie. Test på 5% niveauet, om andelen af kunder under 35 år, som foretrækker den nye mobile højtalerserie, er forskellig fra den tilsvarende andel af kunder over 35 år. 1) Vi opstiller først vores H0 og H1-hypoteser: H0: punder 35 år = punder 35 år H1: punder 35 år punder 35 år Vi har at gøre med en dobbeltsidet hypotese (tosidet), da vi tester for, om kunderne under 35 år, som foretrækker den nye mobile højtalerserie, er forskellig fra den tilsvarende andel af kunder over 35 år. 2. Vi gennemfører testet (4.2.a: Test af differensen for 2 andele) og finder en p-værdi på 0,1939056 (19,39%). Jeg indskriver data på denne måde: Da p-værdi (0,1939056) > testniveau (0,05) accepteres H0. Vi kan altså ikke forkaste H0, da p-værdien er over 0,05 ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!4
4. Det kan med et signifikansniveau på 5% konkluderes, at vi ikke kan se nogen signifikant forskel på de to aldersgruppers præferencer i forhold til den nye type højtalerserie. Vi kan således ikke konkludere, at højtalerserien fortrinsvis henvender sig til de yngre kunder (under 35 år). Opgave 2 TEST AF ANDEL EARLINK ønsker også at undersøge, om mindst 50% af kunderne foretrækker deres nye mobile højtalerserie fremfor den traditionelle stationære serie. Test på 5% niveauet, om mere end 50% af alle kunder foretrækker den nye mobile højtalerserie. 1) Vi opstiller først vores H0 og H1-hypoteser: H0: pforetrækker den nye højtalerserie 50 % H1: pforetrækker den nye højtalerserie > 50 % Vi har at gøre med en enkeltsidet hypotese (højresidet), da vi tester for om mindst 50% af kunderne foretrækker den nye mobile højtalerserie. Husk at vi nu faktisk slår de to grupper (hhv. under 35 år og over 35 år sammen, så vi får én stikprøve på 100 respondenter. Vi ser derfor nu, at 53 foretrækker den nye højtalerserie). 2. Vi gennemfører testet (4.1.a: Test af andel) og finder en p-værdi på 0,2742531 (27,43%). Jeg indskriver data på denne måde: Da p-værdi (0,2742531) > testniveau (0,05) accepteres H0. Vi kan altså ikke forkaste H0, da p-værdien er over 0,05 4. Det kan med et signifikansniveau på 5% konkluderes, at andelen af kunderne der foretrækker den nye mobile højtalerserie ikke overstiger 50%. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!5
Opgave 3 TEST AF FORSKEL MELLEM TO GENNEMSNIT (ved ikke-varianshomogenitet) Producenten af kosmetikproduktet Princess Glory gennemførte i foråret 2015 en kampagne med det formål at forøge salget med mindst 90 Princess Glory produkter om ugen pr. butik i gennemsnit. For at undersøge resultatet af denne kampagne spurgte man 20 vilkårligt udvalgte butikker om deres salg af Princess Glory produkter i ugen, før kampagnen begyndte og i ugen efter den sluttede. Se tabellen nedenfor: Butiknr.: Før kampagnen Efter kampagnen 1 243 352 2 137 225 3 308 412 4 96 192 5 264 357 6 256 365 7 285 379 8 98 198 9 169 278 10 292 389 11 244 334 12 237 339 13 239 351 14 187 278 15 224 322 16 191 298 17 215 325 18 304 409 19 257 365 20 220 327 ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!6
Har kampagnen nået det ønskede salgsmål? 1. Vi opstiller først vores H0 og H1-hypoteser: H0: µfør kampagnen µefter kampagnen + 90 H1: µfør kampagnen < µefter kampagnen + 90 En enkeltsidet hypotese (højresidet), da vi tester for, om kampagnen har forøget salget med mindst 90 Princess Glory produkter om ugen pr. butik i gennemsnit. 2. Vi udregner først henholdsvis middelværdi og standardafvigelse for de stikprøver. Før kampagnen Middelværdi: 240,8571429 Standardafvigelse: 44,10277707 Efter kampagnen Middelværdi: 323,3157895 Standardafvigelse: 64,86657471 Vi gennemfører testet (4.2.e: Upooled test af differensen for 2 gennemsnit) og finder en p-værdi på 0,0000 (0%). Jeg indskriver data på denne måde (læg mærke til, at jeg skriver 90 under Diff. ):! Da p-værdi (0,0000000) < testniveau (0,05) forkastes H0. Vi kan altså forkaste H0, da p-værdien er langt under 0,05 4. Vi kan derfor med stor sandsynlighed konkludere, at kampagnen har nået målet, og dermed forøget det gennemsnitlige daglige salg med mindst 90 Princess Glory produkter. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!7
Opgave 4 TEST AF FORSKEL PÅ TO STIKPRØVER Kan du huske casen med modebloggen fra sidste undervisningsgang (opgave 6)? Modebloggen vil nu forsøge at forbedre det gennemsnitlige tidsforbrug pr. besøgende, for i en fremtidig forhandling med annoncørerne, at opnå en endnu mere fordelagtig pris pr. konvertering (dvs. pr. besøgende som klikker på en reklame og som videresendes til annoncørernes hjemmesider). Modebloggen gennemgår derfor en omfattende opdatering. Al design ændres, bloggens opsætning reorganiseres og moderepportagerne undergår en radikal forandring i sproglig stil, fokus og opsætning. For at teste om det gennemsnitlige tidsforbrug på siden forøges pr. besøgende efter opdateringen, opstiller folkene bag modebloggen en splittest (en form for eksperiment), hvor halvdelen af alle besøgende sendes ind på den oprindelige side, mens den anden halvdel sendes ind på den total reviderede og opdaterede blog. Der udtrækkes derfor to stikprøver blandt 940 besøgende på den oprindelige blog samt 940 besøgende på den opdaterede blog. Det viser sig, at det gennemsnitlige tidsforbrug fordeler sig med henholdsvis 824 sekunder på den oprindelige side (med en standardafvigelse på 281 sekunder) mod 911 sekunder på den opdaterede side (med en standardafvigelse på 331 sekunder). Test på et 5 % signifikansniveau om de besøgendes gennemsnitlige tidsforbrug er signifikant forbedret på den opdaterede modeblog i forhold til den oprindelige blog. Husk naturligvis (som altid!) at opstille H0 og H1-hypoteserne og kommentér på dine resultater. 1) Vi opstiller først vores H0 og H1-hypoteser: H0: µfør opdateringen µefter opdateringen + 90 H1: µfør opdateringen < µefter opdateringen Vi har igen at gøre med en enkeltsidet hypotese (venstresidet), da vi tester for, om opdateringen har forøget det gennemsnitlige tidsforbrug på bloggen. 2. Vi gennemfører testet (4.2.e: Upooled test af differensen for 2 gennemsnit) og finder en p-værdi på 0,0000 (0%). Jeg indskriver data på denne måde: ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!8
Da p-værdi (0,0000000) < testniveau (0,05) forkastes H0. Vi kan altså forkaste H0, da p-værdien er langt under 0,05 4. Da p-værdien er langt under 0,05, forkaster vi H0 og konkluderer vi, at den opdaterede modeblog signifikant har forbedret de besøgendes gennemsnitlige tidsforbrug på bloggen. Vi vil derfor klart anbefale folkene bag bloggen at overgå fuldt til at benytte den opdaterede blog. ØVELSER / Statistik, Logistikøkonom / Efterår 2015 / Jakob Pindstrup Side!9