FORBRUGERNES PRISVIDEN FØR,

Transkript

1 FORBRUGERNES PRISVIDEN FØR, UNDER OG EFTER BUTIKSBESØGET HVILKEN PRISVIDEN ER FORBRUGERNE I BESIDDELSE AF FØR, UNDER OG EFTER KØB AF DAGLIGVARER OG HVAD KAN FORKLARE FORSKELLE I FORBRUGERNES PRISVIDEN? BIRGER BOUTRUP JENSEN INSTITUT FOR MARKETING OG STATISTIK/ MAPP BIND 2

2

3 KAPITEL 9 RESULTATER OG DISKUSSION AF ANALYSER AF FORSKELLE I FORBRUGERNES PRISVIDEN Efter at have analyseret hvilken prisviden forbrugerne er i besiddelse af i kapitel 8, vil det specifikke forskningsspørgsmål (e) fra kapitel 2 være i centrum i dette kapitel. Forskelle i forbrugernes prisviden vil blive analyseret ved hjælp af logistisk regressionsanalyse og ordinal regressions analyse. De logistiske regressionsanalyser tager udgangspunkt i de dikotome afhængige variable (mål for prisviden) price recall, prisgenkendelse, deal spotting og tilbudsopfattelse. I modsætning hertil tager de ordinale regressionsanalyser afsæt i forskellige trin af nøjagtig price recall. Resultaterne af disse analyser danner grundlaget for besvarelsen af de hypoteser, som blev opstillet i afsnit 4.4. Analyserne af forskelle i forbrugernes prisviden gennemgås enkeltvis for de forskellige mål for prisviden, hvorefter hvert hovedafsnit (9.3, 9.4, 9.5 og 9.6) afsluttes med en sammenligning af modellerne for det respektive mål på tværs af de tre måletidspunkter med henblik på at diskutere forskelle og ligheder. Endelig afsluttes kapitlet med en diskussion af forklarende variable i forhold til forbrugernes prisviden på tværs af de forskellige mål og måletidspunkter i afsnit 9.7. Før der tages hul på analyserne til besvarelse af dette forskningsspørgsmål, vil resultaterne af en række indledende faktor- og itemanalyser dog blive gennemgået, ligesom analyseteknikkerne logistisk og ordinal regressionsanalyse vil blive introduceret. 9.1 Faktoranalyser og itemanalyser Faktoranalyser kan spille en vigtig rolle for den senere anvendelse af multivariate dataanalyseteknikker som logistisk og ordinal regression, da de kan komprimere data, forenkle strukturer, synliggøre de bagvedliggende dimensioner i problemstillingen samt forebygge problemer med multikolinearitet i de videre analyser (DeVellis, 1991; Hair et al., 1998; Sharma, 1996). 253

4 Spørgeskemaet til hjemmeudfyldning indeholdt fire overordnede sæt af items (F.1-F.4 butiksloyalitet; G.1-G-8 prisimage; H.1-H.6 mærkeloyalitet; I.1-I.30 forskellige komponenter af prisinvolvering), som blev målt på 7-punkts Likertskala er. I hvert tilfælde eksisterede der a priori en vis forventning om, at items inden for hver enkelt sæt af items havde høj indbyrdes korrelation. Baseret på svarene på disse spørgsmål undersøges således eksplorativt via faktoranalyser, om der var underliggende forhold, der bandt svarene på spørgsmålene sammen. Valget af eksplorativ faktoranalyseteknik faldt på principale komponenters analyse (PKA), som dermed blev anvendt til at beskrive datamaterialets struktur i færrest mulige ukorrelerede dimensioner. PKA er ikke en decideret faktoranalyseteknik, men det er blevet vist, at PKA stort set giver identiske resultater som egentlige faktoranalyseteknikker (DeVillis, 1991; Hair et al., 1998; Sharma, 1996). Der blev ikke gennemført konfirmativ faktoranalyse, dels fordi der var introduceret nye items i de forskellige skalaer, dels fordi det ikke var et mål i sig selv at belyse, om de oprindelige komponenter kunne bekræftes i dette datamateriale. Devellis (1991) argumenterer desuden for, at der godt kan eksistere visse forhåndsforventninger til grupperingen uden det nødvendigvis betyder, at der skal anvendes konfirmativ faktoranalyse. Således vil det styrke forhåndsformodningerne, hvis de også dukker op af sig selv i datamaterialet for eksempel via PKA. En forudsætning for Likertskala ens brug er, at skalaen er endimensional, og at samtlige items måler variablen lige godt. PKA kan derfor også bruges til at undersøge, hvorvidt de valgte items udgør en reliabel og valid Likertskala. Følgende skal i så fald være opfyldt: (1) den første uroterede komponent skal opsamle mindst 40 procent af den totale varians; (2) de efterfølgende komponenter skal opsamle cirka lige megen varians per komponent; og (3) samtlige items skal indgå med nogenlunde samme vægt ved beregning af faktorscoren for den første komponent (Hair et al., 1998; Sharma, 1996). Er punkt 1 og 2 opfyldt, kan skalaen betragtes som værende endimensional. Såfremt punkt 3 er opfyldt kan Likertskalaens anvendelse af simpel summering anses for at være en rimelig tilnærmelse til beregning af faktorscorer (Blunch, 1999; Hair et al., 1998). 254

5 Sharma (1996) definerer måleinstrumentets reliabilitet som dets evne til at give omtrent identiske måleresultater ved gentagne målinger under identiske betingelser. Når der er tale om flere items til måling af en variabel, benyttes itemanalyse til at måle denne reliabilitet Komponentanalyse for butiksloyalitet Det første sæt af items, der undergik en analyse for underliggende dimensioner via PKA var de fire items F.1 til F.4, som på forhånd var udvalgt for at beskrive forskellige aspekter af butiksloyalitet, jævnfør afsnit Tabel 9.1 Resultater af komponentanalysen for butiksloyalitet Mean item score Communality Component loadings Extracted variance Cronbach s alpha F1. Jeg handler oftere i Bilka 4,7 (2,4 c ),70,84 58,5 %,76 end andre steder a F2. Jeg køber ind i mange forskellige supermarkeder b 4,4 (2,1),64,80 F4. Jeg ved præcis, hvor de forskellige varer står i Bilka 5,7 (1,7),46,74 F3. Det er ofte tilfældigt, hvor jeg køber ind b 5,0 (1,8),54,68 * KMO = 0,72 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Spørgsmålet er negativt formuleret i forhold til øvrige items, hvorfor scoren er vendt om c Standardafvigelsen Tabel 9.1 opsummerer de vigtigste resultater fra komponentanalysen. KMO-testen kvantificerer graden af indbyrdes korrelationer mellem items (Hair et al., 1998). En værdi på 0,72 viser, at det kan forsvares at gennemføre en komponentanalyse i dette tilfælde. Såvel scree-plot som Kaiserkriteriet peger i retning af én komponent 1 til at dække indholdet af de fire items. Den første komponent opfanger 58,5 procent af den totale varians, mens de efterfølgende komponenter opfanger cirka lige megen varians. I 1 Der blev gennemført en komponentanalyse for henholdsvis Bilka- og Føtex-respondenter, som i begge tilfælde viste nøjagtig samme mønster. Løsningen må derfor anses som meget robust. 255

6 tillæg viser komponentladningerne, at samtlige items indgår med nogenlunde samme vægt ved beregning af komponentscores. Med andre ord, så er forudsætningerne for, at de fire items kan udgøre endimensional reliabel og valid Likertskala til stede (Blunch, 1999; Hair et al., 1998). PKA gennemføres blandt andet med henblik på datareduktion i forhold til de efterfølgende analyser af forklarende variable. Komponentladningernes nogenlunde ligelige vægtning indikerer, at de fire items kan erstattes af summering til én komponentscore per respondent baseret på gennemsnittet af de fire item-scores. En af fordelene ved at anvende summerede skalaer er, at eventuelle målingsfejl, der relaterer sig til ét item, kan reduceres. Der blev gennemført en itemanalyse for at belyse skalaens reliabilitet. I den forbindelse angiver Cronbachs alfa minimumsværdien for reliabilitetskoefficienten, og som tommelfingerregel skal denne størrelse gerne overstige 0,7 (DeVillis, 1991; Hair et al., 1998; Sharma, 1996). Der kan fjernes items indtil, at Cronbachs alfa ikke længere kan øges dog dikterer face validity kravet, at der ikke fjernes items, som logisk set hører med ind under målingen af den pågældende variabel. Itemanalysen resulterer i dette tilfælde i Cronbachs alfa på 0,76, som ikke kan øges ved at fjerne et item. Der var medtaget yderligere tre variable i spørgeskemaet til at måle graden af adfærdsloyalitet over for den pågældende kæde. Det drejer sig om kædefrekvens, kædekøb og kædevalg, jævnfør afsnit Som forventet er der tale om høj positiv korrelation mellem disse yderligere operationaliseringer af butiksloyalitet og den summerede komponent for butiksloyalitet (henholdsvis r = 0,654; r = 0,767; r = 0,785). Den samtidige kriterievaliditet ( convergent validity ) må derfor betegnes som god, hvilket også gør sig gældende for face validity skalaen måler det, der var meningen (Hair et al., 1998). Summa summarum er der tale om en reliabel og valid Likertskala, som med fordel kan reduceres til én summeret komponentscore for butiksloyalitet Komponentanalyse for prisimage Jævnfør afsnit bestod skalaen til måling af opfattet prisimage af otte mere eller mindre eksplorative items. Tabel 9.2 opsummerer de vigtigste 256

7 resultater fra komponentanalysen for disse items. KMO-testen resulterer i en værdi på 0,92, hvilket viser, at det i særdeleshed er en god idé at gennemføre en komponentanalyse på disse items. Tabel 9.2 Resultater af komponentanalysen for prisimage Mean item score Communality Component loadings Extracted variance Cronbach s alpha G6. Jeg sparer mest ved at handle 3,7 (1,7 b ),81,90 67,5 %,92 dagligvarer i Bilka a G2. Jeg får mest for pengene i Bilka 4,1 (1,6),76,87 G3. Jeg kan købe dagligvarer billigere i Bilka G8. Bilkas normalpriser er lavere end andre steder G7. Tilbudspriserne i Bilka er bedre end andre steder 3,8 (1,7),74,86 3,5 (1,7),72,85 4,0 (1,6),63,80 G1. Priserne i Bilka er rimelige 4,9 (1,4),62,78 G5. Der er mange gode tilbud i Bilka 5,4 (1,3),45,67 * KMO = 0,92 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Standardafvigelsen Den første komponentanalyse pegede på henholdsvis én eller to komponenter alt efter om scree-plot eller Kaiserkriteriet lå til grund for den empiriske vurdering. Indledningsvist blev der derfor arbejdet videre med begge løsningsmodeller for at finde frem til en komponentløsning, hvor både face validity og objektive målekriterier harmonerede. Efter gennemførelsen af en række komponent- og itemanalyser faldt valget på en løsning med kun én komponent. To-komponentløsningen var således tvivlsom ud fra et fortolkningsmæssigt synspunkt, ligesom den i udgangspunktet lå på vippen i forhold til Kaiserkriteriet (eigen value = 1,034) og scree-plot. Denne løsning ville også have budt på en komponent med bare to items, hvilket i lige så høj grad kunne være resultatet af forkert valg af items. En tvungen en-komponentløsning førte derudover til ekskludering af item G4: Bilkas tilbudsaviser er inspirerende. Kommunaliteten for G4 var meget lav (0,32), hvilket er ensbetydende med, at kun 32 procent af 257

8 variablen blev forklaret af den ene komponent. Dette item havde også en meget lavere komponentladning (0,566) i forhold til de øvrige items. En itemanalyse for alle otte items afslørede tillige mulighed for forbedring af Cronbachs alfa med knap en procent, hvilket dog ikke er meget. En vurdering af indholdsvaliditeten tilsiger, at spørgsmålet kan være blevet opfattet anderledes end de øvrige spørgsmål omkring opfattet prisimage, da disse items eksplicit inkluderer priselementet. Inspirerende tilbudsaviser kan ligeledes referere til andet end priserne i tilbudsavisen for eksempel opskrifter, udbud, farver og format. Det kan derfor konkluderes, at face validity understøtter en en-komponentløsning eksklusiv item G4. Den ene komponent forklarer 67,5 procent af variansen (hvilket er højere end tommelfingerreglen på % i første faktor for at være endimen sional), mens de næste komponenter opfanger cirka lige meget varians (9,6 % og 8,1 %). I tillæg er komponentladningerne tilnærmelsesvis lige høje (0,67-0,90), hvorfor det kan forsvares at gennemføre en simpel summering i forbindelse med datareduktion før de videre analyser. De syv resterende items erstattes derfor af én komponentscore per respondent. Denne komponentscore udgøres af summen af respondentens score for de syv items divideret med syv. Komponenten benævnes efterfølgende opfattet prisimage. Itemanalysen for de resterende syv items viser en meget høj Cronbachs alfa på 0,92. Det må derfor konkluderes, at det endelige resultat taler for en reliabel og valid endimensional Likertskala, som kan summeres til én gennemsnitlig komponentscore til anvendelse i de videre analyser Komponentanalyse for mærkeloyalitet Mærkeloyalitet blev målt via seks items, hvoraf fire var gengangere fra en tidligere undersøgelse (Jensen, 2001), mens to items var nye i denne sammenhæng. I den forbindelse viser KMO-værdien på 0,90 i tabel 9.3, at en komponentanalyse også i høj grad er på sin plads i dette tilfælde. Både scree-plot og Kaiserkriteriet (eigen values på henholdsvis 4,2 og 0,6 for de to første mulige komponenter) indikerer med al tydelighed, at én 258

9 komponent 2 igen er tilstrækkeligt til at opsamle informationen fra de seks items. Tabel 9.3 Resultater af komponentanalysen for mærkeloyalitet Mean item score Communality Component loadings Extracted variance Cronbach s alpha H5. Jeg skifter gerne mellem 5,0 (2,3 c ),81,90 68,9 %,91 forskellige kaffemærker a,b H1. Jeg køber det samme kaffemærke hver gang H2. Jeg køber mit foretrukne kaffemærke uanset prisen på andre mærker 5,0 (2,2),78,88 4,9 (2,3),77,87 H3. Generelt sammenligner jeg forskellige mærker, når jeg køber 4,8 (2,3),63,80 kaffe b H6. Jeg tror ikke, andre mærker kaffe kan opfylde mit behov lige så godt som mit favoritmærke H4. Jeg venter med at købe kaffe, hvis mit favoritmærke er udsolgt 4,0 (2,4),61,78 3,6 (2,5),55,74 * KMO = 0,90 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Spørgsmålet er negativt formuleret i forhold til øvrige items, hvorfor scoren er vendt om c Standardafvigelsen Den ene komponent opfanger 68,9 procent af informationen i de seks items. Den opfylder alle tre forudsætninger for en reliabel og valid Likertskala: (1) Første komponent opsamler mere end % af variationen, (2) de næste komponenter cirka lige meget varians (10,2 % og 6,9 %), mens (3) komponentladningerne befinder sig i cirka samme høje leje (0,74-0,90). Der er således tale om en endimensional skala, hvor Likertskalaens anvendelse af summering synes forsvarligt. 2 Med henblik på validering af en-komponentløsningen blev der gennemført separate komponentanalyser for respondenterne fra Føtex og Bilka. Resultaterne heraf var stort set identiske med det samlede resultat, hvilket understreger denne løsnings robusthed. 259

10 Hvad angår reliabiliteten af skalaen, resulterer itemanalysen i en Cronbachs alfaværdi på 0,91, hvilket er meget højere end tommelfingerreglen på 0,7. I tillæg kan Cronbachs alfa ikke øges ved at udelade et item. Der er med andre ord tale om en reliabel Likertskala til måling af mærkeloyalitet. Indholdsvaliditeten skulle være sikret ved hovedsageligt at bygge på tidligere skalaer, ligesom de valgte items er teoretisk funderede. Den samtidige kriterievaliditet blev undersøgt ved hjælp af en korrelationsmatrice indeholdende på den ene side komponenten for mærkeloyalitet og på den anden side spørgsmål B fra spørgeguiden (antal gange det pågældende produktalternativ er blevet købt ud af de sidste 10 gange). Korrelationen på 0,58 indikerer, at skalaen faktisk måler det, den var tiltænkt. Det kan derfor konkluderes, at der er tale om en reliabel og valid endimensional Likertskala til måling af mærkeloyalitet (dog uden opdeling på commitment og inerti). På den baggrund anvendes summering til datareduktion i de følgende analyser. Nærmere bestemt summeres de seks itemscores per respondent, hvorefter denne score divideres med antal items for at opnå én komponentscore Komponentanalyse for prisinvolvering I udgangspunktet var der udvalgt 30 items til at måle forskellige dele af prisinvolvering, jævnfør afsnit Der var tale om 26 gengangere fra en tidligere undersøgelse (Jensen, 2001) og fire nye items genereret fra fokusgruppeinterviewene. Det blev derfor fravalgt at gennemføre konfirmativ faktoranalyse. Resultatet af den indledende komponentanalyse med 30 items gav en KMO-værdi på 0,924, hvorfor det er anbefalelsesværdigt at gennemføre en komponentanalyse. Den første komponent opfangede godt 35 procent af variationen, de efterfølgende komponenter opfangede ikke lige meget variation, ligesom der var stor forskel i komponentladningerne. Alt i alt tyder det på, at prisinvolvering består af flere komponenter. Såvel Kaiserkriteriet som scree-plot indikerer en løsning med fem komponenter, hvilket understøttes af resultatet af en tidligere komponentanalyse (Jensen, 260

11 2001), som på baggrund af 26 ud af de her udvalgte 30 items netop nåede frem til fem fortolkelige dimensioner med rod i teorien. Der var dog ikke umiddelbart tale om en klar og let fortolkelig komponentstruktur, så med henblik på at opnå en bedre og lettere fortolkelig struktur blev der gennemført en række komponentanalyser og itemanalyser. Items med lave og/eller tvetydige komponentladninger blev fjernet ét ad gangen i prioriteret rækkefølge. I samme ombæring blev der skelet til kommunaliteter og ikke mindst face validity. Argumentationen for fjernelse af items I.7, I.8, I.10, I.19, I.27 og I.30 findes i bilag 12. Den endelige Varimax-roterede komponentstruktur er vist i tabel 9.4. Kaiserkriteriet, scree-plot og face validity peger igen på en løsning med fem komponenter, som tilsammen opsamler 63,7 procent af variationen i de resterende 24 items. Den første uroterede komponent opsamler 35,3 procent, de efterfølgende henholdsvis 10,3, 8,6, 5,1 og 4,4 procent af variationen. Det tyder således også på en flerdimensional skala til måling af prisinvolvering. Fortolkningen af de fem komponenter er i tråd med forhåndsforventningerne og resultatet af den tidligere undersøgelse (Jensen, 2001). Komponenterne får derfor følgende overskrifter: o Komponent 1 = opfattede budgetbegrænsninger (opbudget) o Komponent 2 = price mavenism (pricemav) o Komponent 3 = tilbudsinteresse (prominte) o Komponent 4 = lavprisinteresse (lowprice) o Komponent 5 = værdibevidsthed (valuecon) Det er værd at bemærke, at datamaterialet har peget på fem komponenter hele vejen frem mod den endelige komponentløsning. Der blev gennemført separate komponentanalyser for henholdsvis respondenter fra Føtex og Bilka, hvor de selv samme fem komponenter viser sig igen. Fordelingen af items er således nøjagtig den samme, hvilket indikerer, at den endelige komponentløsning er robust. 261

12 Tabel 9.4 Varimax-roterede komponentladninger for prisinvolvering Opbudget Pricemav Prominte Lowprice Valuecon I.24 Jeg har jævnligt problemer med at få pengene til at slå til,90 I.25 Mit budget er altid stramt,88 I.26 Jeg må ofte bruge flere penge, end jeg har til rådighed,86 I.23 Min omgangskreds anser mig for at være en god kilde, når det gælder prisinformation om dagligvarer I.22 Jeg kan godt lide at hjælpe folk ved at fortælle dem, hvad forskellige dagligvarer koster I.20 Min omgangskreds spørger mig om prisen på forskellige dagligvarer I.21 For mange dagligvarer er jeg i stand til at fortælle andre, hvor man skal handle for at gøre det bedste køb I.16 Jeg snakker ofte med min omgangskreds om tilbud, før jeg foretager mine dagligvarekøb I.14 Jeg venter gerne med at købe dagligvarer, til de er på tilbud I.28 Jeg hamstrer gerne, når der er gode tilbud på dagligvarer I.15 I supermarkedet ser jeg efter, hvilke varer der er på tilbud I.13 Generelt søger jeg information om, hvilke varer der er på tilbud, når jeg køber dagligvarer,85,82,82,70,68,71,68,64,62 I.11 Jeg er tilbøjelig til at købe dagligvarer på tilbud,61 I.29 Jeg vil have det skidt, hvis jeg er blevet nødt til at købe dagligvarer til fuld pris I.17 Jeg læser supermarkedernes tilbudsavis for at finde de bedste tilbud I.6 Vendt om - De penge, man kan spare ved at søge efter lavere dagligvarepriser, er normalt ikke de ekstra anstrengelser værd I.4 Vendt om - Jeg er ikke villig til at yde en ekstra indsats for at finde lavere priser I.5 Jeg handler i flere supermarkeder for at drage fordel af lavere dagligvarepriser I.12 Vendt om - Jeg er ikke interesseret i at lede efter et godt tilbud I.18 Jeg sammenligner priser mellem supermarkeder for at gøre det bedste køb I.2 Jeg lægger mindst lige så megen vægt på lave priser som kvalitet I.1 Når jeg køber dagligvarer, sammenligner jeg prisen på forskellige mærker for at være sikker på, at jeg får mest for mine penge I.3 Jeg tjekker altid prisen i supermarkedet for at være sikker på, at jeg får mest for pengene I.9 Jeg har favoritmærker, men for det meste køber jeg de mærker, som er på tilbud,55,54,77,76,72,63,55,71,70,65,57 262

13 Da alle 24 resterende items er med til at determinere graden af respondentens prisinvolvering, var der begrundet risiko for multikolinearitet i efterfølgende analyser, såfremt der blev opereret med gennemsnitlige sumscores per komponent. I stedet udregnede SPSS faktor-scores, som blev gemt til senere anvendelse i de logistiske og ordinale regressionsanalyser. Når der anvendes ortogonal rotation (Varimax 3 i dette tilfælde) vil de fem komponenter blive ukorrelerede ved anvendelse af faktor-scores, hvorved et ellers truende multikolinearitetsproblem kan foregribes. I det følgende præsenteres resultaterne af separate itemanalyser for hver af de fem komponenter. Desuden angives gennemsnitsscore og kommunaliteten for hvert item, mens komponentladningerne findes i tabel Komponent 1: Opfattede budgetbegrænsninger Den første komponent er opfattede budgetbegrænsninger. De vigtigste resultater af komponentanalysen er vist i tabel 9.5. Tabel 9.5 Resultat af komponentanalyse for opfattede budgetbegrænsninger Mean item score Communality b Cronbach s alpha I.24 Jeg har jævnligt problemer med at få 2,3 (1,8 b ),83,87 pengene til at slå til a I.25 Mit budget er altid stramt 2,4 (1,8),82 I.26 Jeg må ofte bruge flere penge, end jeg har til rådighed 1,9 (1,5),75 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Communalities stammer fra den samlede komponentanalyse for prisinvolvering c Standardafvigelsen Jævnfør tabel 9.5 er der tale om forholdsvis lave gennemsnitscores, som for alle items tenderer mod uenighed i udsagnene om opfattede budgetbegrænsninger. Flertallet har tilsyneladende en opfattelse af, at deres 3 Varimax-faktorrotation søger at give variablene loadings så tæt på ± 1 eller 0 for faktoren med henblik på at gøre fortolkningen enklere. 263

14 økonomi er tilstrækkelig god til, at de ikke behøver at bekymre sig på den konto. De tre items svarer nøjagtig til de tre items, der også udgjorde opfattede budgetbegrænsninger i to tidligere undersøgelser (Jensen, 2001; Urbany et al., 1996). Itemanalysen viser en høj Cronbachs alfa på 0,87. Der er med andre ord tale om en reliabel Likertskala til måling af opfattede budgetbegrænsninger som en del af prisinvolvering Komponent 2: Price mavenism Den næste komponent er price mavenism. Jævnfør tabel 9.6 er der tale om forholdsvis lave gennemsnitscores, som for alle items tenderer mod uenighed i udsagnene om price mavenism. Dette er dog ikke så overraskende, da det på forhånd var ventet, at det kun ville være en mindre gruppe, der ville score højt på denne dimension. Flertallet tænker ikke på at søge prisinformationer for dagligvarer med henblik på at videregive disse informationer i sociale sammenhænge men der eksisterer dog et segment der gør. Tabel 9.6 Resultater af komponentanalysen for price mavenism Mean item score Communality b Cronbach s alpha I.23 Min omgangskreds anser mig for at være en god kilde, når det gælder prisinformation 2,1 (1,7 c ),77,87 om dagligvarer a I.22 Jeg kan godt lide at hjælpe folk ved at fortælle dem, hvad forskellige dagligvarer koster I.20 Min omgangskreds spørger mig om prisen på forskellige dagligvarer I.21 For mange dagligvarer er jeg i stand til at fortælle andre, hvor man skal handle for at gøre det bedste køb I.16 Jeg snakker ofte med min omgangskreds om tilbud, før jeg foretager mine dagligvarekøb 2,4 (1,8),75 1,8 (1,4),70 2,5 (1,8),64 1,8 (1,4),56 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Communalities stammer fra den samlede komponentanalyse for prisinvolvering c Standardafvigelsen 264

15 De fem items svarer nøjagtig til de fem items, der også udgjorde price mavenism i en tidligere undersøgelse (Jensen, 2001). Itemanalysen viser en høj Cronbachs alfa. Der er med andre ord tale om en reliabel Likertskala til måling af price mavenism som en del af prisinvolvering Komponent 3: Tilbudsinteresse Jævnfør tabel 9.7 består tilbudsinteresse af syv items, hvoraf I.28 og I.29 er helt nye, idet de blev genereret via analyse af fokusgruppeinterviewene. Generelt er der tale om items med en høj grad af face validity, da de alle adresserer tilbud eksplicit i spørgsmålsformuleringen. Tabel 9.7 Resultater af komponentanalysen for tilbudsinteresse Mean item score Communality b Cronbach s alpha I.14 Jeg venter gerne med at købe dagligvarer, til de er på tilbud a 3,2 (2,0 c ),64,85 I.28 Jeg hamstrer gerne, når der er gode tilbud på dagligvarer I.15 I supermarkedet ser jeg efter, hvilke varer der er på tilbud I.13 Generelt søger jeg information om, hvilke varer der er på tilbud, når jeg køber dagligvarer I.11 Jeg er tilbøjelig til at købe dagligvarer på tilbud I.17 Jeg læser supermarkedernes tilbudsavis for at finde de bedste tilbud 3,7 (2,1),52 4,8 (1,9),59 4,1 (2,1),60 4,6 (1,9),62 4,3 (2,2),58 I.29 Jeg vil have det skidt, hvis jeg er blevet nødt til at købe dagligvarer til fuld pris 2,8 (1,9),45 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Communalities stammer fra den samlede komponentanalyse for prisinvolvering c Standardafvigelsen Spørgsmål E1 og E2 fra spørgeskemaet (bilag 10) beskæftiger sig begge med den adfærdsmæssige (for dagligvarer og produktgruppen) side af tilbudsinteresse. Indbyrdes korrelation mellem E1, E2 og komponenten tilbudsinteresse på henholdsvis 0,24 og 0,31 er med til at understrege den samtidige kriterievaliditet. Itemanalysen viser igen en høj Cronbachs alfa 265

16 (0,85). Der er med andre ord tale om en reliabel Likertskala til måling af tilbudsinteresse Komponent 4: Lavprisinteresse Resultaterne for lavprisinteresse er angivet i tabel 9.8. På nær I.12 (se bilag 12) er der generelt tale om items med en høj grad af face validity i forhold til lavprisinteresse. Tabel 9.8 Resultater af komponentanalysen for lavprisinteresse a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Spørgsmålet er negativt formuleret i forhold til øvrige items, hvorfor scoren er vendt om c Communalities stammer fra den samlede komponentanalyse for prisinvolvering d Standardafvigelsen Mean item score Communality c Cronbach s alpha I.6 De penge, man kan spare ved at søge efter lavere dagligvarepriser, er normalt ikke de ekstra 3,5 (2,0 d ),67,84 anstrengelser værd a,b I.4 Jeg er ikke villig til at yde en ekstra indsats for b at finde lavere priser 3,8 (2,0),63 I.5 Jeg handler i flere supermarkeder for at drage fordel af lavere dagligvarepriser 3,7 (2,1),61 I.12 Jeg er ikke interesseret i at lede efter et godt b tilbud 4,9 (1,9),51 I.18 Jeg sammenligner priser mellem supermarkeder for at gøre det bedste køb 3,4 (2,2),68 Cronbachs alfa overstiger igen minimumsværdien på 0,7, da den lander på 0,84. Dette kan ikke øges ved at fjerne et item, hvorfor de fem items umiddelbart udgør en reliabel Likertskala til måling af lavprisinteresse Komponent 5: Værdibevidsthed Tabel 9.9 viser blandt andet resultatet af itemanalysen for den sidste komponent i prisinvolveringsskalaen. I.1-3 har tidligere ligget til grund for operationalisering af værdibevidsthed (Lichtenstein et al. 1993; Jensen 2001), mens I.9 er ny i denne sammenhæng. 266

17 Tabel 9.9: Resultater af komponentanalysen for værdibevidsthed a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Communalities stammer fra den samlede komponentanalyse for prisinvolvering c Standardafvigelsen Mean item score Communality b Cronbach s alpha I.2 Jeg lægger mindst lige så meget vægt på lave priser som kvalitet a 3,8 (2,1c ),58,74 I.1 Når jeg køber dagligvarer, sammenligner jeg prisen på forskellige mærker for at være sikker på, at jeg får mest for mine penge I.3 Jeg tjekker altid prisen i supermarkedet for at være sikker på, at jeg får mest for pengene I.9 Jeg har favoritmærker, men for det meste køber jeg de mærker, som er på tilbud 4,8 (1,9),60 4,4 (2,0),63 3,6 (1,9),51 Det lave antal items skal holdes in mente ved analyse af resultaterne fra itemanalysen (Hair et al., 1998; Sharma, 1996). Der er dog alligevel en tilfredsstillende Cronbachs alfa-værdi på 0,74, ligesom denne ikke kan øges ved at fjerne et item. De fire items kan derfor umiddelbart siges at udgøre en reliabel skala for værdibevidsthed. 9.2 Analyseteknikker til at forklare forskelle i prisviden Kapitel 8 opererede med flere forskellige mål for forbrugernes prisviden heriblandt 1) price recall, 2) prisgenkendelse, 3) deal spotting, 4) tilbudsopfattelse og 5) procentvis afvigelse fra den faktiske pris. For de fire førstnævnte mål er der tale om dikotome afhængige variable, da udfaldsrummet begrænser sig til to korrekt eller ikke korrekt. Dette har betydning for, hvilken analyseteknik der kan vælges til at analysere, hvad der forklarer forskelle i disse mål for forbrugernes prisviden. I afsnit vil der blive argumenteret for valget af logistisk regressionsanalyse til behandling af denne problemstilling, ligesom denne teknik vil blive beskrevet overordnet. I forlængelse heraf diskuteres den konkrete fremgangsmåde i forbindelse med modelsøgningen, idet antallet af mulige forklarende variable nødvendiggør en prioritering i så henseende. 267

18 Procentvis afvigelse fra den nøjagtige pris adskiller sig fra de andre fire afhængige variable ved, at den ikke er nominalskaleret. Denne afhængige variabel baserer sig på price recall-testen, hvorved den siger noget om, hvor nøjagtig forbrugernes prisviden er. I den forbindelse argumenteres der i afsnit for valget af ordinal regressionsanalyse til at analysere forskelle i nøjagtigheden af forbrugernes prisviden. Afsnittet afsluttes derfor med en overordnet indføring i ordinal regressionsanalyse Logistisk regressionsanalyse For price recall, prisgenkendelse, deal spotting og tilbudsopfattelse er der behov for at analysere, hvad der kan forklare, om respondenten besvarer den enkelte test korrekt eller ej det vil sige et gruppetilhørsforhold. Der er derfor behov for en statistisk analyseteknik, der tager højde for, at den afhængige variabel (her et af de fire mål for prisviden) er nominalskaleret, mens der både vil være tale om nominalskalerede og intervalskalerede forklarende variable. Multipel regressionsanalyse er udelukket, da den afhængige variabel er nominalskaleret med kun to udfald. Valget står derfor umiddelbart mellem diskriminantanalyse og logistisk regressionsanalyse. Diskriminantanalyse hviler i høj grad på forudsætningerne om multivariat normalfordelte forklarende variable og ens kovariansmatricer mellem grupperne. Som det fremgik af tidligere kapitler, så indgår der indtil flere nominalskalerede forklarende variable i analysen, hvorfor anvendelse af diskriminantanalyse til denne problemstilling ville resultere i forudsætningsbrud med deraf følgende højere risiko for upålidelige resultater. Logistisk regressionsanalyse står i modsætning hertil, da denne analyseform ikke er underlagt samme strenge forudsætninger, ligesom logistisk regressionsanalyse har vist sig at være meget robust over for brud på disse forudsætninger (Long, 1997; Menard, 1995; Press & Wilson, 1978; Sharma, 1996). I tillæg er der flere lighedspunkter mellem logistisk regressionsanalyse og multipel regressionsanalyse ikke mindst hvad angår fortolkning og de metoder, der anvendes til at undersøge cases 268

19 enkeltvis 4. Logistisk regressionsanalyse vælges derfor som udgangspunkt for analysen af, hvad der kan forklare forskelle i forbrugernes prisviden. Formålet med logistisk regressionsanalyse er at undersøge den betingede fordeling for en binær afhængig variabel, Y, givet en eller flere uafhængige variable, X 1,..., X n. Den betingede sandsynlighed antages at være givet ved formlen (Hair et al., 1996; Long, 1997; Sharma, 1996): P (Y = 1 X 1,..., X n ) = e α + Σ βi x i.(1 (1) 1 + e α + Σ β i x i Det antages således, at Y er kodet 0 (for ikke korrekt) og 1 (for korrekt), og at de uafhængige variable er på intervalskala-niveau. Nominale eller ordinale uafhængige variable omkodes til binære indikator- eller dummyvariable én for hver kategori af den uafhængige nominale eller ordinale variabel på nær en udvalgt referencekategori. Ved at transformere formel (1) får den generelle logistiske regressionsmodel følgende udseende (k refererer til antallet af uafhængige variable): P(Y i = 1) ln = ln(oddsi ) = α + Σ β k x (2) i k.(1 1 P(Y i = 1) Da P/(1 - P) er forholdet mellem sandsynligheden for, for eksempel, korrekt prisgenkendelse og sandsynligheden for ukorrekt prisgenkendelse, kaldes venstresiden i formel (2) log-odds eller bare logit. Ved at multiplicere med den naturlige logaritme på begge sider i formel (2) kan modellen udtrykkes i odds i stedet for log-odds. Odds i = P(Y i = 1) = e α + Σ β kx i k (3) 1 P(Yi = 1) 4 En ulempe ved logistisk regressionsanalyse er dog, at den kun kan estimere modellen med to grupper i den afhængige variabel. En begrænsning som ikke deles af multipel diskriminantanalyse (Hair et al., 1998; Press & Wilson, 1978; Sharma, 1996). 269

20 I modsætning til regressionsmodellens OLS-estimering estimeres den logistiske regressionsmodels parametre ved hjælp af maximum likelihoodmetoden. Denne metode vælger de parameterkoefficienter, som maksimerer sandsynligheden for, at de observerede værdier er forekommet. Eftersom den logistiske regressionsmodel er ikke-lineær, er der behov for en iterativ algoritme for at estimere parametrene (Hair et al., 1996; Long, 1997; Sharma, 1996). SPSS 11 for Mac OS X indeholder en sådan algoritme, som har dannet grundlag for estimeringen af parametrene i de logistiske regressionsmodeller Modelsøgning i blokke I afsnit 1.2 blev der argumenteret for at inkludere et større udvalg af mulige forklarende variable sammenlignet med tidligere. Formålet er at forklare forskelle mellem de tre målesituationer og mellem de forskellige mål for prisviden. Det høje antal uafhængige variable nødvendiggjorde en prioritering i blokke i forbindelse med modelsøgningen. Variablene blev således delt op i fire blokke, hvorefter en manuel backward (LR) 5 modelsøgning lå til grund for beslutningen om at fjerne eller tilføje variable/interaktioner til modellen. Den manuelle søgning tilgodeså det hierarkiske princip (Field, 2000), når der var basis for at inkludere et eller flere interaktionsled i startmodellen. Derudover blev den manuelle modelsøgning valgt for at undgå, at maskinen tog styringen. De fire blokke udgøres af henholdsvis (1) forbrugervariable, (2) produktkarakteristika, (3) købsspecifikke variable og (4) demografiske variable. Rækkefølgen på de fire blokkes inkludering i modelsøgningen indikerer prioriteringen i forhold til problemstillingen. Alle uafhængige variable, som knyttede sig til en hypotese, blev inkluderet i modelsøgningen for de respektive mål for prisviden. 5 Backward (LR)-søgemetoden starter med alle mulige forklarende variable i modellen. Computeren tester dernæst, om nogen af disse variable kan fjernes fra modellen, uden at det forringer modellens fit signifikant i forhold til de observerede data. Backward LR refererer til det kriterium, som ligger til grund for beslutningen om at fjerne eller tilføje en variabel i dette tilfælde udgøres dette kriterium af Likelihood-ratio testet (LR) (Field, 2000). 270

21 Derudover indeholdt spørgeguiden og spørgeskemaet en række variable af mere eksplorativ karakter. Dette drejede sig for eksempel om demografiske variable, som ikke har udvist en entydig sammenhæng med forbrugernes prisviden i tidligere undersøgelser. Der blev opstillet en korrelationsmatrice for univariate sammenhænge mellem de forskellige mål for prisviden og mulige forklarende variable én matrice for hver af de tre målesituationer. De mere eksplorative variable blev dernæst kun inkluderet i modelsøgningen for et bestemt mål for prisviden i en bestemt målesituation, hvis korrelationsmatricen afslørede en tilnærmelsesvis signifikant univariat sammenhæng. Bruttolisten over mulige forklarende variable præsenteres nedenfor med de variabelnavne, der går igen i modellerne opdelt i forhold til de fire blokke. 1. Den første blok, der blev inkluderet i modelsøgningen, udgøres af en gruppe af variable, som kan betegnes forbrugervariable. Fælles for denne gruppe af variable er, at de ikke kun er bundet op på produktvalget den pågældende dag, men at de derimod er mere stabile karakteristika ved forbrugeren, som kan være afledt af personligheden. Forbrugervariablene nedenfor har desuden et klarere teoretisk fundament, som er afspejlet i hypoteseformuleringen i afsnit 4.4. Dette giver sig også udslag i, at de er mindre eksplorative af natur end variable i de øvrige blokke. Alt i alt medfører disse forhold, at denne blok prioriteres først i modelsøgningen. Følgende mulige forklarende variable indgår i blok 1: a) butiksloyalitet alternativt kædefrekvens; b) opfattet prisimage; c) mærkeloyalitet alternativt mærkeandel; d) tilbudsandel i kategori; e) købsfrekvens (individbaseret); samt følgende fem prisinvolveringskomponenter f) opfattede budgetbegrænsninger; g) price mavenism; h) tilbudsinteresse; i) lavprisinteresse; og j) værdibevidsthed. 2. De tilbageværende signifikante forklarende variable fra blok 1 kontrolleres derefter for effekten af de tre produktkarakteristika (produktdimensioner) i blok 2. Vanhuele og Dréze (2002) undersøgte ligeledes effekten af produktkarakteristika på forbrugernes prisviden før butiksbesøget og fandt, at alle tre havde en signifikant effekt. I nærværende undersøgelse er relativ købsfrekvens og prisintervallets relative størrelse 271

22 gengangere i forhold til Vanhuele og Drézes (2002) undersøgelse, hvilket muliggør en sammenligning i før-målingen. Jævnfør afsnit 7.3.1, er det muligt at opstille en hypotese for hver produktdimension om end det bemærkes, at der ikke er tale om et eksperimentelt design. Endelig er de tre produktdimensioner praktisk relevante, hvilket også taler for at denne blok prioriteres højt i modelsøgningen. Blok 2 udgøres således af følgende tre mulige forklarende variable: a) købsfrekvens; b) kampagneandel; og c) prisintervallets størrelse. 3. Den tredje blok af variable til modelsøgningen kan gå under betegnelsen købsspecifikke variable. I den forbindelse undersøges, om de tilbageværende signifikante variable fra blok 1 og 2 stadig er til stede, når der kontrolleres for købsspecifik adfærd. Der er tale om et sammensurium af mulige forklarende variable, der alle har det til fælles, at de knytter sig til det konkrete butiksbesøg og produktvalg. Variablene i blok 3 er: a) prissammenligning 6 ; b) købt på tilbud 7 ; c) læst tilbudsavis (kædens pågældende uge); d) brugt tilbudsavis til at planlægge produktvalget; samt e) travlt (situationsbestemt opfattelse af travlhed i forbindelse med dagens indkøbstur). 4. Sidste blok består af demografiske variable. Her eksisterer der stort set ingen forhåndsformodninger, da resultaterne heraf i tidligere undersøgelser har været divergerende og i nogle tilfælde direkte modstridende 6 Det skal tilføjes, at det kun var i målingerne under og efter butiksbesøget, at der kunne spørges til, om respondenten havde sammenlignet priserne mellem forskellige mærker før produktvalget. Indledningsvist blev pristjek (spørgsmål 10 fra spørgeguiden) også inkluderet i modelsøgningen, men dette bortfaldt, da pristjek viste sig at være en triviel variabel. Således indgik pristjek i alle modeller under og efter butiksbesøget med positiv effekt. Tillige udvander pristjek effekten af andre forklarende variable, da de til syvende og sidst lige så godt kunne have forklaret forskelle i pristjekningsadfærd. 7 Det giver kun mening at inkludere købt på tilbud i modelsøgningen, såfremt der rent faktisk er foretaget valg af et tilbudsprodukt. Dette hænger sammen med, at hypoteseargumentationen går på den ekstra prissøgningsaktivitet, der kan være foranlediget af at have set aktivt/passivt efter tilbudssignaler ved hylden. Købt på tilbud inkluderes derfor ikke i modelsøgningen for prisviden før butiksbesøget. 272

23 (se Estelami og Lehmann (2001) for en sammenligning). Det teoretiske fundament for inkludering af disse variable hviler i tillæg på et tyndt grundlag (Monroe & Lee, 1999). På den baggrund prioriteres denne blok sidst. Forklarende variable fra modelsøgningen i blok 1, 2 og 3 kontrolleres således for demografiske variable. Der skeles dog i stor udstrækning til face validity i denne afsluttende modelsøgning, så dataene ikke overtager styringen på bekostning af det mere substantielle. Listen med variable i denne blok inkluderer følgende: a) alder; b) køn; c) husstandens størrelse 8 alternativt personer under 18 eller personer under 6; d) uddannelsesniveau kategorisk variabel med tre dummyvariable med op til 10 års skolegang som referencekategori; samt e) indkomst. Grundet det store antal mulige forklarende variable er der gået varsomt frem med hensyn til inkluderingen af interaktionseffekter i modelsøgningen. Et meget højt antal interaktioner vil således kunne føre til et vist antal signifikante interaktioner alene som følge af antallet af inkluderede interaktioner i modelsøgningen det vil sige uden ekstern validitet. Fremgangsmåden for inkludering af interaktionsled har derfor været styret af face validity og teori (f.eks. prisinvolvering*income) frem for datastyring. Dette har bragt antallet af interessante interaktioner betydeligt ned, så ovennævnte problemer kunne undgås, ligesom det fremmer fortolkningen. Inkluderingen af interaktionsled afhang ligeledes af, hvilke variable der var tilbage fra modelsøgningen fra tidligere blokke. Risikoen ved den fremgangsmåde var, at signifikante interaktionsled kunne blive overset, men fordelene i form af 1) mindre datastyring, 2) en klar struktur til håndtering af det store antal mulige forklarende variable samt 3) lettere fortolkning mere end overskygger denne risiko i dette tilfælde. 8 Der er stor risiko for forudsætningsbrud i form af belastende multikolinearitet, hvis specielt husstandens størrelse og personer under 18 indgår i modelsøgningen samtidig. Korrelationen mellem husstandens størrelse og personer under 18 er således på 0,9, mens problemet mellem personer under 6 og henholdsvis husstandens størrelse (r = 0,46) og personer under 18 (r = 0,51) er knap så stort. De tre variable er således blevet introduceret skiftevis i modelsøgningen for at se, hvilken der resulterer i den største modelforbedring. 273

24 9.2.2 Ordinal regressionsanalyse Ved analyse af forskelle i nøjagtigheden af forbrugernes prisviden kommer logistisk regressionsanalyse til kort, eftersom den afhængige variabel ikke længere udgøres af et binært gruppetilhørsforhold. En anden mulighed ville være at anvende multinominal logit analyse, som ville behandle forhåndsdefinerede kategorier (fire i dette tilfælde) af nøjagtig prisviden som nominale. Herefter ville der kunne estimeres en logistisk regressionsmodel for hver af disse kategorier (f.eks. 0 % < afvigelse i price recall 10 % ja eller nej). Dette fravælges dog, da denne fremgangsmåde ville ignorere det faktum, at kategorierne er ordnede i forhold til afvigelsen fra 0. Dette ville medføre, at man ikke udnytter al den information, der er til rådighed i datamaterialet. Derudover kunne det få den konsekvens, at langt flere parametre end nødvendigt skulle estimeres, hvilket ville øge risikoen for at få insignifikante resultater (Agresti, 1990; Menard, 1995). Multipel regressionsanalyse kunne i princippet have været anvendt, hvor den afhængige variabel ville udgøres af absolut procentvis afvigelse fra den faktiske pris i price recall-testen. Det største problem i den forbindelse er, at den afhængige variabel ikke er normalfordelt, ligesom forskellige transformationer heraf med henblik på at omgå dette problem ikke giver et markant bedre resultat. Tjek af forudsætningen, om at der ikke må være tale om belastende multikolinearitet mellem de uafhængige variable i de logistiske regressionsanalyser, viste, at denne forudsætning kunne opfyldes. Men multipel regressionsanalyse er derudover underlagt en række strenge forudsætninger, som ordinal regressionsanalyse er mere robust over for brud af dette gælder ikke mindst antagelsen om normalitet og konstant varians (Agresti, 1990; Hair et al., 1998; Menard, 1995; Sharma, 1996). Som overskriften antyder, vælges ordinal regressionsanalyse derimod til formålet. Den ordinale regressionsmodel, som også går under navnet the cumulative logit model, estimerer effekten af de uafhængige variable på log-odds ved at have lavere frem for højere værdier af den afhængige variabel. Det vil i dette tilfælde sige, hvilken effekt de forskellige mulige forklarende variable har på log-odds ved at have mindre nøjagtig prisviden frem for mere nøjagtig prisviden (målt ud fra price recall-testen) i forhold til kategoriseringen i J antal kategorier. 274

25 Grundlæggende antages, at der eksisterer en kontinuert latent variabel, y*, som udtrykker graden af nøjagtig price recall, y. Ved en opdeling af graden af nøjagtig price recall i fire kategorier (trin) er der ikke længere tale om komplet information om den latente variabel. Til gengæld giver det mulighed for at forklare forskelle i graden af nøjagtig prisviden. Forholdet mellem y* og y kan illustreres som vist nedenfor (Agresti, 1990; Long, 1997):! 1! 2! 3 y* y τ værdierne på skalaen for y* kaldes thresholds eller cutpoints (herefter benævnt afskæringsværdier). I dette tilfælde opdeler de tre afskæringsværdier τ 1 τ 2 og τ 3 skalaen i fire dele, hvilket svarer til opdelingen af nøjagtigheden af forbrugernes prisviden i fire kategorier. Den strukturelle model er: y* = β 1 x 1 + β 2 x β k x k +ε =xβ + ε hvor x 1... x k udgør de uafhængige variable, mens β 1... β k refererer til parameterestimaterne for k = 1 til K. Som ved logistisk regressionsanalyse kan maximum likelihood-metoden anvendes til at estimere modellen. For at kunne anvende denne metode må der antages en specifik fordeling for fejlleddet, ε. Det typiske er at antage en logistisk fordeling for fejlleddene 9 (Long, 1997). Med antagelse om en logistisk fordeling for fejlleddet kan 9 Dette svarer til logit link-funktionen i SPSS. Valget heraf bevirker, at fortolkningen af de forklarende variable kommer til at minde om fortolkningen i de logistiske regressionsanalyser ovenfor. Logit linkfunktionen vælges derudover, fordi alle tre modeller efterfølgende viser sig at opfylde den vigtige forudsætning om parallelle linier ved anvendelse af logit linkfunktionen (Agresti, 1990; Long, 1997). 275

26 den ordinale regressionsmodel skrives på følgende måde 10 (Agresti, 1990; Long, 1997): ln P(Y j) = τ j - Σ β k x k for j = 1 til J - 1 og k = 1 til K (4) P(Y > j) I denne ligning udgør τ j afskæringsværdierne. Effekten af de uafhængige variable β k x k bliver i modsætning til normalt fratrukket afskæringsværdien, hvilket indikerer, at positive β-koefficienter øger sandsynligheden for en højere score på den afhængige variabel og vice versa for negative β-koefficienter (Agresti, 1990). Afskæringsværdierne for J 1 kategorier udtrykker den afhængige variabels kategoriske natur i denne sammenhæng. På den baggrund kan der også beregnes sandsynligheder for, at forbrugeren tilhører en af de fire kategorier. For eksempel kan sandsynligheden for, at forbrugeren er mere end 20 procent fra den faktiske pris (trin 1), udtrykkes ved hjælp af følgende model: P (y = 1 x) = P (y* < τ 1 ) = e τ 1 - xβ.(1 (5) 1 + e τ 1 - x β De J - 1 afskæringsværdier (τ j ) og de K regressionskoefficienter (β) er ukendte parametre, som skal estimeres ved hjælp af maximum likelihoodmetoden (Agresti, 1990; Long, 1997). Den ordinale regressionsmodel antager, at de uafhængige variable har samme koefficient for alle kategorier af den afhængige variabel, hvilket svarer til en antagelse om parallelle regressioner (Long, 1997). Der er her tale om en kritisk forudsætning, som kan verificeres ved hjælp af test of parallel lines. En insignifikant testværdi indikerer, at det ikke kan afvises, at der er tale om ens koefficienter på tværs af kategorierne af den afhæn- 10 Ved at multiplicere med den naturlige logaritme på begge sider i formel (4) kan modellen udtrykkes i odds-ratio i stedet for log-odds. 276

27 gige variabel. Long (1997) gør opmærksom på, at denne forudsætning ofte brydes. Den deraf følgende signifikante test af forudsætningen om parallelle linier indikerer i den forbindelse, at man bør overveje en anden fremgangsmåde, såsom multinominal logit-analyse (Long, 1997). Det er de samme uafhængige variable, som beskrevet ovenfor i afsnit , der indgår i modelsøgningen med de samme forskelle mellem modelsøgningen for målingen før butiksbesøget i forhold til under og efter butiksbesøget. Der findes ingen decideret guide til modelsøgning, når det gælder ordinal regressionsanalyse (Agresti, 1990; Long, 1997). Derfor må der nødvendigvis blive tale om en manuel modelsøgning styret af henholdsvis substantielle betragtninger (som beskrevet ovenfor i prioriteringen i fire blokke) samt trial-and-error. Kriterierne, der kan lægges til grund, vil være en blanding af ændring i pseudomål for modellens forklaringsgrad (McFadden, Cox & Snell og Nagelkerke R 2 ), de forklarende variables signifikansniveau, face validity og ikke mindst test af forudsætningen om parallelle linier. Den afhængige ordinale variabel tager udgangspunkt i absolut procentvis afvigelse fra den faktiske pris, hvorved det bliver et mål for nøjagtigheden af forbrugernes bud i price recall-testen. Denne variabel kan opdeles i et antal afgrænsede kategorier (trin) på næsten uendelig mange måder. Valget faldt til slut på følgende fire trin med stigende nøjagtighed: 1. Procentafvigelse fra den faktiske pris > 20 % % procentafvigelse fra den faktiske pris < 10 % % procentafvigelse fra den faktiske pris < 0 % 4. Procentafvigelse fra den faktiske pris = 0 % Seks kategorier blev også afprøvet, men der var begrundet formodning, om at forskellene ville blive udvandede ved en opdeling i for mange trin. Den viste kategorisering i en ordinal skala med fire trin tager afsæt i (1) unøjagtig prisviden (over 20 % afvigelse), (2) nogenlunde operationel prisviden i forhold til at genkende et godt eller dårligt køb (10-20 % fra den faktiske pris, som også indgår i deal spotting-testen), (3) nogenlunde nøjagtig pris- 277

Vis mere