FORBRUGERNES PRISVIDEN FØR,

Størrelse: px
Starte visningen fra side:

Download "FORBRUGERNES PRISVIDEN FØR,"

Transkript

1 FORBRUGERNES PRISVIDEN FØR, UNDER OG EFTER BUTIKSBESØGET HVILKEN PRISVIDEN ER FORBRUGERNE I BESIDDELSE AF FØR, UNDER OG EFTER KØB AF DAGLIGVARER OG HVAD KAN FORKLARE FORSKELLE I FORBRUGERNES PRISVIDEN? BIRGER BOUTRUP JENSEN INSTITUT FOR MARKETING OG STATISTIK/ MAPP BIND 2

2

3 KAPITEL 9 RESULTATER OG DISKUSSION AF ANALYSER AF FORSKELLE I FORBRUGERNES PRISVIDEN Efter at have analyseret hvilken prisviden forbrugerne er i besiddelse af i kapitel 8, vil det specifikke forskningsspørgsmål (e) fra kapitel 2 være i centrum i dette kapitel. Forskelle i forbrugernes prisviden vil blive analyseret ved hjælp af logistisk regressionsanalyse og ordinal regressions analyse. De logistiske regressionsanalyser tager udgangspunkt i de dikotome afhængige variable (mål for prisviden) price recall, prisgenkendelse, deal spotting og tilbudsopfattelse. I modsætning hertil tager de ordinale regressionsanalyser afsæt i forskellige trin af nøjagtig price recall. Resultaterne af disse analyser danner grundlaget for besvarelsen af de hypoteser, som blev opstillet i afsnit 4.4. Analyserne af forskelle i forbrugernes prisviden gennemgås enkeltvis for de forskellige mål for prisviden, hvorefter hvert hovedafsnit (9.3, 9.4, 9.5 og 9.6) afsluttes med en sammenligning af modellerne for det respektive mål på tværs af de tre måletidspunkter med henblik på at diskutere forskelle og ligheder. Endelig afsluttes kapitlet med en diskussion af forklarende variable i forhold til forbrugernes prisviden på tværs af de forskellige mål og måletidspunkter i afsnit 9.7. Før der tages hul på analyserne til besvarelse af dette forskningsspørgsmål, vil resultaterne af en række indledende faktor- og itemanalyser dog blive gennemgået, ligesom analyseteknikkerne logistisk og ordinal regressionsanalyse vil blive introduceret. 9.1 Faktoranalyser og itemanalyser Faktoranalyser kan spille en vigtig rolle for den senere anvendelse af multivariate dataanalyseteknikker som logistisk og ordinal regression, da de kan komprimere data, forenkle strukturer, synliggøre de bagvedliggende dimensioner i problemstillingen samt forebygge problemer med multikolinearitet i de videre analyser (DeVellis, 1991; Hair et al., 1998; Sharma, 1996). 253

4 Spørgeskemaet til hjemmeudfyldning indeholdt fire overordnede sæt af items (F.1-F.4 butiksloyalitet; G.1-G-8 prisimage; H.1-H.6 mærkeloyalitet; I.1-I.30 forskellige komponenter af prisinvolvering), som blev målt på 7-punkts Likertskala er. I hvert tilfælde eksisterede der a priori en vis forventning om, at items inden for hver enkelt sæt af items havde høj indbyrdes korrelation. Baseret på svarene på disse spørgsmål undersøges således eksplorativt via faktoranalyser, om der var underliggende forhold, der bandt svarene på spørgsmålene sammen. Valget af eksplorativ faktoranalyseteknik faldt på principale komponenters analyse (PKA), som dermed blev anvendt til at beskrive datamaterialets struktur i færrest mulige ukorrelerede dimensioner. PKA er ikke en decideret faktoranalyseteknik, men det er blevet vist, at PKA stort set giver identiske resultater som egentlige faktoranalyseteknikker (DeVillis, 1991; Hair et al., 1998; Sharma, 1996). Der blev ikke gennemført konfirmativ faktoranalyse, dels fordi der var introduceret nye items i de forskellige skalaer, dels fordi det ikke var et mål i sig selv at belyse, om de oprindelige komponenter kunne bekræftes i dette datamateriale. Devellis (1991) argumenterer desuden for, at der godt kan eksistere visse forhåndsforventninger til grupperingen uden det nødvendigvis betyder, at der skal anvendes konfirmativ faktoranalyse. Således vil det styrke forhåndsformodningerne, hvis de også dukker op af sig selv i datamaterialet for eksempel via PKA. En forudsætning for Likertskala ens brug er, at skalaen er endimensional, og at samtlige items måler variablen lige godt. PKA kan derfor også bruges til at undersøge, hvorvidt de valgte items udgør en reliabel og valid Likertskala. Følgende skal i så fald være opfyldt: (1) den første uroterede komponent skal opsamle mindst 40 procent af den totale varians; (2) de efterfølgende komponenter skal opsamle cirka lige megen varians per komponent; og (3) samtlige items skal indgå med nogenlunde samme vægt ved beregning af faktorscoren for den første komponent (Hair et al., 1998; Sharma, 1996). Er punkt 1 og 2 opfyldt, kan skalaen betragtes som værende endimensional. Såfremt punkt 3 er opfyldt kan Likertskalaens anvendelse af simpel summering anses for at være en rimelig tilnærmelse til beregning af faktorscorer (Blunch, 1999; Hair et al., 1998). 254

5 Sharma (1996) definerer måleinstrumentets reliabilitet som dets evne til at give omtrent identiske måleresultater ved gentagne målinger under identiske betingelser. Når der er tale om flere items til måling af en variabel, benyttes itemanalyse til at måle denne reliabilitet Komponentanalyse for butiksloyalitet Det første sæt af items, der undergik en analyse for underliggende dimensioner via PKA var de fire items F.1 til F.4, som på forhånd var udvalgt for at beskrive forskellige aspekter af butiksloyalitet, jævnfør afsnit Tabel 9.1 Resultater af komponentanalysen for butiksloyalitet Mean item score Communality Component loadings Extracted variance Cronbach s alpha F1. Jeg handler oftere i Bilka 4,7 (2,4 c ),70,84 58,5 %,76 end andre steder a F2. Jeg køber ind i mange forskellige supermarkeder b 4,4 (2,1),64,80 F4. Jeg ved præcis, hvor de forskellige varer står i Bilka 5,7 (1,7),46,74 F3. Det er ofte tilfældigt, hvor jeg køber ind b 5,0 (1,8),54,68 * KMO = 0,72 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Spørgsmålet er negativt formuleret i forhold til øvrige items, hvorfor scoren er vendt om c Standardafvigelsen Tabel 9.1 opsummerer de vigtigste resultater fra komponentanalysen. KMO-testen kvantificerer graden af indbyrdes korrelationer mellem items (Hair et al., 1998). En værdi på 0,72 viser, at det kan forsvares at gennemføre en komponentanalyse i dette tilfælde. Såvel scree-plot som Kaiserkriteriet peger i retning af én komponent 1 til at dække indholdet af de fire items. Den første komponent opfanger 58,5 procent af den totale varians, mens de efterfølgende komponenter opfanger cirka lige megen varians. I 1 Der blev gennemført en komponentanalyse for henholdsvis Bilka- og Føtex-respondenter, som i begge tilfælde viste nøjagtig samme mønster. Løsningen må derfor anses som meget robust. 255

6 tillæg viser komponentladningerne, at samtlige items indgår med nogenlunde samme vægt ved beregning af komponentscores. Med andre ord, så er forudsætningerne for, at de fire items kan udgøre endimensional reliabel og valid Likertskala til stede (Blunch, 1999; Hair et al., 1998). PKA gennemføres blandt andet med henblik på datareduktion i forhold til de efterfølgende analyser af forklarende variable. Komponentladningernes nogenlunde ligelige vægtning indikerer, at de fire items kan erstattes af summering til én komponentscore per respondent baseret på gennemsnittet af de fire item-scores. En af fordelene ved at anvende summerede skalaer er, at eventuelle målingsfejl, der relaterer sig til ét item, kan reduceres. Der blev gennemført en itemanalyse for at belyse skalaens reliabilitet. I den forbindelse angiver Cronbachs alfa minimumsværdien for reliabilitetskoefficienten, og som tommelfingerregel skal denne størrelse gerne overstige 0,7 (DeVillis, 1991; Hair et al., 1998; Sharma, 1996). Der kan fjernes items indtil, at Cronbachs alfa ikke længere kan øges dog dikterer face validity kravet, at der ikke fjernes items, som logisk set hører med ind under målingen af den pågældende variabel. Itemanalysen resulterer i dette tilfælde i Cronbachs alfa på 0,76, som ikke kan øges ved at fjerne et item. Der var medtaget yderligere tre variable i spørgeskemaet til at måle graden af adfærdsloyalitet over for den pågældende kæde. Det drejer sig om kædefrekvens, kædekøb og kædevalg, jævnfør afsnit Som forventet er der tale om høj positiv korrelation mellem disse yderligere operationaliseringer af butiksloyalitet og den summerede komponent for butiksloyalitet (henholdsvis r = 0,654; r = 0,767; r = 0,785). Den samtidige kriterievaliditet ( convergent validity ) må derfor betegnes som god, hvilket også gør sig gældende for face validity skalaen måler det, der var meningen (Hair et al., 1998). Summa summarum er der tale om en reliabel og valid Likertskala, som med fordel kan reduceres til én summeret komponentscore for butiksloyalitet Komponentanalyse for prisimage Jævnfør afsnit bestod skalaen til måling af opfattet prisimage af otte mere eller mindre eksplorative items. Tabel 9.2 opsummerer de vigtigste 256

7 resultater fra komponentanalysen for disse items. KMO-testen resulterer i en værdi på 0,92, hvilket viser, at det i særdeleshed er en god idé at gennemføre en komponentanalyse på disse items. Tabel 9.2 Resultater af komponentanalysen for prisimage Mean item score Communality Component loadings Extracted variance Cronbach s alpha G6. Jeg sparer mest ved at handle 3,7 (1,7 b ),81,90 67,5 %,92 dagligvarer i Bilka a G2. Jeg får mest for pengene i Bilka 4,1 (1,6),76,87 G3. Jeg kan købe dagligvarer billigere i Bilka G8. Bilkas normalpriser er lavere end andre steder G7. Tilbudspriserne i Bilka er bedre end andre steder 3,8 (1,7),74,86 3,5 (1,7),72,85 4,0 (1,6),63,80 G1. Priserne i Bilka er rimelige 4,9 (1,4),62,78 G5. Der er mange gode tilbud i Bilka 5,4 (1,3),45,67 * KMO = 0,92 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Standardafvigelsen Den første komponentanalyse pegede på henholdsvis én eller to komponenter alt efter om scree-plot eller Kaiserkriteriet lå til grund for den empiriske vurdering. Indledningsvist blev der derfor arbejdet videre med begge løsningsmodeller for at finde frem til en komponentløsning, hvor både face validity og objektive målekriterier harmonerede. Efter gennemførelsen af en række komponent- og itemanalyser faldt valget på en løsning med kun én komponent. To-komponentløsningen var således tvivlsom ud fra et fortolkningsmæssigt synspunkt, ligesom den i udgangspunktet lå på vippen i forhold til Kaiserkriteriet (eigen value = 1,034) og scree-plot. Denne løsning ville også have budt på en komponent med bare to items, hvilket i lige så høj grad kunne være resultatet af forkert valg af items. En tvungen en-komponentløsning førte derudover til ekskludering af item G4: Bilkas tilbudsaviser er inspirerende. Kommunaliteten for G4 var meget lav (0,32), hvilket er ensbetydende med, at kun 32 procent af 257

8 variablen blev forklaret af den ene komponent. Dette item havde også en meget lavere komponentladning (0,566) i forhold til de øvrige items. En itemanalyse for alle otte items afslørede tillige mulighed for forbedring af Cronbachs alfa med knap en procent, hvilket dog ikke er meget. En vurdering af indholdsvaliditeten tilsiger, at spørgsmålet kan være blevet opfattet anderledes end de øvrige spørgsmål omkring opfattet prisimage, da disse items eksplicit inkluderer priselementet. Inspirerende tilbudsaviser kan ligeledes referere til andet end priserne i tilbudsavisen for eksempel opskrifter, udbud, farver og format. Det kan derfor konkluderes, at face validity understøtter en en-komponentløsning eksklusiv item G4. Den ene komponent forklarer 67,5 procent af variansen (hvilket er højere end tommelfingerreglen på % i første faktor for at være endimen sional), mens de næste komponenter opfanger cirka lige meget varians (9,6 % og 8,1 %). I tillæg er komponentladningerne tilnærmelsesvis lige høje (0,67-0,90), hvorfor det kan forsvares at gennemføre en simpel summering i forbindelse med datareduktion før de videre analyser. De syv resterende items erstattes derfor af én komponentscore per respondent. Denne komponentscore udgøres af summen af respondentens score for de syv items divideret med syv. Komponenten benævnes efterfølgende opfattet prisimage. Itemanalysen for de resterende syv items viser en meget høj Cronbachs alfa på 0,92. Det må derfor konkluderes, at det endelige resultat taler for en reliabel og valid endimensional Likertskala, som kan summeres til én gennemsnitlig komponentscore til anvendelse i de videre analyser Komponentanalyse for mærkeloyalitet Mærkeloyalitet blev målt via seks items, hvoraf fire var gengangere fra en tidligere undersøgelse (Jensen, 2001), mens to items var nye i denne sammenhæng. I den forbindelse viser KMO-værdien på 0,90 i tabel 9.3, at en komponentanalyse også i høj grad er på sin plads i dette tilfælde. Både scree-plot og Kaiserkriteriet (eigen values på henholdsvis 4,2 og 0,6 for de to første mulige komponenter) indikerer med al tydelighed, at én 258

9 komponent 2 igen er tilstrækkeligt til at opsamle informationen fra de seks items. Tabel 9.3 Resultater af komponentanalysen for mærkeloyalitet Mean item score Communality Component loadings Extracted variance Cronbach s alpha H5. Jeg skifter gerne mellem 5,0 (2,3 c ),81,90 68,9 %,91 forskellige kaffemærker a,b H1. Jeg køber det samme kaffemærke hver gang H2. Jeg køber mit foretrukne kaffemærke uanset prisen på andre mærker 5,0 (2,2),78,88 4,9 (2,3),77,87 H3. Generelt sammenligner jeg forskellige mærker, når jeg køber 4,8 (2,3),63,80 kaffe b H6. Jeg tror ikke, andre mærker kaffe kan opfylde mit behov lige så godt som mit favoritmærke H4. Jeg venter med at købe kaffe, hvis mit favoritmærke er udsolgt 4,0 (2,4),61,78 3,6 (2,5),55,74 * KMO = 0,90 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Spørgsmålet er negativt formuleret i forhold til øvrige items, hvorfor scoren er vendt om c Standardafvigelsen Den ene komponent opfanger 68,9 procent af informationen i de seks items. Den opfylder alle tre forudsætninger for en reliabel og valid Likertskala: (1) Første komponent opsamler mere end % af variationen, (2) de næste komponenter cirka lige meget varians (10,2 % og 6,9 %), mens (3) komponentladningerne befinder sig i cirka samme høje leje (0,74-0,90). Der er således tale om en endimensional skala, hvor Likertskalaens anvendelse af summering synes forsvarligt. 2 Med henblik på validering af en-komponentløsningen blev der gennemført separate komponentanalyser for respondenterne fra Føtex og Bilka. Resultaterne heraf var stort set identiske med det samlede resultat, hvilket understreger denne løsnings robusthed. 259

10 Hvad angår reliabiliteten af skalaen, resulterer itemanalysen i en Cronbachs alfaværdi på 0,91, hvilket er meget højere end tommelfingerreglen på 0,7. I tillæg kan Cronbachs alfa ikke øges ved at udelade et item. Der er med andre ord tale om en reliabel Likertskala til måling af mærkeloyalitet. Indholdsvaliditeten skulle være sikret ved hovedsageligt at bygge på tidligere skalaer, ligesom de valgte items er teoretisk funderede. Den samtidige kriterievaliditet blev undersøgt ved hjælp af en korrelationsmatrice indeholdende på den ene side komponenten for mærkeloyalitet og på den anden side spørgsmål B fra spørgeguiden (antal gange det pågældende produktalternativ er blevet købt ud af de sidste 10 gange). Korrelationen på 0,58 indikerer, at skalaen faktisk måler det, den var tiltænkt. Det kan derfor konkluderes, at der er tale om en reliabel og valid endimensional Likertskala til måling af mærkeloyalitet (dog uden opdeling på commitment og inerti). På den baggrund anvendes summering til datareduktion i de følgende analyser. Nærmere bestemt summeres de seks itemscores per respondent, hvorefter denne score divideres med antal items for at opnå én komponentscore Komponentanalyse for prisinvolvering I udgangspunktet var der udvalgt 30 items til at måle forskellige dele af prisinvolvering, jævnfør afsnit Der var tale om 26 gengangere fra en tidligere undersøgelse (Jensen, 2001) og fire nye items genereret fra fokusgruppeinterviewene. Det blev derfor fravalgt at gennemføre konfirmativ faktoranalyse. Resultatet af den indledende komponentanalyse med 30 items gav en KMO-værdi på 0,924, hvorfor det er anbefalelsesværdigt at gennemføre en komponentanalyse. Den første komponent opfangede godt 35 procent af variationen, de efterfølgende komponenter opfangede ikke lige meget variation, ligesom der var stor forskel i komponentladningerne. Alt i alt tyder det på, at prisinvolvering består af flere komponenter. Såvel Kaiserkriteriet som scree-plot indikerer en løsning med fem komponenter, hvilket understøttes af resultatet af en tidligere komponentanalyse (Jensen, 260

11 2001), som på baggrund af 26 ud af de her udvalgte 30 items netop nåede frem til fem fortolkelige dimensioner med rod i teorien. Der var dog ikke umiddelbart tale om en klar og let fortolkelig komponentstruktur, så med henblik på at opnå en bedre og lettere fortolkelig struktur blev der gennemført en række komponentanalyser og itemanalyser. Items med lave og/eller tvetydige komponentladninger blev fjernet ét ad gangen i prioriteret rækkefølge. I samme ombæring blev der skelet til kommunaliteter og ikke mindst face validity. Argumentationen for fjernelse af items I.7, I.8, I.10, I.19, I.27 og I.30 findes i bilag 12. Den endelige Varimax-roterede komponentstruktur er vist i tabel 9.4. Kaiserkriteriet, scree-plot og face validity peger igen på en løsning med fem komponenter, som tilsammen opsamler 63,7 procent af variationen i de resterende 24 items. Den første uroterede komponent opsamler 35,3 procent, de efterfølgende henholdsvis 10,3, 8,6, 5,1 og 4,4 procent af variationen. Det tyder således også på en flerdimensional skala til måling af prisinvolvering. Fortolkningen af de fem komponenter er i tråd med forhåndsforventningerne og resultatet af den tidligere undersøgelse (Jensen, 2001). Komponenterne får derfor følgende overskrifter: o Komponent 1 = opfattede budgetbegrænsninger (opbudget) o Komponent 2 = price mavenism (pricemav) o Komponent 3 = tilbudsinteresse (prominte) o Komponent 4 = lavprisinteresse (lowprice) o Komponent 5 = værdibevidsthed (valuecon) Det er værd at bemærke, at datamaterialet har peget på fem komponenter hele vejen frem mod den endelige komponentløsning. Der blev gennemført separate komponentanalyser for henholdsvis respondenter fra Føtex og Bilka, hvor de selv samme fem komponenter viser sig igen. Fordelingen af items er således nøjagtig den samme, hvilket indikerer, at den endelige komponentløsning er robust. 261

12 Tabel 9.4 Varimax-roterede komponentladninger for prisinvolvering Opbudget Pricemav Prominte Lowprice Valuecon I.24 Jeg har jævnligt problemer med at få pengene til at slå til,90 I.25 Mit budget er altid stramt,88 I.26 Jeg må ofte bruge flere penge, end jeg har til rådighed,86 I.23 Min omgangskreds anser mig for at være en god kilde, når det gælder prisinformation om dagligvarer I.22 Jeg kan godt lide at hjælpe folk ved at fortælle dem, hvad forskellige dagligvarer koster I.20 Min omgangskreds spørger mig om prisen på forskellige dagligvarer I.21 For mange dagligvarer er jeg i stand til at fortælle andre, hvor man skal handle for at gøre det bedste køb I.16 Jeg snakker ofte med min omgangskreds om tilbud, før jeg foretager mine dagligvarekøb I.14 Jeg venter gerne med at købe dagligvarer, til de er på tilbud I.28 Jeg hamstrer gerne, når der er gode tilbud på dagligvarer I.15 I supermarkedet ser jeg efter, hvilke varer der er på tilbud I.13 Generelt søger jeg information om, hvilke varer der er på tilbud, når jeg køber dagligvarer,85,82,82,70,68,71,68,64,62 I.11 Jeg er tilbøjelig til at købe dagligvarer på tilbud,61 I.29 Jeg vil have det skidt, hvis jeg er blevet nødt til at købe dagligvarer til fuld pris I.17 Jeg læser supermarkedernes tilbudsavis for at finde de bedste tilbud I.6 Vendt om - De penge, man kan spare ved at søge efter lavere dagligvarepriser, er normalt ikke de ekstra anstrengelser værd I.4 Vendt om - Jeg er ikke villig til at yde en ekstra indsats for at finde lavere priser I.5 Jeg handler i flere supermarkeder for at drage fordel af lavere dagligvarepriser I.12 Vendt om - Jeg er ikke interesseret i at lede efter et godt tilbud I.18 Jeg sammenligner priser mellem supermarkeder for at gøre det bedste køb I.2 Jeg lægger mindst lige så megen vægt på lave priser som kvalitet I.1 Når jeg køber dagligvarer, sammenligner jeg prisen på forskellige mærker for at være sikker på, at jeg får mest for mine penge I.3 Jeg tjekker altid prisen i supermarkedet for at være sikker på, at jeg får mest for pengene I.9 Jeg har favoritmærker, men for det meste køber jeg de mærker, som er på tilbud,55,54,77,76,72,63,55,71,70,65,57 262

13 Da alle 24 resterende items er med til at determinere graden af respondentens prisinvolvering, var der begrundet risiko for multikolinearitet i efterfølgende analyser, såfremt der blev opereret med gennemsnitlige sumscores per komponent. I stedet udregnede SPSS faktor-scores, som blev gemt til senere anvendelse i de logistiske og ordinale regressionsanalyser. Når der anvendes ortogonal rotation (Varimax 3 i dette tilfælde) vil de fem komponenter blive ukorrelerede ved anvendelse af faktor-scores, hvorved et ellers truende multikolinearitetsproblem kan foregribes. I det følgende præsenteres resultaterne af separate itemanalyser for hver af de fem komponenter. Desuden angives gennemsnitsscore og kommunaliteten for hvert item, mens komponentladningerne findes i tabel Komponent 1: Opfattede budgetbegrænsninger Den første komponent er opfattede budgetbegrænsninger. De vigtigste resultater af komponentanalysen er vist i tabel 9.5. Tabel 9.5 Resultat af komponentanalyse for opfattede budgetbegrænsninger Mean item score Communality b Cronbach s alpha I.24 Jeg har jævnligt problemer med at få 2,3 (1,8 b ),83,87 pengene til at slå til a I.25 Mit budget er altid stramt 2,4 (1,8),82 I.26 Jeg må ofte bruge flere penge, end jeg har til rådighed 1,9 (1,5),75 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Communalities stammer fra den samlede komponentanalyse for prisinvolvering c Standardafvigelsen Jævnfør tabel 9.5 er der tale om forholdsvis lave gennemsnitscores, som for alle items tenderer mod uenighed i udsagnene om opfattede budgetbegrænsninger. Flertallet har tilsyneladende en opfattelse af, at deres 3 Varimax-faktorrotation søger at give variablene loadings så tæt på ± 1 eller 0 for faktoren med henblik på at gøre fortolkningen enklere. 263

14 økonomi er tilstrækkelig god til, at de ikke behøver at bekymre sig på den konto. De tre items svarer nøjagtig til de tre items, der også udgjorde opfattede budgetbegrænsninger i to tidligere undersøgelser (Jensen, 2001; Urbany et al., 1996). Itemanalysen viser en høj Cronbachs alfa på 0,87. Der er med andre ord tale om en reliabel Likertskala til måling af opfattede budgetbegrænsninger som en del af prisinvolvering Komponent 2: Price mavenism Den næste komponent er price mavenism. Jævnfør tabel 9.6 er der tale om forholdsvis lave gennemsnitscores, som for alle items tenderer mod uenighed i udsagnene om price mavenism. Dette er dog ikke så overraskende, da det på forhånd var ventet, at det kun ville være en mindre gruppe, der ville score højt på denne dimension. Flertallet tænker ikke på at søge prisinformationer for dagligvarer med henblik på at videregive disse informationer i sociale sammenhænge men der eksisterer dog et segment der gør. Tabel 9.6 Resultater af komponentanalysen for price mavenism Mean item score Communality b Cronbach s alpha I.23 Min omgangskreds anser mig for at være en god kilde, når det gælder prisinformation 2,1 (1,7 c ),77,87 om dagligvarer a I.22 Jeg kan godt lide at hjælpe folk ved at fortælle dem, hvad forskellige dagligvarer koster I.20 Min omgangskreds spørger mig om prisen på forskellige dagligvarer I.21 For mange dagligvarer er jeg i stand til at fortælle andre, hvor man skal handle for at gøre det bedste køb I.16 Jeg snakker ofte med min omgangskreds om tilbud, før jeg foretager mine dagligvarekøb 2,4 (1,8),75 1,8 (1,4),70 2,5 (1,8),64 1,8 (1,4),56 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Communalities stammer fra den samlede komponentanalyse for prisinvolvering c Standardafvigelsen 264

15 De fem items svarer nøjagtig til de fem items, der også udgjorde price mavenism i en tidligere undersøgelse (Jensen, 2001). Itemanalysen viser en høj Cronbachs alfa. Der er med andre ord tale om en reliabel Likertskala til måling af price mavenism som en del af prisinvolvering Komponent 3: Tilbudsinteresse Jævnfør tabel 9.7 består tilbudsinteresse af syv items, hvoraf I.28 og I.29 er helt nye, idet de blev genereret via analyse af fokusgruppeinterviewene. Generelt er der tale om items med en høj grad af face validity, da de alle adresserer tilbud eksplicit i spørgsmålsformuleringen. Tabel 9.7 Resultater af komponentanalysen for tilbudsinteresse Mean item score Communality b Cronbach s alpha I.14 Jeg venter gerne med at købe dagligvarer, til de er på tilbud a 3,2 (2,0 c ),64,85 I.28 Jeg hamstrer gerne, når der er gode tilbud på dagligvarer I.15 I supermarkedet ser jeg efter, hvilke varer der er på tilbud I.13 Generelt søger jeg information om, hvilke varer der er på tilbud, når jeg køber dagligvarer I.11 Jeg er tilbøjelig til at købe dagligvarer på tilbud I.17 Jeg læser supermarkedernes tilbudsavis for at finde de bedste tilbud 3,7 (2,1),52 4,8 (1,9),59 4,1 (2,1),60 4,6 (1,9),62 4,3 (2,2),58 I.29 Jeg vil have det skidt, hvis jeg er blevet nødt til at købe dagligvarer til fuld pris 2,8 (1,9),45 a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Communalities stammer fra den samlede komponentanalyse for prisinvolvering c Standardafvigelsen Spørgsmål E1 og E2 fra spørgeskemaet (bilag 10) beskæftiger sig begge med den adfærdsmæssige (for dagligvarer og produktgruppen) side af tilbudsinteresse. Indbyrdes korrelation mellem E1, E2 og komponenten tilbudsinteresse på henholdsvis 0,24 og 0,31 er med til at understrege den samtidige kriterievaliditet. Itemanalysen viser igen en høj Cronbachs alfa 265

16 (0,85). Der er med andre ord tale om en reliabel Likertskala til måling af tilbudsinteresse Komponent 4: Lavprisinteresse Resultaterne for lavprisinteresse er angivet i tabel 9.8. På nær I.12 (se bilag 12) er der generelt tale om items med en høj grad af face validity i forhold til lavprisinteresse. Tabel 9.8 Resultater af komponentanalysen for lavprisinteresse a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Spørgsmålet er negativt formuleret i forhold til øvrige items, hvorfor scoren er vendt om c Communalities stammer fra den samlede komponentanalyse for prisinvolvering d Standardafvigelsen Mean item score Communality c Cronbach s alpha I.6 De penge, man kan spare ved at søge efter lavere dagligvarepriser, er normalt ikke de ekstra 3,5 (2,0 d ),67,84 anstrengelser værd a,b I.4 Jeg er ikke villig til at yde en ekstra indsats for b at finde lavere priser 3,8 (2,0),63 I.5 Jeg handler i flere supermarkeder for at drage fordel af lavere dagligvarepriser 3,7 (2,1),61 I.12 Jeg er ikke interesseret i at lede efter et godt b tilbud 4,9 (1,9),51 I.18 Jeg sammenligner priser mellem supermarkeder for at gøre det bedste køb 3,4 (2,2),68 Cronbachs alfa overstiger igen minimumsværdien på 0,7, da den lander på 0,84. Dette kan ikke øges ved at fjerne et item, hvorfor de fem items umiddelbart udgør en reliabel Likertskala til måling af lavprisinteresse Komponent 5: Værdibevidsthed Tabel 9.9 viser blandt andet resultatet af itemanalysen for den sidste komponent i prisinvolveringsskalaen. I.1-3 har tidligere ligget til grund for operationalisering af værdibevidsthed (Lichtenstein et al. 1993; Jensen 2001), mens I.9 er ny i denne sammenhæng. 266

17 Tabel 9.9: Resultater af komponentanalysen for værdibevidsthed a 7-punkts Likertskala med yderpunkterne helt uenig og helt enig b Communalities stammer fra den samlede komponentanalyse for prisinvolvering c Standardafvigelsen Mean item score Communality b Cronbach s alpha I.2 Jeg lægger mindst lige så meget vægt på lave priser som kvalitet a 3,8 (2,1c ),58,74 I.1 Når jeg køber dagligvarer, sammenligner jeg prisen på forskellige mærker for at være sikker på, at jeg får mest for mine penge I.3 Jeg tjekker altid prisen i supermarkedet for at være sikker på, at jeg får mest for pengene I.9 Jeg har favoritmærker, men for det meste køber jeg de mærker, som er på tilbud 4,8 (1,9),60 4,4 (2,0),63 3,6 (1,9),51 Det lave antal items skal holdes in mente ved analyse af resultaterne fra itemanalysen (Hair et al., 1998; Sharma, 1996). Der er dog alligevel en tilfredsstillende Cronbachs alfa-værdi på 0,74, ligesom denne ikke kan øges ved at fjerne et item. De fire items kan derfor umiddelbart siges at udgøre en reliabel skala for værdibevidsthed. 9.2 Analyseteknikker til at forklare forskelle i prisviden Kapitel 8 opererede med flere forskellige mål for forbrugernes prisviden heriblandt 1) price recall, 2) prisgenkendelse, 3) deal spotting, 4) tilbudsopfattelse og 5) procentvis afvigelse fra den faktiske pris. For de fire førstnævnte mål er der tale om dikotome afhængige variable, da udfaldsrummet begrænser sig til to korrekt eller ikke korrekt. Dette har betydning for, hvilken analyseteknik der kan vælges til at analysere, hvad der forklarer forskelle i disse mål for forbrugernes prisviden. I afsnit vil der blive argumenteret for valget af logistisk regressionsanalyse til behandling af denne problemstilling, ligesom denne teknik vil blive beskrevet overordnet. I forlængelse heraf diskuteres den konkrete fremgangsmåde i forbindelse med modelsøgningen, idet antallet af mulige forklarende variable nødvendiggør en prioritering i så henseende. 267

18 Procentvis afvigelse fra den nøjagtige pris adskiller sig fra de andre fire afhængige variable ved, at den ikke er nominalskaleret. Denne afhængige variabel baserer sig på price recall-testen, hvorved den siger noget om, hvor nøjagtig forbrugernes prisviden er. I den forbindelse argumenteres der i afsnit for valget af ordinal regressionsanalyse til at analysere forskelle i nøjagtigheden af forbrugernes prisviden. Afsnittet afsluttes derfor med en overordnet indføring i ordinal regressionsanalyse Logistisk regressionsanalyse For price recall, prisgenkendelse, deal spotting og tilbudsopfattelse er der behov for at analysere, hvad der kan forklare, om respondenten besvarer den enkelte test korrekt eller ej det vil sige et gruppetilhørsforhold. Der er derfor behov for en statistisk analyseteknik, der tager højde for, at den afhængige variabel (her et af de fire mål for prisviden) er nominalskaleret, mens der både vil være tale om nominalskalerede og intervalskalerede forklarende variable. Multipel regressionsanalyse er udelukket, da den afhængige variabel er nominalskaleret med kun to udfald. Valget står derfor umiddelbart mellem diskriminantanalyse og logistisk regressionsanalyse. Diskriminantanalyse hviler i høj grad på forudsætningerne om multivariat normalfordelte forklarende variable og ens kovariansmatricer mellem grupperne. Som det fremgik af tidligere kapitler, så indgår der indtil flere nominalskalerede forklarende variable i analysen, hvorfor anvendelse af diskriminantanalyse til denne problemstilling ville resultere i forudsætningsbrud med deraf følgende højere risiko for upålidelige resultater. Logistisk regressionsanalyse står i modsætning hertil, da denne analyseform ikke er underlagt samme strenge forudsætninger, ligesom logistisk regressionsanalyse har vist sig at være meget robust over for brud på disse forudsætninger (Long, 1997; Menard, 1995; Press & Wilson, 1978; Sharma, 1996). I tillæg er der flere lighedspunkter mellem logistisk regressionsanalyse og multipel regressionsanalyse ikke mindst hvad angår fortolkning og de metoder, der anvendes til at undersøge cases 268

19 enkeltvis 4. Logistisk regressionsanalyse vælges derfor som udgangspunkt for analysen af, hvad der kan forklare forskelle i forbrugernes prisviden. Formålet med logistisk regressionsanalyse er at undersøge den betingede fordeling for en binær afhængig variabel, Y, givet en eller flere uafhængige variable, X 1,..., X n. Den betingede sandsynlighed antages at være givet ved formlen (Hair et al., 1996; Long, 1997; Sharma, 1996): P (Y = 1 X 1,..., X n ) = e α + Σ βi x i.(1 (1) 1 + e α + Σ β i x i Det antages således, at Y er kodet 0 (for ikke korrekt) og 1 (for korrekt), og at de uafhængige variable er på intervalskala-niveau. Nominale eller ordinale uafhængige variable omkodes til binære indikator- eller dummyvariable én for hver kategori af den uafhængige nominale eller ordinale variabel på nær en udvalgt referencekategori. Ved at transformere formel (1) får den generelle logistiske regressionsmodel følgende udseende (k refererer til antallet af uafhængige variable): P(Y i = 1) ln = ln(oddsi ) = α + Σ β k x (2) i k.(1 1 P(Y i = 1) Da P/(1 - P) er forholdet mellem sandsynligheden for, for eksempel, korrekt prisgenkendelse og sandsynligheden for ukorrekt prisgenkendelse, kaldes venstresiden i formel (2) log-odds eller bare logit. Ved at multiplicere med den naturlige logaritme på begge sider i formel (2) kan modellen udtrykkes i odds i stedet for log-odds. Odds i = P(Y i = 1) = e α + Σ β kx i k (3) 1 P(Yi = 1) 4 En ulempe ved logistisk regressionsanalyse er dog, at den kun kan estimere modellen med to grupper i den afhængige variabel. En begrænsning som ikke deles af multipel diskriminantanalyse (Hair et al., 1998; Press & Wilson, 1978; Sharma, 1996). 269

20 I modsætning til regressionsmodellens OLS-estimering estimeres den logistiske regressionsmodels parametre ved hjælp af maximum likelihoodmetoden. Denne metode vælger de parameterkoefficienter, som maksimerer sandsynligheden for, at de observerede værdier er forekommet. Eftersom den logistiske regressionsmodel er ikke-lineær, er der behov for en iterativ algoritme for at estimere parametrene (Hair et al., 1996; Long, 1997; Sharma, 1996). SPSS 11 for Mac OS X indeholder en sådan algoritme, som har dannet grundlag for estimeringen af parametrene i de logistiske regressionsmodeller Modelsøgning i blokke I afsnit 1.2 blev der argumenteret for at inkludere et større udvalg af mulige forklarende variable sammenlignet med tidligere. Formålet er at forklare forskelle mellem de tre målesituationer og mellem de forskellige mål for prisviden. Det høje antal uafhængige variable nødvendiggjorde en prioritering i blokke i forbindelse med modelsøgningen. Variablene blev således delt op i fire blokke, hvorefter en manuel backward (LR) 5 modelsøgning lå til grund for beslutningen om at fjerne eller tilføje variable/interaktioner til modellen. Den manuelle søgning tilgodeså det hierarkiske princip (Field, 2000), når der var basis for at inkludere et eller flere interaktionsled i startmodellen. Derudover blev den manuelle modelsøgning valgt for at undgå, at maskinen tog styringen. De fire blokke udgøres af henholdsvis (1) forbrugervariable, (2) produktkarakteristika, (3) købsspecifikke variable og (4) demografiske variable. Rækkefølgen på de fire blokkes inkludering i modelsøgningen indikerer prioriteringen i forhold til problemstillingen. Alle uafhængige variable, som knyttede sig til en hypotese, blev inkluderet i modelsøgningen for de respektive mål for prisviden. 5 Backward (LR)-søgemetoden starter med alle mulige forklarende variable i modellen. Computeren tester dernæst, om nogen af disse variable kan fjernes fra modellen, uden at det forringer modellens fit signifikant i forhold til de observerede data. Backward LR refererer til det kriterium, som ligger til grund for beslutningen om at fjerne eller tilføje en variabel i dette tilfælde udgøres dette kriterium af Likelihood-ratio testet (LR) (Field, 2000). 270

21 Derudover indeholdt spørgeguiden og spørgeskemaet en række variable af mere eksplorativ karakter. Dette drejede sig for eksempel om demografiske variable, som ikke har udvist en entydig sammenhæng med forbrugernes prisviden i tidligere undersøgelser. Der blev opstillet en korrelationsmatrice for univariate sammenhænge mellem de forskellige mål for prisviden og mulige forklarende variable én matrice for hver af de tre målesituationer. De mere eksplorative variable blev dernæst kun inkluderet i modelsøgningen for et bestemt mål for prisviden i en bestemt målesituation, hvis korrelationsmatricen afslørede en tilnærmelsesvis signifikant univariat sammenhæng. Bruttolisten over mulige forklarende variable præsenteres nedenfor med de variabelnavne, der går igen i modellerne opdelt i forhold til de fire blokke. 1. Den første blok, der blev inkluderet i modelsøgningen, udgøres af en gruppe af variable, som kan betegnes forbrugervariable. Fælles for denne gruppe af variable er, at de ikke kun er bundet op på produktvalget den pågældende dag, men at de derimod er mere stabile karakteristika ved forbrugeren, som kan være afledt af personligheden. Forbrugervariablene nedenfor har desuden et klarere teoretisk fundament, som er afspejlet i hypoteseformuleringen i afsnit 4.4. Dette giver sig også udslag i, at de er mindre eksplorative af natur end variable i de øvrige blokke. Alt i alt medfører disse forhold, at denne blok prioriteres først i modelsøgningen. Følgende mulige forklarende variable indgår i blok 1: a) butiksloyalitet alternativt kædefrekvens; b) opfattet prisimage; c) mærkeloyalitet alternativt mærkeandel; d) tilbudsandel i kategori; e) købsfrekvens (individbaseret); samt følgende fem prisinvolveringskomponenter f) opfattede budgetbegrænsninger; g) price mavenism; h) tilbudsinteresse; i) lavprisinteresse; og j) værdibevidsthed. 2. De tilbageværende signifikante forklarende variable fra blok 1 kontrolleres derefter for effekten af de tre produktkarakteristika (produktdimensioner) i blok 2. Vanhuele og Dréze (2002) undersøgte ligeledes effekten af produktkarakteristika på forbrugernes prisviden før butiksbesøget og fandt, at alle tre havde en signifikant effekt. I nærværende undersøgelse er relativ købsfrekvens og prisintervallets relative størrelse 271

22 gengangere i forhold til Vanhuele og Drézes (2002) undersøgelse, hvilket muliggør en sammenligning i før-målingen. Jævnfør afsnit 7.3.1, er det muligt at opstille en hypotese for hver produktdimension om end det bemærkes, at der ikke er tale om et eksperimentelt design. Endelig er de tre produktdimensioner praktisk relevante, hvilket også taler for at denne blok prioriteres højt i modelsøgningen. Blok 2 udgøres således af følgende tre mulige forklarende variable: a) købsfrekvens; b) kampagneandel; og c) prisintervallets størrelse. 3. Den tredje blok af variable til modelsøgningen kan gå under betegnelsen købsspecifikke variable. I den forbindelse undersøges, om de tilbageværende signifikante variable fra blok 1 og 2 stadig er til stede, når der kontrolleres for købsspecifik adfærd. Der er tale om et sammensurium af mulige forklarende variable, der alle har det til fælles, at de knytter sig til det konkrete butiksbesøg og produktvalg. Variablene i blok 3 er: a) prissammenligning 6 ; b) købt på tilbud 7 ; c) læst tilbudsavis (kædens pågældende uge); d) brugt tilbudsavis til at planlægge produktvalget; samt e) travlt (situationsbestemt opfattelse af travlhed i forbindelse med dagens indkøbstur). 4. Sidste blok består af demografiske variable. Her eksisterer der stort set ingen forhåndsformodninger, da resultaterne heraf i tidligere undersøgelser har været divergerende og i nogle tilfælde direkte modstridende 6 Det skal tilføjes, at det kun var i målingerne under og efter butiksbesøget, at der kunne spørges til, om respondenten havde sammenlignet priserne mellem forskellige mærker før produktvalget. Indledningsvist blev pristjek (spørgsmål 10 fra spørgeguiden) også inkluderet i modelsøgningen, men dette bortfaldt, da pristjek viste sig at være en triviel variabel. Således indgik pristjek i alle modeller under og efter butiksbesøget med positiv effekt. Tillige udvander pristjek effekten af andre forklarende variable, da de til syvende og sidst lige så godt kunne have forklaret forskelle i pristjekningsadfærd. 7 Det giver kun mening at inkludere købt på tilbud i modelsøgningen, såfremt der rent faktisk er foretaget valg af et tilbudsprodukt. Dette hænger sammen med, at hypoteseargumentationen går på den ekstra prissøgningsaktivitet, der kan være foranlediget af at have set aktivt/passivt efter tilbudssignaler ved hylden. Købt på tilbud inkluderes derfor ikke i modelsøgningen for prisviden før butiksbesøget. 272

23 (se Estelami og Lehmann (2001) for en sammenligning). Det teoretiske fundament for inkludering af disse variable hviler i tillæg på et tyndt grundlag (Monroe & Lee, 1999). På den baggrund prioriteres denne blok sidst. Forklarende variable fra modelsøgningen i blok 1, 2 og 3 kontrolleres således for demografiske variable. Der skeles dog i stor udstrækning til face validity i denne afsluttende modelsøgning, så dataene ikke overtager styringen på bekostning af det mere substantielle. Listen med variable i denne blok inkluderer følgende: a) alder; b) køn; c) husstandens størrelse 8 alternativt personer under 18 eller personer under 6; d) uddannelsesniveau kategorisk variabel med tre dummyvariable med op til 10 års skolegang som referencekategori; samt e) indkomst. Grundet det store antal mulige forklarende variable er der gået varsomt frem med hensyn til inkluderingen af interaktionseffekter i modelsøgningen. Et meget højt antal interaktioner vil således kunne føre til et vist antal signifikante interaktioner alene som følge af antallet af inkluderede interaktioner i modelsøgningen det vil sige uden ekstern validitet. Fremgangsmåden for inkludering af interaktionsled har derfor været styret af face validity og teori (f.eks. prisinvolvering*income) frem for datastyring. Dette har bragt antallet af interessante interaktioner betydeligt ned, så ovennævnte problemer kunne undgås, ligesom det fremmer fortolkningen. Inkluderingen af interaktionsled afhang ligeledes af, hvilke variable der var tilbage fra modelsøgningen fra tidligere blokke. Risikoen ved den fremgangsmåde var, at signifikante interaktionsled kunne blive overset, men fordelene i form af 1) mindre datastyring, 2) en klar struktur til håndtering af det store antal mulige forklarende variable samt 3) lettere fortolkning mere end overskygger denne risiko i dette tilfælde. 8 Der er stor risiko for forudsætningsbrud i form af belastende multikolinearitet, hvis specielt husstandens størrelse og personer under 18 indgår i modelsøgningen samtidig. Korrelationen mellem husstandens størrelse og personer under 18 er således på 0,9, mens problemet mellem personer under 6 og henholdsvis husstandens størrelse (r = 0,46) og personer under 18 (r = 0,51) er knap så stort. De tre variable er således blevet introduceret skiftevis i modelsøgningen for at se, hvilken der resulterer i den største modelforbedring. 273

24 9.2.2 Ordinal regressionsanalyse Ved analyse af forskelle i nøjagtigheden af forbrugernes prisviden kommer logistisk regressionsanalyse til kort, eftersom den afhængige variabel ikke længere udgøres af et binært gruppetilhørsforhold. En anden mulighed ville være at anvende multinominal logit analyse, som ville behandle forhåndsdefinerede kategorier (fire i dette tilfælde) af nøjagtig prisviden som nominale. Herefter ville der kunne estimeres en logistisk regressionsmodel for hver af disse kategorier (f.eks. 0 % < afvigelse i price recall 10 % ja eller nej). Dette fravælges dog, da denne fremgangsmåde ville ignorere det faktum, at kategorierne er ordnede i forhold til afvigelsen fra 0. Dette ville medføre, at man ikke udnytter al den information, der er til rådighed i datamaterialet. Derudover kunne det få den konsekvens, at langt flere parametre end nødvendigt skulle estimeres, hvilket ville øge risikoen for at få insignifikante resultater (Agresti, 1990; Menard, 1995). Multipel regressionsanalyse kunne i princippet have været anvendt, hvor den afhængige variabel ville udgøres af absolut procentvis afvigelse fra den faktiske pris i price recall-testen. Det største problem i den forbindelse er, at den afhængige variabel ikke er normalfordelt, ligesom forskellige transformationer heraf med henblik på at omgå dette problem ikke giver et markant bedre resultat. Tjek af forudsætningen, om at der ikke må være tale om belastende multikolinearitet mellem de uafhængige variable i de logistiske regressionsanalyser, viste, at denne forudsætning kunne opfyldes. Men multipel regressionsanalyse er derudover underlagt en række strenge forudsætninger, som ordinal regressionsanalyse er mere robust over for brud af dette gælder ikke mindst antagelsen om normalitet og konstant varians (Agresti, 1990; Hair et al., 1998; Menard, 1995; Sharma, 1996). Som overskriften antyder, vælges ordinal regressionsanalyse derimod til formålet. Den ordinale regressionsmodel, som også går under navnet the cumulative logit model, estimerer effekten af de uafhængige variable på log-odds ved at have lavere frem for højere værdier af den afhængige variabel. Det vil i dette tilfælde sige, hvilken effekt de forskellige mulige forklarende variable har på log-odds ved at have mindre nøjagtig prisviden frem for mere nøjagtig prisviden (målt ud fra price recall-testen) i forhold til kategoriseringen i J antal kategorier. 274

25 Grundlæggende antages, at der eksisterer en kontinuert latent variabel, y*, som udtrykker graden af nøjagtig price recall, y. Ved en opdeling af graden af nøjagtig price recall i fire kategorier (trin) er der ikke længere tale om komplet information om den latente variabel. Til gengæld giver det mulighed for at forklare forskelle i graden af nøjagtig prisviden. Forholdet mellem y* og y kan illustreres som vist nedenfor (Agresti, 1990; Long, 1997):! 1! 2! 3 y* y τ værdierne på skalaen for y* kaldes thresholds eller cutpoints (herefter benævnt afskæringsværdier). I dette tilfælde opdeler de tre afskæringsværdier τ 1 τ 2 og τ 3 skalaen i fire dele, hvilket svarer til opdelingen af nøjagtigheden af forbrugernes prisviden i fire kategorier. Den strukturelle model er: y* = β 1 x 1 + β 2 x β k x k +ε =xβ + ε hvor x 1... x k udgør de uafhængige variable, mens β 1... β k refererer til parameterestimaterne for k = 1 til K. Som ved logistisk regressionsanalyse kan maximum likelihood-metoden anvendes til at estimere modellen. For at kunne anvende denne metode må der antages en specifik fordeling for fejlleddet, ε. Det typiske er at antage en logistisk fordeling for fejlleddene 9 (Long, 1997). Med antagelse om en logistisk fordeling for fejlleddet kan 9 Dette svarer til logit link-funktionen i SPSS. Valget heraf bevirker, at fortolkningen af de forklarende variable kommer til at minde om fortolkningen i de logistiske regressionsanalyser ovenfor. Logit linkfunktionen vælges derudover, fordi alle tre modeller efterfølgende viser sig at opfylde den vigtige forudsætning om parallelle linier ved anvendelse af logit linkfunktionen (Agresti, 1990; Long, 1997). 275

26 den ordinale regressionsmodel skrives på følgende måde 10 (Agresti, 1990; Long, 1997): ln P(Y j) = τ j - Σ β k x k for j = 1 til J - 1 og k = 1 til K (4) P(Y > j) I denne ligning udgør τ j afskæringsværdierne. Effekten af de uafhængige variable β k x k bliver i modsætning til normalt fratrukket afskæringsværdien, hvilket indikerer, at positive β-koefficienter øger sandsynligheden for en højere score på den afhængige variabel og vice versa for negative β-koefficienter (Agresti, 1990). Afskæringsværdierne for J 1 kategorier udtrykker den afhængige variabels kategoriske natur i denne sammenhæng. På den baggrund kan der også beregnes sandsynligheder for, at forbrugeren tilhører en af de fire kategorier. For eksempel kan sandsynligheden for, at forbrugeren er mere end 20 procent fra den faktiske pris (trin 1), udtrykkes ved hjælp af følgende model: P (y = 1 x) = P (y* < τ 1 ) = e τ 1 - xβ.(1 (5) 1 + e τ 1 - x β De J - 1 afskæringsværdier (τ j ) og de K regressionskoefficienter (β) er ukendte parametre, som skal estimeres ved hjælp af maximum likelihoodmetoden (Agresti, 1990; Long, 1997). Den ordinale regressionsmodel antager, at de uafhængige variable har samme koefficient for alle kategorier af den afhængige variabel, hvilket svarer til en antagelse om parallelle regressioner (Long, 1997). Der er her tale om en kritisk forudsætning, som kan verificeres ved hjælp af test of parallel lines. En insignifikant testværdi indikerer, at det ikke kan afvises, at der er tale om ens koefficienter på tværs af kategorierne af den afhæn- 10 Ved at multiplicere med den naturlige logaritme på begge sider i formel (4) kan modellen udtrykkes i odds-ratio i stedet for log-odds. 276

27 gige variabel. Long (1997) gør opmærksom på, at denne forudsætning ofte brydes. Den deraf følgende signifikante test af forudsætningen om parallelle linier indikerer i den forbindelse, at man bør overveje en anden fremgangsmåde, såsom multinominal logit-analyse (Long, 1997). Det er de samme uafhængige variable, som beskrevet ovenfor i afsnit , der indgår i modelsøgningen med de samme forskelle mellem modelsøgningen for målingen før butiksbesøget i forhold til under og efter butiksbesøget. Der findes ingen decideret guide til modelsøgning, når det gælder ordinal regressionsanalyse (Agresti, 1990; Long, 1997). Derfor må der nødvendigvis blive tale om en manuel modelsøgning styret af henholdsvis substantielle betragtninger (som beskrevet ovenfor i prioriteringen i fire blokke) samt trial-and-error. Kriterierne, der kan lægges til grund, vil være en blanding af ændring i pseudomål for modellens forklaringsgrad (McFadden, Cox & Snell og Nagelkerke R 2 ), de forklarende variables signifikansniveau, face validity og ikke mindst test af forudsætningen om parallelle linier. Den afhængige ordinale variabel tager udgangspunkt i absolut procentvis afvigelse fra den faktiske pris, hvorved det bliver et mål for nøjagtigheden af forbrugernes bud i price recall-testen. Denne variabel kan opdeles i et antal afgrænsede kategorier (trin) på næsten uendelig mange måder. Valget faldt til slut på følgende fire trin med stigende nøjagtighed: 1. Procentafvigelse fra den faktiske pris > 20 % % procentafvigelse fra den faktiske pris < 10 % % procentafvigelse fra den faktiske pris < 0 % 4. Procentafvigelse fra den faktiske pris = 0 % Seks kategorier blev også afprøvet, men der var begrundet formodning, om at forskellene ville blive udvandede ved en opdeling i for mange trin. Den viste kategorisering i en ordinal skala med fire trin tager afsæt i (1) unøjagtig prisviden (over 20 % afvigelse), (2) nogenlunde operationel prisviden i forhold til at genkende et godt eller dårligt køb (10-20 % fra den faktiske pris, som også indgår i deal spotting-testen), (3) nogenlunde nøjagtig pris- 277

Bilag 11: Svarfordeling i forhold til indsamlingssted og produktkategori

Bilag 11: Svarfordeling i forhold til indsamlingssted og produktkategori Bilag 11: Svarfordeling i forhold til indsamlingssted og produktkategori 469 Bilag 12: Argumentation for ekskludering af prisinvolveringsitems Items med lave og/eller tvetydige komponentladninger blev

Læs mere

S P Ø R G E S K E M A

S P Ø R G E S K E M A Bilag 10: Spørgeskema til hjemmeudfyldning S P Ø R G E S K E M A Handelshøjskolen i Århus 2005 Undersøgelse af prisviden blandt kunder i Føtex og Bilka 2005 IP Nummer: xxxx xxxx-xxxx-xxxx 461 Velkommen

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008 Indholdsfortegnelse 1 INDLEDNING OG PROBLEMSTILLING... 2 1.1 OVERVÆGT SOM CASE... 2 2 ANALYSEFORBEREDELSER... 4 2.1 HEPRO-UNDERSØGELSEN... 4 2.2 DEN AFHÆNGIGE VARIABEL VIGTIGHED AF ÆNDRINGEN AF VÆGT...

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Hver anden vil benytte øget åbningstid i dagtilbud

Hver anden vil benytte øget åbningstid i dagtilbud Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Rapport: Faktorstrukturen for spørgsmål i Studiemiljø2011, Aarhus Universitet

Rapport: Faktorstrukturen for spørgsmål i Studiemiljø2011, Aarhus Universitet Rapport: Faktorstrukturen for spørgsmål i Studiemiljø2011, Aarhus Universitet Herrmann, Kim Jesper 1 & Anna Bager Center for Uddannelse og Læring, Aarhus Universitet Nærværende rapport har til formål at

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

HYPOTESE 1 - MULTIPEL REGRESSION...

HYPOTESE 1 - MULTIPEL REGRESSION... Indholdsfortegnelse Bilag 1 - TM Graveyard Model... 1 Bilag 2 - Persontransport i Danmark... 1 Bilag 3 - SG&A udgifter for TM i perioden 2010-2014... 2 Bilag 4 - Nyregistrerede biler i perioden 2011-2014...

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Skriftlig eksamen i samfundsfag

Skriftlig eksamen i samfundsfag OpenSamf Skriftlig eksamen i samfundsfag Indholdsfortegnelse 1. Introduktion 2. Præcise nedslag 3. Beregninger 3.1. Hvad kan absolutte tal være? 3.2. Procentvis ændring (vækst) 3.2.1 Tolkning af egne beregninger

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Politisk tillid. Figur 3.2. Politisk deltagelse: effekten af åbenhed ved høj og lav politisk interesse 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1.

Politisk tillid. Figur 3.2. Politisk deltagelse: effekten af åbenhed ved høj og lav politisk interesse 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1. Figur 3.2. Politisk deltagelse: effekten af åbenhed ved høj og lav politisk interesse 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Lav åbenhed Høj åbenhed Lav politisk interesse Høj politisk interesse Politisk tillid

Læs mere

Markante sæsonudsving på boligmarkedet

Markante sæsonudsving på boligmarkedet N O T A T Markante sæsonudsving på boligmarkedet 9. marts 0 Denne analyse estimerer effekten af de sæsonudsving, der præger prisudviklingen på boligmarkedet. Disse priseffekter kan være hensigtsmæssige

Læs mere

FORBRUGERNES PRISVIDEN FØR,

FORBRUGERNES PRISVIDEN FØR, FORBRUGERNES PRISVIDEN FØR, UNDER OG EFTER BUTIKSBESØGET HVILKEN PRISVIDEN ER FORBRUGERNE I BESIDDELSE AF FØR, UNDER OG EFTER KØB AF DAGLIGVARER OG HVAD KAN FORKLARE FORSKELLE I FORBRUGERNES PRISVIDEN?

Læs mere

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Metodenotat: Beregning af indikatorer i den nationale trivselsmåling i folkeskolen

Metodenotat: Beregning af indikatorer i den nationale trivselsmåling i folkeskolen Metodenotat: Beregning af indikatorer i den nationale trivselsmåling i folkeskolen Indledning I aftalen om et fagligt løft af folkeskolen er det beskrevet, at der skal udvikles en række indikatorer for

Læs mere

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Et psykisk belastende arbejde har store konsekvenser for helbredet

Et psykisk belastende arbejde har store konsekvenser for helbredet Flere gode år på arbejdsmarkedet 5. maj 2017 Et psykisk belastende arbejde har store konsekvenser for helbredet Risikoen for at have et dårligt psykisk helbred mere end fordobles for personer med et belastende

Læs mere

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1 Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006 Økonometri 1: F9 1 Program frem til efterårsferien Om goodness-of-fit, prediktion og residualer (kap. 6.3-4) Kvalitative egenskaber i den multiple

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006 Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

Anna Kock Maj Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000

Anna Kock Maj Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000 Bilag Bilag 1: Oversigt over bilag på CD Bilag 7: Interview med Anders Rene Jensen, indkøbs- og marketingchef i Rema 1000 Bilag 8: Interview med Alexander Jensen, købmand i Rema 1000 Bilag 9: Bilag 10:

Læs mere

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Center for Statistik. Multipel regression med laggede responser som forklarende variable Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der

Læs mere

Projekt 6.1 Rygtespredning - modellering af logistisk vækst

Projekt 6.1 Rygtespredning - modellering af logistisk vækst Projekt 6.1 Rygtespredning - modellering af logistisk vækst (Projektet anvender værktøjsprogrammet TI Nspire) Alle de tilstedeværende i klassen tildeles et nummer, så med 28 elever i klassen uddeles numrene

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne 3. ARBEJDSMILJØET OG ARBEJDSMILJØARBEJDET I dette afsnit beskrives arbejdsmiljøet og arbejdsmiljøarbejdet på de fem FTF-områder. Desuden beskrives resultaterne af arbejdsmiljøarbejdet, og det undersøges

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Kapitel 13 Reliabilitet og enighed

Kapitel 13 Reliabilitet og enighed Kapitel 13 Reliabilitet og enighed Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 Version 11. april 2011 1 / 23 Indledning En observation er sammensat af en sand værdi og en målefejl

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine

Læs mere

Bilag 1: Spørgeskemaer og kvantitativ analyse

Bilag 1: Spørgeskemaer og kvantitativ analyse Bilag 1: Spørgeskemaer og kvantitativ analyse Bortfaldsanalyse: Spørgeskema om organisering Spørgeskemaet om organiseringen af MED-systemet blev sendt til i alt 99 respondenter. Respondenterne var enten

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

LUP Fødende læsevejledning til afdelingsrapporter

LUP Fødende læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Bilag 16: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed.

Bilag 16: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed. Bilag 16: Robusthedsanalyser af effektiviseringspotentialerne Bilaget indeholder analyser af effektiviseringspotentialernes robusthed. FORSYNINGSSEKRETARIATET FEBRUAR 2013 INDLEDNING... 3 1. COSTDRIVERSAMMENSÆTNING...

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program Dagens program Økonometri 1 FunktioneI form i den lineære regressionsmodel 19. oktober 004 Mere om funktionel form (kap 6.) Log transformation Kvadratisk form Interaktionseffekter Goodness of fit (kap.

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Metodenotat FLIS sammenligningskommuner 2016-data

Metodenotat FLIS sammenligningskommuner 2016-data Metodenotat FLIS sammenligningskommuner 2016-data Dette notat præsenterer metoden bag beregningen af de modeller, der anvendes til bestemmelse af sammenligningskommuner i FLIS. Den seneste beregning er

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2 Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Ref. PIL/- 17.02.2016 Indledning I dette notat præsenteres resultater fra en analyse af lønforskellen mellem mænd og kvinder. Analysen

Læs mere

Faktoranalyse. Udarbejdet af: Simon Calmar Andersen Lau Andreassen. Bilag til ekspertgruppens anbefalelsesnotat. TrygFondens Børneforskningscenter

Faktoranalyse. Udarbejdet af: Simon Calmar Andersen Lau Andreassen. Bilag til ekspertgruppens anbefalelsesnotat. TrygFondens Børneforskningscenter Faktoranalyse Bilag til ekspertgruppens anbefalelsesnotat TrygFondens Børneforskningscenter 28. september 2017 Udarbejdet af: Simon Calmar Andersen Lau Andreassen 1 For at understøtte skolernes arbejde

Læs mere

Seminaropgave: Præsentation af idé

Seminaropgave: Præsentation af idé Seminaropgave: Præsentation af idé Erik Gahner Larsen Kausalanalyse i offentlig politik Dagsorden Opsamling på kausalmodeller Seminaropgaven: Praktisk info Præsentation Seminaropgaven: Ideer og råd Kausalmodeller

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1 Økonometri 1 Inferens i den lineære regressionsmodel 25. september 2006 Økonometri 1: F6 1 Oversigt: De næste forelæsninger Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan

Læs mere

Statistik & Skalavalidering

Statistik & Skalavalidering å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Effekten af indvandring på indfødte danskeres løn og beskæftigelse

Effekten af indvandring på indfødte danskeres løn og beskæftigelse d. 22.05.2017 Brian Krogh Graversen (DØRS) Effekten af indvandring på indfødte danskeres løn og beskæftigelse I kapitlet Udenlandsk arbejdskraft i Dansk Økonomi, forår 2017 analyseres det, hvordan indvandringen

Læs mere

GRIBSKOV KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2019 DAGTILBUD, SKOLE, FO OG KLUB

GRIBSKOV KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2019 DAGTILBUD, SKOLE, FO OG KLUB GRIBSKOV KOMMUNE FORÆLDRETILFREDSHEDSUNDERSØGELSE 2019 DAGTILBUD, SKOLE, FO OG KLUB INDHOLD Afsnit 1 Introduktion Side 02 Afsnit 2 Sammenfatninger Side 04 Afsnit 3 Resultater dagtilbud Side 08 Afsnit 4

Læs mere

Uddybende beregninger til Produktivitetskommissionen

Uddybende beregninger til Produktivitetskommissionen David Tønners Uddybende beregninger til Produktivitetskommissionen I forlængelse af mødet i Produktivitetskommissionen og i anledning af e-mail fra Produktivitetskommissionen med ønske om ekstra analyser

Læs mere