Fordele og ulemper ved Institut for Erhvervsstudier, Aalborg Universitet
Disposition Hvad er (klassisk)? Eksempel på anvendelse Senere udviklinger Eksemplet fortsat Fordele og ulemper ved latent klasseanalyse
Hvad er (klassisk)? Paul F. Lazarsfeld, o. 1950 og frem til 1968 Faktoranalyse af kvalitative data? Begrebet statistisk forklaring (Mosteller) Estimation med tvivlsomme metoder Leo A. Goodman, 1974-1980 Et specialtilfælde af den log-lineære model til analyse af antalstabeller ML estimation af modellens parametre Første computerprogram (Clogg s MLLSA, 1977) Falder ind under modeller med incomplete data, Dempster, Laird & Rubin (1977)
Eksempel på anvendelse af (klassisk) latent klasseanalyse Forbrugerklageundersøgelsen 1978 Repræsentativ undersøgelse med 600 respondenter 6 hypotetiske situationer A - F For hver situation bliver respondenten spurgt om han/hun vil klage i situationen Eksempel
Eksempel på anvendelse af Formålet med spørgsmålene er at måle forbrugernes klagetilbøjelighed Hertil blev først anvendt itemanalyse i form af en Rasch-model Med 6 items giver modellen grundlæggende en klassifikation i 7 grupper, hvoraf de to ydergrupper (klager aldrig, klager i hver situation) er ikkeskalerbare Data blev senere analyseret med MLLSA med følgende resultat
Eksempel på anvendelse af 6
Eksempel på anvendelse af Vurdering af goodness-of-fit Bestemmelse af antal klasser ved AIC, BIC, o.l. For et givet antal klasser 2 -statistics, Pearson og specielt L 2 Hypotesetests ved betinget testning af nestede modeller Restriktioner på parametrene Værdirestriktioner Lighedsrestriktioner Tilordning af hver respondent til klassen med størst recruitment probability (Bayes teorem)
Eksempel på anvendelse af Modellen giver altså En opdeling af respondenterne efter deres forskellige klageprofil Et estimat over størrelsen af klasserne For et givet antal klasser, et goodness-of-fit -mål baseret på 2 -fordelingen Mulighed for hypotesetest ved betinget testning En klassifikation af respondenter, der i princippet gør den latente klassevariabel manifest
Udvikling af den latente klasse model De gyldne år 1980 ca. 2000 Flere anvendelser Udvikling den grundlæggende model Mixed Markov og Latent Markov (Poulsen, 1982) Mixed Latent Markov (Langeheine & van der Pol, (1990) LK-modellen som logistisk regression, (Kamakura & Russel, 1989) Softwareudvikling, PANMARK, lem, Latent GOLD LK modellen som et ikke-parametrisk alternativ til Bayesianske metoder og multi-level modellering Ca. 2000 En række stadig mere raffinerede, men også mere komplekse modeller, især knyttet til Vermundts & Magidsons Latent GOLD program
Eksempel på mere avanceret brug af Klageundersøgelsen blev fulgt op i 2002 De samme 6 situationer anvendtes med henblik på sammenligning af strukturen på de to tidspunkter Resultatet
* N.B. Kun 2 klasser Eksempel på mere avanceret brug af 1978 2002 1.00 1.00 0.90 0.90 0.80 0.80 0.70 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 A D E B F C 0.60 0.50 0.40 0.30 0.20 0.10 0.00 A D E B F C Klasse 1 (54%) Klasse 2 Klasse 1 (57%) Klasse 2 (43%) A = Sokker, B =Tæppe, C = Køleskab, D = Bukser og trøje, E = Ægte bihonning, F = Bogreol Postalt udsendt skema efter en telefonisk rekruttering Forskellene mellem de to modeller kan formelt testes ved en gruppe analyse, Goodman & Clogg (1982)
Eksempel på mere avanceret brug af I 2002 tilføjedes 4 nye situationer, G J, som var inspirerede af typiske sager fra Forbrugerklagenævnet De indeholdt hver en række elementer, som blev varieret eksperimentelt i et telefonisk interview (CATI)
Situation G: Eksempel på mere avanceret brug af 1. 4 mdr. 2. 8 mdr. 3. 12 mdr. 1. Et lavprisvarehus 2. En skoforretning 1. 600 kr. 2. 1,000 kr. 3. 1,200 kr. Hver respondent fik et tilfældigt valgt niveau af de tre eksperimentelle faktorer præsenteret. Der er således 18 varianter af denne klagesituation.
Situation H: Eksempel på mere avanceret brug af 1. Nystartet PC butik 2. Autoriseret PC forhandler 1. 8,000 kr. 2. 10,000 kr. 3. 12,000 kr. Hver respondent fik et tilfældigt valgt niveau af de to eksperimentelle faktorer præsenteret. Der er således 6 varianter af denne klagesituation.
Eksempel på mere avanceret brug af 603 respondenter svarede på alle 10 situationer Vi havde vi nu for at estimere følsomheden i klagetilbøjeligheden over for de varierede elementer Men, bemærk, at vi analyserer de 10 situationer, A J, simultant
Eksempel på mere avanceret brug af Generel klagetilbøjelighed, betinget af klassen Situationsbestemt klagetilbøjelighed, betinget af klassen Situationsspecifikke effekter, betinget af klassen e e e e e 0,44 0,02 0,11 0,01 0,62 e 1,16 odds klage 1,16 e Pr klage 0, 76 1,16 1 e i den specificerede situation
Fordele og ulemper ved latent klasseanalyse Fordele Grundlæggende er der tale om en mixture af multinomiske choice-modeller (Derfor) Meget anvendelig i analyser af surveys, panel data o.l. inden for samfundsforskningen Et modelbaseret alternativ til datadrevet klyngeanalyse Generel model til håndtering af (parameter-) heterogenitet Let at kommunikere resultater Actionable Adgang til brugervenlig software (Latent GOLD læser og skriver SPSS-filer)
Fordele og ulemper ved latent klasseanalyse Ulemper Ikke en integreret del af gængse statistikpakker, dog har SAS nu siden 2009 en PROC LSA Bestemmelsen af antal klasser og goodness-of-fit baseres på heuristikker Kræver datasæt (antal respondenter) af en vis størrelse, men ikke større end sædvanlige surveys (500 1500) Diskret beskrivelse af heterogenitet vil nogen se som en (for) grov approksimation til fænomener som mere naturligt antages at variere kontinuert Med mange klasser kan antallet af estimerede parametre blive stort
Latent klasse analyse Hvis man vil vide mere Goodman s klassiske artikler er værd at læse, selv om de er noget omstændelige McCutcheon, A. L. (1987): Latent Class Analysis. Sage university Paper, no. 64 Hagenaars, J. A. (1993): Loglinear Models with Latent Variables. Sage university Paper, no. 94 Rost, J. & Langeheine, R. (1997): Applications of Latent Trait and Latent Class Models in the Social Sciences. Waxman. Hagenaars, J. A. & McCutcheon, A. L. eds. (2002): Applied Latent Class Analysis. Cambridge University Press. Software En oversigt findes på adressen http://www.john-uebersax.com/stat/soft.htm Latent Gold er anvendt til eksemplet i denne præsentation