Hvordan finder man en god skala vha. Raschmetoden? Svend Kreiner & Tine Nielsen



Relaterede dokumenter
To spørgsmål: Hvilken betydning har de manglende svar på items for målingen af spiritualitet?

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Linear Programming ١ C H A P T E R 2

Nationale test. v. Marie Teglhus Møller. Slides er desværre uden eksempelopgaver, da disse ikke må udleveres.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

2.7. HVAD BETYDER DET EGENTLIG AT BETEGNE SIG SELV SOM TROENDE?

Metoder anvendt til validering af skalaer i LUP og resultater af analyser

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Logistisk Regression - fortsat

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US

Statistik II 4. Lektion. Logistisk regression

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Ikke-parametriske tests

Analyse af binære responsvariable

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Kvant Eksamen December timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Generelle lineære modeller

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

SPØRGESKEMAER, SKALAER OG TESTS SIGNE BOE RAYCE

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Program dag 2 (11. april 2011)

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Løsning til øvelsesopgaver dag 4 spg 5-9

Kapitel 12 Variansanalyse

Synopsis til eksamen i Statistik

Multipel Lineær Regression

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Elaborering: Analyse af betingede relationer

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Kvantitative Metoder 1 - Forår Dagens program

Cross-Sectorial Collaboration between the Primary Sector, the Secondary Sector and the Research Communities

Reeksamen i Statistik for Biokemikere 6. april 2009

Project Step 7. Behavioral modeling of a dual ported register set. 1/8/ L11 Project Step 5 Copyright Joanne DeGroat, ECE, OSU 1

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Eksamen i Statistik og skalavalidering

Eksamen i statistik 2009-studieordning

Analyse af PISA data fra 2006.

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

How consumers attributions of firm motives for engaging in CSR affects their willingness to pay

MPH specialmodul Epidemiologi og Biostatistik

Basic statistics for experimental medical researchers

Module 4: Ensidig variansanalyse

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Statistiske Modeller 1: Kontingenstabeller i SAS

Eksamen Efterår 2013

Kvantitative Metoder 1 - Efterår Dagens program

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Statistiske principper

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget?

Statistik & Skalavalidering

Kapitel 12 Variansanalyse

Measuring Evolution of Populations

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Fang Prikkerne. Introduktion. Scratch

Hvad er ateisme? Hvordan bliver man ateist? Dansk Ateistisk Selskab. Ateisme er kort og godt fraværet af en tro på nogen guddom(me).

To samhørende variable

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Epidemiologi og Biostatistik

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Godtgørelse: Hvad skal det til for?

Meget formel, modtager har en meget speciel titel som skal bruges i stedet for deres navne

Lineær og logistisk regression

Meget formel, modtager har en meget speciel titel som skal bruges i stedet for deres navne

Kønsproportion og familiemønstre.

TM4 Central Station. User Manual / brugervejledning K2070-EU. Tel Fax

Afgrænsning af miljøvurdering: hvordan får vi den rigtig? Chair: Lone Kørnøv MILJØVURDERINGSDAG 2012 Aalborg

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Afdeling for Anvendt Matematik og Statistik December 2006

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

To-sidet varians analyse

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Løsning til opgave i logistisk regression

Project in Statistics MB

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

MENNESKET JESUS KRISTUS PDF

Besvarelse af vitcap -opgaven

Transkript:

Hvordan finder man en god skala vha. Raschmetoden? Svend Kreiner & Tine Nielsen 1

Svaret: Man spørger en, der har forstand på det, som man gerne vil måle 2

Eksempel: Spiritualitet Peter A., Peter G. & Peter L.: Man tæller antal positive svar på følgende fem spørgsmål: Which, if any, of the following do you believe in? God Life after death Hell Heaven Sin Reincarnation 3

Efter at man har fundet skalaen følger det spørgsmål som burde have været titlen på foredraget: Hvordan kan man vurdere om man har fundet en god skala? Og hvad gør man, hvis det ikke er tilfældet? Her kan Rasch modellen være til hjælp fordi den stiller så store krav til skalaen, at man kan bruge den som en gold standard. 4

Rasch modellen 5

Rasch modellens krav til gode skalaer 1) Unidimensionalitet 2) Monotonicitet 3) Lokal uafhængighed 4) Ingen DIF 5) Sufficient data reduktion Konsekvenserne: P(Item 1 ) i exp( θ α ) 1 exp( ) i = θ = + θ α i Begrebsvaliditet Kriterievaliditet Specifik objektivitet Enkelhed 6

Modelkontrollen Udled og afprøv en række hypoteser, som alle er sande, hvis modellen er sand. Afledte model-hypoteser: Item parametrene er de samme i alle delpopulationer Ingen DIF: Items og exogene variable er betinget uafhængige givet den samlede score Lokal uafhængighed: Items er parvis betinget uafhængige givet delscores uden det ene item Forventede residualer (= observeret forventet) er lig med 0 7

Item parametrene er de samme i alle delpopulationer Såkaldte betingede maximum likelihood tests CLR df p ---------------------------- scoregroups 31.9 5 0.000 G: RELIGION 185.0 15 0.000 L: TROENDE 118.6 5 0.000 M: GÅIKIRKE 140.8 15 0.000 K: KIRKE 20.8 5 0.001 Q: KOHORTER 106.4 30 0.000 P: KØN 36.1 5 0.000 Rasch modellen bliver afvist på alle fronter 8

Residual analyser (item fits) Sammenligninger mellem den forventede korrelation mellem items og restscores Gamma Item observed expected sd p -------------------------------------------------- A - GUD 0.729 0.760 0.028 0.2563 B - EVIGTLIV 0.835 0.762 0.025 0.0028 high ** C - HELVEDE 0.921 0.776 0.033 0.0000 high *** D - PARADIS 0.889 0.777 0.027 0.0000 high *** E - SYND 0.734 0.774 0.026 0.1162 F - REINKARN 0.590 0.777 0.027 0.0000 low *** -------------------------------------------------- Critical levels adjusted by the Benjamini-Hochberg procedure: FDR = 0.05 reject if p<= 0.0333 FDR = 0.01 reject if p<= 0.0067 FDR = 0.001 reject if p<= 0.0005 9

DIF analyser Tests af betinget uafhængighed mellem items og exogene variable givet den samlede score GUD LIV HELVEDE PARADIS SYND REINKAR A B C D E F ------------------------------------------------------------ G RELIGION Gamma 0.491-0.454-0.002 0.242 0.215-0.431 p 0.000 0.000 0.986 0.041 0.017 0.000 L TROENDE Gamma 0.923-0.764-0.502-0.347-0.318-0.661 p 0.000 0.000 0.366 0.190 0.133 0.003 M GÅIKIRKE Gamma 0.341-0.200 0.075 0.236 0.078-0.378 p 0.000 0.033 0.635 0.028 0.362 0.000 K KIRKE Gamma 0.690-0.334-0.581-0.359-0.128-0.221 p 0.013 0.167 0.075 0.250 0.587 0.286 Q KOHORTER Gamma 0.305-0.334 0.041 0.163 0.106-0.209 p 0.000 0.000 0.776 0.082 0.214 0.001 P KØN Gamma -0.076-0.223 0.388-0.094 0.535-0.214 p 0.429 0.059 0.058 0.429 0.000 0.047 10

Analyse af lokal uafhængighed Test af parvis betinget uafhængighed mellem items A B C D E F ------------------------------------------------------------ A GUD Gamma -0.059-0.043 0.462 0.307-0.511 p 0.857 0.762 0.011 0.020 0.000 B EVIGTLIV Gamma -0.594 0.281 0.122-0.594 0.732 p 0.000 0.429 0.619 0.000 0.000 C HELVEDE Gamma -0.231-0.019 0.715 0.582-0.824 p 0.805 0.992 0.001 0.001 0.000 D PARADIS Gamma 0.314-0.028 0.617 0.287-0.626 p 0.122 0.857 0.002 0.020 0.000 E SYND Gamma 0.436-0.364 0.734 0.618-0.747 p 0.012 0.021 0.000 0.000 0.000 F REINKARN Gamma -0.736 0.899-0.298-0.211-0.719 p 0.000 0.000 0.333 0.241 0.000 11

Det er ikke vanskeligt at vise at Rasch modellen ikke holder Kunsten er at finde ud af, hvad der er galt fordi ét problem af en bestemt type kan føre til evidens (testresultater) der antyder at der er tale om helt andre problemer. Multidimensionalitet Lokalt afhængige items, DIF & misfit Lokalt afhængige items resultater der antyder multidimensionalitet DIF resultater der antyder multidimensionalitet, lokal afhængighed og anden form for DIF osv., osv., osv. 12

Virkeligheden Reinkarnation hører ikke til i skalaen, men spørgsmålet om et liv efter døden gør Items er lokalt uafhængige, men der er en hel del differentiel item funktion 13

Generelt: Kirkegængere er mere spirituelle end ikke kirkegængere og de spirituelle synes i højere grad end de ikke spirituelle, at religion er vigtigt. DIF: alt andet lige 1) troende og medl. af folkekirken tror mere på Gud end andre, 2) tror dem, der synes religion er vigtigt mindre på et liv efter døden end andre 3) medl. af folkekirken tror mindre på helvede end andre 4) tror mænd mere på synd end kvinder 14

Modelkontrollen CLR df p ---------------------------- scoregroups 10.8 11 0.462 G: RELIGION 29.8 21 0.096 L: TROENDE 11.0 9 0.277 M: GÅIKIRKE 38.2 33 0.246 K: KIRKE 16.5 7 0.021 Q: KOHORTER 91.5 66 0.021 P: KØN 9.6 10 0.476 Gamma Item observed expected sd p -------------------------------------------------- A - GUD 0.776 0.774 0.027 0.9479 B - EVIGTLIV 0.741 0.758 0.025 0.5116 C - HELVEDE 0.945 0.926 0.020 0.3345 D - PARADIS 0.915 0.858 0.021 0.0067 E - SYND 0.772 0.810 0.025 0.1208 -------------------------------------------------- 15

Konklusion: Ingen ren Rasch skala, men da der kan justeres for DIF en er det et mindre problem +--------------------+ DIF equated scores +--------------------+ DIF sources: G - RELIGION L - TROENDE K - KIRKE P - KØN GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP score 1111 2111 3111 4111 1211 2211 3211 4211 1121 2121 3121 4121 1221 2221 3221 4221 ----------------------------------------------------------------------------------------------------------------------- 1 1.00 1.02 1.04 1.07 0.96 0.97 1.00 1.02 1.33 1.35 1.39 1.44 1.14 1.16 1.18 1.20 2 2.00 2.05 2.15 2.28 1.85 1.89 1.96 2.05 2.15 2.19 2.28 2.39 1.81 1.84 1.89 1.95 3 3.00 3.06 3.19 3.42 2.67 2.72 2.82 2.99 2.95 3.00 3.11 3.28 2.49 2.53 2.63 2.76 4 4.00 4.02 4.08 4.21 3.45 3.49 3.58 3.76 3.72 3.75 3.82 3.96 3.27 3.31 3.42 3.63 GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP GLKP score 1112 2112 3112 4112 1212 2212 3212 4212 1122 2122 3122 4122 1222 2222 3222 4222 ----------------------------------------------------------------------------------------------------------------------- 1 0.86 0.87 0.89 0.90 0.84 0.84 0.86 0.87 1.15 1.16 1.19 1.21 1.01 1.02 1.04 1.06 2 1.69 1.72 1.78 1.86 1.59 1.62 1.67 1.72 1.88 1.91 1.97 2.06 1.61 1.63 1.67 1.71 3 2.67 2.74 2.89 3.16 2.39 2.44 2.54 2.70 2.69 2.74 2.86 3.06 2.24 2.28 2.36 2.47 4 3.90 3.93 4.01 4.17 3.27 3.32 3.43 3.65 3.60 3.63 3.72 3.90 3.04 3.09 3.22 3.47 Men det ville være væsentligt nemmere (bedre?) hvis vi havde haft en ren Rasch skala. 16

Hvordan kan skalaen så forbedres (i Rasch-termer)? Nielsen & Kreiners strategi for itemmodicifering/erstatning! 17

Item-analyse strategi 1) Do item responses fit a Rasch model? If not: 2) Do item responses fit a loglinear Rasch model? (Uniform DIF and LD) Yes: Should items be modified or replaced anyway? No: Which items should be eliminated from analysis and considered modified or replaced? - Repeat cycle 18

Overview modificerings-strategi Results of graphical loglinear Rasch analyses Results of subject matter analyses point directly to or combine into decision of or point directly to modificational action 19

20

Spritualitetsskala, alle problemer af samme typer: LLRM med uniform DIF kombineret med type D (uklart mål) Løsning erstat spørgsmål med nyt 21

Liste over identificerede problemer og forslag 1) DIF ( Religion i forhold til spørgsmålet om tro på et liv efter døden) kombineret med problemtype D (uklart mål) Kan spørgsmålet om tro på et liv efter døden formuleres således at det fungerer ens for personer som synes religion er vigtigt hhv. mindre vigtigt? Forslag: Begrebet et liv efter døden spørges til på klarere måde, da det kan betyde flere ting (på jorden, i himlen, i helvede, osv.) 2) DIF ( Kirke i forhold til spørgsmålet om tro på Gud) kombineret med problemtype D (uklart mål) Kan spørgsmålet om tro på Gud formuleres således at det fungerer ens for personer, der er medlem af folkekirken/trossamfund hhv. ikke er? Forslag: Begrebet Gud spørges til på klarere måde. Overvejelse: Måske ved blot at skrive med småt, da Gud med stort kan have forskellig betydning både for medlemmer af forskellige trossamfund og for medlemmer ikke medlemmer eks. nok mest medlemmer af kristne trossamfund, der skriver Gud med stort, men det betyder jo ikke at medlemmer af andre ikke tror på gud/guder, men måske ikke Gud 22

3) DIF ( Troende i forhold til spørgsmålet om tro på Gud) kombineret med problemtype D (uklart mål) Kan spørgsmålet om tro på Gud formuleres således at det fungerer ens for troende hhv. ikke troende personer? Forslag: Begrebet Gud spørges til på klarere måde. Overvejelse: Måske ved blot at skrive med småt, da Gud med stort må forventes at have en anden mening for et troende menneske end hhv. et ikke-troende menneske og en overbevist ateist 23

4) DIF ( Kirke i forhold til spørgsmålet om tro på helvede) kombineret med problemtype D (uklart mål) Kan spørgsmålet om tro på helvede formuleres således at det fungerer ens for personer, der er medlem af folkekirken/trossamfund hhv. ikke er? Forslag: Begrebet helvede spørges til på klarere måde. 24

5) DIF ( Køn i forhold til spørgsmålet om tro på synden) kombineret med problemtype D (uklart mål) Kan spørgsmålet om tro på synden formuleres således at det fungerer ens for mænd og kvinder? Forslag: Begrebet synden spørges til på klarere måde. Overvejelse: Er der nogen bestemt grund til at der spørges til synden og ikke synd virker som om der spørges til noget bestemt, dog uden at det er helt klart hvad det er? 25

Næste skridt 2 muligheder Faglig/teoretisk bearbejdning af spørgsmål (eksperterne) Fokusgruppeinterviews med repræsentanter fra de grupper af respondenter, der definerer exogene variabelkategorier mhp. afdækning af hvordan de problematiske begreber opfattes 26

Afprøvning af strategi på 13 læringsstils-skalaer Bedste pilot skalaer 13 skalaer med et varierende antal items inkluderet: 4 skalaer med 8 items alle GLLRM 3 skalaer med 7 items alle GLLRM 5 skalaer med 6 items 4 GLLRM + 1 RM 1 skala med 5 items RM Bedste reviderede skalaer (efter modificering) 13 skalaer med minimum 7 items inkluderet: 8 skalaer med 8 items 6 GLLRM + 2 RM 5 skaler med 7 items 3 GLLRM + 2 RM 27

Systematisk kombination af statistisk & indholdsmæssig analyse viste sig effektiv 10 skalaer viste store forbedringer 7 skalaer har flere items 3 skalaer er forbedret fra at være GLLRM til at være RM med samme antal items 1 skala viste ingen nævneværdig forbedring Den bedste skala model (GLLRM) er ikke forbedret + RM har fået tilføjet et item 2 skalaer viste lille forværring GLLRM har fået tilføjet en lokal afhængighed + RM har mistet et item GLLRM tilføjet DIF mht. KØN 28

Choice of modificational action based on analyses results Loglinear Rasch analyses results Subject matter analyses results No problem Type B wording similar Type C measure same characteristic Type D unclear measure RM No change No change No change Exchange single item LLRM with No change No change No change Exchange single low uniform LD item ***** LLRM with No change Mutual Exchange single Exchange single moderate modification of item item uniform LD items ***** LLRM with high uniform LD LLRM with uniform DIF Modeling not possible No change No change No change Mutual modification of items Exchange single item ** Exchange single item (consider additional problematic items for modification) Exchange single item Exchange single item ** Exchange single item (consider additional problematic items for modification) Exchange single item ***** Exchange single item Exchange single item Type A wording error Single item modification Single item modification Single item modification Single item modification Single item modification Single item modification 29