Seminaropgave: Fra teori til empiri

Relaterede dokumenter
Praktiske aspekter: Metode og den politiske beslutningsproces

Seminaropgave: Præsentation af idé

Aktører III: Modtagere af den offentlige politik

Behandling af kvantitative data

Etiske og praktiske overvejelser

Aktører II: Eliter. Erik Gahner Larsen. Offentlig politik

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Validitetstypologi. Erik Gahner Larsen. Kausalanalyse i offentlig politik

Forelæsning 11: Kapitel 11: Regressionsanalyse

9. Kursusgang. Validitet og reliabilitet

Kvantitative metoder spørgeskemakonstruktion og dataindsamling

Hus 20, hus P10 og hus 22: forelæsning kl samt opfølgning i eget hus kl

Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget?

Kapitel 10 Simpel korrelation

SAMFUNDSVIDENSKABELIG METODE

Potentielle udfald og kontrafaktisk kausalitet

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Dorte Fagfestival - Sundhed på mange måder - Odense marts 2009

Metoder og struktur ved skriftligt arbejde i idræt.

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Et oplæg til dokumentation og evaluering

Diffusion of Innovations

Program dag 2 (11. april 2011)

Kausalitet. Introduktion til samfundsvidenskabelig metode. Samfundsvidenskabelig metode. Hvad er metode? Hvad er kausalitet.

Kompetencemål i undervisningsfaget Matematik yngste klassetrin

Grundlæggende metode og videnskabsteori. 5. september 2011

Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Logistisk Regression - fortsat

Statistik II 4. Lektion. Logistisk regression

Dansk Clearinghouse for Uddannelsesforskning

1. Hvad er det for en problemstilling eller et fænomen, du vil undersøge? 2. Undersøg, hvad der allerede findes af teori og andre undersøgelser.

Project in Statistics MB

Almen studieforberedelse. 3.g

Videnskabsteoretiske dimensioner

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Juridisk anvendelse af (Q)SAR'er i henhold til REACH

Jens Olesen, MEd Fysioterapeut, Klinisk vejleder Specialist i rehabilitering

At lave dit eget spørgeskema

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Artikler

Studiets metoder. Pia Bøgelund & Søren Hansen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Dag 1: 1) Fra problemformulering til spørgeskema-tematikker; 2) Hvordan hører data sammen; 3) Overvejelser om datas egenskaber; 4) Hvad kan man

Introduktion til Konjunktur teori. Carl-Johan Dalgaard Økonomisk Institut Københavns Universitet

Hvor er mine runde hjørner?

Analyser af LEARN-skalaer. Pilottest af kvalitetsmåling

Kvantitative metoder

Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

FNE Temaeftermiddag Grafisk rapport. Kompetence Program. Fortolkning af AMPS resultater

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

SPØRGESKEMAER, SKALAER OG TESTS SIGNE BOE RAYCE

Vidensbegreber vidensproduktion dokumentation, der er målrettet mod at frembringer viden

Grundlæggende metode og. 2. februar 2011

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Basic statistics for experimental medical researchers

Psykisk arbejdsmiljø og stress

QUESTIONNAIRE DESIGN. Center for OPinion & ANalyse (COPAN) betydningen heraf for datakvalitet. Lektor Sanne Lund Clement clement@dps.aau.

Vejledning til Excel-ark til Kappaberegning

Indhold. Forord 9. kapitel 1 Hvornår er et fænomen et socialt fænomen? 11. kapitel 2 Sociologien og den kvantitative metode 20

HVORDAN SIKKER VIDEN BLIVER TIL ANVENDT VIDEN BRUG OG FORMIDLING AF VALIDEREDE REDSKABER I EVALUERINGER

Dato: Præsenteret af: e-stimate international. Powered by e-stimate

Forbedringsmodellen - Kom godt i gang med afprøvninger

On the complexity of drawing trees nicely: corrigendum

Kvantitative metoder, teori og praksis

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Løsning til eksaminen d. 14. december 2009

Bilag. Resume. Side 1 af 12

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Uddannelsesevaluering, 6. semester, Politik & Administration, fora r 2016

Indledning. Sikkerhed I: At undgå det forkerte. Notat om oplæg til sikkerhedsforskning. Erik Hollnagel

Behandling af kvantitativ data

Project Step 7. Behavioral modeling of a dual ported register set. 1/8/ L11 Project Step 5 Copyright Joanne DeGroat, ECE, OSU 1

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Thomas Harboe Metode og

Kvantitative metoder 2

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Repitition. 25. november 2013

EVALUERING AF BOLIGSOCIALE AKTIVITETER

AMEE Oplæg Milene Torp Madsen

AT 2016 M E T O D E R I B I O L O G I

Kompetencemål for Matematik, klassetrin

ELEVERS INTERESSE OG SELVTILLID I NATURFAGENE -OG I FREMTIDEN

Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017

Epidemiologi og Biostatistik

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Væksten i det gode liv

Løsning til eksaminen d. 29. maj 2009

Indledning Hvad skal vi? Hvem er vi? Hvad er vores mål? Vi sad over for hinanden med vores opgavepapir foran os, og en rungende stilhed råbte at En

1 Multipel lineær regression

Tilmelding sker via stads selvbetjening indenfor annonceret tilmeldingsperiode, som du kan se på Studieadministrationens hjemmeside

Bilag 2: Undersøgelse af de nationale tests reliabilitet. Sammenfatning

Statistik II 1. Lektion. Analyse af kontingenstabeller

Inspirationsmateriale fra anden type af organisation/hospital. Metodekatalog til vidensproduktion

Forvaltning / Politik og Administration / Socialvidenskab

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Metodekursus for ansatte i Region Hovedstaden. Konsulenter Karen Skjødt Hansen, Rikke Gut og Brian Rimdal

Transkript:

Seminaropgave: Fra teori til empiri Erik Gahner Larsen Kausalanalyse i offentlig politik

Dagsorden Seminaropgaven: Udvalgte råd Fra teori til empiri Validitet og reliabilitet Målevaliditet Datakvalitet Indholdsvaliditet Konvergensvaliditet Konstruktionsvaliditet

Seminaropgaven Skriv dig ind i en litteratur Find et emne Ekspliciter relationen til offentlig politik Du skal have én pointe (ikke to, tre eller fire) Du skal have en argumentation

Udvalgte råd til seminaropgaven (Zigerell 2013) Lav et abstract tidligt i processen 200 ord, gerne mindre Beskriv hvorfor emnet er vigtigt Den eksisterende litteratur er mangelfuld Litteraturreviewet skal mere end bare gennemgå historien for forskningen i et felt Hav et formål med litteraturreviewet

Udvalgte råd til seminaropgaven (Zigerell 2013) En seminaropgave skal have én pointe Pas på med for mange hypoteser Empiriske valg skal begrundes med teori Metode Kodning af variable Periode osv. Visualiser resultaterne

Fra teori til data Til nu har vi fokuseret på teori Kausalmodeller Abstrakte koncepter (variable) Intet fokus på konstruktion af data, ingen målefejl osv. De kommende gange: metode, empiriske tilgange Fællesnævner: data Forskellige metodiske tilgange To pointer i dag 1. Fokuser på målevaliditet 2. Vær kritisk i forhold til data

Metode og data De kommende lektioner vil fokusere på forskellige metoder Eksperimenter, naturlige eksperimenter, observationsstudier Ofte meget fokus på avancerede metoder Brug for tilsvarende stærkt fokus på kvaliteten af data Ingen metode er bedre end de data, vi har til rådighed Har vi dårlige data, kan ingen metodisk tilgang hjælpe os

Data, data, data Uden data har vi ingenting Men... In God we trust; all others must bring data. Statistics make officials, and officials make statistics. Med andre ord: Data er fantastiske, men skal anvendes med omtanke

Fra teori til data Udgangspunkt: Teoretisk koncept empirisk operationalisering Som altid: mange veje til Rom Det er ofte ikke givet, hvordan vi skal operationalisere et koncept Når vi operationaliserer vores koncepter, laver vi - implicit eller eksplicit - en model for, hvordan vi måler ting Teoretiske og metodiske implikationer

Fra teori til data Vi skal ud og måle virkeligheden Hayes og Embretson (2012, 163): measurement is a system of rules for assigning numbers to the variable of interest such as developing a yardstick for assessing an object s (or respondent s) properties (variables) Udfordring: Optimeringen af relationen teoretisk koncept og empirisk observation Målevaliditet, measurement validity Valid measurement is achieved when scores (including the results of qualitative classification) meaningfully capture the ideas contained in the corresponding concept. (Adcock og Collier 2001, 530)

Virkeligheden: usikkerhed og målefejl Vi skal altid operere med usikkerhed As far as the laws of mathematics refer to reality, they are not certain; and as far as they are certain, they do not refer to reality. Sandhed = observation + målefejl Det bedste scenarie: tilfældige målefejl I mange tilfælde: systematiske målefejl

Validitet og reliabilitet Validitet reliabilitet Hvad er forholdet mellem validitet og reliabilitet? Reliabilitet: the reproducibility of measurements, and this is the degree to which a measure produces the same values when applied repeatedly to a person or process that has not changed. (Shrout og Lane 2012, 643) Vi har en latent variabel vi gerne vil replikere

Validitet og reliabilitet

Reliabilitetstests Forskellige måder at vurdere reliabiliteten Test-retest reliabilitet Mål en variabel to gange på forskellige tidspunkter Udfordring: isolere målefejl fra reelle forandringer Inter/intrakoderreliabilitet Interkoder: flere kodere, samme materiale, en gang Intrakoder: en koder, samme materiale, flere gange

Målevaliditet (Adcock og Collier 2001)

Målevaliditet (Adcock og Collier 2001) Tre opgaver: konceptualisering, operationalisering, klassificering Konceptualisering Operationalisering Klassificering Tre typer af validitet Indholdsvaliditet (content, logical) Konvergensvaliditet (convergent, discriminant) Konstruktionsvaliditet (nomological, construct)

Målevaliditet: Indholdsvaliditet Repræsenterer vores empiriske mål vores teoretiske koncept? Indfanger vores indikatorer (level 3) vores koncept (level 2)? To spørgsmål: 1. Er hovedelementer fraværende i indikatoren? 2. Er irrelevante elementer inkluderet i indikatoren? Løsning: Undersøg værdierne givet i klassificeringen

Målevaliditet: Konvergensvaliditet Er der konvergens mellem to mål, der skal måle det samme? Er der diskrepans mellem to mål, der ikke skal måle det sammme? Er klassifikationerne (level 4) skabt af indikatorer (level 3) af et koncept (level 2) relateret? Er klassifikationer skabt med udgangspunkt i forskellige koncepter ukorreleret? Når en indikator bruges som refernecepunkt til at evaluere andre indikatorer: kriterierelateret validitet

Målevaliditet: Konstruktionsvaliditet Validiteten i den inferens vi drager mellem vores operationalisering og de teoretiske koncepter, de repræsenterer Er en hypotese bekræftet når enhederne er klassificeret (level 4) med de angivne indikatorer (level 3) for et koncept (level 2)? Jo bedre repræsentation, desto højere validitet Se slides fra lektion 4

Øvelse: Byg en eksplicit målemodel Lav et diagram med processen fra teori til data Gerne med udgangspunkt i seminaropgaven Beskriv koncept, dimension, indikatorer Hvilke udfordringer er der i forhold til validiteten?

Datakvalitet (Herrera og Kapur 2007) Data dumper ikke bare ned fra himlen Vi skal stillle vigtige spørgsmål ift. evalueringen af data Hvem har indsamlet/konstrueret data? Hvilke interesser har disse aktører? Hvorfor er disse data indsamlet? Like all organizations, those that produce data are prone to problems of agency, bureaucratic incentives, shirking, and multiple principals and goals, all of which are likely to shape their output, that is, data. (Herrera og Kapur 2007, 366)

Datakvalitet: validitet, dækning, præcision Hvordan vurderer vi kvaliteten af de data, vi har? Som med alting vi arbejder med: ikke blot én dimension Tre elementer ved datakvalitet Validitet Dækning Præcision

Datakvalitet: Validitet Relationen mellem teoretisk koncept og indsamlet data Udgangspunkt: Definition af koncept Ofte underteoretiseret Målevaliditeten: Relationen mellem dimensioner og data Udfordring: Konsistens, sammenlignelighed, reliabilitet Er mål sammenlignelige på tværs af lande?

Datakvalitet: Dækning Har vi komplette data? Hvis vi ikke har de data, vi skal bruge, er der problemer med dækningen Tilstedeværelsen (eller fraværet) af data er sjældent tilfældigt (ikke MCAR!) Er det tilfældigt hvilke data vi har fra Kina?

Datakvalitet: Præcision Præcision angiver fraværet af fejl i de data, vi har Fejl i dataindsamlingen eller datapræsentationen reducerer præcisionen Udfordringer Metodiske ændringer Forkerte indtastninger

Datakvalitet: Forsyningskæden (Herrera og Kapur 2007)

Datakvalitet: Aktører Respondenter Husholdning Firma Offentligt ansat Indsamlingsenheder Ministerier Analyseinstitutter Interesseorganisationer Akademia

Datakvalitet: Respondenter Incitamenter Penge Politisk support Frygt for straf Alternativomkostninger Kapaciteter Tid Viden Uddannelse Surveyadgang Datakvalitetsproblemer Manglende svar Bevidst forkerte svar Selvselektion i svar

Datakvalitet: Indsamlingsenheder Incitamenter Professionelle normer Penge Eksternt pres Kapaciteter Ressourcer Viden Penge Datakvalitetsproblemer Mangelfuld indsamling af data Manipulation af data Selvselektion i svar

Datakvalitet: Interesseorganisationer/NGO Incitamenter Professionelle normer Support fra andre aktører Samarbejde Kapaciteter Ressourcer Viden Penge Datakvalitetsproblemer Manglende indsamling af data Selvselektion i svar

Datakvalitet: Akademia Incitamenter Publikationer Profesionelle normer Kapaciteter Tid Forskningsmidler Viden Datakvalitetsproblemer Manglende data Vedvarende brug af dårlige data Problematisk brug af eksisterende data Matcher ofte ikke teoretisk dimension eller koncept

Hvad med kvalitative og kvantitative data? Hvordan skal vi forholde os til kvalitative og kvantitative data? Er der forskelle? Et spørgsmål om skalaniveauer Et kontinuum af kvantificerbar De fleste kvalitative kategorier er blot nominelle kategorier Tænk tilbage på Metode II-undervisningen

Skalaniveauer Skala Transformation Egenskab Statistik Nominel Isomorfi a = b, a b Modus, fordelingstest Ordinal Monotonisk a > b, a b Median, Spearman ρ Interval Lineær a + b Gennemsnit, Pearson ρ Ratio Ratio a/b Gennemsnit, Pearson ρ

Hvorfor får ministerier gennemført meningsmålinger?

Hvorfor får ministerier gennemført meningsmålinger? Finansministeriet finder det derimod ikke hensigtsmæssigt, at ministeriernes bevilling anvendes til en direkte test af politiske budskabers opbakning blandt vælgerbefolkningen eller et bredt udsnit heraf. Finansministeriet mener derfor, at der bør udvises særlig omtanke og tilbageholdenhed i forbindelse med bestilling af meningsmålinger, som er rettet mod den brede befolkning, og som indeholder spørgsmål vedrørende politiske holdninger.

Hvilke data vil være svære at få fat på? Overvej gerne hvilke data der ikke findes Er der mulighed for at indsamle dem? Hvilke grunde kan der være til, at specifikke data ikke findes? (eller ikke er offentligt tilgængelige) Politiske aktører har stærke interesser i forhold til indsamlingen og tolkningen af data

Eksempel: Politisk sensitivitet og datamanipulation Wallace (2016) studerer BNP i Kina BNP: salient BNP korrelerer med mindre saliente mål Elektricitetsproduktivitet Forbrug Kan en svagere korrelation mellem BNP og relevante mål forklares? Hvad finder Wallace (2006)? Data på vækst i provinserne viser, at der er mere vækst i alle provinser end den nationale vækstrate Der er variation i relationen mellem BNP og andre mindre saliente mål Større differens i år hvor ledere udskiftes

Eksempel: Politisk sensitivitet og datamanipulation

Eksempel: Politisk sensitivitet og datamanipulation

Implikationer af målefejl Målefejl i afhængig variabel: Større usikkerhed i effektestimater Målefejl i uafhængig variabel: Større usikkerhed i effektestimater Andre ukorrelerede variable påvirkes ikke Målefejl i uafhængige variable der korrelerer: Forkerte estimater Målefejl i én uafhængig variabel kan påvirke effekten af de andre Målefejl i uafhængig variabel der korrelerer med målefejl i afhængig variabel: Manglende korrekt specifikation, forkerte estimater

Bagsiden af datarevolutionen: nemt at drukne i data

Øvelse: Dataindsamling Hvilke data vil du gerne bruge i seminaropgaven? Hvem har en interesse i at disse data (ikke) findes? Hvilke implikationer har det for de forbehold man skal tage sig, når man analyserer disse data?

Næste gang Eksperimenter Samme tid og sted