Det gode håndværk eller simpel datafangst? Peter Linde 8. juni 2009
|
|
|
- Kaj Bro
- 10 år siden
- Visninger:
Transkript
1 Det gode håndværk eller simpel datafangst? Peter Linde 8. juni 2009
2 Tre udsagn Tal er tyranni Ikke alt der tæller kan tælles og ikke at der kan tælles tæller (Einstein) Man kan kun have tillid til statistik man selv har manipuleret (Churchill)
3 Repræsentativitet i pressen Undersøgelsen er gennemført i perioden juni 2008 blandt et repræsentativt udsnit af den danske befolkning (1000 besvarelser).
4 Tal er tyranni Hvad er forskellen på: - Ældre vil gerne have teknisk hjælpemidler og 91% ønsker stok eller rollator med indbygget GPS - Nogle få genstande for meget og en promille på 1,37 Eksakte tal har en selvbekræftende rigtighed og autoritet, der ikke stilles spørgsmålstegn ved. Ethvert samfund har brug for god statistik
5 Ikke alt der tæller kan tælles Det gælder også mål for kvaliteten af statistik Tre ting kan gå helt galt: - hvordan man måler (spørgeskemaet) - mangelfuld udvalgsramme (population) og udvælgelse - bortfald og dataindsamlingen og selvfølgelig forkerte metoder/principper Noget er svært at måle med tal, fx kvaliteten og betydningen af spørgeskemaet, udvalgsrammen og bortfaldet Ingen statistik er stærkere end sit svageste led
6 Når producenten skal beskrive sin kvalitet arbejder med en udvælgelsesmetode der sikrer at de udvalgte husstande og personer er repræsentativt fordelt efter de demografiske kriterier: køn, alder og geografi. Fordelingen er altid baseret på de seneste tal fra Danmarks Statistik, og der benyttes ikke efterfølgende vejning af datamaterialet eller andre typer af efterstratifikation.
7 Når producenten skal beskrive sin kvalitet (II) The key to our business is our access panels. We have developed a number of procedures for recruiting, validating, and sampling that enable us to use internet samples to represent the population as a whole. We believe that internet research should be as accurate as traditional methods, but faster and more flexible, thereby freeing resources for the vital interpretation and implementation of results.
8 Disposition Indsamlingsprocessen - fra udvælgelse og design til formidling Hvad er godt håndværk? Ansvaret - Hvad er de forskellige aktørers ansvar?
9 Sikkerheden i statistikkerne Afhænger af: Udvalgsrammen Udvælgelsen eller afgrænsningen Dataindsamlingen (internt eller eksternt) Besvarelsen (målingen - indholdet i variablerne) Bortfaldet eller uoplyste værdier Korrektion, vægtning og imputering Analysen - offentliggørelsen (fx brug af vægte, imputerede data) Og sammenhængen mellem alle elementer - ingen statistik er bedre end sit svageste led
10 Tilfældige og systematiske fejl Vandret (rød): Bias (skævhed). Nederste kurve stikprøvefejlen og den øverste den samlede fejl (mean square error)
11 Udvalgsrammen Hvilke personer eller virksomheder skal beskrives? Udvalgsrammen = populationen? Korrekt Aktuel - opdateret Delmængde (underdækning) Overdækning Overdækning kan delvist løses, men en del ikke relevante svarer ikke og bliver en del af bortfaldet. Underdækning vil altid give en fejl. Dækningsfejl
12 Afgrænsning Eksempler på afgrænsninger/udelukkelser Under en hvis omsætning (cut off eller bagatelgrænsen) Adgang til telefon Adgang til internet Afgræsningsfejl
13 Stikprøveudvælgelse Udvælgelses metoden Repræsentativ: Lodtrækning tilfældig udvælgelse. Kendte udvalgssandsynligheder fx flere telefoner Antal der udvælges betyder mest Sikkerheden fordobles, hvis stikprøven firedobles Hvis man udvælger alle er der ingen stikprøveusikkerhed Designet skal overholdes ellers udvælgelsesfejl Stikprøve usikkerhed + mulig udvælgelsesfejl
14 Stikprøve-udvælgelse: Tommelfingerregel En tommelfinger regel siger, at usikkerheden højst er: Der udvælges 100 enheder +/- 10 % Der udvælges 400 enheder +/- 5 % Der udvælges 1600 enheder +/- 2,5% Osv. Eksempel: 900 interviews 9 gange større end en stikprøve på gange bedre (3*3=9) end en på 100 Usikkerheden er derfor: 10%/3 = 3,3%
15 Dataindsamlingen (I) Kan gennemføres af fx SFI-survey, Danmarks Statistik eller privat firma Instruktion og træning af interviewer, indsamler og organisation Overvågelse af dataindsamlingen Opfyldelse af indsamlingsplan/design Aflønning af interviewere Dataindsamlingsfejl
16 Indsamlingsformer (II) Selvudfyldelse (af personer eller virksomheder): Kontakter selv indsamler og udfylder et skema Får tilsendt et skema som udfyldes Kan også være en indtastningsblanket på WEB Udfyldelse med hjælp undervejs: Personlig hjælp fx interviewer Intelligent understøttende elektronisk blanket Udfyldelse af 3. part: Sagsbehandler eller andet personale
17 Målingen indholdet i variablen/svaret Overblik og brugervenlighed Spørgsmål og svarmuligheder Hukommelse Vælg et eller flere svar Ja/nej Følsomme spørgsmål Indsamlingsmedie (dataindsamlingsform) Byrden Test af spørgeskemaet Målingsfejl
18 Bortfald Alle undersøgelser, hvor personer kontaktes er frivillige Bortfaldet er stigende. Op til 30-40% + forskerbeskyttelsen på 13% Bortfald er altid skævt. Det er et spørgsmål om hvor meget! Objekt bortfald - respondent bortfald Variable bortfald - spørgsmål ikke besvaret Uoplyste værdier i registre Hvordan skal der opregnes for bortfald? Bortfaldsfejl
19 Vægtning Designvægtning (N/n) Vægtning for bortfald Måske vægtningsfejl En mulig stor forbedring
20 Analysen og offentliggørelsen (bagefter) Brug af vægte for bortfald Brug af designvægte Brug af imputerede variabler Måske estimationsfejl Normalt ikke et problem
21 Samlet usikkerhed Tilfældig: Stikprøveusikkerhed Systematisk: + måske udvælgelsesfejl + dækningsfejl + dataindsamlingsfejl + målefejl + bortfaldsfejl + måske vægtningsfejl + måske bearbejdelsesfejl = samlet usikkerhed
22 Tilfældige og systematiske fejl Vandret (rød): Bias (skævhed). Nederste kurve stikprøvefejlen og den øverste den samlede fejl (mean square error)
23 Samlet vurdering Sjældent højere end det svageste led - og aldrig højere end det/de vigtigste led - fx hæves kvaliteten ikke ved at øge stikprøvestørrelsen, hvis det største problem er bortfaldet eller underrapportering
24 Repræsentativitet Definition: Kun tilfældige fejl central estimator Dvs. afhænger kun af udvælgelsesmetoden Størrelsen af den tilfældige fejl afhænger af antallet, der udvælges Systematiske fejl vil der altid være Afhænger ikke af stikprøvestørrelsen, men af alt andet det er det der er kernen i god statistik
25 Hvis ansvar? Producenterne skal dokumenterer Brugerne skal kræve dokumentation Fagstatistikere skal hjælpe Uddannelsesinstitutionerne skal uddanne Ingen dataindsamling er uden fejl og skævhed. Fokus på løsninger og ikke kritik Fordi intet er korrekt betyder det ikke at alt er lige godt Ellers leger alle skrædderne i Kejserens nye klæder
26 Varedeklaration Hvor skæv er populationen? Er der afgrænset og hvad betyder det? Hvordan er der udvalgt er udvalgssandsynligheden kendt? Hvordan kontrolleres dataindsamlingen Er spørgeskemaet testet? Hvad betyder bortfaldet? Hvordan er der opregnet? Hvordan er vægte og imputerede tal brugt? Alle led har krav om tilgængelig dokumentation Analyser og dokumentation øger forståelsen af hvordan data kan bruges
27 Hvorfor skal kvalitet måles? Brugernes nytteværdi af statistikken Vores interesse i korrekt anvendelse Mere målrettet fokus på kvalitet - og derved bedre kvalitet Optimal anvendelse egne ressourcer Omverden ved hvad de får for pengene
28 Hvilke redskaber findes der? Indikatorer for kvaliteten af outputtet Standarder for produktionen Kvalitative analyser, test eller beskrivelser
29 2 - Hvilke redskaber findes der? Svage indikatorer (I1), fx andel af fejl i en fejlsøgning - kan kun sammenlignes inden for tællingen Stærke indikatorer (I2), fx bortfaldet eller uoplyste - kan sammenlignes over tid for en konkret tælling og mellem tællinger af samme type Universelle indikatorer (I3), fx varianskoefficienten i en stikprøve - kan sammenlignes over tid, mellem tællinger og lande.
30 Fire kvalitetsniveauer Fire kvalitetsniveauer A - Meget høj kvalitet B - Høj kvalitet C - Rimelig kvalitet D - Usikker kvalitet De to højeste niveauer kræver tilgængelig dokumentation
31 2- Hvordan kan fire mål bruges? Den basale kvalitet af en indikatorer kan hæves: - analyser der kvalitativt og kvantitativt beskriver og håndtere et problem - analyser der dokumenterer en effekt Fx kan bortfaldet i en stikprøveundersøgelse være så stort, at den basale kvalitet er Usikker eller Rimelig, men bortfaldsanalyser og opregningen kan hæve kvaliteten hvis de er dokumenteret og tilgængelige
32 Eksempel 1 Stikprøveusikkerhed for hovedvariabler (I3) Hvis fokus er på ændringer også usikkerheden af ændringen Usikker kvalitet: Stikprøvefejl på over 3 % på totaler hhv. 15 % for undergrupper Rimelig kvalitet: Under 3%/15% Høj kvalitet: Under 2%/10% Meget høj kvalitet: Under 1%/5%
33 Eksempel 2 Bortfald (I2) + Korrektion for bortfald, der inddrager korreleret registerinformation + Dokumenteret stor reduktion af bortfaldsbias endnu en grad Usikker kvalitet: Over 40% af de udvalgte enheder Rimelig kvalitet: Under 40% af de udvalgte enheder Høj kvalitet: Under 20% af de udvalgte enheder Meget høj kvalitet: Under 5% af de udvalgte enheder
34 Eksempel 3 Kvaliteten af opregning (K) Usikker kvalitet: Ikke baseret på kendte udvalgssandsynligheder på udtrækstidspunktet (ikke repræsentativ) Rimelig kvalitet: Simpel opregning (N/n) for udvalgssandsynligheder ved udtrækstidspunktet Høj kvalitet: Registerinformation inddrages som hjælpeinformation, men effekten er ikke dokumenteret Meget høj kvalitet: Registerinformation inddrages som hjælpeinformation og effekten er dokumenteret
35 Varedeklarationer i pressen Tak for ordet
Kvalitetsmåling i statistik
Kvalitetsmåling i statistik Peter Linde. Survey and Methods. Statistics Denmark. [email protected] Opfyldelse af brugernes behov Over- eller undervurderer statistikken den faktiske udvikling, og hvor sikre er
Repræsentative undersøgelser Non-response Vægte. Peter Linde, DST Survey
Repræsentative undersøgelser Non-response Vægte Peter Linde, DST Survey [email protected] >> >> Dagsorden Hvad er en repræsentativ undersøgelse? Bortfaldes betydning for repræsentativitet Vægtning for bortfald
Repræsentative undersøgelser før og nu. Peter Linde, Interviewservice [email protected]
Repræsentative undersøgelser før og nu Peter Linde, Interviewservice [email protected] >> >> Dagsorden Hvad er en repræsentativ undersøgelse? Bortfald og forskerbeskyttelse Vægtning for bortfald Effekt af vægtning
Forebyggelse og reparation - vægtning af data. Brian Larsen Thorsted
Forebyggelse og reparation - vægtning af data Brian Larsen Thorsted [email protected] Indhold Usikkerhed i stikprøveundersøgelser Bortfald Estimation Regressionsestimator Reduktion af usikkerhed Repræsentativitet
Dokumentation af interviewundersøgelser
Dokumentation af interviewundersøgelser Varedeklaration Opgave Kunde Delopgaver udført af: Population Stikprøve Dataindsamling Opregning Population Bruttostikprøve Nettostikprøve Antal svar Svarprocenter:
Grundlæggende metode og videnskabsteori. 5. september 2011
Grundlæggende metode og videnskabsteori 5. september 2011 Dagsorden Metodiske overvejelser Kvantitativ >< Kvalitativ metode Kvalitet i kvantitative undersøgelser: Validitet og reliabilitet Dataindsamling
Problemstillinger omkring spørgeskemaundersøgelser blandt etniske minoriteter. Vibeke Jakobsen SFI Det Nationale Forskningscenter for Velfærd
Problemstillinger omkring spørgeskemaundersøgelser blandt etniske minoriteter Vibeke Jakobsen SFI Det Nationale Forskningscenter for Velfærd Er kvaliteten lavere i data indsamlet blandt etniske minoriteter
METODEBILAG FRIVILLIGRAPPORT , BEFOLKNINGSUNDERSØGELSEN. Tal om det frivillige Danmark. Om undersøgelsens metode. Spørgeskema.
METODEBILAG FRIVILLIGRAPPORT 2016-2018, BEFOLKNINGSUNDERSØGELSEN Tal om det frivillige Danmark Ref.: HDJ, MH 15. august 2017 Om undersøgelsens metode Dataindsamlingen til Frivilligrapportens befolkningsundersøgelse
Grundlæggende metode og. 2. februar 2011
Grundlæggende metode og videnskabsteori 2. februar 2011 Dagsorden Metodiske overvejelser Kvantitativ >< Kvalitativ metode Validitet og repræsentativitet Stikprøver Dataindsamling Kausalitet Undervejs vil
Monitorering af danskernes rygevaner. Metodebeskrivelse m.m. Januar 2004
Monitorering af danskernes rygevaner 2003 Metodebeskrivelse m.m. Januar 2004 Monitorering af danskernes rygevaner 2003 Metodebeskrivelse m.m. Januar 2004 Indhold Side 1.1. Indledning... 1 1.2. Baggrund
2. Indledende sonderinger (eksplorative forundersøgelser) Sekundære data Kvantitative og kvalitative Desk research
Mark edsanalyseproc essen 1. Problemerkendelse 2. Indledende sonderinger (eksplorative forr) Herunder: Sekundære interne og eksterne data samt primære interne data 3. Problemformulering og mål for n 4.
Denne rapport må kun offentliggøres med følgende kildeangivelse: Epinion A/S for 3F. 3F - Dagpenge. 27. april Side 1 af 8
3F - Dagpenge 27. april 2006 Side 1 af 8 Indholdsfortegnelse 1 Kort om Epinion A/S... 3 2 Baggrund... 4 2.1 Indledning... 4 3 Frekvenser... 5 4 Undersøgelsens metode... 8 Side 2 af 8 1 Kort om Epinion
DR - Velfærdsforløb. 21. november 2005. Side 1 af 14
DR - Velfærdsforløb 21. november 2005 Side 1 af 14 Indholdsfortegnelse 1 Kort om Epinion A/S... 3 2 Baggrund... 4 2.1 Indledning...4 3 Resultater... 5 3.1 Skal efterlønnen bevares?...5 3.2 Tror befolkningen
Danmarks første kvindelige statsminister
DR Danmarks første kvindelige statsminister Rapport - Epinion A/S 3. april 2007 Indholdsfortegnelse 1 Kort om Epinion A/S...3 2 Baggrund...3 2.1 Indledning...3 3 Frekvenser...3 4 Krydstabuleringer...3
DR Politikerlede. Danmarks Radio. 14. jun 2016
t DR Politikerlede Danmarks Radio 14. jun 2016 AARHUS COPENHAGEN MALMÖ OSLO SAIGON STAVANGER VIENNA 1 INDHOLDSFORTEGNELSE 1. Frekvenser... 3 2. Kryds med køn... 5 3. Kryds med alder... 7 4. Kryds med Partivalg...
Påskemåling - Detektor. 23. mar 2015
t Påskemåling - Detektor 0 DR. mar 0 AARHUS COPENHAGEN MALMÖ OSLO SAIGON STAVANGER VIENNA INDHOLDSFORTEGNELSE. Frekvenser.... Kryds med alder.... Kryds med køn.... Kryds med Partivalg.... Om Undersøgelsen...
A B C F l O V Ø Å +/- 2,1 +/- 0,9 +/- 0,8 +/- 0,9 +/- 1,3 +/- 1,9 +/- 1,9 +/- 1,3 +/- 1. Valgresultat ,5 26,3 21,1 21,0 19,5 19,9
3 26,3 26, 2 2 21,1 21, 19, 19,9 7, 8,1 7,8 8, 4,6 4, 3,4 3,2 4,2 4,3 4,8 4,9 +/- 2,1 +/-,9 +/-,8 +/-,9 +/- 1,3 +/- 1,9 +/- 1,9 +/- 1,3 +/- 1 Valgresultat 2 19-8-2 47 47 4 4 3 37 36 34 3 3 2 2 13 14 14
MEGAFON. Vi kender danskerne. 1g.megafon.dk. Rådgivning og analyse, der bringer dig godt videre
MEGAFON Vi kender danskerne Rådgivning og analyse, der bringer dig godt videre 1g.megafon.dk En god markedsanalyse kræver kun 2 ting: Almindelig sund fornuft Tænk jer godt og grundigt om. Er alt klart,
Interviewereffekter på spørgsmål om sort arbejde. Rockwool Fondens Forskningsenhed Oktober 2008
Interviewereffekter på spørgsmål om sort arbejde Rockwool Fondens Forskningsenhed Oktober 2008 Tak til Rockwool Fondens Forskningsenhed Danmarks Statistiks Interviewservice, specielt til Isak Isaksen,
Kendskab til borger.dk. December 2018
Kendskab til borger.dk 2018 December 2018 FORMÅL Undersøgelsens formål Formål Digitaliseringsstyrelsen ønsker i 2018 at få gennemført en kendskabsanalyse af borger.dk Digitaliseringsstyrelsen har tidligere
1 Metodeappendiks. Spørgeskemaet omhandler ledernes erfaringer med forældresamarbejde og indeholder både faktuelle spørgsmål og holdningsspørgsmål.
1 Metodeappendiks Om undersøgelserne Der er foretaget to spørgeskemaundersøgelser blandt hhv. forældre til børn, som går i daginstitution og daginstitutionsledere. Danmarks Statistik har stået for udsendelse
Behandling af kvantitative data 19.11.2012
Behandling af kvantitative data 19.11.2012 I dag skal vi snakke om Kvantitativ metode i kort form Hvordan man kan kode og indtaste data Data på forskellig måleniveau Hvilke muligheder, der er for at analysere
NOTAT Mobning blandt sygeplejersker 2012
Louise Kryspin Sørensen Oktober 2012 NOTAT Mobning blandt sygeplejersker 2012-14 % af de beskæftigede sygeplejersker vurderer, at der ofte eller sommetider forekommer mobning på deres arbejdsplads. - Hver
Statistikdokumentation for Forbrugerforventninger 2019
Statistikdokumentation for Forbrugerforventninger 2019 1 / 12 1 Indledning Statistikken belyser forbrugernes syn på den nuværende og fremtidige økonomiske situation. Resultaterne fra undersøgelsen anvendes
FINANSIEL FORSTÅELSE OG REGNEFÆRDIGHED
FINANSIEL FORSTÅELSE OG REGNEFÆRDIGHED PENGE- OG PENSIONSPANELET OKTOBER 2016 METODE Undersøgelsen er baseret på en svensk undersøgelse fra Finansinspektionen fra 2014 1. Det er forsøgt at gøre den danske
RAPPORT. Unges holdninger til EU 2007. Kunde: Dansk Ungdoms fællesråd Scherfigsvej 5 2100 København Ø. Projektnummer: 53946
RAPPORT Unges holdninger til EU 2007 Projektnummer: 53946 Rapporteringsmåned: Marts 2007 Kunde: Dansk Ungdoms fællesråd Scherfigsvej 5 2100 København Ø TNS Gallup METODENOTAT BAGGRUND TNS Gallup har for
Estimatet for standardfejlen i stikprøven, som anvendes i udregningen af konfidensintervallet ( ) ( )
Enhed Administrationspolitisk kontor Sagsbehandler KHS, STJO Koordineret med CWU, APK Sagsnr. 2014-13042 Doknr. 200174 Dato 24-06-2014 Overvejelser om svarprocenter i brugertilfredshedsundersøgelser Dette
Analyse af tilfredsheden med hjemmesygeplejen i Gribskov Kommune
Analyse af tilfredsheden med hjemmesygeplejen i Gribskov Kommune Resumé Gribskov Kommune har september 2017 fået gennemført en analyse af tilfredsheden med hjemmesygeplejen i kommunen. Analysen er gennemført
Markedsanalyse for Boligindretningsbutikker
Markedsanalyse for Boligindretningsbutikker Af gruppe 7: Mohammed Kayed, Patrick Kisbye, Maria Vinther og Kathrine Kristiansen 6. OKTOBER 2016 MAK, CPH BUSINESS Modul 2 Markedsanalyse for Boligindretningsbutikker
Jacob Hviid Hornnes, Anne Christensen og Ulrik Hesse. Arbejdsnotat. Metode- og materialeafsnit til Sundhedsprofil for Gribskov Kommune
16. august 2006 Jacob Hviid Hornnes, Anne Christensen og Ulrik Hesse Arbejdsnotat Metode- og materialeafsnit til Sundhedsprofil for Gribskov Kommune 1. Materiale og metode 1.1 Indsamling af data Data er
Borgere og IT. Metodenotat/rapport. Grønlands Selvstyre. Digitaliseringsstyrelsen. 15. januar 2018
Borgere og IT Grønlands Selvstyre Digitaliseringsstyrelsen Metodenotat/rapport 15. januar 2018 AARHUS KØBENHAVN HAMBORG LONDON MALMØ NUUK OSLO SAIGON STAVANGER WIEN Undersøgelse af borgere og IT INDHOLDSFORTEGNELSE
Unges holdning til køb og salg af sex
Feltperiode: Den december 2014 januar 2015. Målgruppe: Respondenter i alderen 1520 år Metode: CATI (telefoninterviews). Interviews er foretaget af udvalgte interviewere, som forud har modtaget en særlig
Kvantitative Metoder 1 - Forår Dagens program
Dagens program Kapitel 8.1-8.3 Tilfældig stikprøve (Random Sampling) Likelihood Eksempler på likelihood funktioner Sufficiente statistikker Eksempler på sufficiente statistikker 1 Tilfældig stikprøve Kvantitative
