surveyforskning - ved Hans Bay - cand. stat. - Mobilepanels - Mail: hansbaydk@gmail.com - Te: 25 11 06 66 (mobil) - Te: 35 38 78 05
Resultat fra søgning s i infomediabasen 1990 indeks 100 for alle søgeords 1800 1600 1400 1200 1000 800 600 400 200 0 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 Undersøgelse Spørgeskemaundersøgelse Interviewundersøgelse Opinionsundersøgelse Videnskabelig undersøgelse
Definitioner Udvalg = stikprøve = (survey) Univers = Hele populationen Stikprøve = en del af universet
Surveys Hvad er surveys? En repræsentativ stikprøve i målgruppenm Hvad er repræsentativ? En stikprøve indsamlet tilfældigt ldigt i målgruppenm Hvad er simpelt tilfældigt? ldigt? En stikprøve hvor alle har samme sandsynlighed for at blive udtrukket
Simpel tilfældig ldig udvælgelse Det virker! G. Gallup demonstrerede dette effektivt i starten af det 20. århundrede
Eksempler påp resultater af ikke- repræsentative stikprøver Forside i 1948 vinder af præsidentvalget Euro afstemning 1992 Folketingsvalg 1998
A Theory Of Voting Behavior Predicting Presidential Electronics Ray C. Fair, November 2001
The History Buff Newspaper Archives
Så brug dog simpel tilfældig ldig udvælgelse - Bortfald - Begrænsninger i CPR (forskerbeskyttelsen)
Bortfald 1987, 1994 og 2000 SIF s store indsamlinger 1987 1994 2000 Interview gennemført 79,9 78,0 74,2 Ønsker ikke at deltage 12,3 16,4 22,4 Sygdom/handicap 1,5 2,2 1,3 Bortrejst/hospital 2,1 1,5 0,2 Ej truffet 3,2 1,1 1,2 Flyttet 0,9 0,4 0,2 Andet 0,2 0,4 0,4 I alt 100,0 100,0 100,0
Dataindsamlingsmetoder Mette Kjøller SIF Personligt Telefonisk Selvadministreret Internet interview interview spørgeskema Dataindsamlingsfase lang kort lang kort Opnåelses-procent høj høj lav varierer Dataindsamling decentralt decentralt/ centralt centralt centralt Omkostninger høje moderat lave (porto) lave Interviewer-korps uddannet uddannet - - Oplevet anonymitet lav lav Høj/lav høj Overtale svarperson gode muligheder moderate ringe mulighed ringe mulighed til at medvirke muligheder Tid til at overveje moderat lang kort lang lang svar Kompleksitet i simpelt spørgeskema moderat spørgeskema Indsigt i dataindsamlingssituationen - filtre og overspringelser - gentagelse af spørgsmål - mulighed for - vis kort mulig viden om hvem, der har svaret - filtre og overspringelser - gentagelse af spørgsmål delvis mulig ikke mulig ikke mulig Uoplyste besvarelser ingen eller få ingen eller få mange mange anden rækkefølge? Interviewerbias høj nogen ingen ingen
Uddannelse og besvarelse Den interviewedes skoleuddannelse fordelt på dataindsamlingens forskellige faser. Ungdomsundersøgelsen 1981. Socialforskningsinstituttet. De 16-25 årige. Dataindsamlingens faser Besvarer postspørgeskema Inden 1 uge 1-3 uger Senere end 3 uger Besøgsinterview I alt Antal Skoleuddannelse: 9. Klasse eller mindre 19 21 29 32 101 810 10. Klasse eller realeksamen 29 23 30 19 101 1451 Gymnasium eller HF 43 28 19 10 100 900 Antal 957 748 836 620 3161 Uoplyst mht. uddannelse 72 46 68 11 197 Kilde: Christoffersen MN: Brev, telefon, besøg. Socialforskningsinstituttet.
ESS Response rates 1 st st wave 2002 18 countries 90,0 80,0 70,0 60,0 50,0 40,0 30,0 20,0 10,0 0,0 AT BE CH CZ DE DK ES FI FR GB GR HU IE IL IT LU NL NO PL PT SE SI TR
Response rates of the ESS Round 3 (deviations from target response rate 70%) FR DE GB DK CH NL BE CY ES HU SE SI BG FI NO RU PL SK PT 35% 40% 45% 50% 55% 60% 65% 70% 75% 80% 85% response surveyforskning rate oktober 2008
F2F interviews - Er nødvendige n - Er et mega problem i storbyerne.
Betydning af forskerbeskyttelse ESS 3. runde i Danmark (2006) Brutto brutto stikprøve: 2964 Efter 13% forskerbeskyttelse: 2578 Netto stikprøve: 1505 Traditionel opnåelse: 1505/2578 = 58% Samlet opnåelse. (1-0,13)*0,58= 0,87*0,58= 50,8%
Personer med forskerbeskyttelse 800 700 A n tal [1000 p erso n er] 600 500 400 300 200 100 0 januar 2004 januar 2005 januar 2006 januar 2007 januar 2008 januar 2009
Personer med forskerbeskyttelse 4,0 3,5 3,0 Tilvækst [%] 2,5 2,0 1,5 1,0 0,5 0,0 januar 2004 januar 2005 januar 2006 januar 2007 januar 2008 januar 2009
Beskyttelser i CPR Forsker-, markedsførings- og v ejv iserbeskyttelse i CPR 900000 800000 Antal 700000 600000 500000 400000 300000 200000 100000 0 Forskerbeskyttelse Markedsføringsbeskyttelse Forsker- og markedsføringsbeskyttelse Forsker- og vejviserbeskyttelse Alle tre beskyttelser 2000 2001 2002 2003 2004 2005 2006 2007 2008 Årstal
Folketal og forskerbeskyttede 1-1-20061 aldersgruppe Folketal 1. Januar 2006 Forskerbeskyt. Januar 2008 I % Antal beskyttede Brugbart univers Realiseret stikprøve 0-9 664.967 11,9 79.131 585.836 0 10-19 19 665.125 11,6 77.155 587.971 70 20-29 29 624.789 25,8 161.196 463.593 143 30-39 39 786.779 20,4 160.503 626.276 259 40-49 49 783.735 12,1 94.832 688.903 272 50-59 59 738.785 7,7 56.886 681.899 285 60-69 69 588.519 5,9 34.723 553.796 274 70+ 574.760 4,9 28.163 546.597 202 I alt 5.427.459 692.588 4.734.871 1.505
ESS 3. runde Univers og stikprøve 18+ Folketal 1. Januar 2006 forventet stikprøve Realiseret stikprøve O-F Chi- bidrag 0-9 10-19 19 20-29 29 624.789 219 143-76 26,3 30-39 39 786.779 276 259-17 1,0 40-49 49 783.735 274 272-2 0,0 50-59 59 738.785 259 285 26 2,7 60-69 69 588.519 206 274 68 22,4 70+ 574.760 201 202 1 0,0 I alt, over 20 år 4.097.367 1.435 1.435 0 52,3 DF=5 P<<0,05
ESS 3. runde Univers og stikprøve Folketal 1. Januar 2006 forventet univers forventet stikprøve Realiseret stikprøve O-F Chi- bidrag 0-9 10-19 19 20-29 29 624.789 463.593 187 143-44 10,3 30-39 39 786.779 626.276 252 259 7 0,2 40-49 49 783.735 688.903 278 272-6 0,1 50-59 59 738.785 681.899 275 285 10 0,4 60-69 69 588.519 553.796 223 274 51 11,6 70+ 574.760 546.597 220 202-18 1,5 I alt, over 20 år 4.097.367 3.561.064 1.435 1.435 0 24,0
Folketingsvalg 2005 Folketingsvalg 2005 4003616 4003616 Stemmeber Stemmeber. 83,9 83,9 100,0 100,0 3357208 3357208 sum sum 0,0 0,0 0,0 0,0 1204 1204 udenfor udenfor 0,2 0,2 0,3 0,3 8850 8850 Minoritet Minoritet M 0,8 0,8 1,0 1,0 33880 33880 CD CD D 1,5 1,5 1,7 1,7 58071 58071 Kristen. Kristen. K 2,9 2,9 3,4 3,4 114123 114123 Enheds Enheds Ø 5,0 5,0 6,0 6,0 201047 201047 SF SF F 7,7 7,7 9,2 9,2 308212 308212 Radikale Radikale B 8,6 8,6 10,3 10,3 344886 344886 Konservative Konservative C 11,1 11,1 13,3 13,3 444948 444948 DF DF O 21,7 21,7 25,8 25,8 867350 867350 Soc.Dem Soc.Dem A 24,3 24,3 29,0 29,0 974637 974637 Vesnstre Vesnstre V
Beregning af DF s andel i stikprøve 97 siger de har stemt påp DF 1244 siger hvad de har stemt 97/1244 = 7,8% 97/1505 = 6,4% Andre korrektioner: alder, stemmeberettiget, og siger de har stemt.
1244 1244 96 96 359 359 179 179 77 77 368 368 165 165 Stik Stik 7,3 7,3 7,8 7,8 97 97 1,00 1,00 4.411.580 4.411.580 0,003 0,003 4,2 4,2 4 0,08 0,08 340.962 340.962 70+ 70+ K 0,023 0,023 9,7 9,7 35 35 0,24 0,24 1.053.420 1.053.420 40 40-69 69 K 0,006 0,006 3,4 3,4 6 0,19 0,19 851.737 851.737 15 15-40 40 K 0,008 0,008 15,6 15,6 12 12 0,05 0,05 233.798 233.798 70+ 70+ M 0,020 0,020 8,2 8,2 30 30 0,24 0,24 1.057.619 1.057.619 40 40-69 69 M 0,012 0,012 6,1 6,1 10 10 0,20 0,20 874.044 874.044 15 15-40 40 M W* W* andel andel Est Est. andel andel # der # der siger siger DF DF W Univers Univers
Stratifikation - formål At inddele universet i ensartede strata (grupper) For derved at øge sikkerheden eller reducere stikprøven Stratifikation er kunst. I I mange praktiske eksempler viser det sig tilsvarende, at det kun er til besvær r at betragte inddelinger i strata efter irrelevante kriterier. SåS en bevidstløs s inddeling efter køn, k urbaniseringsgrad etc. kan ikke anbefales som en generel fremgangsmåde de. A. Milhøj, Stikprøveteori for økonomi og erhverv. Side 179 Findes påp nettet http://www.econ.ku.dk/milhoj/stik/stik.htm
Vægtning med brug af registre i Danmarks Statistik AKU undersøgelse over 20.000 observationer Opnåelse 75% Gennemsnit af Indkomst førf skat spredning Vægtet efter Køn, alder geografi 180.982 118.000 Vægtet efter Køn, alder, geografi Arbejde og udannelse 176.928 116.000 Ikke mulig for stikprøver under 5.000 resp. Uvægtet dvs,. Simpelt gennemsnit (De der deltog) 180.379 118.000 Det korrekte resultat (Alle udtrukne) 175.367 116,000
Konsekvenser af Storbyen og F2F - Kan man differentiere brugen af F2F i Storbyen? - Interview påp arbejdspladser
Konsekvenser af forskerbeskyttelsen - Kan det stadig betale sig at trække simpelt tilfældigt ldigt i CPR? - Brug opregning fra andre register til at reducere skævheden - Danmarks Statistik metode kontor (Metode og Data nr. 93) - Vægtning efter køn, k alder geografi. Det er ligegyldigt - Brug også uddannelse og andre variable (arbejde)
Andre forslag/kommentarer - Henvendelse til politikerne vedr. forskerbeskyttelsen - Stringent brug af uddannelses-sp spørgsmålene - Stringent brug af arbejds-sp spørgsmålene - Også i internationale undersøgelser - Etablering af et panel, der indeholder respondenter der er forskerbeskyttet - Diskussionen om repræsentativitet vil kun foregå blandt forskere, ikke (mere) i den kommercielle sektor. - On-line interview vil stige eksponentielt - Betaling for interview?!
Hvordan er ESCS Konstrueret? ESCS-Indekset er dannet ud fra følgende variable: Det højeste internationale socioøkonomiske indeks for beskæftigelsesm ftigelsesmæssigssig status for far eller mor(?) (?) Det højeste uddannelsesniveau for far eller mor omregnet til antal uddannelsesår Antallet af bøger derhjemme såvel som adgang til uddannelsesmæssige ssige og kulturelle ressourcer indhentet ved at spørge eleverne, om de derhjemme havde: et skrivebord til at lave lektier ved, eget eget værelse, et stille sted at lave lektier,, en computer til brug ved skolearbejde, computerprogram til undervisning, forbindelse til internettet, egen lommeregner, klassisk litteratur, digtsamlinger, kunstværker (malerier), bøger, der kan hjælpe med skolearbejdet og en ordbog.. (Q13) Elevens score på indekset fremstår som en faktorscore beregnet på grundlag af Principal Component Analysis, som er standardiseret til at have et OECD-gennemsnit på 0 og en standardafvigelse på 1. Kilde: http://www.uvm.dk/07/documents/pisa_rapport.pdf
Den familiemæssige baggrunds indflydelse på PISA scoren 1 2 3 4 5 6 7 8 9 10 11 12 13 14 New Zealand Polen UK USA Norge Island Sverige Australien Danmark Irland Finland Canada Spanien Slovakiet 39,4 34,9 32,4 31,2 29,6 29,3 29,3 28,7 28,0 27,9 27,0 23,0 21,8 20,1
15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Schweiz Tjekkiet Portugal Luxembourg Belgien Grækenland Tyrkiet Tyskland Korea Mexico Holland Østrig Italien Japan Ungarn 19,1 17,7 17,0 15,4 15,0 14,6 12,9 10,0 9,0 7,4 6,9 6,8 5,8 5,1 4,5 Tal med fed er signifikante. Så alle er signifikante
Technical evolution Old days Mobil Internet CATI F2F Now a days