NOTAT OM SAMPLING SLICA GRØNLAND Dette notat gør kort rede for de metodiske overvejelser, der skal gøres i forbindelse med udtræk af stikprøven i forbindelse med gennemførelse af SLICA s dataindsamling i Grønland. 1. Sampling i 1994 undersøgelsen På grund af de økonomiske og tidsmæssige ressourcer lå det fra starten fast, at der ikke kunne trækkes en simpel tilfældig stikprøve i befolkningen. Løsningen blev derfor at anvende en stratificeret tretrins klyngeudvælgelse med proportionalt stratificeret udvælgelse inden for de enkelte klynger. På forhånd blev Ivituut og stationer udenfor den kommunale inddeling fravalgt. Det blev vurderet, at der var ressourcer til at berejse fem kommuner, hvorfor disse blev grupperet i fem grupper udfra den gennemsnitlige skattepligtige indkomst for årene 1989-1991: 1) Avanersuaq, Upernavik, Ammassalik, Nanortalik og Kangaatsiaq (19.5 % af befolkningen). 2) Uummannaq, Aasiaat, Paamiut og Qasigiannguit (18.8 % af befolkningen). 3) Qaqortoq, Narsaq, Illoqqortoormiut og Ilulissat (19.6 % af befolkningen). 4) Maniitsoq, Qeqertarsuaq og Sisimiut (18.8 % af befolkningen). 5) Nuuk (23.3 % af befolkningen). Følgende kommuner blev herefter udvalgt ved proportional stratificeret udvælgelse: Kangaatsiaq, Paamiut, Qaqortoq, Sisimiut og Nuuk. Fra disse kommuner blev der udtrukket 1500 respondenter over 18 år pr. 1. februar 1994 igen ved proportional stratificeret udvælgelse. Udvælgelsesprocessen fremgår af figur 4.8.1. Figur 1, Tretrins stratificeret klyngeudvælgelse (1994 undersøgelsen) 1 17 kommuner 2 5 gr upper St r at i f i cer et kl yngeudvæl gel se 3 5 kommuner P r o p o r t i o n a l t s t r a t i f i c e r e t u d v æl g e l s e P r o p o r t i o n a l t s t r a t i f i c e r e t u d v æl g e l s e 4 1500 s v a r p e r s o n e r Herudover blev der gennemført en særundersøgelse i Ammassalik og Upernavik kommuner dels for at inddrage en yderdistriktskommune og dels for at have en nordvestgrønlandsk yderdistriktskommune med i undersøgelsen. Resultaterne for denne særundersøgelse kunne ikke samkøres med resultaterne fra hovedundersøgelsen, da yderdistrikterne i så fald ville blive 1
overrepræsenterede. I stedet blev resultaterne brugt til selvstændige undersøgelser af de to kommuner. 2. SLICA i Grønland 2003 For at mindske risikoen for systematisk bortfald i stikprøven, vil der i forbindelse med gennemførelsen af SLICA i Grønland blive foretage en højere grad af stratifikation af populationen. I det følgende gennemgås et forslag til sampling strategien for SLICA i Grønland. 2.1 Stikprøveenhed og analyseenhed Stikprøveenhed og den primære analyseenhed er individet. 2.2 Stikprøvens størrelse og omfang Populationen består af alle personer bosiddende i Grønland, som er fyldt 15 år på dataindsamlingstidspunktet. Dog undtaget personer bosiddende i Ivittuut kommune. I levevilkårsundersøgelsen fra 1994 var der tale om en samlet svarprocent på ca. 75,0. Det skal dog understreges, at 45 pct. af dataindsamlingen foregik ved enquetes. Det må forventes, at svarprocenten ligger omkring 90,0 ved anvendelse af mundtlige interviews. Såfremt det antages, at der vil være ca. 10 pct. frafald, og vi f.eks. ønsker et datamateriale bestående af 2.000 interviews, skal der samples ca. 2.200 husstande og dermed respondenter. Det skal understreges, at der bør oversamples i bygderne, da erfaringerne fra 1994 undersøgelsen viste, at der var for få respondenter i udtrækket i denne befolkningsgruppe, således at det var vanskeligt at gennemføre egentlige flervariate analyser på bygdebefolkningen. Et bud på fordelingen vil således være, at der i det endelige datamateriale er 1.500 respondenter fra bybefolkningen og 500 fra bygdebefolkningen. I de samlede analyser af hele befolkningen vil respondenterne fra bygdebefolkningen naturligvis blive vejet ned. 2.3 Sampling proceduren Følgende procedure foreslås: A) Populationen er alle personer bosiddende i Grønland, der er fyldt 15 år på dataindsamlingstidspunktet. Dog undtaget personer bosiddende i Ivittuut Kommune. B) Populationen fordeles på de 17 resterende kommuner. C) Kommunerne fordeles på de 5 hovedregioner ifølge Grønlands Statistiks officielle regionalinddeling: Nordgrønland: Qaanaaq, Upernavik, Uummannaq Diskoregionen: Qeqertarsuaq, Ilulissat, Aasiaat, Qasigiannguit, Kangaatsiaq Midtregionen: Sisimiut, Maniitsoq, Nuuk, Paamiut Sydgrønland: Qaqortoq, Nanortalik, Narsaq Østgrønland: Tasiilaq, Ittoqqortoormiut Der udvælges én eller flere kommuner fra hver af de fem regioner. Dette sker ved tvungen udvælgelse. 2
D) De udvalgte kommuner opdeles på hhv. by og bygder. P.g.a. de budgetmæssige begrænsninger kan der ikke trækkes simpelt tilfældigt fra bygderne. Det vil således være nødvendigt at begrænse sig til 2-3 bygder i hver kommune. Disse kan trækkes proportionalt tilfældigt eller om nødvendigt stratificeres efter særlige karakteristika. E) Inden for de udvalgte byer og bygder trækkes ca. 2.400 husstande. Igen foretages proportional tilfældig udvælgelse, således at personer i små husstande ikke har større sandsynlighed for at blive udtrukket, end personer i større husstande. Med udgangspunkt i Grønlands Statistiks befolkningstal fra 2002, vil andelene af husstande og dermed respondenter fordele sig på følgende vis på de fem hovedregioner: Nord: 11% Disko: 22% Midt: 47% Syd: 14% Øst: 6% Disse tal vil naturligvis blive opdateret efter de nyeste befolkningstal. F) Der udtrækkes én respondent fra hver husstand ved simpel tilfældig udvælgelse. Rent praktisk bør dette foregå ved, at der for hver husstand opstilles en liste over husstandsmedlemmer, som er fyldt 15 år på tidspunktet for dataindsamlingen. Ud fra denne liste trækkes tilfældigt én person. Herved opnås en stikprøve på ca. 2.400 personer. Forslaget til denne samplingsstrategi er grafisk fremstillet i figur 2 neden for. 3
Figur 2, Sampling strategi for SLICA i Grønland 2003 Populationen (Personer bosiddende i Grønland undtagen Ivittuut Kommune, som er fyldt 15 år på tidspunktet for dataindsamlingen) Klyngeinddeling Ivittuut Kommune udelades Klyngeinddeling 17 kommuner 5 hovedregioner Grønlands Statistiks officielle regionalinddeling anvendes Tvungen udvælgelse Af kommunerne 8 kommuner Stratificeret udvælgelse BY BYGDER Stratificeret udvælgelse efter husstandsstørrelse Stratificeret udvælgelse efter husstandsstørrelse 2.373 Husstande Simpel tilfældig udvælgelse (én tilfældig respondent, som er fyldt 15 år trækkes fra hver husstand) Trækning af 2.373 individer 4
2.4 Udvalgte kommuner Nord: Disko: Midt: Syd: Øst: Upernavik Kommune Ilulissat Kommune + Aasiaat Kommune Nuuk Kommune + Paamiut Kommune Nanortalik Kommune + Qaqortoq Kommune Tasiilaq Kommune Med udgangspunkt i, at der udover de landsdækkende analyser, skal kunne gennemføres analyser på regionalt og bygdeniveau foreslås følgende model. BY BYGD TOTAL NORD 172 191 363 Upernavik 172 191 363 DISKO 420 79 499 Aasiaat 180 27 207 Ilulissat 240 52 292 MIDT 608 76 684 Nuuk 608 76 684 Paamiut 110 27 137 SYD 265 83 348 Qaqortoq 179 19 198 Nanortalik 86 64 150 ØST 220 122 342 Tasiilaq 220 122 342 TOTAL 1.796 575 2.373 Note: Baseret på befolkningstal fra ultimo 2003. Skal opdateres med nyeste befolkningstal for befolkningen, som er fyldt 15 år ved start af dataindsamlingen fordelt på kommuner og by/bygd. Forudsætningerne bag denne sampling er følgende: 1) Der forventes en svarprocent på minimum 90,0. 2) Regionerne i Nord, Syd og Øst er oversamplede, så der på baggrund af den forventede svarprocent minimum vil blive gennemført 300 interviews i hver region. 3) Region Midt (Nuuk) er samplet ned. Dog således, at der kan forventes minimum 600 gennemførte interviews. 4) Bygderne i alle regioner er samplet op, således at det samlede forventede antal interviews i bygderne vil være minimum 500. 5
3.0 Tidsplan for dataindsamlingen AKTIVITET AFSLUTNING SPØRGESKEMA Opsætning af spørgeskema på dansk og grønlandsk 25. september 2003 Trykning af spørgeskemaer 1. oktober 2003 SAMPLING Endelig samplingsplan 25. september 2003 Udtræk af respondenter 1. oktober 2003 MANUALER Manual for interviewertræning 1. oktober 2003 Manual for dataindsamling 1. oktober 2003 INTERVIEWERTRÆNING Rekruttering af interviewere 13. oktober 2003 Interviewertræning i Nuuk 16. oktober 2003 Interviewertræning i Ilulissat 19. oktober 2003 Interviewertræning i Qaqortoq 25. oktober 2003 DATAINDSAMLING PR virksomhed nationalt og regionalt 1. november 2003 Dataindsamling i Øst/BY 1. december 2003 Dataindsamling i Øst/BYGD 15. januar 2004 Dataindsamling i Syd/BY 1. december 2003 Dataindsamling i Syd/BYGD 15. januar 2004 Dataindsamling i Disko/BY 1. december 2003 Dataindsamling i Disko/BYGD 15. januar 2004 Dataindsamling i Midt/BY 1. december 2003 Dataindsamling i Midt/BYGD 15. januar 2004 Dataindsamling i Nord/BY 1. december 2003 Dataindsamling i Nord/BYGD 15. januar 2004 DATABEHANDLING Indtastning af data 1. marts 2004 Datavalidering 15. marts 2004 6